基于WignerVille分布与PCA降维的射频指纹特征提取仿真.doc

资源描述

《基于WignerVille分布与PCA降维的射频指纹特征提取仿真.doc》由会员分享，可在线阅读，更多相关《基于WignerVille分布与PCA降维的射频指纹特征提取仿真.doc（35页珍藏版）》请在三一办公上搜索。

1、本科毕业设计（2015届）题目基于Wigner-Ville分布与PCA降维的射频指纹特征提取仿真学院通信工程学院专业信息对抗技术班级10083511学号10083122学生姓名梁思指导教师孙闽红完成日期2015年6月杭州电子科技大学本科毕业设计摘要指纹的概念源于人类指纹特征，凭借指纹特征可以对人进行个体识别。推而广之，无线网络发射机指纹识别概念的提出源于发射机个体身份的识别要求。无线网络发射机识别，又称为无线网络发射机信号指纹识别，是指从接收到的无线网络信号中提取能够标识发射机个体的特征向量集(类似人类的指纹特征)，从而识别发射机个体的技术。随着当今复杂电磁环境下的信息安全问题随

2、时涌现，该技术在通信对抗侦察系统、无线网络安全、通信资源管理等诸多领域有着十分广阔的应用前景。然而如今的现代无线网络发射机设备集成度和一致性极高、调制参数设置软件化、载波频率高信号带宽大等特点给无线发射机的个体识别技术带来了更大的挑战和更加深入研究的需要。本文研究了基于Wigner-Ville分布的时频分析法将一维时域信号映射到由时间和频率组成的时- 频联合矩阵上来分析信号，再利用PCA降维技术降低时频数据矩阵的维数，保存主要信息，从而提取到信号特征，有效的识别同一型号的不同发射机个体。关键词：指纹；无线网络发射机指纹识别； Wigner-Ville分布； PCA降维Abstract The

3、 concept of finger originated in the human finger print, it canidentify individuals by virtueof fingerprint. By extension, the proposes of the concept of wireless network transmitter fingerprint from the transmitter identification requests. Wireless transmitter identification also known as wireless

4、transmitter signal fingerprinting. Its a technology to getting the extraction of features vector sets which can identify individual transmitter that is similar to human fingerprints characteristics, from the received signal in a wireless network, to identify individual transmitters in the end. With

5、todays complex electromagnetic environment information security problems emerge at any time, the technology in the communication against reconnaissance systems, wireless network security, communications resource management and many other fields has a very broad application prospects. todays modern h

6、igh wireless network transmitter device integration and consistency of the modulation parameter setting software, the carrier frequency and other characteristics of high signal bandwidth brings greater challenges and needs more in-depth study to the wireless transmitter individual identification tec

7、hnology. This paper studies the time-frequency analysis method based on the Wigner-Ville distribution, we map the one-dimensional time-domain signal to the composition of the time and frequency joint matrix to analyze the signal, and then use PCA dimensionality reduction technology to reduce the tim

8、e-frequency dimension of data matrix , save key information, thereby extracting a signal feature.Keywords: Fingerprint; fingerprint of wireless network transmitter; Wigner-Ville distribution; PCA dimension reduction目录1. 引言11.1. 研究的背景和意义11.2. 国内外研究动态21.3. 章节安排42. 无线网络发射机识别原理62.1. 无线网络发射机识别的概念62.2. 无

9、线网络发射机识别的原理63. Wigner-Ville分布原理83.1. Wigner-Ville(WVD)分布原理84. PCA原理124.1. PCA概念124.2. 主成分的计算134.3. 样本主成分164.4. 主成分的选取164.5. 主成分分析的性质175. 无线网络发射机射频指纹特征提取与仿真185.1. 无线网络发射机射频指纹特征提取与仿真186. 结论24致谢25参考文献26附录一27附录二311. 引言1.1. 研究的背景和意义随着人类运用无线网络发射机进行通信，电子战应运而生，并伴随无线通信的发展而发展。无线通信具有开放性与无界性，一方面给人类带来信息交流的快捷与方便

10、，另一方面敌人或不法之人有了窃取情报与干扰正常通信的可趁之机。日俄战争在1905年的爆发，拉开了第一次运用通信侦察、通信监听、通信干扰的无线通信电子战大幕，无线网络电子战在一个多世纪的历史内所有战争中多次获得好功绩，已然变成在还没开战就能震慑其他国家主要的战争手段，是衡量一个强国的重要标志。如今，电子战具有三项功能分别是信号侦察、信号攻击和信号防御。通信电子侦察作为军队的“千里眼”和“顺风耳”，是获得主要谍报、在背后援助战场和获得讯息交流的主导权的主要方式。在信号侦察过程中，侦察到的无线网络信号是要在无线网络接收机事先没有获得目标无线网络发射机的相关参数的情况下，对该无线网络发射机发射的无线网

11、络信号进行接收用于处理与分析，从而达到截取目标发射机的特征以及相关参数（频率、带宽、产生模式、信号幅度、定位坐标方向以及它所承载的主要信息）的目的。无线网络发射机侦察随着现如今通讯科技的进步而进步。不但先要解调接收到的无线发射机信号，而且可能还需要再对经过解调后的信号的复杂解密过程才能获得原始信息。可是在无线网络信号侦查当中，人们不但要掌握无线发射机产生的信号所包含信息内容，而且还得拥有无线发射机个体与其它属于的平台等发射机特征信息，这对于在战场上创建电子序列图，为战术和战略作出极其重要的贡献。随着无线网络通讯科学技术的快速飞跃，无线电频谱的监测手段与无线信号频谱管理技术还需要再不断突破一轮

12、又一轮的挑战，不法分子的干扰与监听行为、冒充成合法用户并且进行非法入侵等都需要对无线网络发射机设备进行个体身份的验证和鉴别。新兴的无线电软件化等相关科学技术的广泛发展和运用，同一个无线网络发射机可以经过软件设置的调节来改变无线信号的的调制模式、载频和波特率等相关参数，因此传统无线网络发射机个体识别方法如调制模式等已经不再符合现如今越来越繁复的无线网络发射机监管和检测。所以，研究更加有效的方法对发送信号的设备其硬件的细微特征进行提取与检测已日益显现出它的重要性。就像雷达个体识别技术，首先它接收正在工作的目标设备所发出的雷达信号，再对信号进行一系列处理来得到目标设备的各种参数指标如所在信号传播的方

13、向角度和设备的具体坐标等；无线网络发射机的个体指纹识别是与通信信号中包含要传递的真实信息内容毫无关系，它的指纹识别方式是，首先利用网络接收设备来收取目标网络设备发出的信号，然后再通过一系列相关的信号处理手段来获取潜藏在目标无线网络发射机内部的细微的个体指纹特征，并不需要去解调无线网络发射机发射的信号来获取其要传播的信息内容，两者的目的显然不同。利用雷达设备具有的独特又细微的指纹特征，可以对雷达信号进行分类识别，现已有了一系列相关的理论体系与算法方案，同时也获得了大量有意义又有效的研究成就。我们可以把识别雷达设备的指纹的概念扩展至无线网络发射机设备的辨别技术。在现实生活当中的无线网络发射机因为

14、其生产技术与设备的局限性，以及生产内部元器件是产生出物理误差，这些细小的差别会在设备生成无线信号过程当中以各种形式通过载体传达出去，那些微小差别标注出不同网络发射机设备的特质，又被称为无线网络发射机设备的指纹，这已经是它们之间存在区别的重要依据。比在当启动与关机或设备切换调制模式的一瞬间，无线网络发射机的暂态信号就会拥有非常多的个体指纹特征，就算是同厂同款的一些发射机，它们之间微小的差别依然会存在。然而网络发射机的信号不与雷达的信号相同，它可以传播一大批话音与数据，通过不同的调制方法，发射信号就拥有了对应带宽，重要参数的差别不大。现代硬件开发技术发展到可以实现非常复杂的信号提取算法的程度，这也

15、在很大程度上提升了个体指纹的可测性，研究工作没有止于对无线网络信号的提取与分析，而是逐渐着手对隐藏在信号里面的指纹特征进行长远地探索。伴随着社会的快速发展和现代信息化，无线网络发射机个体指纹识别技术不单单只是应用在军事电子对抗中，在无线网络和平、无线网络资源管理等这些领域也具有非常广大的运用空间和发展前景。比如在识别无线网络发射机设备上，将识识别用于认知无线电的频谱感知上，将合法用户设备相关的指纹导入创建的数据库中，以实现有效地管理频谱资源和精确辨别假冒用户的方针。再比如，当前由于所采用的网络安全策略均都只是基于应用层的范畴中，假如有用户有要盗取密码等信息的不良意图，很明显要侵犯就是轻而易取

16、之事。所以我们可以运用无线网络发射机设备中的硬件指纹特征，再与物理层的身份验证和应用层的密钥管理结合，将大大地提升现如今的无线通信安全。还有网络发射机设备的指纹，不仅能区分网络发射端，还能够用在检查和保证设备生产工艺水平的精确度。由于生产设备的元器件都是一样的，也不排除元器件生产可能导致的个体细微差异，但同一生产流水线的工艺水平也应该要一样，这样能保持同型号产品一致。如果指纹信息显现出一定的波动，就认为确定该元件可能在生产过程中精确度，去掉不合格的产品，从而达到让产品保持非常稳定的质量水平。随着无线网络发射机个体指纹识别技术研究发展一步步走向实用化、体系化，在这过程当中人们会陆陆续续地发明出许

17、许多多新异的应用模式。1.2. 国内外研究动态1.2.1. 国内外无线网络发射机识别技术的发展状况无线网络发射机的个体指纹识别技术的运用最先发生在第二次世界大战期间军队对电报按键时产生出细微特征的识别，发送电报的通讯员的个人按键发报习惯等一些信息会以报文为载体，让报文具有特殊的“无意调制信息”，拥有丰富经验和技能的的电报监听员能够凭借它来发现和找到报文来源于什么发报机和那个通讯员。1960年左右，美国需要Northrop Grumman能够研发出让导弹能够辨识与追踪目标发射机的系统，因而才产生特定辐射源识别的概念。Northrop Gram man公司研究员DnTalbot定义了SEI(Sp

18、ecific Emitter Identification)即“特定辐射源识别”，是指通过测量信号特性，然后和特性数据库对比监测出匹配出它的特征，达到能够辨识独一的发射端设备。该公司与美国的海军合作继续研究特定辐射源识别技术长达四五十年的时间，主导并参与研发出一系列的军用乃至民用特定辐射源识别系统，其中包括“鹰眼”机载预警机装备新的ESM系统，和电子支援系统，能够辨识出可能核武器的船只发出的信号。英格兰的CELT Mariner RWR用于船上的报警装置，德国的“欧洲鹰”无人机计划等。美国于AOC上，提议关于信号测量和特征谍报的观点，简称MASINT，它所侦察的目标对象不但含有常常要说到的雷达

19、信号、通讯信号等，还包含非有意辐射(Unintentional Radiated Emissions，tntE)的信号，信号测量和特征情报技术可以认为是特定辐射源识别技术的延伸和扩展。人们在不断地得到重视和挖掘特定辐射源识别的军用价值与民用价值，然而由于国家的保密，国外公开的特定辐射源识别的技术相关资料非常稀缺。国外的射频指纹识别现处于蓬勃的发展发展阶段，并不断突破一个个技术难关，让指纹识别技术造福于全人类。而中国的时频指纹识别技术处于比较落后的萌芽期，但也掀起了对射频指纹识别研究和探讨的潮流，由于缺乏相关资料，大部分的研究只能通过仿真敌我识别，雷达指纹提取和通信设备的设备来实现，完全脱离了

20、实际，缺乏实践的考验。1.2.2. 射频指纹特征提取的研究状况无线网络发射机的特征提取是射频指纹识别技术的首要一个过程。而本文就是研究指纹特征的提取，因为发射的信号发射前要被调制，通常无法直接观察到产生于无线网络发射机内部个体的细微差异，所以为了排除调制信号的的影响，从而能够获得其指纹特征。形成无线网络发射机存在射频指纹的要素有很多，比如电源的不稳定，码率调制的不同、内部结构的非线性、噪声等。雷达一般都是通过分析稳态特征（高阶谱分析法、循环谱分析法）来实现识别的，这种方法通常会用在船来识别雷达信号和由船产生的噪声。但是无线通信信号与雷达信号不同，现代无线信号分析方法在无线网络发射机(如电台、

21、WiFi等设备)的识别中的应用随着研究不断地深入也逐渐增多。蔡先生的团队在对多个发射端提取双谱特征进行鉴别的研究上获得了非常好的成效。基姆和史普纳曾利用提取出OFDM信号的二阶循环谱特征技术，分别给六家厂商的网卡通过识别，其识别率可以达到94左右。许先生通过泰勒级数的建模对无线网络发射端的功率放大器的非线性特性提取白激指数与频推指数等一些特点，并验证了该方法确实有效果，然而这个实验是基于仿真建模来得到结果。总而言之，虽然对无线网络发射机特征提取方法的研究有了一些很好的成绩，可是这些方法普遍存在一些缺陷。许多提取技术只能体现信号的一些能够显而易见的参数，至于潜藏在信号内部的微弱的又符合作为指纹特

22、征标准的特质在等待大家去挖掘出来，因此特征提取这一领域仍然需要有识之士对它进一步的研究。在环境噪声复杂多变和多个发射机工作等多种干扰的背境下,仅仅采用用频谱分析所得到的特征是完全不够的,因为该特征的成分不足以成为指纹去区分其他设备。时域只能体现信号随时间而幅度变化的规律，频域只能反映出信号含有的频率以及所占的能量，而采用时频分析法能将信号的频率特性和时间特性结合在一起，相辅相成，弥补两者的缺陷，同时又结合了两者的优势，这对特征提取有非常重要的意义。1.3. 章节安排本课题要研究的课题是基于Wigner-Ville分布与PCA降维的射频指纹特征提取仿真。用Wigner-Ville分布对多个无线网

23、络发射机发射的信号采用时频分析得到时频矩阵，再采用PCA降维技术的根据特征向量对时频矩阵提取主成分，进而得到由高贡献率组成成分形成的降维矩阵，这就是要提取的特征。时频分析能很好地给出信号的频域和时域的特性, 信号通过Wigner-Ville转换与PCA降维技术的处理过程，可以得到能够区分其他设备的指纹特征向量。第一章简单介绍了无线网络发射机识别的发展与应用以及本文所要研究的无线网络发射机识别的方法，同时也简单概括了国内外对射频识别的研究现状。第二章主要介绍无线网络发射机识别原理，还讲述无线网络发射机识别的作用和意义。第三章主要分析Wigner-Ville原理、性质、优缺点以及它的运用。第四章主

24、要详细介绍PCA降维原理、性质和优点。第五章应用MATLAB软件进行仿真基于Wigner-Ville分布与PCA降维的无线网络发射机射频指纹特征提取实验。第六章就上述章节的研究归纳总结出一些结论，并阐述了本毕业设计的缺点和以后需要改进的地方。编写MATLAB程序产生三个同一调制方式但它们的频率差小的2ASK的仿真同一型号不同无线网络发射机发出的信号。利用基于维格纳-威利变换程序对分别使三个射频信号转换成时频矩阵，最后通过PCA降维来提取m个主分量足够大(85 %以上)的特征向量，画出时频分布的主成分分布图，计算了它们之间的欧式距离，判断和识别出三个同一型号的无线网络发射机。2. 无线网络发射机

25、识别原理2.1. 无线网络发射机识别的概念以前的无线网络发射机的侦查都是以获取和分析无线网络发射机传播的内容为目的的，通过截取各种频段可检测到的各种信号，进而分析信号获取的频率和产生信号的方式等特性。可是在现代战争中，无线网络发射机信号的侦查手段的重要性在不断提高，对于因无线通讯设备内部硬件的个体差异会产生的并寄存于无线传播的信号中的一些物理量被研究人员慢慢地重视起来。怎样才能获得再分析这些寄生于无线网络射频信号上的又不会破坏正常传输、检验性、再显现、不易改变的细小特性来识别多个无线网络设备个体，这就是无线网络发射机识别。2.2. 无线网络发射机识别的原理无线网络发射机分类辨别的过程如图2-

26、1所示。分类判决特征的选择和提取信号的获取预处理图2-1无线网络发射机的分类辨别流程由于模式识别是无线网络发射机设备辨别的根本性质，其过程是先获取无线网络设备的传播信号，再通过预处理去除噪声，然后就可以提取出细微的特征，最后执行分类判决，依据已有的特征数据库匹配和分类判决。拣选特征是在无线网络发射机设备辨别流程中的的重要步骤，如何挑选什么微小的特质作为个体指纹特征，还有获取指纹参数的手段及其精确度，都是决定最终的分类鉴定结果的首要因素，乃至会影响识别性能的好坏水平。2.2.1. 信号细微特征的产生机理产生细小指纹的因素良多，其中最关键因素包括以下六个来源：（1）由于现代数学模版对电磁情景的

27、臆造和模仿，尤其是越来越向非线性部件靠拢，这与现实状况不完全契合，导致结果与实际有一定偏差；（2）由于部件在生产制作过程中出现加工技艺缺陷所造成其的制作目标和标称值的误差；（3）由于发射机的设计的缺陷使之生产过程中导致不同发射机的差异性；（4）发射机在工作历程中会随着时间而发生衰退现象导致设备性质与效用也随之回差等原因的作用效果；（5）基带信号：在信源中有消息特点与消息的特点以及因为数学模版的误差、相仿、电子元件的不连续性所造成的消息特点与消息的特点的偏离；（6）射频信号：信号在合成和经过功率放大器放大信号准备发送要传播的过程中，必然要遭到射频以及无线网络设备的非线性与内部电子元件的

28、不平稳、不连续的作用，结果造成了混淆和误差。2.2.2. 个体特征的选择如果要想把这些各式各类细小的特质当作可以显示无线网络发射机间差别的指纹，综合慨括一下它们必须符合下面几项标准：（1）特征的普遍性，就是作为无线网络发射机设备鉴别的细微特质必须对于任意一个发射机都有，并不只是一部分的无线网络发射机才有。（2）特征的独特性，要作为识别发射机设备鉴别的细微特质必须各相同。（3）特征的固定性，细微特质应该具有很强的稳固性能，不会随着时间或者传播环境的改变，结果产生明显的变化，从保持其很高的可信度。（4）特征的可测性，就是指纹的细微特质应该可以通过运用现时所有高端科学技术定量的数据

29、中获取到，并且提取出的数据能实现指纹鉴别的作用，不会随信号被混淆而有所变化，如此才能使得识别存在有用的意义。无线网络发射机的指纹特质根据无线信号本来的表示方法可以分成暂态特性与稳态特性。暂态特性表达的是系统过渡形态，也就是当发射机在运行时正处于非稳定时表现出非线性特性，其具有明显的个体特色。过渡状态源自设备自己，像无线网络设备开启和关闭、切换工作模式，码字变换等等；其他有的源自设备外的一些激发效果，例如电源提供的电不是很稳定。然而发射机系统的瞬态其将持续时间一般都非常短暂，并且它的瞬态特征出现的时间是不可预测性的，这对于信号的侦察很难实现有效地截获，况且持续时间太过于短暂的信号还不能有利于

30、精确地提取它的瞬态特征；由设备外部一些因素激发所导致的暂态变化是随机发生的，不能普遍导致对于每一个发射机产生信号同时发生变化。所以通过提取暂态特征来实现无线网络发射机鉴别很难得到广泛运用。3. Wigner-Ville分布原理3.1. Wigner-Ville(WVD)分布原理对于时频能量分布，相信大家最会感兴趣的就是由维格纳和威利共同提出来的Wigner-Ville分布，简写WVD，又称维格纳-威利分布。它不但是最先产生的一种表示时频的方法，而且还具有非常好的时频聚集性，较高的时间分辨率与频率分辨率等特点，计算方法简单。维格纳-威利时频分析就是将时域信号转换成由时与频组成的时频矩阵信号, 是

31、一种二次型变换方法，有很多优越于其他时频变换的性质, 特别是对于非平稳随机信号的维格纳-威利分布, 它与寻常的一些时频变换比较，如短时谱会显得更加卓越。在利用短时谱处理NSRS，假设信号在短时间都是平稳的，那么这里就出现非常大的弊端，因为它时间的长短将会影响的时频分辨率, 而为了让其提高还得需要采用较长的时间去观察，那么其将会与短时平稳条件相矛盾，导致信号在时间与频率上出现模模糊糊的状况。而维格纳-威利时频转换却是一种完全能够解决这类问题的时频联合表达信号特征的方式。3.1.1. 信号的Wigner-Ville分布定义 (1)信号s(t)的Wigner-Ville 分布的定义： (3.1) 式

32、中：z(t)是s(t)的解析信号。如果式(1)对把s(t)替换成z(t)，那么得到的时频分布是Wigner 分布，但是其不会被不经常使用到。 (2)Wigner-Ville时频分布用解析信号表达的频谱公式表示如下： (3.2)(3)离散WV D分布定义： (3.3)式中为离散解析信号。维纳利分布不但能有效地体现信号的能量随时间和频率的变化, 而且可以通过其来求出瞬时频率。不妨证明，WVD的一阶矩和信号的瞬时频率成正比关系。设有一个离散信号为，则其离散序列的频率为：（3.4）式中:为采样频率，离散维格纳-威利分布一有K个频率分布（可表达为N K 的矩阵)；是离散维格纳-威利分布的一阶矩。3.1

33、.2. Wigner-Ville分布的性质 Wigner-Ville分布具有以下重要的性质：（1）对于所有的t和f值是实的；（2）具有时移不变性：（3）具有频移不变性：（4）满足时间边缘特性：（5）具有频率边缘特性：当分析多个分量的信号和NSRS的时候，对其作时频分布转换会在多分量信号的地方产生互分布就是交叉项，在图像上呈现的虚假信号，从而给信号的时频分布分析造成一定的干扰。对于任意一个多分量信号，二次型时频分布必会然产生一个交叉项，设有n个分量信号，可以得到多个分量信号的维格纳-威利分布: （3.5）公式中，表示第k分量与第j分量之间的互WVD，即交叉项。维格纳-威利分布

34、的交叉项主要发生在在两个分量的几何中心处和连接这两点的直线上面。为此，学者们于维格纳-威利的基础上又提议能够抑制交叉项的时频分析方法。3.1.3 Wigner-Ville 分布的改进信号及其频谱只在某个时间范围和频率范围内非零，则称信号及其频谱是有限支撑的。假如信号的时频分布在信号以及其频谱的总支撑区域外面也等于零，那么它就是有限支撑的。交叉项能够一直出现在于信号的周围，抑制交叉项，即使时频分布的支撑区域内外交叉项等于零，主要是利用增加对核函数约束条件的方法来达成。对信号进行平滑技术的滤波过程，可以减少交叉项对真实信号的干扰程度，但是平滑处理会丧失维格纳-威利分布的许多比较有用的特性，减小自

35、项，信号项其时频凝聚性也会在一定程度减小并且也不会全部解除它的交叉项，因此必须对核函数的范围与形状进行合理筛选。下面我们介绍了两种基于WVD分布的改进型分布：（1）伪 Wigner-Ville 分布（PWVD）对于式（1），的取值范围为，实际中无法满足，且为解决 WVD的双线性产生交叉项问题，对 WVD 在频域进行平滑。当核函数只是对加窗来截取从而完成减小交叉项的目的，这就是伪WVD变换：（3.6）（2）平滑伪 Wigner-Ville 分布（SPWVD）对变量t与变量的方向同时经过加窗截取处理，这样可以将这两个t、方向上的交叉项平滑掉，得到平滑伪 PWVD，这就是 SPWVD变换

36、：（3.7）上式中，与分别是2个实偶窗函数，同时。为了直观说明 WVD 分布及其改进分布的性能，现对常见信号的 WVD 分布、PWVD 分布和 SPWVD 分布进行仿真。图3-1 LFM信号WVD、PWVD、SPWVD变换产生的时频分布图3-2 频率编码信号WVD、PWVD、SPWVD变换后的时频分布由以上图3-1可知，WVD 分布高度集中在时频平面图上，具有较好的时频聚集特性，能够拥有较高的时间与频率的分辨率，尤其是识别性能在线性调频信号上体现效果的更加地好。但是出现了频谱扩展，有交叉项存在，而PWVD 和 SPWVD 对信号分析性能有较大的改善，边缘更加光滑，杂项较少。PWVD 转换不

37、仅减少频率分辨率，并且交叉项抑制效果又不如 SPWVD 分布，SPWVD 通过时域的平滑过程，达到的抑制交叉项的效果最好。从图3-2可以看到，在对频率编码信号进行 WVD 分析和 PWVD 分析之后，在两个频率直接出现了第三个频率分量，出现了虚信号，影响了分析效果，这大部分因素是由时频分布其二次型造成的交叉项而导致的，频率编码信号经过 SPWVD 分析之后，清除了虚假频率信息，进而抑制了它。4. PCA原理4.1. PCA概念 PCA全称主成分分析（Principal Component Analysis，PCA），又称主元分析、K-L变换（Karhunen-Loeve Transform），

38、对于它的研究可以追溯到1901年，由皮尔森首次提出，而主成分分析的概念是由霍特林总结出来。霍特林对PCA的定义如下:对一个d维度的观察向量序列,，PCA降维的目的就是要获得q个正交的主方向，让在q个主方向上投影后的方差最大。图4-1所示就是PCS降维的简单示例，图中圆的所组成的直线表示第一主成分，把三角形表示的矩阵往主成分上投影就是矩阵从二维至一维的最佳降维。图4.1 主成分分析示例假定要观测的指标共有p个，分别是，显然有非常多的方法将这些指标结合成为一个综合指标，但将这些指标用线性组合的方法综合起来就是最简单的方法了。因此，可设定其综合指标的表达形式是这些指标的线性组合，那么就有: （4.

39、1）很明显，因为各组合的各个系数不相等，于是可以得到不相等的综合指标。综合指标可以有多个，所以需要去主成少数几个来代替原始指标。要防止它们发生重迭，还得约束综合指标间必须是不相关的。少数指标可以将原始指标的变动情况传达出来。其中能够传达变动程度最大的那个指标是最主要的，就称之为第一主成分；而能够能够传达其变动程度次大的那个指标，就称之为第二主成分；就这样一直下去，即能够能够传达其变动程度第k大的那个指标，就称之为第k主成分。各个原始观测变量的方差反映了各个原始观测指标的变动程度，而各个综合指标作为原始观测变量的线性组合，其方差的大小就取决于这些原始观测变量各自的方差和它们之间的协方差。由上可得

40、，主成分可以依据方差来来求得。设想有p个向量为，它的均值向量是，他们的协方差矩阵是，那么对于第i个向量其方差为其协方差矩阵主对角线上相应的元素，而总方差是，总方差可以体现出总体上的变化。某一个线性组合为：，那么它的方差是：（4.2）假如定义原始观测变量对应的第一主成分是，第二主成分是,，第k主成分是，那么就有：（4.3）并且有：。4.2. 主成分的计算4.2.1. 第一主成分的计算由PCA的概念我们可以知道，若想求得这p个原始指标所对应的第一主成分，就应该想办法去寻求使得取得最大值时的那个指标所对应的本征向量组合。由于是向量的增函数c，也就是说对于给出的任意一个常数，它都会有，由此如果不

41、对给予限制，想使得取得最大，应该取无穷大，这样会致使这个问题毫无意义可言了。因而，通常要是将线性组合对应的系数标准化也就是单位化，令，因而第一主成分的题目转变成在的条件之下，要使得取得最大的向量的题目，即：（4.4）我们可以得到的函数是：（4.5）由于它是线性的，微分取零可得：（4.6）由前p个方程，可以得到：（4.7）从的约束条件可以得知，因此存在非零解。由我们大一所学的数学的知识可以知道，这时方程组对应的,其行列式为0：（4.8）将前p个方程式所组成的向量与一个行向量相成得出的结果为：（4.9）因为在约束条件中规定，所以必定有：（4.10）因而，如果要使得取得最大值，的取值

42、也就要尽可能的偏大：（4.11）同时对应的本征向量：（4.12）就应当是最大主成分相应的本征向量，即最大主成分是: （4.13）4.2.2. 第k个主成分的计算如果只用最大主成分作为特征也许会造成特征提取的不足，为了这种情况的发生还须要再计算第二大主成分。这样下去，假如前(k-1)大主成分还未能足作为信号的指纹特征是，这就须要再求出第k大主成分了。在的情况下下，求出使得的最大的。这个问题就是：（4.14）（4.15）微分并令其为0，可推出：（4.16）由此易知一定是的特征根，从函数可以知到其应该为协差阵对应的第k个征根的值，的就是与第k个主成分的相应系数向量，其方差值就是这个的值。

43、事实上，因为是非负矩阵，所以，可以算出与之相对应的主成分。这里假如定义出主成分向量分别为，本征向量分别为所构成出A，即：（4.17）然后我们可以得出主成分就是：（4.18）如此，可以求出所有的主成分。4.3. 样本主成分在实际试验中，总体的协方差矩阵常常都是不可能知道的，所以要实行主成分分析那就必须以样本为出发点。假定来自原始变量的不同样本所组成的数据观测矩阵为: （4.19）那么可先计以计算各样本变量的均值为和方差是，然后对样本观测的数据矩阵进行中心化变换或者标准化变换，用其变换后的得到数据矩阵来计算出样本协方差矩阵是：（4.20）在利用该方法得出相应的各主成分之后，如果我们分别把

44、样本里的每一个个体所对应的值代入其对应的公式中，这样就可以得出每一个个体在每个主成分上与之相对应的数值，这里我们可以称之为每个个体的主成分贡献。其中要得出其贡献而采取的变量数据，绝对不是来自于原始的观测数据，而应该是要和在计算中要采用的变量数据保持一致。总而言之，主成分假如是依据样本的协方差矩阵的方法而得出来的，那么我们要计算的主成分贡献就应当要利用每一个个体的中心化变换过程后来得到的数据。4.4. 主成分的选取从上述分析中的基本原理和算法流程不难得出，该算法分析就是要将p个任意变量所对应的分解成为r个毫无关联的随机变量方差之和。每一个主成分的方差就是对应的特征根说明了这个主成分的方差与全部方

45、差中的比值，因此这里所提到的方差是第j个主成分)对应的贡献率，因此可以得到，当方差的值越高，证明主成分的作为数据变量的性能就越大，因此就是指我们用的差异程度去证明x这个随机向量的差异的能力很强。具体的实践使用当中，一般第一主成分不能足够地去反映原始的变量信息，因此我们都须要采用前多个方差。我们通过对方差的从大到小的顺序依次列出，将前边几个比较大方差之和去除以总的方差：（4.21）代表的是累积贡献率。目前提出的问题出现需要选取的时候，普遍都需要其累积贡献率的大小不能低于86%。4.5. 主成分分析的性质4.5.1. 在平均误差最小的原则情况下的最优降维依据上述这个主要成分的分析概念和算法流程，它的主要目标就是要数据矩阵由基数为d的高维降至维数为q的一个低维，而且此时还要最大限度的保留下需要的原数据所包含的内容。通过这种算法可以得出需要的转换矩阵：为阶，其变换之后的随机向量是。假设qd，那么y是q维矩阵的一个任意向量，此时就可以完成PCA降维。我们可以通过此分析算法的定义可以知道，结论中的d*q维矩阵所包括的数据量是最少的，所以我们去除最终的那几维从而达PCA降维这一目标，并且在这个过程中丢掉的数据可以达到最小。将上述经过转换就可以得到

展开阅读全文