《机械故障诊断学钟秉林 第6章状态识别方法原理ppt课件.ppt》由会员分享,可在线阅读,更多相关《机械故障诊断学钟秉林 第6章状态识别方法原理ppt课件.ppt(114页珍藏版)》请在三一办公上搜索。
1、第6章 状态识别方法的原理,近邻决策算法,贝叶斯(Bayes)分类法,2022/11/11,1,机械故障诊断理论与方法,第2篇 基于人工智能的故障诊断技术,对比分析法,距离函数分类法,Fisher判别方法,势能函数分类法,基于粗糙集理论的诊断方法,主成分分析及独立成分分析,模糊诊断方法,故障树分析法,逻辑推理法,灰色理论诊断法,模型分析法,工况监测与故障诊断 - 状态分类问题,本章以状态监测识别为主,介绍几种常用方法的原理及,其应用。如,对比分析法模型分析法逻辑推理法,贝叶斯(Bayes)分类法距离函数分类法模糊诊断,故障树分析等,概述,2022/11/11,2,1、两种诊断原理比较信号源传感
2、器信号采集及记录,简易诊断统计量,阈值,趋势图,正常状态或异常状态,状态识别,精密诊断信号分析,典型故障的振动特征,振动特征,故障的类型、原因、部位等诊断决策,模式识别,图,简易诊断与精密诊断过程比较,2022/11/11,3,2、模式(状态)识别方法原理,模式识别:把待检模式Xt与k种典型故障模式,X i(i=1,2,3,k)进行比较、,分类的方法 。,2022/11/11,4,待检模式Xt,典型模式X1,典型模式X2典型模式X3,模式识别(比较、分类),典型模式Xk图 模式识别方法原理,2022/11/11,5,3、模式识别方法-其理论基础是聚类分析法,1)直接观察法(经验法):将待检模式
3、的特征与典型,模式的特征进行直观比较、分析后进行分类。,2)计算机辅助诊断法:有时序诊断法、模糊诊断法、灰色系统诊断法等,解决模式边界不太清晰问题。,3)计算机自动识别法:又称诊断专家系统。由专家知,识、各种故障全部诊断信息组成知识库,通过计算机自动识别和诊断的方法。,2022/11/11,6,在故障机理研究的基础上,通过计算分析、试验研究、统计归纳等手段,确定与各有关状态的特征作为标准模式(参考模式)。,在机械设备运行过程中,选择某种特征量,根据其变化规律和参考模式比较,用人工分析方法,判别机械设备的运行状态。,例如,在旋转机械运行过程中,人们常用频谱分析仪,分析振动信号幅值谱的谱峰及频率位
4、置的变化,和标准模式对比,就可判断工况是否正常,甚至可以识别某些故障的原因。,一、对比分析方法,2022/11/11,7,旋转机械的转子是一个转动体,由于加工误差、轴与轴承间间隙、材料质量不均、因结构设计造成转动体质量不均及加工装配误差等,当转子按一定转数旋转时,离心力很难避免。这种离心力激励着转子系统产生简谐振动,在谱图上的表征是有固定的工作频率 f 及其相应的谱峰。,如果轴线不对中,就产生二倍频2f,且工作频率f 的幅值也会改变;,2022/11/11,8,该方法能否取得成功取决于两个条件:,一是对人的技术水平依赖性很大,专业面要宽,对现有科学技术工具的原理要有一定的基础,能灵活使用计算机
5、及仪器;,二是对机器设备的物理背景或运行历史要有一定的了解。,2022/11/11,9,由n个特征参数组成的特征向量相当于n 维特征空间上的一个点。,同类模式点具有聚类性,不同类状态的模式点有各自的聚类域和聚类中心。,如果事先知道各类状态的模式点的聚类域作为参考模式,则可将待检模式与参考模式间的距离作为判别函数,判别待检状态的属性。,二、距离函数分类法,2022/11/11,10,X ( x1 , x2 , xn )T,DE2,n ( xi zi )2 ( X Z )T ( X Z )i 1,1 欧氏距离(Euclidean distance),在欧氏空间中,设矢量,和,Z ( z1 , z2
6、 , zn )T ,两点距离越近,表明相似性越大,,则可认为属于同一个群聚域,或属于同一类别,欧氏距离(Z为标准模式矢量,X为待检矢量。):,2022/11/11,11,d 2,A,x 1,x 2,d 10 1,0 2M,几何概念如图,DE2,n ( xi zi )2 ( X Z )T ( X Z )i 1,2022/11/11,12, w1, 0,wn ,考虑到特征矢量中的诸分量对分类起的作用不同,可采用加权方法,构造加权欧氏距离。Dw2 ( X Z )T W ( X Z )式中W为权系数矩阵。当W为单位矩阵时即为上述等式,W ,0 ,w2,当 w1、w2、wn 取不同值时,表明矢量中各个分
7、量的作用不同。,2022/11/11,13,2 马氏距离(Mahalanobis distance),这是加权欧氏距离中用得较多的一种,其形式为,Dm2 ( X Z )T R 1 (X Z),R为 x与 z的互相关矩阵(协方差矩阵),即,R XZ T,马氏距离的优点是排除了特征参数之间的相互影响。,2022/11/11,14, , 2.5x , , , nx , g X 1 g 2 1 2 0.5x 1x 2 x X 1.5x ,特征矢量的构成统计、时序模型参数特征频率,其他特征量,如信息量等,2022/11/11,15,基于局部Hilbert边际能量谱的特征能量法,例: 基于局部Hilber
8、t边际能量谱的故障诊断方法(1) 基于局部Hilbert边际能量谱的特征能量法,输入振动信号,HHT变换,特征能量提取,故障模式识别,马氏距离判别函数,2022/11/11,16,d i ,计算待检信号特征值S x与各状态下的标准特征值之间的马氏距离:,Si 和Var (S i ),各状态下相应的标准特征值和方差,S x S iVar ( S i ),2022/11/11,17,某型号滚动轴承标准特征值及其方差,状态正常状态外圈故障内圈故障,特征值0.8702.02310.058,方差0.15990.91413.1805,2022/11/11,18,马氏距离函数诊断结果,被检信号及状态(1)正
9、常状态(2)正常状态(3)外圈故障(4)外圈故障(5)外圈故障(6)外圈故障(7)内圈故障(8)内圈故障(9)内圈故障(10) 内圈故障,d10.53990.01697.79107.64543.58733.489864.165061.076931.052529.2741,d21.35421.26280.10220.07670.63270.649810.13209.41744.16863.8577,d32.91602.88972.49692.50432.70842.71330.38890.18331.32691.4163,诊断结果正确正确正确正确正确正确正确正确正确正确,2022/11/11,1
10、9,2022/11/11,20,三、近邻决策算法,最初的近邻法是由Cover和Hart于1968年提出的,随后得到理论上深入的分析与研究,是非参数法中最重要的方法之一。,最近邻法:nearest neighborhood classifier (nnc),将与测试样本最近邻样本的类别作为决策的结果。设样本集xi,i=1,2,n每个样本xi所属的类别均已知,对于状态模式点分别为k(k=1,2,m)的m分类问题,样本集中每类样本的个数为Ni个,i1,m,则可以规定第i类i的判别函数为:,|.|表示距离,或相似度。可以是欧式距离,曼哈坦距离,明考斯基距离等。,2022/11/11,21,最近邻法在原
11、理上最直观,方法上也十分简单。明显的缺点就是计算量大,存储量大。,欧几里得距离与曼哈坦距离的共同点(1)即距离是一个非负的数值 (2)自身的距离为0 (3)即距离函数具有对称性 (4)即距离函数满足三角不等式,距离计算方法,2022/11/11,22,k-近邻法: 最近邻法的扩展,其基本规则是,在所有N个样本中找到与测试样本的k个最近邻者。设样本集xi,i=1,2,n每个样本xi所属的类别均已知,对应得状态模式分别为k(k=1,2,m) ,不考虑样本的属性,在已知样本集中找出x的k个近邻,若k1,k2,km分别为k个近邻中属于1, 2 , n类的个数,则k-近邻规则的判别函数定义为 gi(x)
12、=ki, i=1, 2,m。 若 则,k-近邻一般采用k为奇数,跟投票表决一样,避免因两种票数相等而难以决策。,2022/11/11,23,取k=5,在样本x的5近邻中形状为“ ”的样本个数为3,形状为“ ”的样本个数为2,则测试样本x被归为“ ”形状所属的类别。,5-近邻规则,x1,o,x2,2022/11/11,24,近邻法算法的改进,近邻法的一个严重问题是需要存储全部训练样本,以及繁重的距离计算量。两类改进的方法:一种是对样本集进行组织与整理,分群分层,尽可能将计算压缩到在接近测试样本邻域的小范围内,避免盲目地与训练样本集中每个样本进行距离计算。另一种则是在原有样本集中挑选出对分类计算有
13、效的样本,使样本总数合理地减少,以同时达到既减少计算量,又减少存储量的双重效果。,2022/11/11,25,最近邻与k-近邻法比较,3-近邻,最近邻,2022/11/11,26,表示,并有,+,=1。,P(1 ),P( 2 ),机械设备运行和机械制造过程的状态都是一个随机变量,事件出现的概率在很多的情况下是可以估计的,这种根据先验知识对工况状态出现的概率作出的估计,称之为先验概率 j ( 1 , i , m )在工况监视过程中,主要是判别工况正常与异常两种状态,它们的先验概率用 P(1 ) 和 P( 2 ),四、贝叶斯(Bayes)分类法,2022/11/11,27,(x/1 )正常状态的类
14、条件概率密度;p(x/ 2)异常状态的类条件概率密度;则Bayes公式有,p( x i ) P( i ),P( i x) ,2, p( x j ) P( j )j式中 P( i / x) 表示已知样本条件下, i 出现的概率,称为后验概率。,2022/11/11,28,对两类状态有,p( x 1 ) P( 1 ),2,P( 1 x) , p( x j ) P( j )j,p( x 2 ) P( 2 ),2,P( 2 x) , p( x j ) P( j )j 最小错误率的贝叶斯决策规则,P( 1 / x) P( 2 / x)P( 1 / x) P( 2 / x ),x 1x 2,2022/11
15、/11,29,Bayes判别方法是基于最小错误率,错误率是分类性能好坏的一种度量,它是指平均错误率而言,用P(e)表示,其定义为:, ,P(e) P(e, x)dx P(e / x) p( x)dx,2022/11/11,30,五、Fisher判别方法,适用于指标为定量指标的两类判别(或多类判别),Fisher判别法是1936年提出来的,该方法的主要思想是通过将多维数据投影到某个方向上,投影的原则是将总体与总体之间尽可能的分开,然后再选择合适的判别规则,将新的样品进行分类判别。,2022/11/11,31,Fisher判别法(先进行投影),所谓Fisher判别法,就是一种先投影的方法。考虑只有
16、两个(预测)变量的判别分析问题。假定这里只有两类。数据中的每个观测值是二维空间的一个点。见图。这里只有两种已知类型的训练样本。其中一类有38个点(用“o”表示),另一类有44个点(用“*”表示)。按照原来的变量(横坐标和纵坐标),很难将这两种点分开。于是就寻找一个方向,也就是图上的虚线方向,沿着这个方向朝和这个虚线垂直的一条直线进行投影会使得这两类分得最清楚。可以看出,如果向其他方向投影,判别效果不会比这个好。有了投影之后,再用前面讲到的距离远近的方法来得到判别准则。这种首先进行投影的判别方法就是Fisher判别法。,2022/11/11,32,两类Fisher判别示意图,Y,X,L=b1X+
17、b2Y,G1,G2,2022/11/11,33,1. Fisher判别的原理(两类判别),2022/11/11,34,2022/11/11,35,2022/11/11,36,2022/11/11,37,A,oo,o,x,xx,x,x,x,x,x,x,x,x,xx,xx,x,xBxx,m,m,Q分界线起点 sb),ooo,oooo oo oo o o oo o o o oo o o o oo o o o o oo o o o oo o o o o oo o o o oo o o oo ooo,x,Qox oo oo xox 21s,xox x,六、势能函数分类法,2022/11/11,38, 势
18、能函数的含义是把模式点看成能量源,其能量由势能函数描述, 正常工况模式样本聚类性好,在聚类中心A附近,模式点密集,由势能累积的能量多,能量大,势能累积形成能量峰高。离开聚类中心远,模式样本分布稀疏,累积的能量峰相对较低, 异常工况模式点的分布更为稀疏,能量峰低。两类状态的能量场交叉,所形成的峰谷自然把类别不同的状态分开,这就是用势能构成判别函数的概念。,K( X, X k ) 2i i X i X k ,i 1,任意一点的势能函数可用下式表示( i X 为归一化正交函数 ),2022/11/11,39,第6章 状态识别方法的原理,近邻决策算法,贝叶斯(Bayes)分类法,2022/11/11,
19、40,机械故障诊断理论与方法,第2篇 基于人工智能的故障诊断技术,对比分析法,距离函数分类法,Fisher判别方法,势能函数分类法,基于粗糙集理论的诊断方法,主成分分析及独立成分分析,模糊诊断方法,故障树分析法,逻辑推理法,灰色理论诊断法,模型分析法,机器运行过程的动态信号及其特征值都具有某种不确,定性,如偶然性和模糊性。,如故障征兆特征用许多模糊的概念来描述,如“振动强烈”、“噪声大”,故障原因用“偏心大”、“磨损严重”等。,同一种机器,在不同的条件下,由于工况的差异,使机器的动态行为不尽一致,人们对同一种机器的评价只能在一定范围内作出估计,而不能作出明确的判断,还有不同的技术人员由于种种原
20、因,这些都导致对同一台机器的评价得到不确切的结论。,七、模糊诊断方法,2022/11/11,41,以模糊数学为基础,把模糊现象与因素间关系用数学,表达方式描述、运算,即模糊诊断,2022/11/11,42, ( )x,()x,( x ) ,1 exp( k( x a )2 ), x a,隶属函数模糊数学将0、1二值逻辑推广到可取0,1闭区间中任意取值的连续逻辑,此时的特征函数称为隶属函数(x),它满足0 (x) 1,10,a,x,0 x ax a,0,( x ) 1,x,a,1,0, 0, 0 x a,升半正态分布,升半矩形分布,2022/11/11,43, (t),0,很 好,较 好,一 般
21、,很 差,x,较,差,2022/11/11,44, Rmn ,模糊关系方程,模糊关系方程为: B = RA,R称为模糊关系矩阵, R1n R2 n ,R12R22Rm 2, R11 RR 21 Rm1,2022/11/11,45, 特, , 征 , 矢 , 量, ,B ,A , 故 障 ,模糊诊断准则最大隶属准则即取B中隶属度最大的元素,1i m, i max 1 , 2 , , m,隶属于模糊子集 i ,即发生了第i 种故障,2022/11/11,46,故障树分析法是把所研究系统的最不希望发生的故障状态作为故障分析的目标,然后寻找直接导致这一故障发生的全部因素,再找出造成下一事件发生的全部直
22、接因素,一直追查到毋需再深究的因素为止。,通常,把最不希望发生的事件称为顶事件,毋需再深究的事件称为底事件,介于顶事件与底事件之间的一切事件称为中间事件。用相应的符号代表这些事件,再用适当的逻辑门把顶事件、中间事件和底事件联结成树形图,这样的树形图称就称为故障树,用以表示系统或设备的特定事件(不希望发生的事件)与它的各个子系统或各个部件故障事件之间的逻辑结构关系。,八、故障树分析法,2022/11/11,47, 应用故障树分析的步骤:,1) 给系统以明确的定义,选定可能发生的不希望事件作为顶,事件。,2) 对系统的故障进行定义,分析其形成原因 (如设计、运,行、人为因素等)。,3) 作出故障树
23、逻辑图。,4) 对故障树结构作定性分析,分析各事件结构重要度,应用布尔代数对故障树简化,寻找故障树的最小割集,以判明薄弱环节。,5) 对故障树结构作定量分析。如掌握各元件、各部件的故障率数据,就可以根据故障树逻辑,对系统的故障作定量分析。,2022/11/11,48,4,5,3,1,反应装置,2化学反应流程及控制系统示意图。系统由冷却装置2、供料装置4和卸压装置5组成。温度计1,压力计3,2022/11/11,49,危险状,态,&,不 能,正 常运 行,不 能停 料,卸 压装 置不 正常, 1, 1, 1,1,23,1:,4,3:5,为了使反应装置的冷却水温度、压力维持一定关系,可依靠温度计1
24、与压力计3的输出信号,由计算机控制系统的调节器与控制信号调节冷却水量,并靠调节阀使化学反应维持在正常状态。若反应装置中的温度超标,温度计1显示工况不正常,操作员即关闭手动阀4,停止供料,防止系统出现危险。如果选择系统出现危险的状态作为顶事件(不希望发生事件),就可得到如图所示的故障树。,2022/11/11,50,T&,T 1,1,1,2,2,n,n,.,.,与或门故障树,a) 与门故障,b) 或门故障树,2022/11/11,51,2022/11/11,52,2022/11/11,53,粗糙集的含义,粗糙集(RoughSets)理论是由波兰数学家Pawlak Z 于1982年提出的。粗糙集方
25、法是基于一个机构(或一组机构)关于现实的大量数据信息,以对观察和测量所得数据进行分类的能力为基础,从中发现、推理知识和分辨系统的某些特点、过程、对象等的一种方法。经过二十多年的发展以及研究的深入,粗糙集方法在理论和实际应用上都取得了长足的发展。在知识发现、数据挖掘、模式识别、故障检测、医疗诊断等领域得到了广泛应用。,九、基于粗糙集理论的诊断方法,2022/11/11,54,粗糙集理论在故障诊断中的作用,在数据预处理过程中,粗糙集理论可以用于对特征更准确的提取在数据准备过程中,利用粗糙集理论的数据约简特性,对数据集进行降维操作。在数据挖掘阶段,可将粗糙集理论用于分类规则的发现。在解释与评估过程中
26、,粗糙集理论可用于对所得到的结果进行统计评估。,2022/11/11,55,粗糙集理论是一种处理不精确、不确定与不完全数据的新的数学方法。由于它在机器学习与知识发现、数据挖掘、决策支持与分析、专家系统、归纳推理、模式识别等方面的广泛应用,现已成为一个热门的研究领域。 RS理论主要兴趣在于它恰好反映了人们用Rough集方法处理不分明问题的常规性,即以不完全信息或知识去处理一些不分明现象的能力。或依据观察,度量到的某些不确定的结果而进行分类数据的能力。,粗糙集理论的基本概念,2022/11/11,56,粗糙集理论的基本概念,RS理论认为知识即是将对象进行分类的能力,假定我们起初对全域里的元素(对象
27、)具有必要的信息、或知识,通过这些知识能够将其划分到不同的类别。若我们对两个元素具有相同的信息,则它们就是不可区分的(即根据已有的信息不能够将其划分开)。显然这是一种等价关系。不可区分关系是RS理论最基本概念。在此基础上引入了成员关系、上近似和下近似等概念来刻划不精确性与模糊性。,2022/11/11,57,2022/11/11,58,不可分辨关系,给定一个有限的非空集合U称为论域。任何子集X U,称为U中的一个概念或范畴。U中的任何概念族称为U的抽象知识,简称知识。设R是U上的一个等价关系,U|R表示R的所有等价关系构成的集合,xR表示包含元素 x U的R等价类。 设R是U上的一族等价关系,
28、若P R,且P ,则P(P中所有等价关系的交集)也是一个等价关系,称为P上的不可分辨关系,用ind(P)来表示,即: (6-9-1),2022/11/11,59,不可分辨关系是物种由属性集P表达时,论域U中的等价关系。U|ind(P)表示由等价关系ind(P)划分的所有等价类,且将其定义为与等价关系P的族相关的知识,称为P基本知识。同时,也将U|ind(P)记为U|P,ind(P)的等价类称为关系P的基本概念或基本范畴。,不可分辨关系,2022/11/11,60,设R为U上的一族等价关系。R将U划分为互不相交的基本等价类,二元对K=(U, R)构成一个近似空间(Approximation Sp
29、ace)。设X为U的一个子集,a为U中的一个对象,aR表示所有与a不可分辨的对象所组成的集合,即a决定的等价类,可表示为:,等价类,2022/11/11,61,例题1,取B为各种属性组合, 则得到不同等价类,取B=A则等价类为:x1,x2,x3,x4,x8,x5,x6,x7,2022/11/11,62,当集合X能表示成基本等价类组成的并集时,则称集合X是R可精确定义的,称作R精确集;否则,集合X是R不可精确定义的,称作R非精确集或R粗糙集。对于粗糙集可近似利用两个精确集,即下近似和上近似来描述。X关于R的下近似(Lower Approximation)定义为: 是由那些根据已有知识判断肯定属于
30、X的对象所组成的最大的集合,也称为正域。,上近似和下近似,2022/11/11,63,X关于R的上近似(Upper Approximation)定义为: 是所有与X相交非空的等价类aR的并集,是那些可能属于X的对象组成的最小集合,也称为负域。,上近似和下近似,2022/11/11,64,称为X的R边界域; 称为X的R正域; 称为X的R负域。显然, 。若 ,即 , 称集合X为R可精确定义的,称作R精确集;否则,集合X是R不可精确定义的,即 称作R非精确集或R粗糙集。,边界域、正域、负域,2022/11/11,65,当且仅当 ,X是精确集;当且仅当 ,X是粗糙集;,精确集与粗糙集,2022/11/
31、11,66,假定有一个信息系统, 有两个属性. 属性一有5个值, 属性二有6个值. 现在有一个要近似的集合, 在图中用红色的圆表示.,例题2,2022/11/11,67,仅使用第一个属性进行划分的情形. 正区域为空. 蓝色区域为负区域.,2022/11/11,68,使用两个属性进行划分的情况,加入第二个属性,负区域,正区域(下近似),2022/11/11,69,边界区域,上近似,综合表示,2022/11/11,70,边界的存在导致集合的不精确,边界区越大,精确性越低。在粗糙集理论中不精度的定义如下: 其中,card( )表示该集合的基数,精度 反映了对于集合X的知识的完全掌握程度。也即对U中的
32、任意一个对象,根据R中各属性的属性值确定它属于(或不属于)X的可信度。,确定度(精度),2022/11/11,71,对于每一个R且 ,有0aR(X)1。当aR(X)=1时,U中的全部对象根据R中各属性的属性值就可以确定其是否属于X,X为R的可定义集;当0aR(X)1时,集合X有非空边界与,U中的部分对象根据R中各属性的属性值就可以确定其是否属于X,而另一部分对象不能确定其是否属于X,X为R的部分可定义集;当aR(X)=0时,U中的全部对象都不能根据R中各属性的属性值确定其是否属于X,X为R的完全不可定义集。当X为R的部分可定义集或完全不可定义集时,X为R的粗糙集。,确定度(精度)性质:,202
33、2/11/11,72,条件与决策,对于每个xU,定义函数:dx:A V,其中dx(a)=a(x), 。函数dx称为决策表S中的决策规则,x是决策规则dx的标识。规则dx对条件属性集C的约束记为dx|C,dx对决策属性D的约束记为dx|D,dx|C和dx|D分别称为dx的条件和决策。,2022/11/11,73,例题:磨屑烧伤状态识别,取磨屑流热辐射信号的均值、标准差以及其一阶自回归系数、二阶自回归系数为特征量,假设存在如表所示的决策表。其中, 列表示属性,行表示对象,每行表示该对象的一条信息,其中条件属性c1表示磨屑流热辐射信号的均值,条件属性c2表示磨屑流热辐射信号的标准差,条件属性c3表示
34、AR(2)模型的一阶自回归系数,条件属性c4表示AR(2)模型的二阶自回归系数;ci=1表示属性值小, ci=2表示属性值大。决策属性d表示磨削工况,d=1表示工况正常,d=2表示砂轮磨钝,d=3表示工件烧伤。,2022/11/11,74,表6.9.1 磨削故障识别决策表,2022/11/11,75,表6.9.2 基于分类模式的决策表,根据式(6.9.1)对表6.9.1进行合并处理,所有条件属性值ci和决策属性值d都相同的样本元素约简为一个分类模式,将磨削故障识别的决策表转换为表6.9.2所示的只包含分类模式的决策表,该决策表中的每个元素代表一个分类模式,每个分类模式对应于样本空间的多个样本。
35、表中序号4、5对应的规则条件相同,但是决策不同,即: d4|C= d5|C, d4|D= d5|D,因此,决策表6.9.2是不相容决策表。,2022/11/11,76,十、主成分分析及独立成分分析,通过多个传感检测得到的设备状态信息彼此之间往往高度相关,尽管更多的信息可以减少系统状态的不确定性,提高诊断精度,但是大量的冗余信息也给故障分类带来了更大的复杂度。因此,消除信息冗余,提取对故障分类最为有效的特征以改善故障诊断系统的效率一直是人们追求的目标之一, 主成分分析(PCA,Principal Components Analysis) 和 独立成分分析(ICA,Independent Comp
36、onent Analysis) 就是其中两种较为有效的方法。,2022/11/11,77,对这两个相关变量所携带的信息进行浓缩处理。假定只有两个变量x1和x2,从散点图可见两个变量存在相关关系,这意味着两个变量提供的信息有重叠。,主成分分析的基本思想 (以两个变量为例),如果把两个变量用一个变量来表示,同时这一个新的变量又尽可能包含原来的两个变量的信息,这就是降维的过程,2022/11/11,78,椭圆中有一个长轴和一个短轴,称为主轴。在长轴方向,数据的变化明显较大,而短轴方向变化则较小如果沿着长轴方向设定一个新的坐标系,则新产生的两个变量和原始变量间存在一定的数学换算关系,同时这两个新变量之
37、间彼此不相关,而且长轴变量携带了大部分的数据变化信息,而,短轴变量只携带了一小部分变化的信息(变异) 此时,只需要用长轴方向的变量就可以代表原来两个变量的信息。这样也就把原来的两个变量降维成了一个变量。长短轴相差越大,降维也就越合理,主成分分析的基本思想 (以两个变量为例),2022/11/11,79,多维变量的情形类似,只不过是一个高维椭球,无法直观地观察每个变量都有一个坐标轴,所以有几个变量就有几主轴。首先把椭球的各个主轴都找出来,再用代表大多数数据信息的最长的几个轴作为新变量,这样,降维过程也就完成了。,找出的这些新变量是原来变量的线性组合,叫做主成分,主成分分析的基本思想 (以两个变量
38、为例),2022/11/11,80,主成分分析的基本原理,假定有样本X,每个样本共有p个特征,构成一个np阶的数据矩阵,2022/11/11,81,当p较大时,在p维空间中考察问题比较麻烦。 为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的。,主成分分析的基本原理,2022/11/11,82,定义:记x1,x2,xP为原变量指标,z1,z2,zm(mp)为新变量指标,系数lij的确定原则: zi与zj(ij;i,j=1,2,m)不相关;,主成分分析的基本原理,20
39、22/11/11,83, z1是x1,x2,xP的一切线性组合中方差最大者,z2是与z1不相关的x1,x2,xP的所有线性组合中方差最大者; zm是与z1,z2,zm1都不相关的x1,x2,xP, 的所有线性组合中方差最大者。 则新变量指标z1,z2,zm分别称为原变量指标x1,x2,xP的第1,第2,第m主成分。,主成分分析的基本原理,2022/11/11,84,从以上的分析可以看出,主成分分析的实质就是确定原来变量xj(j=1,2 , p)在诸主成分zi(i=1,2,m)上的荷载 lij( i=1,2,m; j=1,2 ,p)。 从数学上可以证明,它们分别是相关矩阵m个较大的特征值所对应的
40、特征向量。,2022/11/11,85,主成分分析的计算步骤,1 计算相关系数矩阵 rij(i,j=1,2,p)为原变量xi与xj的相关系数, rij=rji,其计算公式为,2022/11/11,86,2 计算特征值与特征向量 解特征方程,常用雅可比法(Jacobi)求出特征值,并使其按大小顺序排列 ;, 分别求出对应于特征值的特征向量 ,要求 =1,即,其中表示向量 的第j个分量。,2022/11/11,87, 计算主成分贡献率及累计贡献率 贡献率,累计贡献率,一般取累计贡献率达85%95%的特征值所对应的第1、第2、第m(mp)个主成分。, 计算主成分载荷,2022/11/11,88,第6
41、章 状态识别方法的原理,近邻决策算法,贝叶斯(Bayes)分类法,2022/11/11,89,机械故障诊断理论与方法,第2篇 基于人工智能的故障诊断技术,对比分析法,距离函数分类法,Fisher判别方法,势能函数分类法,基于粗糙集理论的诊断方法,主成分分析及独立成分分析,模糊诊断方法,故障树分析法,逻辑推理法,灰色理论诊断法,模型分析法,独立成分分析法(ICA,Independent Component Analysis)的历史,是90年代后期发展起来的,是盲信号处理的一种 。ICA是盲信号处理的一个组成部分,20世纪90年代后期(1986、1991)发展起来的一项新处理方法,最早是针对“鸡尾
42、酒会问题”这一声学问题发展起来的。,2022/11/11,90,独立成分分析的鸡尾酒会问题,鸡尾酒会问题: 从嘈杂的人声中提取所关心对象的声音。,ICA一种盲源分离的方法,2022/11/11,91,根据源信号的统计特性,仅由观测的混合信号恢复(分离)出未知原始源信号的过程,雷达、声纳、通信、语音处理、地震预报和生物医学等,“盲”,源信号不可观测,混合系统的特性事先不可知,盲源分离(Blind Source Seperation),独立成分分析,2022/11/11,92,信号的分离,盲源分离(Blind Source Seperation),2022/11/11,93,独立成分分析的模型与假
43、定,设某个混合系统由个k传感器和m个信号源组成,其混合模型可以表述如下: (6.9.2) 其中, 为了保证上式的可分解性。需有如下的假设限制(约束条件) : 1.每个源信号之间是统计独立的,其联合概率密度函数可分解为边缘密度的乘积。2.混合矩阵 ,为列满秩的矩阵,即rank( )= 。3.在 的分量中,服从高斯分布的分量不超过一个。,2022/11/11,94,由(6.9.2)可见,信号S放大 k 倍与A的相应列缩小k倍的结果相同,从而决定了ICA得到的信号存在强度的不确定性。为此, 在求解时往往把观测信号先转化为有单位协方差的信号,即在ICA之前先有一个白化过程。,设信号向量y的联合概率密度
44、为p(y),而每一个信号成分的概率密度为p(yi),则信号向量的互信息可以表示为:,当各个信号成份相互独立时, 则 I(y)=0 。,p(y)=Mi=1p(yi),2022/11/11,95,ICA的目的是:在我们不知道混合矩阵的情况下,寻找线性映射w,从观测信号中提取不能被直接观测的原信号,这里把它记为: y=wx=wAs,2022/11/11,96,(1)互信息极小判据,互信息极小简化成了四阶累积量最大,从而可以通过对四阶累积量的计算,实现独立成份的分离。,(2)信息极大判据,理论分析表明, 如果把完成ICA的过程用一个运算网络表示,并在此网络的输出端, 引入相应的信源的累积分布函数为变换
45、函数的一个非线性环节, 则的熵最大就等效于式(6.9.3)互信息极小 。,独立成分分析的基本理论(目标函数),(6.9.3),2022/11/11,97,(3)极大似然估计判据,当N足够大时,其对数似然概率收敛于它的期望 上式可改写为:,极大似然估计的目的是通过对观测模型式x=As进行估计,得到潜在的信号S,利用,即,可通过极大似然估计判据 提取独立成份,2022/11/11,98,(1) 成对旋转法 :利用Givens旋转,将信号中的独立成份两两成对旋转直到独立性判据目标函数收敛为止 。,(2) 固定点算法: (i)四阶累积量,(3)自然梯度学习算法,(ii) Newton法,常用独立成分分
46、析的算法,2022/11/11,99,原始信号 混合信号 ICA 分离信号,常用独立成分分析的例图,2022/11/11,100,从统计意义上将,主成分分析考虑的仅仅是二阶统计量,用于消除数据的相关性;而独立成分分析是基于信号的高阶统计特性,更进一步使数据独立。,主成分分析与独立成分分析的比较,2022/11/11,101,当征兆与状态之间,有一定逻辑上的联系时,可以通过征兆以推理方式判断机器的运行状态;其他诊断方法(如故障树分析法)也用到逻辑分析;,逻辑判别法分为物理逻辑判别和数理逻辑判别两种。,十一、逻辑推理法,2022/11/11,102,物理逻辑判断法是根据征兆与状态之间的物理关系,进
47、行推理诊断。典型的方法如润滑油污染分析,通过光谱、铁谱、磁塞或磁棒方式,分析设备润滑油中所含的金属微粒的情况,作为机械设备运行的征兆,根据机器运动部分有关零件的材料与成分,就可从微粒变化情况推断出设备的磨损和零件的磨损情况。,数理逻辑判断法根据征兆与状态之间的数理逻辑关系(即布尔函数),在获得征兆后,按照逻辑代数运算规则,判别工况状态。,2022/11/11,103,用颜色来描述工程系统,可以分成三类:一是白色系统,是指因素与系统性能特征之间有明确的映射关系,例如物理型系统,它有确定的系统结构和明确的作用原理;另一类系统是黑色系统,即人们对系统性能特征与因素间关系完全不知道,如时间序列分析建模
48、方法就是基于系统是一个黑箱,无需确知系统的输入,而是根据系统的观察值建模;实际的工程系统有的信息能知道,而有的不可能知道,称之为灰色系统。大多数运行的机械设备都具有灰色系统的特征。 故障诊断就是利用已知的信息去认识这个含有未知信息的系统特性、状态和发展趋势,并对未来作出预测和决策。,十二、灰色理论诊断法,2022/11/11,104,动态过程一般都可用数学方法描述,数学模型能最本质地表征动态过程规律,因此可根据模型结构或模型参数的变化,研究机器的运行状态;如 时间序列分析、模态分析、状态空间分析;,时间序列分析是根据观测数据建立的数学表达式。如果模型正确,则动态过程的基本规律、工况状态正常与异
49、常等重要信息必然蕴含在模型结构及其参数之中。其中特别是模型参数、残差平方和等特征量比较敏感。,十三、模型分析法,2022/11/11,105,时域模型分析及其在故障诊断中的应用, 动态过程十分复杂,从观测数据不能直接分析系统的变化规律-数学模型。, 动态过程状态的变化,反映在其数学模型的结构、参数和特征函数的变化。, 模型还可以用于对系统的未来状态和发展趋势进行预报和控制。,2022/11/11,106, ARMA模型的典型结构,自回归滑动平均(AutoRegressive Moving Average),模型简称ARMA模型,xt 1xt1 2 xt2 n xtn at 1at1 2at2
50、matm,2022/11/11,107,ARMA模型的条件:时间序列平稳、线性,当滑动平均部分为零-AR模型,n,xt i xt i a t,i 1,2022/11/11,108,x t 1 x t 1 2 x t 2 n x t n a t,AR(n)模型:,当 t = t+1,有1步预报:,x t 1 1 x t 2 x t 1 n x t n 1 0 x t (1 ),依此类推,当 t = t+m 时,有m步预报:,x t ( m ) x t m 1 x t ( m 1) 2 x t ( m 2 ) n x t n m,当 t = t+2,有2步预报:, 1 x t (1) 2 x t