《第五章机组故障诊断原理及方法.docx》由会员分享,可在线阅读,更多相关《第五章机组故障诊断原理及方法.docx(39页珍藏版)》请在三一办公上搜索。
1、第五章 水电机组故障诊断原理及方法第五章 水电机组故障诊断原理及方法2.1故障诊断的概述故障诊断是根据在线监测所获得的信息结合机组已知的结构特性和参数,以及环境条件,结合机组的历史记录,对机组可能要发生或已经发生的故障进行预报和分析、判断,确定故障的性质和类别、程度、原因、部位,指出故障发生和发展的趋势及其后果,提出控制故障继续发展和消除故障的调整、维修、治理的对策措施,并加以实施,最终使机组恢复到正常状态。故障诊断的重要任务就是查找故障原因,包括系统层次间的纵向成因、子系统之间的横向成因、间接成因和外部成因。水电机组上不同部位、不同类型的故障,引起机组功能上不同的变化,导致机组整体及各部位状
2、态和运行参数的不同变化。水电机组故障诊断系统的任务,就是当机组某一部位出现某种故障时,要从状态及其参数的变化推断出导致这些变化的故障及其所在部位。由于故障诊断系统从在线监测系统获得的状态监测量的数据十分庞大,因此系统必须先在原始数据中找出反映机组故障的特征信息,即提取机组特征量,才能有效的对故障进行诊断。水电机组的故障诊断模型如图5-1所示。图5-1给出了水电机组诊断的模型,图中H(f)/h(t)是机组时域或频域的传递函数。机组故障诊断中,系统的输出状态向量是机组异常或故障信息的重要载体。在机组诊断中,要综合考虑工作介质、环境,系统特征以及系统行为状态。对于图5-3的机组诊断模型来说,其关键和
3、核心部分就是“综合诊断”。水电机组故障诊断系统的内容包括状态检测、故障诊断、趋势预测。其过程可分为:(1) 信号输入 水电机组的故障诊断系统是水电机组在线监测系统的上位系统,诊断的发生,需要从下层系统获得表征机组运行状态的特征参数,即获取机组故障征兆,如机组的振动和摆度。(2) 信号处理 由监测系统输入的信号,必须经过一系列的处理。对输入信号进行分类、去噪滤波,然后提取特征征兆。水电机组在运行过程中产生大量的噪声,同时定转子的强大电流在水电机组周围形成很强的电磁场,这些都对在线监测系统的采集数据有影响。对故障诊断有用的信息可能隐藏在被噪声严重污染的原始信号中,要使诊断结果有效,必须对原始信号进
4、行处理。(3) 状态识别 将经过信号处理后获得的机组特征参数与规定的允许参数或判别参数进行比较、对比以确定机组所处的状态,是否存在故障以及如果存在故障,故障的类型和性质等。这需要制订相应的判别准则和诊断策略。(4) 诊断决策 经过状态识别,判断出机组的状态,然后根据一定的规则,给出应采取的对策和措施,同时根据机组当前的状态信号预测机组状态可能发展的趋势。 水电机组系统构造H(f)/h(t)输入X(f)输出辅机部分发电机部分水轮机部分 x(t)机组行为状态的检测与评价机组系统特征的检测与评价工作介质、环境的检测与评价综合诊断图5-1水电机组故障诊断模型水电机组的故障诊断技术的分类很多,其中主要有
5、以下几种。(1)按照诊断环境可以分为在线诊断与离线诊断在线诊断一般是指对现场正在运行的水电机组进行自动实时诊断,这类诊断一般用于大中型机组。离线诊断是指通过磁带记录仪或其它存储记忆设备将现场的状态信号记录下来,结合机组状态的历史档案资料,作离线分析诊断。(2)按照所利用的状态信号的物理特征进行分类振动诊断法(振动诊断技术),以平衡振动、瞬态振动及模态参数为检测目标,进行特征分析、谱分析和时频分析以及其它方法。声学诊断法,以噪声、声阻、超声为检测目标,进行声级、声强、声谱分析。温度诊断法,以温度、温差、温度场、热象为检测目标,进行温变量、温度场的识别与分析。对于轴承诊断,采用温度诊断法。压力检测
6、诊断法,以机组系统中的气体、流体的压力作为信息源,在机组运行过程中,通过压力参数的变化特征判别机组的运行状态。噪声检测诊断法,以机组运行中的噪声作为信息源,在机组运行过程中,通过噪声参数的变化特征判别机组的运行状态。这种方法易受环境噪声的影响,诊断可靠性不高。表面形貌诊断法,这种诊断方法以裂纹、变形、斑点、凹坑、色泽等为检测目标,进行裂纹破损、空蚀磨损的现象分析。(3)按照诊断目的分功能诊断和运行诊断功能诊断是针对新安装或刚修复后的机组或部件,诊断机组的性能是否正常,按诊断的结果进行调整修复。运行诊断是针对正在运行中的机组或部件,进行运行状态的监视,对故障的发生、发展进行早期诊断。(4)按照诊
7、断的要求分为定期诊断和连续诊断定期诊断是指每隔一定时间对水电机组进行检查和诊断,这种诊断方式是计划检修的内容。连续诊断就是对机组运行状态进行连续监测、分析和诊断。(5)按照诊断的途径分为直接诊断和间接诊断直接诊断是根据水电机组的关键部件的信息直接确定其状态,如轴承间隙、叶片裂纹、大轴不同心等。直接诊断受到机组结构和工作条件的限制而无法实现。间接诊断是通过二次诊断信息来间接判断机组中关键部件的状态变化,如水导摆度、振动等。(6)按照诊断方法原理分为频域诊断法、时域诊断法、模式识别法等频域诊断法,应用频谱分析技术,根据机组信号的频谱特征的变化,判别机组的运行状态和发生故障的形成原因。目前,大多采用
8、这类诊断方法。时域诊断法,应用时间序列模型及其有关的特性函数,判别水电机组工况状态的变化。统计分析法,应用概率统计模型及其相关的数学模型和特征函数,对机组的运行状态进行监视和故障诊断。模式识别法,利用检测信号,提取对机组运行工况状态反应灵敏的特征参数向量构成机组模式矢量,然后利用适合的分类,判别机组运行状态。分形诊断法,从水电机组的行为出发,研究水电机组这一复杂的机械系统的分形参数对不同故障的敏感性,建立系统层次上的分形诊断法。信息理论分析法,利用信息理论建立的某些特性函数在机组运行中的变化,对机组运行状态进行判别和故障诊断。人工智能诊断,应用目前的人工智能技术,对机组运行状态进行识别和故障诊
9、断。以上只是给出了水电机组故障诊断的一般分类方法,除此之外,还可以有其它分类方法。水电机组的故障诊断同其它设备的故障诊断不同,表现为故障的多源性,故障的传播性,故障的非线性。2.2故障信息与故障特征参量上一节,我们给出了水电机组故障以及故障诊断的概念和分类,并简述了机组故障诊断的几个实施步骤。信号检测和特征提取是诊断中的两个重要的环节。机组在运行中,系统参数偏离了正常状态就可能出现故障,表征它的特征向量也会变化。只要故障存在,这种故障信息就会通过特征参数表现出来。因此,以信息量作为出现故障的量度,就可以对机组状态进行诊断。2.2.1故障信息故障源发出的信息是通过系统的特征和状态来传递的。信息源
10、发出的如果仅是一种确定状态量,表征它的特征就不会携带任何有用的信息。换言之,也就是故障信息源含着某种不确定性。这种不确定性与故障信息源所包含的随机事件的可能状态数及每种状态出现的概率有关20。设机组的运行的状态集合为X(x1,x2xn),每种状态对应的出现概率为P(xi),则故障信息源的概率空间为P(X)。且有。对于状态概率和故障信息源的不确定性一般表现为以下几点:(1)离散故障信息源的概率空间为等概率分布时,这种信息的不确定性为最大。(2)信息的不确定性与故障信息源概率空间的状态数及其概率分布有一定的相关性。(3)当故障信息源的概率空间等概率分布时,信息的不确定性与可能的状态数有关,当机组运
11、行的状态数越多,相应的概率越小,机组的不确定性越大。对于信息源的不确定性,哈特莱研究确定了用信息源概率的倒数来度量。 (5-1)以信息量来作为信息多少的度量,将信息量定义为:不确定的减少量。换言之,系统的信息量就是系统前后接受的信息不确定性程度的减少量。这种是因为收到信息前后的概率空间的改变。称收到信息前的概率为先验概率P(y),收到信息后的概率为后验概率。以X表示收到的信息量,不确定性为:H(y/x)=H(P(y/x) (5-2)式5-2中P(y/x)表示后验概率,于是信息量根据定义为:I=H(y)-H(y/x) (5-3a) =H(P(x)-H(P(y/x) I= (5-3b)故障信息通常
12、来源于两个方面,一是故障模式类别属性构成的信息源,它为系统的可能故障和这些故障类别的出现概率所构成的,我们把它称之为故障模式信息,二是故障样本特征属性构成的信息源,称之为故障特征信息源,由故障特征和故障特征的概率分布函数所构成的20。设E=,P是故障模式概率空间,其中是故障模式类别集合 i(I=1,2,m),m是故障类别数。各故障的先验概率为P(i),满足: (5-4a)设F=X,P(X)为样本概率空间,P(X)是定义在F下的样本特征概率密度函数,满足: (5-4b)水电机组是一个比较复杂的系统,可以分成很多子系统或许多亚层系统。故障信息源可以是多个子系统子故障源的组合,也可以是多个亚层系统亚
13、故障源的组合。不同子系统的故障源对外表现为一个整体,因此,故障总是从某个子系统传递出来的。也就是说,当机组中的某个子系统出现故障,即使系统的输入正常,但是系统的输出必然异常,产生异常征兆。异常信息总是以两种形式向外传递,即层内传递和层间传递。层内传递是指异常信息作为同一层次的其它相连系统的输入,而引起相连系统的输出异常以至故障。层间传递是指低层的子系统出现故障后,其异常的输出征兆输入到上层系统,引起上层系统的输出异常或出现故障。通常,机组的故障信息的传递是这两种方式的相互作用的结果。故障信息传输定理:故障信息在传播过程中,通过某一层的子系统前的信息量总要大于通过子系统后的信息量20。2.2.2
14、故障信息特征对于某一确定故障类型,应该关注的是:这类故障是通过那种物理量表现出来的,而且与其它量之间有什么样的关系。当机组运行状态发生变化时,相应的机组的各参数之间的关系也在变化。但是最主要的,是当这些参数随着运行状态的改变而改变时,表征某一故障类型的物理量是否也在改变。对于表征机组的各参数,应从中选出灵敏度高的物理量作为某类型故障的特征。因此,有如下的定义:能对机组的运行状态进行定量描述的因素称为机组故障诊断中的特征参数,简称特征。在进行机组状态监测与故障诊断时,首先必须确定适合的特征参数,用于定量的表征机组运行状态的变化。选择适合的特征是诊断成败的关键。故障诊断的前提就是有一定数量的故障特
15、征能反映故障信息。当故障特征信号为静态信号时,特征信号就是征兆。当故障特征信号为动态信号时,先根据情况选择能反映系统功能指标,又便于测取的特征信号组,然后通过对特征信号分析提取便于决策的征兆。水电机组的故障类型很多,对于某一确定的故障类型,可能有一种征兆,也可能有多种征兆,同时每种征兆可能对应着一个或多个原因。它们之间的关系式为:F=f(a1,a2,an) (5-5)式中F故障类型a1,a2,an故障征兆或故障原因。故障诊断就是确定F与a1,a2,an之间的对应关系f。已知故障F的发生来寻找故障发生的原因,或者通过检测故障征兆a1,a2,an推断确定故障F。特征参数分类:按测量对象划分,特征参
16、数包括加速度、速度、温度、位移、压力、应力、电流、电压、功率、效率等。按特征抽取方法分为:幅域参数(峰值、有效值、裕度、脉冲指标等),时域参数(时序模型参数、特征根、倒谱参数、相关分析参数等),频域参数。众所周知,对于水电机组而言,某种故障类型发生所能引起变化的物理参数很多,但是可用作故障特征的参量有限。实践证明,选取故障特征参量可遵循以下原则:(1)高灵敏性水电机组系统状态的微弱变化可引起故障特征参量的较大变化。用指标灵敏度来度量特征参数对机组运行状态变化的敏感程度。设特征参数X(n)对机组运行状态Y的灵敏度为 (5-6)式中为特征参数X的变化引起状态参数Y的改变量的大小。实际运用中,为了避
17、免灵敏度的变化方向影响特征参数的评价,在机组故障诊断中对灵敏度取绝对值。 (5-7)通常机组状态参数和特征参数之间存在单调性,随着故障程度的增加,特征参数也呈上升趋势。(2)高可靠性故障特征参量是依赖于机组系统的状态变化而变化的,表征这一指标的是特征参数的稳定性。稳定性的定义是指特征参数受测试条件(采样频率、采样时间长度、采样起始位置、测试仪器的灵敏度等)和机组工作条件(负荷、转速等)影响的大小。特征参数X的稳定度 (5-8)式中是指各种条件的变化对于机组故障诊断系统,特征参数的稳定性越高越好。(3)具有可实现性机组故障诊断系统必须具有可实现性,因此选择的故障特征参量也必须具有可实现性。故障特
18、征参量的可实现性是一个有一定内涵的定义。首先,可实现性是指该特征参量可以有相应的仪器将之检测出来。其次,可实现性是指该特征参量在故障诊断计算中可以被实现。对于监测与诊断系统,系统的性价比是一个比较重要的问题,选择适当的特征参量,减小测试量和计算量有助于降低监测与诊断的费用。因此,故障特征的选择就是在已有的N个特征参数中依据以上的原则挑选出m个特征参数,组成某种函数准则下最优特征子集。该特征子集既保留了原特征集的物理意义,又减小了特征参数之间的相关性的大小。由于水电机组故障诊断中所采用的特征参数较多,因此,很有必要对机组的特征参数进行特征选取,减少特征参数的测量、信号采集传输通道数量以及信息存储
19、空间和信息处理时间。规则5-1 将特征参数X和模式分类结果y组成的样本集作为BP网络的学习样本,对网络进行训练,设Wi,q和Wk,q分别为与特征参数Xi,Xq对应输入单元与隐层单元q之间的连接权系数: (5-9)如果下式成立: (5-10a)则特征参数Xi的灵敏度比Xq的灵敏度大,即: (5-10b)也就是说明特征参数Xi的分类能力比特征参数Xq的分类能力大。特征参数的选择涉及所有可能的特征集,于是这个问题转化为搜索最优组合问题。但是最优解的搜索计算量太大,通常无法进行穷举搜索,所以工程应用中,常用的方法有前向贯算法、后向贯算法、分支界限算法等。所谓的前向贯算法是指由底向上进行搜索处理过程的一
20、种算法,先从空集开始,挑选一个最优特征值作为第一个,随后每一个步骤的下一个特征从剩下的特征中选取,挑选出来的特征一起获得准则函数的最佳值。相对而言,后向贯算法是从顶向下的一个处理过程。从已有特征集中先删去一个特征值,每一步删去的特征值是使得准则函数值降低到最小的特征值。分支界限法是一种树搜索方法。它的搜索方案是沿着树自上而下,从右至左进行,由于树的每一个节点代表一种特征组合,于是所有可能的组合都考虑在内。因为利用了可分性判据的的单调性采用了分支定界策略,使得在实际上并不计算某些特征组合而又不影响全局寻优,同时因为搜索从结构简单的部分开始,所以这种特征选择算法效率最高,而这种方法称为分支定界法。
21、2.2.3故障特征的提取随着机组运行安全性要求的日益提高,对故障诊断的要求也日益增加。机组结构的日趋复杂,故障类别愈来愈多,反映故障的征兆也相应增加。在机组故障诊断过程中,为了提高诊断的准确度,总是要求采集尽可能多的样本,以获得足够的故障信息。同时,样本数的增加又带来另一个问题,即大量样本占用大量存储空间和计算时间,而目前的计算技术和硬件存储的能力是有限的。如果采用神经网络选取特征信息,过多的特征输入也会引起样本训练过程中耗时费工,甚至会影响训练网络的收敛,影响分类精度。综上而述,从大量的采集样本中提取对故障诊断有用的信息是十分必要的,而这一过程则称为故障的特征提取。水电机组总是运行在噪声、电
22、磁干扰等环境中,故障信息总是混杂在大量干扰信号中,于是怎样在大量原始采集信号中提取适合机组故障诊断系统的信息就是水电机组故障诊断系统的特征提取。定义:机组原始信息为n维向量X(n)=x1,x2,xn ,经过降维为向量Y(m)=y1,y2,yn,mn,向量Y含有向量X的主要特性,向量X降维向量Y叫做特征提取。特征提取的方法有很多,常用的有主元特征提取法,神经网络提取法,模糊优化处理的特征提取法,小波分析的特征提取法,最小误判概率的特征提取法,离散K-L变换的特征提取法等等。(1)小波分析的特征提取方法小波分析是为了弥补付里叶变换的不足而发展起来的,是一种全新的数学工具。在信号处理上,小波将信号分
23、解在不同尺度上,分解后的信号是在时间尺度的相平面上。由于小波变换后的结果是在尺度和时间平面上,尺度和时移参数对信号的突变有自适应性,高频处时间窗长,而低频处时间窗短。实际中高频常表现出为信号突变处的频率,它含有故障的大部分信息,所以小波变换可应用在对故障特征的提取上。水电机组的故障诊断系统是一个复杂的系统,其含有多个子系统,并具有多层次性。水电机组的主要部件为水轮机及发电机,水轮机的工作介质为水,其运动特性就很复杂,所以表现出的故障也很复杂,应用小波分析可很好地提出故障信号中的特征参数。水电机组的故障中,发生频率最高,影响最大的故障是振动故障。因此,振动故障的诊断就成为机组故障诊断系统中最重要
24、的部分。水电机组的振动类型多,振源多,振动机理复杂,振动具有渐变性和不规则性。影响机组振动的因素主要有机械、水力以及电磁。机械方面的原因有转动部件不平衡、固定部件与转动部件的碰磨、导轴承间隙过大、推力轴承调整不良等等。水力原因有卡门涡引起的中高频压力脉动、叶片进口水流冲角过大引起的中高频压力脉动、尾水管内的漩涡流引起的压力脉动等等。对于机组表现出来的振动,有可能是上述某一原因引起的,也有可能是两种或两种以上原因耦合引起的。因此,采集系统的原始信号的提取对于后续诊断就显得很重要。设向量a=a1, a2, a3,an-1, an代表机组的原始几何参数,如转轮直径,导叶数等。设矩阵B=b1, b2,
25、 b3,bm-1, bm表示引起机组振动的主要源及其频率,b1, b2, b3,bm-1, bm是二维向量。对于水电机组可写出矩阵B的基本表达式。b1,1 b1,2 b1,3 b1,4 b1,5 b1,6 b1,7 b1,8 b1,9 b1,10 b1,11 b1,12 b1,13B0= b2,1 b2,2 b2,3 b2,4 b2,13 矩阵中的元素值b1,1 b1,2以及b2,1 b2,2其值为表5-1: 表中f0是机组转频。 (5-11)fw表示的是低频涡带频率,涡带频率与转速以及转轮的几何尺寸有关。对于不同型号和容量的机组,其涡带频率都不一样,它的一般计算公式为: (5-12)表5-1
26、 机组故障的特征大轴有折线质量不平衡不同心摩擦转定子间隙不匀转子不圆定子不圆转子动不平衡低频涡带叶片卡门涡导叶nf0nf0nf0nf0nf0nf0100Hznf0fwfyfkfd式5-12中的S是计算系数,可以由机组参数计算出来。fy=Z叶f0,Z叶是叶片数。fd = Z导f0,Z导是导叶数。设向量=x1,x2,xk为机组监测系统数据库的数据,即采集系统采集的机组振动信号。机组振动的一般监测点有顶盖,水导,上导,上机架,下机架,定子铁心,推力轴承支承架,大轴法兰连接处,对于不同的机组监测系统除了上述点之外可能还有其它监测点。从不同监测点采集的信号作为向量的元素值,向量表示了机组振动的原始信息。
27、设采集频率为0,采样长度为2M,最高频率为max=0/2,序号为i的小波包分解对应的频带是(imax/2N,(i+1)max/2N)。应用小波包对向量进行分解,也就是分别对向量元素x1,x2,xk进行分解。xi代表第i通道振动采集信号,该信号受现场的各种干扰,含有大量的噪声。对xi分解后,xi信号就分解到不同频段,每一频段对应着不同的特征频率。噪声信号一般为高频,而且在高频段分布比较均匀,因此对高频段小波包变换系数进行阈值处理可以有效地去噪。小波包对信号的分解以2的级数分解,对向量进行J层分解,则向量的每一元素对应着2J2M-J的小波包分解系数矩阵。引入矩阵B0的行向量b2,m,并且设(b2,
28、m)为机组振动的诊断特征向量。对于行向量b2,m 的值,对应着信号分解系数矩阵的某一子矩阵。如:行向量B0中b2,7=100Hz,对应着信号xi分解系数矩阵的某一子矩阵,在频域图上表示为中心频率为100Hz的频段。做记号D为信号xi的分解系数矩阵,Di,m为特征频率b2,m对应的信号xi的系数矩阵的子矩阵,R(D)表示对系数矩阵重构,si表示信号xi的重构信号。诊断特征向量(b2,m)就可表示为:(b2,m)= m=1,2,13 (5-13)对于对应着特征频率的振源,即矩阵B0的行向量b1,m的特征信号可以表示为:P(b1,m)= (5-13)经过上述特征提取之后,对应的诊断特征向量(b2,m
29、)就可以表征机组振动的真实情况。这一诊断向量可以被后续的诊断系统获取,进行故障识别。利用小波包进行故障诊断过程可以表示为: 信号采集 小波包分解 特征提取 故障识别。(2)基于BP神经网络的特征提取神经网络从出现到目前,已经应用到了许多领域。利用BP网络的高分辨信息压缩的非线性映射的特点,可以将BP网络应用在故障特征的信息提取上。设BP神经网络的隐层的输出为,则当网络收敛后,隐层k单元的输出为: (5-14)k=1,2,n,为输入单元I与隐层单元k之间的连接权。输出层第j单元的输出为: (5-15)j=1,2,N,为阈值,为隐层单元k与输出层单元j之间的连接权。上面两式实现了从输入层到输出层之
30、间的非线性映射,隐层的输出值代表了输入层原始特征空间的特征。基于神经网络的特征提取一般有如下步骤:a. 对原始特征进行归一化处理。b. 选择BP网络的模型结构参数,输入和输出单元数等于原始特征参数的维数。c. 选择合适的神经网络学习参数,以保证较高的收敛精度。d. 利用误差反向传播法对BP网络进行训练。e. 将原始特征参数的所有样本输入已训练好的BP网络,进行前向计算,求出BP网络第一隐层各单元的输出值,得到所提取的新特征参数。(3)主元特征提取法有限离散K-L变换,又称为Hotelling变换或主分量分解,它是一种基于目标统计特性的最佳正交变换。其变换后产生的新的分量正交或不相关,以部分新的
31、分量表示原矢量均方误差最小,使变换矢量更趋确定,能量更趋集中。设有特征集X和Y,X和Y之间的线性变换可表示为:Y=AX式中A为变换矩阵。特征集X和Y的均值矢量,相关阵Rx=EXXT,RY=EYYT,协方差阵,。将X与Y用转置矩阵表示为:YT=XTATE(YYT)=AE(XXT)ATRY=ARxAT 式中RY为角矩阵,RX为实对称矩阵,A是正交矩阵,从而非负矩阵RX有n个正实特征根,它们组成对角阵RY,即: (5-16)选择前面m个最大特征对应的特征矢量构成m维空间。比值,反映了特征集Y中第i个分量对整体方差的贡献,比值越大,说明该分量越重要。一般选择m使: (5-17)该式的详细说明可查阅参考
32、文献8。对于K-L变换的详细过程可查阅参考文献24。(4)基于互信息熵的特征提取熵在信息论中表示不确定性,不确定性越大熵越大。机组采集信号中的信息具有不确定性,这是诊断所需求的。对于m类问题,设给定的X的各类后验概率为:,那么熵的定义是: (5-18)对于式中logpi,当pi=0,。熵具有以下性质:(1)H(X)0,当且仅当存在,有p=1,i,pi=0时等号成立,也就是说确定概率场熵最小。(2)等概率场熵最大。(3)熵函数是p的对称的上凸连续函数。对信息进行分类和特征提取,必须有一个准则,因此取熵的期望作为类别可分性的判据。 (5-19)根据上式,构造一个广义的熵定义: (5-20)上式中a
33、是一实的正参数,a1。对于不同的a就有不同的度量。当,称之为Shannon熵 (5-21a)当a=2,称之为平方熵 (5-21b)上面给出了熵的定义和熵可分类判别的准则,下面开始论述利用熵提取故障特征。利用互信息熵进行特征提取,就是在由给定的n个特征值的集合X,寻找一个具有最大互信息熵或最小特征条件熵H(xi/E)的集合:X=x1,x2xk,kn。最大互信息熵是由系统熵和后验熵确定的,一般而言,系统熵是确定的,因此后验熵越小,则互信息熵就越大,。后验熵为H(E/F): (5-22)计算后验熵,就要估计概率分布,这一过程的计算比较复杂。如Fisher的线性辨识方法。因此。需要近似的估计后验熵。为
34、了简化计算,将样本的平均分布近似为故障类别的平均分布,于是后验熵近似为: (5-23)式中是样本集和对于条件概率的估计,利用Parzen分布 (5-24)条件化的归一化表达式为 (5-25)在一定的初始条件下,识别样本的后验熵是确定的,随着特征优化,特征删除的过程中,就会有信息的损失,使后验熵增大。利用熵提取特征的步骤为:(1)令原始特征集和为SK=N。(2)计算H(E/S)。(3)SK=N-1,计算H(E/S)。(4)选择优化特征集合:以递减的集合的后验熵为依据,选择具有最小后验熵的特征向量集和为最优特征集合。(5)输出最优特征集合。2.3常用的诊断理论和识别方法故障诊断的核心是运行状态的识
35、别、故障模式的识别。识别的方法很多,有统计识别法、函数识别法、逻辑识别法、模糊识别法、灰色识别法、神经网络识别法、对比分析识别法、故障树分析法等。2.3.1对比分析识别法在故障机理的研究基础上,通过计算分析、实验研究、统计归纳等手段,确定与有关状态的特征作为标准模式,在水电机组运行过程中,选择某种特征量,根据变换规律和参考模式对比,用人工方法进行判别。在机组运行过程中,常采用频谱仪分析振动信号幅值谱的谱峰和频率位置的变化,与标准对比,可以判别运行工况的正常与异常,识别某些故障的原因。这类方法依据于两个条件:一是运行人员的技术水平,要求技术人员具有扎实的基础知识、较宽的专业知识面、能够灵活使用测
36、试仪器;二是对机组参数和机组运行历史有一定的了解。2.3.2统计识别法机组诊断系统的输入信号、输出信号都具有随机性,从被测信号中要提取特征信号时采用统计识别法能反映出被诊断对象的实时状态。统计识别法对机组进行诊断有四个步骤:信号测量、特征提取、建立标准特征库、比较识别。四个步骤里面的比较识别也被称为门限识别或聚类分析,就是将被诊断对象的实时信号提取出来的特征元素与标准库中的正常状态模式进行对比,根据相应集合接近的程度给出诊断的结论。门限比较的基本算子为6: (5-26)D为故障变量,是一个逻辑值,当出现故障时为1,没有故障为0。门限值 l提取的特征元素。K由试验数据统计或理论分析计算确定的标准
37、库中的特征元素。单位阶跃函数 0 x0(5-27)= 1 x0 当特征元素为n个特征参数组成的特征向量时,每个特征向量相当于在维特征空间中的一个点。按照一定准则,将这些特征向量点划分为若干个群,群代表状态。建立机组故障诊断的标准模式库时,通常是在已知机组的状态下获得特征向量的一批样本,求得各种状态下的特征点的聚类中心,将对应于这些聚类中心的特征向量作为标准模式,表示为:, (5-28)对于机组待检状态的特征向量KT与各聚类中心的距离d(Kj,KT)。如果下式成立, (5-29)则称待检特征向量Ki与标准模式特征向量KT最接近,待检状态归入状态Di.。中心距离d函数是进行识别的关键,常用的距离函
38、数有欧氏距离、加权欧氏距离、马氏距离、广义距离、相似性指标、信息距离等。(1)欧氏距离在欧氏空间中,设矢量,,两点距离越近,表明相似性越大,可认为是同一群聚域,或者属于同一类别,这种距离称之为欧氏距离。 (5-30)式中,Z为标准模式矢量,X为待检模式矢量,为矩阵转置。欧氏距离简单明了,不受坐标旋转、平移的影响。为避免坐标尺度对分类结果的影响,在计算欧氏距离之前先对特征参数进行规一化处理: (5-31)式中的xmin,xmax是特征参数的最小值和最大值。(2)加权欧氏距离因为特征向量种的各分量对分类的作用不同,所以采用加权方法。加权欧氏距离是对欧氏距离的一种改进。构造的加权欧氏距离为: (5-
39、32)式中W是加权系数矩阵。加权欧氏距离中的加权系数矩阵W的计算方法很多,根据不同的取值方法有不同的距离函数,如马氏距离函数。(3)马氏距离(Mahalanobis Distance)马氏距离是加权欧氏距离的一个距离函数,它的加权系数矩阵W取值为R,R是X与Z的协方差矩阵:马氏距离形式为: (5-33)马氏距离的优点是排除了特征参数之间的相互影响。(4)相似性指标相似性指标也是作聚类分析时衡量两个特征矢量点是否属于同一类的统计量。角度相似性指标(余弦度量) (5-34)或 (5-35)Sc是特征矢量X和Z的夹角的余弦,夹角为零取值为1,角度相似最大。(5)相关系数 (5-36)式中的分别为X,
40、Z的平均值。相关系数越大,表示相似性越强。(6)广义距离广义距离也是空间距离的一种,也被称为明氏距离。 (5-37)当q=1,上式称作绝对距离 (5-38)当q=2,就是欧氏距离。当q=,为切比雪夫距离。 (5-39)(7)库尔伯克莱贝尔(Kullback-Leiber)信息距离函数设X=(x1,x2,xN)为随机矢量,概率密度函数为P(x),它属于概率密度族函数中的一个,是参数矢量。 (5-40)库尔伯克莱贝尔(Kullback-Leiber)信息数(KL)是描述P(x)与G的接近程度,这种接近程度用下式表示: = = (5-41)由于 (5-42)当,KL信息量达到最小值,即 (5-43)KL信息量的实质是寻求接近P(x)的参数概率密度函数,使得I(P,G)达到最小。若P(x)代表参考模式的概率密度函数,G(x)是待检模式的概率密度函数,按照KL信息数可以比较两类状态的相似程度。根据不同的分类标准可以划分出不同类型的统计诊断方法。按照诊断要求和内容的不同可分为基本型、析因型和预报型三种类型。基本型只给出单一结论。析因型在基本型的基础上增加了故障原因分析。预报型除了基本型的功能外,增加了故障预报功能。基本型中的门限比较有类加法、逐项比较法以及综合法。类加法的公式为: (5-44)公式中的