《《数据驱动技术》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《数据驱动技术》PPT课件.ppt(20页珍藏版)》请在三一办公上搜索。
1、主讲人:徐浩,复杂工程和社会系统的智能数据驱动分类和过程预测,Kihoon Choi,Ph.D.,内容提要,背景及现实意义数据驱动技术与传统方法的比较本篇论文的研究方向SVM介绍致谢,随着科学技术、特别是信息科学技术的快速发展,企业的规模越来越大,生产工艺、生产设备和生产过程越来越复杂。相当数量的企业每天都在产生并存储着大量的生产、设备和过程数据,这些数据隐含着工艺变动和设备运行等信息。如何有效利用大量的离、在线数据和知识,在难于建立受控系统较准确机理模型的条件下,实现对生产过程和设备的优化控制、预报和评价,已成为当今迫切需要解决的问题。因此,发展数据驱动技术作为过程监控措施成为新时期的必然要
2、求,具有重要的理论与现实意义。,背景及现实意义,数据驱动技术与传统方法的比较,1、在HVAC系统中使用数据驱动技术来进行故障诊断和严重性估计;2、针对汽车系统智能故障诊断的数据降维技术;3、针对汽车系统中智能故障诊断的新颖的分类器融合方法;4、针对冲突和不稳定性分析的一种数据驱动分类和预测框架;5、在工程分析和社会系统将不同的诊断方法集成到一个快速样机平台上。,本篇论文的研究方向,数据驱动技术在HVAC系统的应用,一个离心机组和系统模型的图表,数据驱动技术在HVAC系统的应用,诊断过程综述1、故障检测:通过监测一个参数与其标称值的偏差数量/速度来执行,该例中我们采用GLRT方法;2、故障隔离:
3、模式分类技术:SVM;多变量统计技术:PCA和PLS;3、故障严重性估计:故障严重性估计是通过PLSR、SVMR和PCR算法执行的。,数据驱动技术在HVAC系统的应用,实时FDD策略的方框图,数据驱动技术在HVAC系统的应用,有噪声数据的FDD和严重性估计策略,数据驱动技术在HVAC系统的应用,有噪声数据的分类结果,数据驱动技术在HVAC系统的应用,有噪声数据的故障严重性估计结果,支持向量机简介,SVM方法是通过一个非线性映射p,把样本空间映射到一个高维乃至无穷维的特征空间中(Hilbert空间),使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题。简单地说,就是升维和线
4、性化。升维,就是把样本向高维空间做映射,一般情况下这会增加计算的复杂性,甚至会引起“维数灾难”,因而人们很少问津。但是作为分类、回归等问题来说,很可能在低维样本空间无法线性处理的样本集,在高维特征空间中却可以通过一个线性超平面实现线性划分(或回归)。,支持向量机简介,在一维空间中,没有任何一个线性函数能解决下述划分问题(黑红各代表一类数据),可见线性判别函数有一定的局限性。,支持向量机简介,如果建立一个二次判别函数g(x)=(x-a)(x-b),则可以很好的解决上述分类问题。决策规则仍是:如果g(x)0,则判定x属于C1,如果g(x)0,则判定x属于C2,如果g(x)=0,则可以将x任意分到某
5、一类或者拒绝判定。,支持向量机简介,一般的升维都会带来计算的复杂化,SVM方法巧妙地解决了这个难题:应用核函数的展开定理,就不需要知道非线性映射的显式表达式;由于是在高维特征空间中建立线性学习机,所以与线性模型相比,不但几乎不增加计算的复杂性,而且在某种程度上避免了“维数灾难”这一切要归功于核函数的展开和计算理论,支持向量机原理图,一个SVM分类器的原理图,支持向量机的最优分类面,SVM 是从线性可分情况下的最优分类面发展而来的,基本思想可用图2的两维情况说明。,图中,方形点和圆形点代表两类样本,H 为分类线,H1,H2分别为过各类中离分类线最近的样本且平行于分类线的直线,它们之间的距离叫做分
6、类间隔(margin)。所谓最优分类线就是要求分类线不但能将两类正确分开(训练错误率为0),而且使分类间隔最大。推广到高维空间,最优分类线就变为最优分类面。,支持向量机的特点,1、非线性映射是SVM方法的理论基础,SVM利用内积核函数代替向高维空间的非线性映射;2、对特征空间划分的最优超平面是SVM的目标,最大化分类边际的思想是SVM方法的核心;3、支持向量是SVM的训练结果,在SVM分类决策中起决定作用的是支持向量。4、SVM 是一种有坚实理论基础的新颖的小样本学习方法。它基本上不涉及概率测度及大数定律等,因此不同于现有的统计方法。从本质上看,它避开了从归纳到演绎的传统过程,实现了高效的从训练样本到预报样本的“转导推理”,大大简化了通常的分类和回归等问题。,支持向量机的特点,5、SVM 的最终决策函数只由少数的支持向量所确定,计算的复杂性取决于支持向量的数目,而不是样本空间的维数,这在某种意义上避免了“维数灾难”。6、少数支持向量决定了最终结果,这不但可以帮助我们抓住关键样本、“剔除”大量冗余样本,而且注定了该方法不但算法简单,而且具有较好的“鲁棒”性。这种“鲁棒”性主要体现在:增、删非支持向量样本对模型没有影响;支持向量样本集具有一定的鲁棒性;有些成功的应用中,SVM 方法对核的选取不敏感。,致谢,Thank you!,