《主成分分析法在热轧吨钢电耗回归预测模型中的应用.doc》由会员分享,可在线阅读,更多相关《主成分分析法在热轧吨钢电耗回归预测模型中的应用.doc(7页珍藏版)》请在三一办公上搜索。
1、主成分分析法在热轧吨钢电耗回归预测模型中的应用第31卷第1期2010年2月能源技术ENERGYTECHNOLoGYVo1.31No.1Feb.2010主成分分析法在热轧吨钢电耗回归预测模型中的应用曹阳.杨洁,张旭(同济大学暖通空调及燃气研究所,上海200092)摘要:根据热轧钢板生产的统计数据,初步确定影响热轧吨钢电耗主要因素是生产量,延伸系数,轧后厚度,轧后宽度,初始长度和轧制速度.采用主成分分析法对这些因素的统计数据进行处理和分析,得到了前3个主成分的表达式.并在这个基础上建立了热轧吨钢能耗的多元线性回归模型,通过与未经处理的原始数据建立的模型进行对比,证明主成分分析法分析后的模型具有良好
2、的预测效果.关键词:热轧吨钢电耗;主成分分析法;多元线性回归中图分类号:TG335.1;O212.4文献标志码:A文章编号:10057439(2010)Ol一0001-04ApplicationofPrincipalComponentsAnalysisinPowerConsumptionPerTonofHotRolledSteelRegressionForecastingModelCAOYang.YANGJie,ZHANGXu(HVACGasInstitute.TongjiUniversity.Shanghai200092,China)Abstract:Thispaperinvestigate
3、sthestatisticaldatacollectedfromhotrollingprocess,andpreliminarilydeterminesprimaryfactorsthatinfluencingpowerconsumptionpertonofhotrolledsteel,includingproduction.elongation,workpiecethickness,workpiece,initiallengthandrollingspee&ThemethodofprincipalcomponentsanalysisisappliedtOprocessandanaly
4、zethestatisticaldataaboutthesefactors,andmathematicalexpressionsofthefirstthreecomponentsareconcluded.Onthisbasis,thispaperestablishesamultiplelinearregressionmodeloftheenergyconsumptionpertonofhotrolledsteel,whichprovestOhaveagoodeffectofpredictionbycomparingwiththemodel1uiltonprimaryvariableswitho
5、utprocessing.Keywords:powerconsumptionpertonofhotrolledsteel;principalcomponentsanalysismethod;multiplelinearregression轧钢厂实行节能降耗是降低生产成本,提高经济效益的重要途径,热轧吨钢电耗作为热轧工序能耗之一,是一项体现轧钢综合能耗的重要技术经济指标.为了做好热轧生产过程中的节能降耗工作,除了减少设备空转和加强用电管理外1,更应从轧制钢材的工艺技术要求,产品规格等方面人手,深入探讨影响吨钢电耗的内在因素及其变化规律.采用热轧吨钢电耗模型可以分析这些因素和规律,但是影响吨钢电耗
6、的因素较多而且相互间存在着相关性,电耗模型采用主成分分析方法可以对输入变量中的信息重新进行综合筛选,从中选取具有最佳解释能力的新综合变量,用它们进行回归建模,可以在分析与解决问题中得到较满意的效果.本文将以某热轧轧钢厂为例,采用主成分分析法对其产品技术指标与生产数据进行分析与研究并以此建立吨钢电耗回归模型.基金项目:冶金能源系统基于产品能耗的最优化分析技术及全一1主成分分析自动煤气回收技术:o7da12oo7)主成分分析是一种多元统计分析方法,它通过?1?曹阳等:主成分分析法在热轧吨钢电耗回归预测模型中的应用线性变换从被考察的可能有一定相关关系的多个变量中综合出较少个互不相关的新变量,在数学变
7、换中变量的总方差保持不变.这些新的变量按照方差依次递减的顺序排列.方差最大的就是第一主成分;次大的为第二主成分,依次类推.设有原始样本7”/个,每个样本共有个变量,则构成了一个nXP的矩阵:X=:利用个变量构成少数几个新的综合变量,包含了原始变量的信息,定义的新变量z,Zz,Z3为原始变量的线性组合:f1一InX1+112x2+Z1pJZ2121Xl十122X2+.+z2pro,【1一Z1Xl+lm2X2+.+Zp其中,z,分别称为原始变量的第一,第二,第m个主因子,在总方差中所占比例最大,.,依次递减.系数称为新变量的因子得分,即把主成分表达成可观测变量的线性组合3一.根据主成分分析的基本原
8、理,其计算主有以下几个基本步骤:(1)对数据进行标准化处理,消除原始数据的量纲和数量级的影响,即:一(z一xf)/af(一1,2,7”/;J一1,2,夕)(3)(2)计算标准化数据矩阵x的相关系数矩阵,y又是的协方差矩阵,相关系数为:=去(一)/叩(4)”五=1(3)计算相关系数矩阵的特征值,由特征方程lRJ:=O求得特征值(一1,2.,户),并使其按大小顺序排列,它是确定主成分个数的依据,选取特征值大于1的新变量为主成分;然后分别计算出对应于特征值的特征向量(),要求显;一1,其中表示向量e的第个分量;最后计算主成分贡献率和累计贡献率.(4)计算主成分载荷值,它的大小反映了主成分因子对可观测
9、变量的影响程度,主成分载荷为:zff一/(5)然后对主成分包含信息给予合理的解释.?2,(5)计算因子得分矩阵得到因子得分函数,由此得到回归建模的新变量.2影响吨钢电耗因素的主成分分析2.1生产数据选取及影响因素的确定主成分分析采用的原始数据取自某热SkSk钢厂的计量数据库(数据统计中排除了因机组故障而停产等生产不正常情况),统计钢种为低碳钢薄板(宽11O01600mm,厚420mm),共65组数据样本,涵盖了不同工序的各个机组与设备(如热卷,剪裁,精轧等).本文通过对轧制生产指标与产品生产规格等数据的特点的分析,选定与热轧吨钢电耗Y有关的6个因素:轧制质量z,延伸系数z.,轧后厚度z.,轧后
10、宽度z,初始长度z.和轧制速度Xe.(1)轧件质量将成卷的原材料纵向剪切成所需宽度的卷料(轧件会损失一部分质量),轧件质量就是指钢坯轧后的质量.开卷机,纵剪机,张紧装置,收卷机等组成的生产线消耗一定的电力,当然与轧件质量的多少有关.(2)延伸系数由于钢坯经过加热塑性提高,变形抗力降低也影响吨钢电耗,变形量可以用延伸系数,即轧件最终长度与原始长度之比表示:一式中:为延伸系数;L为轧件最终长度,mmLo为轧件原始长度,mm.(3)轧件厚度在轧制过程中轧件的高,宽,长都发生变化,其中高度减少量叫做压下量,即:AhHh(7)式中:Ah为压下量,mm;H为轧件轧制前高度,inn1;h为轧件轧制后高度,m
11、m.轧制时轧件在高度方向受压,金属向长度和宽度方向流动即产生延伸和宽展,压下量愈大,相应的延伸和宽展也愈大.根据原始数据,由于轧件初始厚度基本为250mm,即H不变,因此用轧后的厚度h表示影响因素.(4)轧件宽度随着轧件宽度的增加,接触面积增大,变形区的金属在横向流动的阻力增加,导致宽展量减小.为了达到目标宽度,机组就需要增加单位轧制压力,相应要做更多的功,因此要消耗更多的电力.(5)轧件初始长度轧件的初始长度变化范围很大,在很大程度上影响着能耗的分布与变化.(6)轧制速度在本研究中,轧制速度表示为曹阳等:主成分分析法在热轧吨钢电耗回归预测型生廑每1min轧制的钢板数.轧制速度愈高,摩擦系数愈
12、低,从而能量的消耗减少l_4.2.2主成分分析过程按照主成分分析可以对影响吨钢电耗的因素进行评价.(1)对原始数据进行标准化后求出其相关系数矩阵引,如表l所示.表1相关系数矩阵-z11.000O.0100.0600.5970.6270.034X2O.0101.000一O.9410.138一O.U7一O.545X3O.0600.9411.000一O.0790.1240.519X40.5970.1380.0791.000一O.2190.117x5O.627一O.1170.124一O.2191.0000.002X60.034.0.5450.5190.1170.0021.000(2)解得相关系数矩阵的
13、特征方程计算特征值,由此计算主成分的贡献率和累计贡献率.根据表2,确定主成分的个数,第一,第二,第三主成分的特征值分别为2.407,1.773,1.172,均大于1.主成分贡献率分别为40.124,29.544,19.541,其累计贡献率为89.209,说明它们基本包含了以上6个指标的所有信息.其中,第一个主成分最重要,包含的信息最多,对吨钢电耗变化影响最大.表2特征值,贡献率及累积贡献率表主成分序号特征值贡献率累积贡献率%2.4071.7731.172O.5760.0580.01440.12429.54419.5419.5960.9620.233(3)计算各评价指标在主成分中的载荷值,见表3
14、.该表格是按照方差极大法对因子载荷矩阵旋转后的结果.从主成分载荷大小来看,与第一主成分密切相关的:是延伸系数,轧后厚度,轧制速度,它们与第一主成分的相关系数绝对值分别为0.949,0.936,0.732,因此反映了每块钢板的延伸体积的变化速度;与第二主成分密切相关的是轧后质量(O.994),反映了钢板生产率对吨钢能耗的影响;在第三主成分中,轧后宽度(O.769)与初始长度(一0.727)比例较高,反应了轧制前钢板在规格尺寸方面的影响作用,由于轧制过程中初态与终态的钢板宽度变化并不大,因此也反应了轧制接触面积的影响.表3主成分载荷值图1所示是公共因子碎石图.它的横坐标为公共因子数,纵坐标为公共因
15、子的特征值.可见前3个公共因子特征值变化非常明显,到3个特征值以后,特征值变化趋于稳定,因此提取3个公共因子可以对原变量的信息描述有显着作用.从表3也可以看出这样的结果.趔聋困蒜公共因子数图1碎石图(4)表4是因子得分矩阵,这是根据回归算法计算出来的因子得分函数的系数.表4因子得分系数表曹阳等:主成分分析法在热轧吨钢电耗回归预测模型中的应用根据这个表格可以得到下面的因子得分函数:f1一O?O04z10?4O22+.?一0?326z6l20.403x10.O03x2+.一0.084x6(8)【一0.390x10.O02x2+.+0.023x6计算求得新变量Z,z,Z3三个因子变量之间是正交,不相
16、关的.3多元非线性回归模型的建立与预测3.1多元线性回归模型以热轧吨钢电耗为自变量,采用原始65组未进行主成分分析的数据进行多元线性回归6,可得热轧吨钢能耗的预测模型:Y=:=一0.2752Xl一11.9923x2301.1860x3+7.0641x4+I.5571x516744.671lx6(9)同时,采用主成分分析后的新变量Z,z.,Z3进行多元线性回归,可得主成分分析后的热轧吨钢能耗预测模型:Y一一98.9827zl一4.2276z2+5.3282z3(1O)对于主成分分析前的原始数据多元回归模型(9)与主成分分后得到的多元回归模型(1O),将二者的回归吨钢能耗值与实际吨钢能耗值进行比较
17、得到的绝对误差曲线分别表示于图2中.样本序号图2主成分分析前后绝对误差曲线比较图由预测结果可以看到,主成分分析后建立的多元线性回归模型相对于未经处理的原始数据回归模型,其回归效果在精度上有很大的提高,这是因为主成分分析后可有效地减少变量的个数并降低建模的复杂性,由此证明主成分分析法在实际应用中具有良好的效果.3.2热轧吨钢电耗的预测通过上一节的分析可以发现,主成分分析后的含有三个变量的热轧吨钢电耗模型具有较好的精度,因此采用模型(1o)进行电耗预测.选取热轧厂数据库中的30组原始数据,通过计算得到预测值,并与实际生产电耗进行比较,结果见图3.毫耀释督图3预测值与实际值绝对误差曲线比较图由图3可
18、见,预测值与实际值两条曲线吻合的较好,其中预测值与实际值的最大绝对误差为4.85,最小绝对误差值为0.06,平均误差为2.39.可见主成分分析后的回归预测模型具有很好的精度与预测较果.4结论(1)主成分分析法和多元线性回归方法,可以有效地提取出原始数据中包含主要信息的综合因子,从而建立热轧吨钢电耗模型.(2)相对于由原始数据建立的多元线性回归模型,以主成分分析后的新变量建立的多元回归线性模型可以有效地提高预测精度,简化模型的变量数目,具有较好的预测效果.参考文献:11徐亚滨,尹志刚.轧钢工序能耗浅析及节能途径J.冶金能源,2002,21(2):1518.E23章文波,陈红艳.实用数据统计分析及SPSS12.0应用M.北京:人民邮电出版社,2006.31卢纹岱主编.SPSsorWindows统计分析(第2版)M.北京:电子工业出版社,2002.4刘文,王兴珍着.轧钢生产基础知识问答EM1.北京:冶金工业出版社.1994.51袁志发,周静芋主编.多元统计分析M.北京:科学出版社,2002.E61方开泰,全辉,陈庆云编着.实用回归分析M.北京:科学出版社,1988.0OO000O654321稍酱靛目丰