多指标评估体系的分析.docx

上传人:李司机 文档编号:1996956 上传时间:2022-12-30 格式:DOCX 页数:15 大小:139.26KB
返回 下载 相关 举报
多指标评估体系的分析.docx_第1页
第1页 / 共15页
多指标评估体系的分析.docx_第2页
第2页 / 共15页
多指标评估体系的分析.docx_第3页
第3页 / 共15页
多指标评估体系的分析.docx_第4页
第4页 / 共15页
多指标评估体系的分析.docx_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《多指标评估体系的分析.docx》由会员分享,可在线阅读,更多相关《多指标评估体系的分析.docx(15页珍藏版)》请在三一办公上搜索。

1、多指标评估体系的分析摘要:本文以地区限额以上工业主要评价指标体系为例,争论了主成分分析、聚类分析以及主成分聚类分析在多指标评估体系中的应用,显示了主成分分析在简化指标体系、突出主要因素方面的作用,体现了聚类分析将相像样本进行聚类,简化数据处理难度的优点,同时也证明白主成分聚类分析的可行性。为全面评价对象,往往给出一个由很多指标构成的评价指标体系。为使信息集中,又常常使用加权平均。这存在以下几个问题:(I)一般评价体系指标众多,由于信息的重叠,一些指标之间存在肯定的相关关系;(2)简洁的加权平均的权重安排有较大的人为因素;(3)简洁的加权平均损失大量信息,主要因素不突出。本文以地区限额以上工业主

2、要评价指标体系为例,采用主成分分析法,构造少数几个综合指标以充分揭示隐蔽在样本数据后的大量信息,突出主要影响因素,以对评价对象作出科学评价;采用聚类分析方法,依据各指标之间的相像性逐步进行归群成类,客观地反映了这些指标之间的内在组合关系,对指标进行群聚,大大简化了数据的处理难度,为评价过程供应有力的依据。采用主成分聚类分析削减了数据的冗余,原理清楚,计算简洁,所得的结论客观,为分析问题供应了有力的依据。1主成分分析法主成分分析基本思想是通过原有变量(指标)的少数几个线性组合来解释原有变量所体现的样本变差。由于原有变量之间的相关性,原有P个变量的大部分样本变差能够由k(比P小很多)个主成分(特别

3、的线性组合)来概括。在新的综合指标体系(指标数将大为削减)中,对评价对象进行分析、类比。设x,X2,.Xp为原有的P个指标;X=WLXP为其标准化观看矩阵;R=(q)pp为其相关系数矩阵;Lj=(/,6l(=12,p)为P个常数向量。考虑如下线性组合:4=fhXJ=l,2,p为P个新指标(主成分)。Zi的样Jt=I本方差VarZi=HRLj,协方差Cov(ZjZj)=L;RLjG;/=1,2,p)。盼望用较少的新指标代替原来的P个指标,就要求它们含有尽可能多的原指标信息且互不相关。指标中所含信息量的大小通常用该指标的方差来表示。设R的特征值和对应的正交单位化特征向量分别为4/l2/lp0;el

4、,e2,,ep,则取乙=6时,VarZj=%,COV(ZjZ,=(i,j=1,2,p)。可以证明原有指标的标准化样本总方差为P,称a为第i个主成分的贡献率;P之Z为前k个主成分的累积贡献率。累积贡献率表明白前k个主成分提取了原tP有指标总信息量的分额,当其达到肯定数值时,用k个主成分代替原有指标将不致于损失太多信息,从而达到削减指标的目的。2聚类分析法聚类分析(CkISterAnaIySiS)是统计学所争论的“物以类聚”问题的一种方法,它属于多变量统计分析的范畴。它是一种建立分类的方法,能够将一批样本数据(或变量)依据它们在性质上的亲疏程度在没有先验学问的状况下自动进行分类。这里,一个类就是一

5、个具有相像的个体的集合,不同类之间具有明显的非相像性。在分类过程中,不必事先给出一个分类标准,聚类分析能够从样本数据动身,客观地打算分类标准。系统聚类法(HierarChiCalCIUSteringMethOdS)也称层次聚类分析法,是目前国内外使用得最多的一种方法。这种方法的基本思想是:先将n个样品各自看成一类,然后规定样品之间的距离和类与类之间的距离。开头,因每个样品自成一类,类与类之间的距离与样品之间的距离是相等的,选择距离最小的一对并成一个新类,计算新类和其他类的距离,再将距离最近的两类合并,这样每次削减一类,直至全部的样品都成一类为止。由此可见,系统聚类方法中,度量数据之间的亲疏程度

6、是极为关键的。这里并没有给定分类的标准,也没有给出全部数据分成几类,而要求比较客观地从数据自身动身进行分类。类与类之间的亲疏程度有最短距离法、最长距离法、中间距离法、重心法、类平均法、离差平方和法等。3应用实例以年全国个省市的项限额以上工业主要评价指标为例(数据来自统计年鉴),见表1,分别用主成分分析和聚类的方法对其进行分析。表1部分岖限额以上工业主要评价指标地区产品隹售及人工业应姚款经济她繇合总资产贡斛魅保值增斛资产负债率全员劳动生产X1亿元X2亿元指教为X4X5X67l北京i857.46380.47101.865.98109.7762.3743925.20天津2034.65445.0810

7、4.587.02115.9561.3633414.17河北29()7.36490.701()4.(X)8,41105.6764.3728311.56山百975.46318.0669.035.02101.5067.7016453.57上海4987.441083.91127.048.24108.6552.3062872.09江苏8343.141363.77105.898.37112.2761.9535613.99浙江4814.59744.35124.2511.38114.38S8.8641074.00翘14()0.462W).3181.1()7,16104.5163.0222859.46福建195

8、1.38341.76108.369.13114.6755.8329443.26山东6566.99K56.(M109.689.55109.6063.3636249.00广东9678.501786.91109.227.26106.0361.1245812.17广声848.91163.8677.736.55105.2769.3724264.62重失816.74224.6167.875.H8109.9469.0820617.75叫Il1853.21447.2585.196.83108.(1941.8122346.29贵州433.72157.8K71.5()7,05104.8771.7821684.85

9、陕百922.56266.6967.675.54107.1269.90I9(II1.O甘肃575.39164.6859.695,4493.6068.5915767.153.1用主成分分析进行分析3.1.1程序:dataal;inputgroup$xl-x7;cards;北京1857.46380.47101.865.89109.7762.3743925.20天津2034.65445.08104.587.02115.9561.3633414.17河北2907.36490.70104.008.41105.6764.3728311.56山西975.46318.0669.035.02101.5067.70

10、16453.57上海4987.441083.91127.048.24108.6552.3062870.09江苏8343.141363.77105.898.37112.2761.9535613.99浙江4814.59744.35124.2511.38114.3858.8641074.00安徽1400.46280.3181.107.16104.5163.0222859.46福建1951.38341.76108.369.13114.6755.8329443.326山东6566.99856.04109.689.55109.6063.3636249.00广东9678.501786.91109.227.2

11、6106.0361.1245812.17广西848.91163.8677.736.55105.2769.3724264.62重庆816.74224.6167.875.88109.9469.0820617.75四川1853.21447.2585.196.83108.0941.8122346.29贵州433.72157.8871.507.05104.8771.7821684.85陕西922.56266.6967.675.54107.1269.9019011.00甘肃575.39164.6859.695.4493.6068.5915767.15procprincompdata=al prefix=z

12、 out=a02;var xl-x7;run;options ps=42 ls=85;proc plot data=a02;plot z2*zl $ group=,*,href=-l href=2 vref=0;run;proc sort data=a02;by zl;run;proc print data=a02;var number zl z2 xl-x4;run;3.1.2运行结果:TheSASSystem20:43Monday,April12,20121ThePRINCOMPProcedureObservations17Variables7SimpleStatisticsxlx2x34

13、x5xx7Mean2998.115294559.784117692.627058827.336470588107.758235362.5158823530571.65859StD2857.113024465.579283321.309008241.6770788515.38891377.4723874812582.99519CorrelationMatrixxl234567xl1.00000.97380.69340.54140.3118-.28870.6675x20.97361.00000.68450.42420.2655-.33840.705430.9340.68451.00000.7940

14、0.8803-.55010.8788x40.54140.42420.79401.00000.5782-.37930.5114x50.31180.20550.68030.57821.0000-.39250.4605x-.2887-.3364-.5501-.3733-.39251.0000-.4404X70.G6750.70540.87680.51140.405-.44041.0000EigenvaluesoftheCorrelationMatrixEigenvaIueDifferenceProportionCuimjIative14.377279773.265718650.82530.62532

15、1.111583120.425382350.15880.784130.686180770.263370680.09800.882140.422210090.080738600.0030.942550.381471490.330318860.05160.994180.031152830.021010510.00450.398670.010142120.00141.0000Eigenvectorsz1z2z3z4z5z6z710.3993290.4884370.081415-.172307-.315591-.055306-.89435520.3897680.512784-.080058-.0030

16、91-.3032350.0828550.89274630.458101-.13B4140.0848430.0725340.311329-.8112110.084142x40.387415-.2759710.395219-.8767810.2377730.3271440.105278x50.308708-.5375880.3144380.421126-.5726200.107846-.001085x6-.278170.3521330.8483560.2254980.137784-.0690900.08372070.4133300.099263-.0893320.5280520.5550450.4

17、58795-.125495散点图:TheSASSystem20:43Monday,April12,20128通过运行结果我们可以看出:运行结果中,特征值按降序排列,对应特征值大的主成分对总变差的贡献率也大。从结果中可以看出看出,最大特征值的近似值为为4.377,贡献率为62.53%,即第1主成分反映了原有指标体系样本总变差的62.53%,而前2个主成分的累积贡献率已接近80%。这就意味着在新的指标体系中2个指标就能反映样本差异近80%。第1,第2特征值对应的特征向量(主成分系数向量)如下图所示:Xl匕X3X4X5X6X70.3993230.3837660.4581010.367415 0.30

18、8706 -.278617 0.413330220.4e84370.512784-.138414 -275971 -537588 0.352133 0.099263从上图中我们可以看出,zl中各重量(即对应各Xi系数)的值除X6外均为正值,肯定值都在0.270.46。其中以X3和X7为最大。原有各项指标反映良好,则第1主成分得分就高;原有各项指标反映差,则第1主成分得分就低。这表明第1主成分反映了一个地区工业企业的综合进展水平。Z2中各重量有正有负,肯定值较大的正项有X4;负项有XI,X2,X6o正项对应的是反映地区工业企业资本运作、资产保值增值方面的各项指标;而负项对应的是反映地区工业企业产

19、品销售、经营状况等各项指标。第2主成分分值大的地区,其工业企业资本运作、资产保值增值方面做得较好而产品销售、经营状况略差;第2主成分分值小的地区,则反之;而第2主成分分值肯定值较小的地区,其工业企业各方面做得比较均衡。计算17个样本的主成分得分:Z1=X,zl,Z2=X,z2各地区新指标(主成分)得分地区NIN2上海3.14660.2215浙江2.83791.1184L东2.7513-2.584O江苏2.37551.0724ill东1.H596O.333福建1.(11171.204天津0.5614I.156O北京0.1487O.32()河北O.14630.0635四川-O.CM)61.24H6

20、安皴-1.2029O.1799广西-1.731OO.0431重庆1.S56O.315O贵州-2.0152O.O2K3陕西-2.159-O.1133山西2.51K0.6928甘肃-3.3195一i.2717从表中可以看出,上海地区第1主成分得分为3.1466,显示了上海地区工业企业较高的综合进展水平,尤其是在经济效益综合指数和全员劳动生产率上表现突出;而第2主成分得分为-0.2215,显示了的工业企业各方面都做得较好;浙江与广东第1主成分相差无几,而第2主成分相差较大,分析其缘由,广东地区有很高的产品销售收入,浙江地区则有较高的经济效益综合指数,较高的总资产贡献率及较高的资产保值增值率。显示出这

21、两个地区在产品销售与资本运作上各有千秋。3. 2聚类分析3.1.1 程序:title;optionsfIext=宋体;dataal;inputgroup$xl-x7;cards;北京1857.46380.47101.865.89109.7762.3743925.20天津2034.65445.08104.587.02115.9561.3633414.17河北2907.36490.70104.008.41105.6764.3728311.56山西975.46318.0669.035.02101.5067.7016453.57上海4987.441083.91127.048.24108.6552.30

22、62870.09江苏8343.141363.77105.898.37112.2761.9535613.99浙江4814.59744.35124.2511.38114.3858.8641074.00安徽1400.46280.3181.107.16104.5163.0222859.46福建1951.38341.76108.369.13114.6755.8329443.326山东6566.99856.04109.689.55109.6063.3636249.00广东9678.501786.91109.227.26106.0361.1245812.17广西848.91163.8677.736.5510

23、5.2769.3724264.62重庆816.74224.6167.875.88109.9469.0820617.75四川1853.21447.2585.196.83108.0941.8122346.29贵州433.72157.8871.507.05104.8771.7821684.85陕西922.56266.6967.675.54107.1269.9019011.00甘肃575.39164.6859.695.4493.6068.5915767.15procprintdata=al;run;procclusterdata=almethod=avestdpseudocccouttree=b01;

24、varxl-x7;idgroup;proctreedata=blhorizontalgraphics;title,使用类平均法的谱系聚类图,run;title;3.1.2 运行结果:Obsgroup12347891011121314151617北天河山上广广重四贵陕甘Xlx23x422:16Monday,April12,20121x5x6x71857.46380.47101.885.89109.7762.3743925.202034.85445.08104.587.02115.9561.3633414.172907.36490.70104.008.41105.6764.3728311.5897

25、5.48316.0889.035.02101.5087.7016453.574987.441083.91127.048.24108.6552.3062870.098343.141363.77105.898.37112.2?81.9535813.934814.59744.35124.2511.38114.3858.8841074.001400.46280.3181.107.16104.5163.0222859.461951.38341.78108.389.13114.?55.8329443.336566.99856.04109.889.55109.6083.3636249.008678.5017

26、88.91109.227.26106.0361.1245812.17848.91183.8877.736.55105.2789.3724264.62816.74224.8167.875.88109.9489.0820817.751853.21447.2585.196.83108.0941.8122346.29433.72157.8871.507.05104.8771.7821684.85922.56286.8967.875.54107.1269.9019011.00575.39184.8859.695.4493.EO68.5915767.1522:16Monday,April12,20122T

27、heCLUSTERPrOCedUreAverageLinkageClusterAnalysisEigenvaluesoftheCorrelatiMatrixEigenvalueDifferenceProportiCumulative14.377278773.265718850.82530.825321.111583120.425382350.15880.784130.88180770.283970680.03800.882140.422210090.08073380o.om0.942550.31471490.330318880.05160.33410.031152830.021010510.0

28、0450.998870.010142120.00141.0000Thedatahavebeenstandardizedtomean0andvariance1Root-Mean-SquareTotaI-SampIeStandardDeviation=1Root-Mean-SquareDistanceBetweenObservations3.741857ClusterHistoryNCL-ClustersJoined-FREQRSQERSQNormTRMSiDiste6543210987854321西庆16盥*京910128海563广重CL安山天hsCLCLCL比匕CLCLCL辔J5J4J3隼J1

29、北NJ东,4川N贵陕CL比CL子CLiCL广CL四CL20.001$.99820.0018.99740.0095.98750.0119.97660.0133.96220.0108.95220.0107.94130.0241.91740.0225.89430.0297.88570.0434.82170.0887.73320.0423.89030.1082.58280.1126.469170.4695.000SPRSQ668-522-OOO042.90.157545.60.158818.18.10.297213.32.80.379211.82.20.408911.80.411312.40.4128

30、11.02:30.575610.91.30.576310.72.80.631310.15.70.67478.24.60.79739.70.8231.59.8&0.96886613.38.31.0535CCCPSFPST2谱系聚类图:XiftBofCbservationorCluster期鼾端确系髅图AvertjeDistanceBetweenClusters323结果分析由输出的谱系聚类图,易得出分为二类、三类、四类等的分类结果。应当分为几类,应当进行进一步的分析。(1) RQ统计量(列标题为RSQ)用于评价每次合并成NCL个类时的聚类效果,现在考察服女的值随NCL的变化。在分为四个类之前(N

31、CL4)的并类过程中穴鼠的削减是渐渐的,转变不大;当分为四个类时的暇=0.690,而下一次合并后分为三个类时,&=0582,以及下一次合并为两个类时,Rl=0.469,这两次的R2的变化都比较大,因此,通过对R2统计量的变化分析可得出分为四个类和三个类都是比较合理的。(2)查看RQ变化的大小可以由半偏联(列标题为SPRSQ)得到,依据半偏心的值是上一步骤Ri与该步骤总的差值,故某步骤的半偏总值越大,说明上一步骤的合并效果越好。从运行结果可以看出,半偏最大和次大分别为1,2和3,说明依据半偏R2准则分为两个类、三个类或四个类是比较合适的。(3)伪F统计量(列标题为RSP)用于评价分为NCL个类的

32、聚类效果。伪Fncl统计量值越大表示这些观测样本可以较显著分为NCL个类,从运行结果中可以看出,瓜最大和次大的分别为2和5,说明依据伪F准则,将样本分为两个类或五个类是比较合适的。(4)伪t2统计量(列标题为PST2)用以评价此步骤合并类的效果。由该统计量的定义可知,伪t2值较大标明上次合并的两个类是很分开的,也就是说上次聚类的效果是好的。从运行结果中可以看出,t2最大和次大的分别是NCL=I,2,说明依据伪t2准则分为两个类或三个类是比较合适的。由以上分析可以看出:半偏R2准则支持分为四个类和三个类,半偏R2准则支持分为两个类、三个类或四个类,F准则支持将样本分为两个类或五个类,伪t2准则支

33、持分为两个类或三个类。综合分析,认为采纳类平均法分类,将17个地区分为两类或三类较合适。分为三类的结果为G;=四川(一个地区),G;=甘肃、陕西、重庆、贵州、广西、安徽、山西(7个地区),G”北京、天津、福建、河北、江苏、山东、浙江、上海、广东(9个地区)。若分为两类,则=WIo3.3运用主成分聚类分析法进行分析主成分聚类分析法就是先用主成分分析法对指标分析,分析指标间的关系,剔除一些没有明显分异作用的指标或相互间存在明显的线性相关关系的指标,以确定最终的指标。然后采纳类平均的聚类方法对该系统进行分析聚类。EicenvalueDifferenceProportionCumjltttive4.3

34、77273773265716650.62530.62531.111563120.425382350.15880.78410.686180770.263970680.09800.88210.422210030.060738600.06030.94250.361471490.330318860.05160.88410.031152630.021010510.00450.99860.010142120.00141.0000EicenvaIuesoftheCorrelationMatrix.一;r57从主成分分析的运行结果我们可以看出,第六主成分和第七主成分对系统的作用很小,可以忽视,只对前5个主成分

35、进行分析。用各主成分的方差贡献率作为权重,线性加权求和得到综合评价函数Zi=Ia病而(?=12,p)m=1Zi即反映了第i个地区的综合实力,Zj越高说明该地区的综合实力越高,反之则越低。综合评价函数为:Z.=0.6253z1+O1588z.+0.0980zo+0.0603zy1+0.0516zz12345将各地区数据代入上式求得结果如下表所示:北京天津河北山西上海江苏淅江xl1857.462034.652907.36975.464987.448434.144814.59x2380.47445.08490.7318.061083.911363.77744.35x3101.86104.581046

36、9.03127.04105.89124.25x45.987.028.415.028.248.3711.38x5109.77115.95105.67101.5108.65112.27114.38x662.3761.3664.3767.752.361.9558.86x743925.233414.1728311.5616453.5762872.0935613.0941074zl19096.0440514854.7032113109.559567354.5773328459.1284818674.3370719254.94321z25360.461734431.602294364.560642207.

37、033299054.908888117.181426640.54907z3-3692.9856-2746.6487-2225.64059-1315.04982-5188.36727-2497.52589-3226.75226z422939.0009517360.9968914512.776418581.2992832401.3936617417.1321420926.19669z523655.0567817743.2791814628.187678700.9632975.9856916665.9966421033.05464Z15033.9077711685.6341110302.321955

38、786.84109122380.3174814631.5323415125.56874麹廉陈降BDJH酬牺聪461951.386566,999678,5848,91816.741853.21433,72922,5675,39280.31B我M1786,91163.8622461W.25157.88266邢M68上1108.36109.22109.229m67MTl.567.5759.69il:j2$0:c.E5.883T.055.54104.51IlUT106.03106.03105.2?109.MIO104.87107.1263.0255.83仁口61.1269.3769.0841.81?1

39、.T8:有68.5922859.4629班26;45丽45812.1724264.6220617.7522346,2921684,85.1901115机1510163.6069?13圉嬲2821942.18991匝画画1563L8976即395I(MI76329238,234M66期丽3015.25175394415432M109240082838.951342493.1知3252.11802238?.2,901131878.878814849.122682395,72919-3518.-3341.18725-.08飒5946-1806.21986-1539.085111276.26昭1189

40、1,15213153723122.122581110811.1121111539.26816Iim邺598298284.3112312135.2591215598,6则77,ITO10337.136623075.1721121809.2892913123,概2418781968249.34而511085.9782111653.01368525T9T8019.M4311823.9281210149.3993?2?8.T671414岫,超95391.2程序:title;optionsfIext=宋体”;dataa03;inputgroup$z;cards;北京15033.91天津11685.63河北10302.32山西5786.84上海22380.32江苏14631.53浙江15125.57安徽7996.15福建10337.14山东17230.12广东18460.78广西8249.34重庆7067.53四川8019.38贵州7278.79陕西6588.67甘肃5391.23;procclusterdata=a03method=avestdpseudocccouttree=b03;varz;idgroup;proctreedata=b03horizonalgraphics;run;title;运行结果:U2:b8Iuesday,ApriI13,2U】22TheCLUSTERPr

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号