时序全局主成分分析与经典主成分分析区别与联系.doc

上传人:laozhun 文档编号:4167011 上传时间:2023-04-08 格式:DOC 页数:2 大小:226.50KB
返回 下载 相关 举报
时序全局主成分分析与经典主成分分析区别与联系.doc_第1页
第1页 / 共2页
时序全局主成分分析与经典主成分分析区别与联系.doc_第2页
第2页 / 共2页
亲,该文档总共2页,全部预览完了,如果喜欢就下载吧!
资源描述

《时序全局主成分分析与经典主成分分析区别与联系.doc》由会员分享,可在线阅读,更多相关《时序全局主成分分析与经典主成分分析区别与联系.doc(2页珍藏版)》请在三一办公上搜索。

1、时序全局主成分分析与经典主成分分析:区别与联系夏茂森(安徽财经大学,蚌埠,233030)中图分类号:F830.91文献标识码:A文章编号:10092781(2007)07025802经典的主成分分析也称主分量分析,是由 Hotelling 于1933 年首先提出的。对主成分分析的一项十分著名的工作 是美国的统计学家斯通(stone)在 1947 年关于国民经济的研 究。他运用主成分分析,竟以 97.4的精度,用三新变量 就取代了原来 17 个反映国民收入与支出的变量要素。随后, 主成分分析方法的运用越来越广泛,同时,很多的专家学 者对这种分析方法进行了拓展和改进,提出了基于经典主成分分析原理的

2、一些新方法,如时序全局主成分分析法和 核主成分分析法等,但对时序全局主成分的研究及其与经 典主成分的异同研究较少。本文针对时序全局主成分分析 法和经典主成分分析法的异同进行了比较研究。一、应用案例分析 为研究我国各地区城市环境卫生情况,结合实际情况,确定选取 2003 年和 2004 年两个年份的 6 个指标,构建我国各地区城市环境卫生评价的主要指标体系。主要指标有:X1(平方米/人)表示人均清扫保洁面积;X2(吨/人)表示 人均生活垃圾清运量;X3(吨/人)表示人均粪便清运量; X4(台/万人)表示每万人市容环卫专用车辆数;X5(座/ 万人)表示每万人公共厕所数;X6(座/万人)表示每万人

3、水冲式公共厕所数量。运用 SPSS 软件或马克威分析软件计算(两者的运算结 果基本相同),首先对数据进行无量纲化处理,通常采用的 方法是数据标准化。然后计算相关系数矩阵,计算特征值、特征向量和方差贡献率(见表 1),因子载 荷矩阵,最后得到因子得分系数矩阵。在进行主成分分析 之前,要检验数据间是否具有相关性,以确定能否采用主 成分分析。本文采用巴特利特球体检验,检验的卡方值为489.6,伴随概率为 0.000,小于 1,说明数据具有较强的 相关性,是适宜做主成分分析的。主成分分析法一般取累计贡献率达到 85%以上的少数几个因子就可以代表原来多个指标的绝大部分信息。由表 1可见,取前三个因子(主

4、成分)F1,F2,F3 即可以代表原来6 个指标的 90.789的信息。表 1特征根和贡献率从表 1 中,我们可以看出全局主成分分析和经典主成分分析提取三个主成分的累计贡献率分别为 90.789、91% 和 92.775%,全局主成分分析提取的三个主成分的累计贡 献率小于经典主成分分析所提取的三个主成分的累计贡献 率。全局主成分分析法较之经典主成分分析法提取相同个 数主成分的信息损失大。全局主成分分析提取的三个主成分 F ,F ,F ,F 在1 2 3 1X1,X2,L,X6 都有较大载荷,因此 F1 可以命名为各地区城市环境卫生的综合因子,反映了各地区环境卫生的综合水平。F 在 X ,X 上

5、有较大载荷,这主要从公厕数量来反2 5 6映城市环境卫生的发展水平,因此 F2 可以命名为城市环境卫生发展水平因子。F 在 X 上有较大载荷,X 是表示粪便3 33清运量,它反映的是城市除污能力的指标,因此 F3 可以命名为各城市环境卫生的除污因子。F1,F2,F3 由 X1,X2,L,X6 表示的表达式为:F1 = 0.4320X1 + 0.4275X2 + 0.3858X3 + 0.4376X4 + 0.3856X5 + 0.3761X6F2 = 0.1145 X1 -0.2767X2 -0.2815X3 + 0.1128X4 -0.4392X5 + 0.7909X6F3 = -0.447

6、9X1 -0.3590X2 -0.2377 X3 -0.0922 X4 + 0.7990X5 + 0.2777X6将衡量各地区城市环境卫生指标的原始数据标准化后代入上式,得各城市环境卫生的因子得分。因子 F1,F2,F3 的得分从三个方面反映了各省市环境卫生水平。虽然 F1,F2,F3 综合原信息的能力较强,但单独使用某个因子,并不能对各地区城市环境卫生水平做出一个综合评价。因此我们将 F1,F2,F3 以其方差贡献率为系数(权重),加权求和得到一个衡量各地区城市环境卫生水平的综合评价得分,得分情况见表 2:258方法特征根(提取前三个)累计贡献率全局主成分4.5540.4930.40175.

7、89984.10790.7892004 经典主成 分4.4370.5910.43373.94283.79912003 经典主成 分4.6980.4870.38278.30186.41192.775财经界July,2007理论创新表 2 全国各地区城市环境卫生得分表由表 2 中各地区城市环境卫生的得分情况(分全局主成分分析和经典主成分分析两种方法计算的得分),我们可 以看出:通过全局主成分分析方法,在 2003 年,广东省和江苏省的城市环境卫生综合得分分别位列第 1、第 2,山东 和北京紧随其后,分别位列第 3 和第 4,浙江第 8,上海排 在第 10,西藏最末。而到 2004 年,江苏省的城市

8、环境卫生 水平发展迅速,超过广东省,位列第 1,广东第 2,山东和 北京仍处在第 3 和第 4,上海排在第 7,浙江第 8,西藏仍 为最末。纵观 2003 年和 2004 年,我们可以通过全局主成 分分析看出各地区环境卫生水平发展的动态变化过程,各 地区城市环境卫生综合水平上升的有江苏、山西、上海、福建、江西、重庆和青海,上海和山西环境卫生水平发展 最为显著,分别从第 10 位跃到第 7 位和从第 14 位跃到第11 位,都上升了 3 个位次。综合水平和其他地区城市相比 较而言排序下降的有天津、河北、吉林、河南、湖北、广 东、海南、四川和甘肃。其他各地区城市环境卫生水平排 名保持不变。经典主成

9、分分析方法和全局主成分分析方法的综合得 分排名虽然在大体上相同,但仍存在着差异,2003 年的综 合得分排名有 4 个省市排名不同,分别是北京、黑龙江、 江苏、广东。2004 年的综合得分排名有 7 个省市排名不同,其中差别最大的是山西省,位次相差了 3 位。究其产生差 异的原因是全局主成分分析将两年的数据进行综合而得出的排名,减小了短期数据的波动产生的影响。如果将数据 扩展到 3 年或 5 年或更多的年份,则全局主成分分析的综 合得分排名则更具有稳健性和代表性,并且更能体现样品 变化的动态过程。二、全局主成分分析法和经典主成分分析法的异同 通过上述全局主成分分析法和经典主成分分析法的阐述以及

10、对我国 31 个省市环境卫生综合评价的案例应用,我们可以看出两者之间具有的相同之处:1两种方法的基本原理基本相同。全局主成分分析法 和经典主成分分析法都试图在力保数据信息丢失最少的原 则下,对这种多变量的数据表进行最佳综合简化,对高维 变量空间进行降维处理。也就是把多个指标化为少数几个综合指标的统计分析方法。它们找出几个综合因子(主成分)来代表原来众多的变量,使这些综合因子尽可能地反映原 来变量的信息量,而且彼此之间互不相关。2在操作步骤上,全局主成分分析除第一步外,其他 步骤的操作和经典主成分分析大致一样。虽然全局主成分分析法和经典主成分分析法有相同的 地方,但同时这两种方法也存在着很大的区

11、别:1两种方法的数据选取不同。经典主成分分析法是针对多变量的截面数据表进行最佳综合简化。而全局主成分 分析法是采用时序立体数据表,将每张数据表在一个子空 间上进行投影,从而得到近似的表达,并从全局来看,该子空间对数 据表整体的表达效果是最佳的。通过这种方法将截面数据和时序数据结合在一起。我们可采用 T 年的多变量截 面数据进行经典主成分分析,从而打破了经典主成分分析 只能采用截面数据的束缚,将时序数据和截面数据有效的 结合起来了,并且这种结合的数据和计量计量经济学中的面板数据也不雷同。这一点正是全局主成分分析和经典主 成分分析的最大区别。时序立体数据表,从而提取的主成分是从 T 年的截面 数据

12、中共同作用下提取出来的,不同经典主成分分析从单 独的某一截面数据表中提取出来的。3.两种方法在变量信息的提取上经典主成分分析法优于全局主成分分析法(假设提取相同个数的主成分)。全局 主成分分析采用T 年数据的综合提取主成分,提取的信息 必然比单独从某一截面数据表中提取主成分的损失大。4全局主成分分析法能够反映事物发展的动态过程。 由于全局主成分分析的主成分是从 T 年的截面数据中共同 作用下提取出来的,则可对 T 年的各样品进行比较分析,以发现各样品的变化特征。而经典的主成分分析无法做到 这一点,由于各年提取的主成分各不相同,从而不能直接 比较不同年份的得分情况。5从综合评价的结果来看,全局主

13、成分分析的结果较 经典主成分分析在长期更具有稳健性和代表性。全局主成 分分析有效避免了经典主成分分析由于样本指标值的短期波动而引起的评价结果的偏误。259名称全局主成分分析经典主成分分析名称全局主成分分析经典主成分分析2004 年2003 年2004 年2003 年2004 年2003 年2004 年2003 年北 京 天 津 河 北山 西 内蒙古辽 宁 吉 林黑龙江 上 海江 苏 浙 江安 徽 福 建江 西 山 东河 南420101117614571815182431241891417613510281519263114201181761457191518263125189141761341018151926311湖 北 湖 南 广 东广 西 海 南重 庆 四 川贵 州 云 南西 藏 陕 西甘 肃 青 海宁 夏 新 疆91622330191327253122262928217161232920122725312224302821101622330191327243122252928217162232920122725312224302821

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公文档 > 其他范文


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号