《主成分分析操作步骤.docx》由会员分享,可在线阅读,更多相关《主成分分析操作步骤.docx(6页珍藏版)》请在三一办公上搜索。
1、主成分分析操作步骤主成分分析操作步骤 1)先在spss中录入原始数据。 2)菜单栏上执行,打开因素分析对话框,将要分析的变量都放入窗口中。 3)设计分析的统计量 点击:选中“Statistics”中的“原始分析结果”和“相关性矩阵”中的“系数”。然后点击“继续”。 点击:“方法”里选取“主成分”;“分析”、“输出”、“抽取”均选中各自的第一个选项即可。 点击:选取第一个选项“无”。 点击:选中“保存为变量”,方法中选“回归”;再选中“显示因子得分系数矩阵”。 点击:选择“按列表排除个案”。 4)结果解读 5)A. 相关系数矩阵:是6个变量两两之间的相关系数大小的方阵。通过相关系数可以看到各个变
2、量之间的相关,进而了解各个变量之间的关系。 相關性矩陣 相關 食品 衣着 燃料 住房 交通和通讯 娱乐教育文化 食品 1.000 .692 .319 .760 .738 .556 衣着 .692 1.000 -.081 .663 .902 .389 燃料 .319 -.081 1.000 -.089 -.061 .267 住房 .760 .663 -.089 1.000 .831 .387 交通和通讯 .738 .902 -.061 .831 1.000 .326 娱乐教育文化 .556 .389 .267 .387 .326 1.000 B. 共同度:给出了这次主成分分析从原始变量中提取的信
3、息,可以看出交通和通讯最多,而娱乐教育文化损失率最大。 Communalities 食品 衣着 燃料 住房 交通和通讯 娱乐教育文化 起始 1.000 1.000 1.000 1.000 1.000 1.000 擷取 .878 .825 .841 .810 .919 .584 擷取方法:主體元件分析。 C. 总方差的解释:系统默认方差大于1的为主成分。如果小于1,说明这个主因素的影响力度还不如一个基本的变量。所以只取前两个,且第一主成分的方差为3.568,第二主成分的方差为1.288,前两个主成分累加占到总方差的80.939%。 說明的變異數總計 起始特徵值 元件 1 2 3 4 5 6 總計
4、 3.568 1.288 .600 .358 .142 .043 變異的 % 59.474 21.466 10.001 5.975 2.372 .712 累加 % 59.474 80.939 90.941 96.916 99.288 100.000 總計 3.568 1.288 擷取平方和載入 變異的 % 59.474 21.466 累加 % 59.474 80.939 擷取方法:主體元件分析。 D.主成分载荷矩阵: 元件矩陣a 元件 食品 衣着 燃料 住房 交通和通讯 娱乐教育文化 1 .902 .880 .093 .878 .925 .588 2 .255 -.224 .912 -.195
5、 -.252 .488 擷取方法:主體元件分析。 a. 擷取 2 個元件。 特别注意: 该主成分载荷矩阵并不是主成分的特征向量,即不是主成分1和主成分2的系数。主成分系数的求法:各自主成分载荷向量除以各自主成分特征值得算数平方根。则第1主成分的各个系数是向量除以3.568后才得到的,即才是主成分1的特征向量,满足条件是系数的平方和等于1,分别乘以6个原始变量标准化之后的变量即为第1主成分的函数表达式: Y1=0.490*Z交+0.478*Z食+0.466*Z衣+0.465*Z住+0.311*Z娱+0.049*Z燃 同理可求出第2主成分的函数表达式。 E.主成分得分系数矩阵 元件評分係數矩陣 元
6、件 食品 衣着 燃料 住房 交通和通讯 娱乐教育文化 1 .253 .247 .026 .246 .259 .165 2 .198 -.174 .708 -.152 -.196 .379 擷取方法:主體元件分析。 元件評分。 该矩阵是主成分载荷矩阵除以各自的方差得来的,实际上是因子分析中各个因子的系数,在主成分分析中可以不考虑它。 元件評分共變異數矩陣 元件 1 2 1 1.000 .000 2 .000 1.000 擷取方法:主體元件分析。 元件評分。 6)因子得分 在之前的“得分”对话框中,由于选中了“保存为变量”,方法中的“回归”;又选中了“显示因子得分系数矩阵”,因此SPSS的输出结果
7、和原始数据一起显示在数据窗口里: 7)主成分得分 特别提醒: 后两列的数据是北京等16个地区的因子1和因子2的得分,不是主成分1和主成分2的得分。主成分的得分是相应的因子得分乘以相应的方差的算数平方根。 即:主成分1得分=因子1得分乘以3.568的算数平方根 主成分2得分=因子2得分乘以1.288的算数平方根 得出各地区主成分1和主成分2的得分如下表: 后两列就是16个地区主成分1和主成分2的得分。 8)综合得分及排序: 每个地区的综合得分是按照下列公式计算的: Y=0.73476*主成分1得分+0.26524*主成分2得分 按照此公式计算出各地区的综合得分Y为: 按照综合得分Y的大小进行16
8、个地区的排序: 点击 特别提醒: 1.若主成分分析中有n个变量,则特征值之和就等于n; 2.特征向量中各个数值的平方和等于1,否则就不是特征向量,也不是主成分系数; 3.主成分载荷向量各系数的平方和等于其对应的主成分的方差; 本例中0.925+ 0.902+ 0.880+ 0.878+ 0.588+ 0.093= 3.568 4.SPSS没有专门的主成分分析模块,是在因子分析模块进行的。它只输出主成分载荷矩阵和因子得分值,而我们最想得到的主成分的系数和主成分则需要另外计算。 5.若计算没有错误,因子1、因子2、主成分1、主成分2和综合得分Y,它们各自的数值之和都等于0; 6.主成分分析应该计算出综合得分并排序。 7. 2 2 2 2 2 2