主成分因子分析步骤.docx

上传人:牧羊曲112 文档编号:3226826 上传时间:2023-03-11 格式:DOCX 页数:11 大小:40.08KB
返回 下载 相关 举报
主成分因子分析步骤.docx_第1页
第1页 / 共11页
主成分因子分析步骤.docx_第2页
第2页 / 共11页
主成分因子分析步骤.docx_第3页
第3页 / 共11页
主成分因子分析步骤.docx_第4页
第4页 / 共11页
主成分因子分析步骤.docx_第5页
第5页 / 共11页
亲,该文档总共11页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《主成分因子分析步骤.docx》由会员分享,可在线阅读,更多相关《主成分因子分析步骤.docx(11页珍藏版)》请在三一办公上搜索。

1、主成分因子分析步骤主成分分析、因子分析步骤 不同点 概念 主成分分析 因子分析 具有相关关系的p个变量,经过将原数据中多个可能相关的变量综合成少数几线性组合后成为k个不相关的新个不相关的可反映原始变量的绝大多数信息的变量 综合变量 减少变量个数,以较少的主成分来解释原有变量间的大部分变异,适合于数据简化 找寻变量间的内部相关性及潜在的共同因素,适合做数据结构检测 主要 目标 强调 重点 最终结果应用 变异解释程度 是否需要旋转 是否有假设 强调的是解释数据变异的能力,强调的是变量之间的相关性,以协方差为导向,以方差为导向,使方差达到最大 关心每个变量与其他变量共同享有部分的大小 形成一个或数个

2、总指标变量 它将所有的变量的变异都考虑在内,因而没有误差项 主成分分析作综合指标用, 不需要旋转 只是对数据作变换,故不需要假设 反映变量间潜在或观察不到的因素 只考虑每一题与其他题目共同享有的变异,因而有误差项,叫独特因素 因子分析需要经过旋转才能对因子作命名与解释 因子分析对资料要求需符合许多假设,如果假设条件不符,则因子分析的结果将受到质疑 因子分析 1 描述性统计量对话框设置 KMO和Bartlett的球形度检验。 因子抽取对话框设置 方法:默认主成分法。主成分分析一定要选主成分法 分析:主成分分析:相关性矩阵。 输出:为旋转的因子图 抽取:默认选1. 最大收敛性迭代次数:默认25.

3、因子旋转对话框设置 因子旋转的方法,常选择“最大方差法”。“输出”框中的“旋转解”。 因子得分对话框设置 “保存为变量”,则可将新建立的因子得分储存至数据文件中,并产生新的变量名称。 选项对话框设置 2 结果分析 KMO及Bartletts检验 KMO 和 Bartlett 的检验 取样足够度的 Kaiser-Meyer-Olkin 度量。 Bartlett 的球形度检验 近似卡方 df Sig. .515 3.784 6 .706 当KMO值愈大时,表示变量间的共同因子愈多,愈适合作因子分析。根据Kaiser的观点,当KMO0.9、KMO0.8、KMO0.7、KMO0.6、KMO0.5、KM

4、O0.5。 公因子方差 公因子方差 卫生 饭量 等待时间 味道 亲切 起始 1.000 1.000 1.000 1.000 1.000 撷取 .855 .846 .819 .919 .608 撷取方法:主体元件分析。 Communalities表示公因子对各个变量能说明的程度,每个变量的初始公因子方差都为1,共同度越大,公因子对该变量说明的程度越大,也就是该变量对公因子的依赖程度越大。共同度低说明在因子中的重要度低。一般的基准是0.4就可以认为是比较低,这时变量在分析中去掉比较好。 解释的总方差 说明的变异数总计 各因子的特征值 元件 1 2 3 4 5 总计 2.451 1.595 .662

5、 .191 .100 变异的 % 49.024 31.899 13.246 3.823 2.008 累加 % 49.024 80.923 94.168 97.992 100.000 总计 2.451 1.595 因子贡献率 变异的 % 49.024 31.899 累加 % 49.024 80.923 总计 2.042 2.004 因子累积贡献率 变异的 % 40.843 40.079 累加 % 40.843 80.923 撷取方法:主体元件分析。 第二列:各因子的统计值 第三列:各因子特征值与全体特征值总和之比的百分比。也称因子贡献率。 第四列:累积百分比也称因子累积贡献率 第二列统计的值是各

6、因子的特征值,即各因子能解释的方差,一般的,特征值在1以上就是重要的因子;第三列%是各因子的特征值与所有因子的特征值总和的比,也称因子贡献率;第四列是因子累计贡献率。 如因子1的特征值为2.451,因子2的特征值为1.595,因子3,4,5的特征值在1以下。因子1的贡献率为49.0%,因子2的贡献率为31.899%,这两个因子贡献率累积达80.9%,即这两个因子可解释原有变量80.9%的信息,因而因子取二维比较显著。 至此已经将5个问项降维到两个因子,在数据文件中可以看到增加了2个变量,fac1_1、fac2_1,即为因子得分。 成分矩阵与旋转成分矩阵 成分矩阵是未旋转前的因子矩阵,从该表中并

7、无法清楚地看出每个变量到底应归属于哪个因子。旋转后的因子矩阵,从该表中可清楚地看出每个变量到底应归属于哪个因子。此表显示旋转后原始的所有变量与新生的2个公因子之间的相关程度。 一般的,因子负荷量的绝对值0.4以上,认为是显著的变量,超过0.5时可以说是非常重要的变量。如味道与饭量关于因子1的负荷量高,所以聚成因子1,称为饮食因子;等待时间、卫生、亲切关于因子2的负荷量高,所以聚成因子2,又可以称为服务因子。 因子得分系数矩阵 元件评分系数矩阵 元件 卫生 饭量 等待时间 1 -.010 .425 -.038 2 .447 -.036 .424 味道 亲切 .480 -.316 .059 -.3

8、71 撷取方法:主体元件分析。 转轴方法:具有 Kaiser 正规化的最大变异法。 元件评分。 因子得分系数矩阵给出了因子与各变量的线性组合系数。 因子1的分数=-0.010*X1+0.425*X2-0.038*X3+0.408*X4-0.316*X5 因子2的分数=0.447*X1-0.036*X2+0.424*X3+0.059*X4-0.371*X5 因子转换矩阵 元件转换矩阵 元件 1 2 1 .723 .691 2 -.691 .723 撷取方法:主体元件分析。 转轴方法:具有 Kaiser 正规化的最大变异法。 因子转换矩阵是主成分形式的系数。 因子得分协方差矩阵 元件评分共变异数矩

9、阵 元件 1 2 1 1.000 .000 2 .000 1.000 撷取方法:主体元件分析。 转轴方法:具有 Kaiser 正规化的最大变异法。 元件评分。 看各因子间的相关系数,若很小,则因子间基本是两两独立的,说明这样的分类是较合理的。 主成分分析 1 设计分析的统计量 中的“系数”:会显示相关系数矩阵; :检验原始变量是否适合作主成分分析。 里选取“主成分”。 :选取第一个选项“无”。 :“保存为变量” :“回归”;再选中“显示因子得分系数矩阵”。 2 结果分析 相关系数矩阵 相关性矩阵 相关 食品 衣着 燃料 住房 交通和通讯 娱乐教育文化 食品 1.000 .692 .319 .7

10、60 .738 .556 衣着 .692 1.000 -.081 .663 .902 .389 燃料 .319 -.081 1.000 -.089 -.061 .267 住房 .760 .663 -.089 1.000 .831 .387 交通和通讯 .738 .902 -.061 .831 1.000 .326 娱乐教育文化 .556 .389 .267 .387 .326 1.000 两两之间的相关系数大小的方阵。通过相关系数可以看到各个变量之间的相关,进而了解各个变量之间的关系。由表中可知许多变量之间直接的相关性比较强,证明他们存在信息上的重叠。 KMO及Bartletts检验 KMO

11、与 Bartlett 检定 Kaiser-Meyer-Olkin 测量取样适当性。 .602 62.216 Bartlett 的球形检定 大约 卡方 df 显著性 15 .000 根据Kaiser的观点,当KMO0.9、KMO0.8、KMO0.7、KMO0.6、KMO0.5、KMO0.5。 公因子方差 Communalities 食品 衣着 起始 1.000 1.000 擷取 .878 .825 燃料 住房 交通和通讯 娱乐教育文化 1.000 1.000 1.000 1.000 .841 .810 .919 .584 擷取方法:主體元件分析。 Communalities表示公因子对各个变量能

12、说明的程度,每个变量的初始公因子方差都为1,共同度越大,公因子对该变量说明的程度越大,也就是该变量对公因子的依赖程度越大。共同度低说明在因子中的重要度低。一般的基准是0.4就可以认为是比较低,这时变量在分析中去掉比较好。 解释的总方差: 说明的变异数总计 起始特征值 元件 1 2 3 4 5 6 总计 3.568 1.288 .600 .358 .142 .043 变异的 % 59.474 21.466 10.001 5.975 2.372 .712 累加 % 59.474 80.939 90.941 96.916 99.288 100.000 总计 3.568 1.288 撷取平方和载入 变

13、异的 % 59.474 21.466 累加 % 59.474 80.939 撷取方法:主体元件分析。 因子1的贡献率为49.0%,因子2的贡献率为31.899%,这两个因子贡献率累积达80.9%,即这两个因子可解释原有变量80.9%的信息,因而因子取二维比较显著。 成分矩阵 元件矩阵a 元件 食品 衣着 燃料 住房 交通和通讯 娱乐教育文化 1 .902 .880 .093 .878 .925 .588 2 .255 -.224 .912 -.195 -.252 .488 撷取方法:主体元件分析。 a. 撷取 2 个元件。 该矩阵并不是主成分1和主成分2的系数。 主成分系数的求法:各自主成分载荷向量除以主成分方差的算数平方根。则第1主成分的各个系数是向量除以3.568后才得到的,即才是主成分1的特征向量。 第1主成分的函数表达式: Y1=0.490*Z交+0.478*Z食+0.466*Z衣+0.465*Z住+0.311*Z娱+0.049*Z燃 因子得分 因子得分显示在SPSS的数据窗口里。通过因子得分计算主成分得分。 主成分得分 主成分的得分是相应的因子得分乘以相应方差的算数平方根。 即:主成分1得分=因子1得分乘以3.568的算数平方根 主成分2得分=因子2得分乘以1.288的算数平方根 综合得分及排序 综合得分是按照下列公式计算: 综合得分Y为:

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号