《spss第十一章主成分分析和因子分析.ppt》由会员分享,可在线阅读,更多相关《spss第十一章主成分分析和因子分析.ppt(25页珍藏版)》请在三一办公上搜索。
1、主成分分析和因子分析,主要内容,11.1 主成分析12.2 因子分析,11.1 主成分析,基本概念 主成分分析(Principal Component Analysis)就是考虑各指标之间的相互关系,利用降维的方法将多个指标转换为少数几个互不相关的指标,从而使进一步研究变得简单的一种统计方法。主成分分析是由Hotelling于1933年首先提出的,是利用“降维”的思想,在损失很少信息的前提下把多个指标转化为几个综合指标,称为主成分。分类变量和连续变量均可以参与两步聚类分析。每个主成分均是原始变量的线性组合,且各个主成分之间互不相关,这就使得主成分比原始变量具有某些更优越的性能。主成分分析不能看
2、作是研究的结果,而应该在主成分分析的基础上继续采用其他多元统计方法来解决实际问题。,11.1 主成分析,统计原理,第i个主成分:,设第k个主成分的方差占总方差的比例为,则有:,主成分的计算公式为:,11.1 主成分析,分析步骤第1步 原始数据的标准化处理;第2步 计算相关系数矩阵;第3步 计算特征值及单位特征向量;第4步 计算主成分的方差贡献率和累计方差贡献率;第5步 计算主成分。,11.1 主成分析,SPSS实现举例【例11-1】为了从总体上反映世界经济全球化的状况,现选择了具有代表性的16个国家的数据,这些国家参与经济全球化程度指标值见下表。试对其进行主成分分析。,11.1 主成分析,第1
3、步 分析:根据题目要求,需进行主成分分析。第2步 数据组织:按如上表所示的“指标”一列定义变量,输入数据并保存;第3步 主成分分析的设置,主要如下两图所示。,11.1 主成分析,第4步 因子分析的结果;,特征值与方差贡献表,从表中可以看出前3个主成分已经解释了总方差的近86.7%,故可以选择前3个主成分进行分析。,11.1 主成分析,主成分的碎石图,该图从另一个侧面说明了取前三个主成分为宜。,11.1 主成分析,旋转前的因子载荷矩阵,11.1 主成分析,第5步 利用因子分析的结果进行主成分分析:上表是旋转前的因子载荷矩阵,并不是主成分分析中所需要的标准化的正交向量,要得到标准化正交向量还需作如
4、下运算:将上表因子载荷矩阵中的数据输入SPSS数据编辑窗口中,将3个变量名分别命名为a1,a2和a3。用公式 计算出标准化特征向量。其步骤为:打开Analyze Compute Variable,计算过程如下图所示。,11.1 主成分析,计算结束后得到的特征向量矩阵如下表所示。,11.1 主成分析,对原始的数据变量进行标准化。由于是以相关系数矩阵为出发点进行因子分析的,所以主成分分析表达式中的变量应该是经过标准化的数据。计算主成分:再通过表各个主成分所分析的方差百分比计算出综合得分函数,其公式为:,11.1 主成分析,主成分及综合得分表:,主要内容,11.1 主成分析11.2 因子分析,11.
5、2 因子分析,基本概念 因子分析是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的分析方法,最早是由心理学家Chales Spearman在1904年提出的,它的基本思想是将实测的多个指标,用少数几个潜在的指标(因子)的线性组合表示。因子分析主要应用到两个方面:一是寻求基本结构,简化观测系统;二是对变量或样本进行分类。因子分析的基本思想是根据相关性的大小把变量分组,使得同组内的变量的相关性较高,而不同组的变量相关性较低。每组变量代表一个基本结构,这个基本结构称为一个公共因子。,11.2 因子分析,统计原理,其中x1,x2,xp为p个原有变量,是均值为零,标准差为1的标准化变量,F1,F
6、2,Fm为m个因子变量,m小于p,表示成矩阵形式为:,11.2 因子分析,分析步骤第1步 将原始数据进行标准化;第2步 确定待分析的原有若干变量是否适合于因子分析;第3步 构造因子变量;第4步 利用旋转使得因子变量更具有可解释性;第5步 计算因子变量的得分。计算因子得分和模型为:,j=1,2,m,11.2 因子分析,SPSS实现举例【例11-2】为了研究几个省市的科技创新力问题,现取了2005年8个省市的15个科技指标数据,请对其进行因子分析。,11.2 因子分析,第1步 分析:如题所示,要求用因子分析法分析。第2步 数据组织:建立x1-x15共15个数据变量和一个“省市”字符型变量,将北京、
7、天津等8个省市作为个案数据输入并保存。第3步 因子分析设置:,11.2 因子分析,正交旋转设置:,保存对话框设置:,11.2 因子分析,第4步 主要结果及分析:,特征值与方差贡献表,可以看出前3个特征值大于1,同时这3个公共因子的方差贡献率占了93.924%,说明提取这3个公共因子可以解释原变量的绝大部分信息。,11.2 因子分析,旋转前的因子载荷矩阵,在表的底部表明使用的是主成分分析法,3个主成分被抽取出来。,11.2 因子分析,旋转后的因子载荷矩阵,从旋转后的因子载荷矩阵可以看出。因子1在1、3、4、6、7、12、13、14上有较大的载荷,反映科技投入与产出情况,可以命名为创新水平因子。因子2在指标5、8和15上有较大载荷,反映地区经济发展及财政科教投入水平,可以命名创新环境因子,因子3在指标9和指标10上有较大的载荷,可以命名为高技术产业发展因子。,11.2 因子分析,因子转换矩阵,表明了因子提取的方法是主成分分析,旋转的方法是方差极大法。,因子得分及综合因子得分情况:通过以下函数计算得出综合因子得分情况。,