SPSS的因子分析.ppt

上传人:牧羊曲112 文档编号:5449225 上传时间:2023-07-08 格式:PPT 页数:33 大小:264.99KB
返回 下载 相关 举报
SPSS的因子分析.ppt_第1页
第1页 / 共33页
SPSS的因子分析.ppt_第2页
第2页 / 共33页
SPSS的因子分析.ppt_第3页
第3页 / 共33页
SPSS的因子分析.ppt_第4页
第4页 / 共33页
SPSS的因子分析.ppt_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《SPSS的因子分析.ppt》由会员分享,可在线阅读,更多相关《SPSS的因子分析.ppt(33页珍藏版)》请在三一办公上搜索。

1、第九章 因子分析,因子分析的基本思想,为尽可能完整描述一个事物,往往要收集它的许多指标(如企业评价、投资环境评价)多指标产生的问题:计算处理麻烦信息重叠从众多的指标中剔除一些指标又会造成信息丢失,因子分析的基本思想,因子分析的基本出发点将原始指标综合成较少的指标,这些指标能够反映原始指标的绝大部分信息(方差)这些综合指标之间没有相关性因子变量的特点这些综合指标称为因子变量,是原变量的重新构造个数远远少于原变量个数,但可反映原变量的绝大部分方差不相关性可命名解释性,因子分析的核心问题,如何构造因子变量如何使因子变量具有命名解释性,因子分析的基本步骤,确认待分析的原始变量是否适合作因子分析构造因子

2、变量利用旋转方法使因子变量具有可解释性计算每个样本的因子变量得分,因子分析的数学模型,数学模型(xi为标准化的原始变量;Fi为因子变量;mp)x1=a11F1+a12F2+a1mFm+a11x2=a21F1+a22F2+a2mFm+a22xp=ap1F1+ap2F2+apmFm+app也可以矩阵的形式表示为:X=AF+a,F:因子变量A:因子载荷阵aij:因子载荷:特殊因子,因子分析的基本概念,因子载荷在因子变量不相关的条件下,aij就是第i个原始变量与第j个因子变量的相关系数。aij绝对值越大,则Xi与Fi的关系越强。反映因子和各变量间的密切程度,因子分析的基本概念,变量的共同度(Commu

3、nality)(公因子方差比)衡量因子分析效果Xi的变量共同度为因子载荷矩阵A中第i行元素的平方和,在原始变量标准化的条件下:h2i+2i=1可见:Xi的共同度反应了全部因子变量对Xi总方差的解释能力,表示提取公因子后,各变量中信息分别被提取出的比例,或者是原变量的信息量(方差)中由公因子决定的比例(类似于决定系数),因子分析的基本概念,因子变量Fj的方差贡献衡量因子的重要程度因子变量Fj的方差贡献为因子载荷矩阵A中第j列各元素的平方和,可见:因子变量Fj的方差贡献体现了同一因子Fj对原始所有变量总方差的解释能力。Sj/p表示了第j个因子解释原所有变量总方差的比例,原有变量是否适合作因子分析,

4、计算原有变量的相关系数矩阵一般小于0.3且未通过统计检验就不适合作因子分析巴特利特球度检验(Bartlett test of sphericity)H0:相关系数矩阵与单位阵无显著差异以变量的相关系数矩阵出发计算巴特利特统计量。统计量较大且概率小于显著性水平,应拒绝H0,表示适合作因子分析,原有变量是否适合作因子分析,反映象相关矩阵(Anti-image correlation matrix)检验以变量的偏相关系数矩阵为出发点,将偏相关系数矩阵的每个元素取反,得到反映象相关阵。如果反映象相关矩阵中的很多元素的绝对值比较大,则说明这些变量可能不适合作因子分析KMO检验KMO=所有变量间相关系数平

5、方和/(所有变量间相关系数平方和+所有变量间偏相关系数平方和)一般0.7以上就可以作因子分析,确定因子变量个数-主成分分析,主成分分析法:利用坐标变换y1=u11x1+u21x2+up1xpy2=u12x1+u22x2+up2xpyP=u1Px1+u2Px2+uppxp该方程组要求:u1k2+u2k2+u3k2+upk2=1(k=1,2,3,p),将原有的P个相关变量Xi作线性变换后转成另一组不相关的变量Yi,x2,x1,y1,y2,X1与x2相关,y1与y2不相关,确定因子变量个数-主成分分析,系数uij依照两个原则来确定yi与yj(ij,i,j=1,2,3,p)互不相关;y1是x1,x2,

6、x3,xp的一切线性组合(系数满足上述方程组)中方差最大的;y2是与y1不相关的x1,x2,x3,xp的一切线性组合中方差次大的;yP是与y1,y2,y3,yp都不相关的x1,x2,x3,xp的一切线性组合中方差最小的;,确定因子变量个数-主成分分析,主成分分析的基本步骤:将原始数据标准化计算变量间简单相关系数矩阵R求R的特征值123p0及对应的单位特征向量1,2,3,p得到:yi=u1ix1+u2ix2+upixp特征根(Eigenvalue)可以看成主成分影响力度的指标,代表引入该因子(主成分)后可以解释平均多少原始变量的信息,确定因子变量个数-主成分分析,确定m个主成份根据特征值i确定:

7、取特征值大于1的主成分;二是,根据累计贡献率,一般累计贡献率应在70%以上;另外,还可以通过直观观察碎石图的方式确定主成分的个数。综合判断,往往根据累计贡献率确定较少,根据特征值i确定又较多,应两者结合注:因子分析更重要的是因子的可解释性,必要时可保留特征根小于1的因子;而即使特征根大于1,但无合理解释,也可舍去。,计算因子载荷矩阵,主成分分析中选取主成分的个数就是因子分析中因子变量的个数依据因子载荷矩阵计算变量的共同度和因子变量的方差贡献率,因子变量的命名解释,发现:aij的绝对值可能在某一行的许多列上都有较大的取值,或aij的绝对值可能在某一列的许多行上都有较大的取值。表明:某个原有变量x

8、i可能同时与几个因子都有比较大的相关关系,也就是说,某个原有变量xi的信息需要由若干个因子变量来共同解释;同时,虽然一个因子变量可能能够解释许多变量的信息,但它却只能解释某个变量的一少部分信息,不是任何一个变量的典型代表。结论:因子变量的实际含义不清楚,因子变量的命名解释,通过某种手段使:每个变量在尽可能少的因子上有比较高的载荷,即:在理想状态下,让某些变量在某个因子上的载荷趋于1,而在其他因子上的载荷趋于0。这样:一个因子变量就能够成为某些变量的典型代表,它的实际含义也就清楚了。通过对因子载荷矩阵进行旋转来实现,因子变量的命名解释,例如:在市场调查中收集食品的五项指标:味道、价格、风味、是否

9、快餐食品、能量。因子分析结果:X1=0.02z1+0.99z2+1X2=0.94z1-0.01z2+2X3=0.13z1+0.98z2+3X4=0.84z1+0.42z2+4X5=0.97z1-0.02z2+5第一公因子代表“价廉”,第二公因子代表“味美”。,计算因子得分,因子得分是因子变量构造的最终体现。基本思想:是将因子变量表示为原有变量的线性组合,即:通过因子得分函数计算因子得分Fj=j1x1+j2x2+j3x3+jpxp(j=1,2,3,m),因子分析的基本步骤,菜单选项:analyze-Data Reduction-Factor选择参与因子分析的变量到Variables框Extrac

10、tion:选择构造因子变量的方法。默认主成分分析法。Display Scree plot画碎石图Extract框:指定确定因子个数的标准,因子分析的基本步骤,Rotation:选择因子载荷矩阵的旋转方法。默认是不进行旋转。一般可以选择Varimax选项,采用方差极大法旋转Scores:Save as variables:将因子得分存成一个名为FACn_m的SPSS变量中,其中:n是因子变量的名,以数字序号的形式表示;m表示是第几次作的。Display factor score coefficient matrix项表示:以矩阵的形式输出因子得分函数。Method框中提供了估计因子得分的几种方法

11、。,因子分析实例,对中国移动集团下属省公司的投资环境展开分析随着我国通信市场竞争格局的形成与完善,竞争程度的日益加剧,各大运营商都将创造价值作为企业追求的核心目标“有效益地投资”是企业价值创造活动的核心,是企业在竞争中立足于不败之地的法宝,探寻有效的投资方案是保证企业投资效益的根本分析各分公司投资环境,根据投资环境的优劣确定投资是一套有效的方案投资环境是对各地区剔除规模因素外的影响投资各项因素的综合评估,选择因子分析法的原因,投资环境评价指标体系庞杂,共涉及六大类18项指标,且指标间具有一定的相关性对于18项指标逐一赋以权值难度大,难以兼顾客观性、科学性、公平性、准确性的要求因子分析法是一种较

12、为适宜的方法降维,简化指标结构,避免指标间相关因素的影响采用各因子的方差贡献率作为权数避免了权值确定中人为因素的影响,有利于保证结果的客观性,因子分析结果,公因子个数的确定:根据方差贡献率,观察碎石图因子变量的实际解释:通过因子载荷矩阵旋转因子得分及其含义,六因子,八因子,对应分析,问题提出,分析分类变量之间关系时,卡方检验只能给出总体有无关联的结论,无法给出各分类之间的联系实际问题:全球通品牌的用户都是谁?其他还有什么特征的人群也倾向于成为移动用户?什么特征的人群还没有找到满意的品牌?移动公司推出的品牌是否全面,有无重叠品牌?有无空白市场需要品牌填补?,对应分析方法,是一种多维图示分析技术,直观而简单地呈现类别间的联系。通过进行主成分分析描述两个或多个分类变量各水平间相关性,分析结果主要采用反映变量间相互关系的对应分析图来表示,对应分析实例1,收入水平与品牌选择(1)b产品定位高端客户,无重复产品(2)c产品定位模糊,应考虑与a、d拉开距离(3)a、d产品在第一维度上无区别,而第二维度仅携带2%的信息,两者定位重复,对应分析实例2,92年美国大选,不同教育水平的选民倾向性如何?(1)第一维度携带两变量大部分信息,第二维度则较少;(2)高中学历和本科学历的选民倾向于布什(3)研究生学历的选民倾向于克林顿(4)倾向于佩罗则不明显,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号