多元统计分析——基于R语言课件因子分析.pptx

上传人:小飞机 文档编号:1722120 上传时间:2022-12-16 格式:PPTX 页数:47 大小:4.86MB
返回 下载 相关 举报
多元统计分析——基于R语言课件因子分析.pptx_第1页
第1页 / 共47页
多元统计分析——基于R语言课件因子分析.pptx_第2页
第2页 / 共47页
多元统计分析——基于R语言课件因子分析.pptx_第3页
第3页 / 共47页
多元统计分析——基于R语言课件因子分析.pptx_第4页
第4页 / 共47页
多元统计分析——基于R语言课件因子分析.pptx_第5页
第5页 / 共47页
点击查看更多>>
资源描述

《多元统计分析——基于R语言课件因子分析.pptx》由会员分享,可在线阅读,更多相关《多元统计分析——基于R语言课件因子分析.pptx(47页珍藏版)》请在三一办公上搜索。

1、多元统计分析,中国人民大学:何晓群苏州大学:马学俊,基于R语言,多元统计分析中国人民大学:何晓群基于R语言,因子分析,学习目标:1.理解因子分析方法的思想;2.了解因子分析的基本理论;3.掌握求解因子的方法步骤;4.分辨因子分析与主成分分析的异同;5.能够用R软件进行因子分析,并正确理 解系统输出结果。,06,因子分析学习目标:06,6.1因子分析的基本理论,6.1因子分析的基本理论因子分析因子分析(factor a,6.1.1 因子分析的基本思想,因子分析的基本思想是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,不同组的变量间的相关性则较低。每组变量代表一个基本结构,并用一个

2、不可观测的综合变量表示,这个基本结构就称为公共因子。,6.1 因子分析的基本理论, 对于所研究的某一具体问题,原始变量可以分解成两部分之和的形式,一部分是少数几个不可测的所谓公共因子的线性函数,另一部分是与公共因子无关的特殊因子。抓住这些主要因子就可以帮助我们对复杂的经济问题进行分析和解释。 因子分析不仅可以用来研究变量之间的相关关系,而且可以用来研究样品之间的相关关系,通常将前者称为R型因子分析,后者称为Q型因子分析。,6.1.1 因子分析的基本思想因子分析的基本思想是根据相关性,6.1 因子分析的基本理论,6.1.2 因子分析的基本理论及模型,1.查尔斯斯皮尔曼提出因子分析时用到的例子,6

3、.1 因子分析的基本理论6.1.2 因子分析的基本理论及模,6.1 因子分析的基本理论,6.1.2 因子分析的基本理论及模型,1.查尔斯斯皮尔曼提出因子分析时用到的例子,6.1 因子分析的基本理论6.1.2 因子分析的基本理论及模,1.查尔斯斯皮尔曼提出因子分析时用到的例子,6.1 因子分析的基本理论,6.1.2 因子分析的基本理论及模型,1.查尔斯斯皮尔曼提出因子分析时用到的例子6.1 因子分析,2.一般因子分析模型,6.1 因子分析的基本理论,6.1.2 因子分析的基本理论及模型,2.一般因子分析模型6.1 因子分析的基本理论6.1.2 因,2.一般因子分析模型,6.1 因子分析的基本理论

4、,6.1.2 因子分析的基本理论及模型,因子模型,2.一般因子分析模型6.1 因子分析的基本理论6.1.2 因,6.1 因子分析的基本理论,6.1.2 因子分析的基本理论及模型,载荷矩阵A的统计意义以及公共因子与原始变量之间的关系如下,6.1 因子分析的基本理论6.1.2 因子分析的基本理论及模,6.1 因子分析的基本理论,6.1.2 因子分析的基本理论及模型,载荷矩阵A的统计意义以及公共因子与原始变量之间的关系如下,6.1 因子分析的基本理论6.1.2 因子分析的基本理论及模,6.2 因子载荷的求解,6.2 因子载荷的求解求解步骤step1:确定因子载荷矩阵:,6.2.1 主成分法,6.2

5、因子载荷的求解,主成分法,6.2.1 主成分法6.2 因子载荷的求解主成分法,6.2.1 主成分法,6.2 因子载荷的求解,主成分法,6.2.1 主成分法6.2 因子载荷的求解主成分法,6.2.2 主轴因子法,6.2 因子载荷的求解,主轴分析法求解方法如下:,6.2.2 主轴因子法6.2 因子载荷的求解主轴分析法求解,6.2.3 极大似然法,6.2 因子载荷的求解,极大似然法,6.2.3 极大似然法6.2 因子载荷的求解极大似然法,6.2.4 因子旋转,6.2 因子载荷的求解,原因:不管用何种方法确定初始因子载荷矩阵A,它们都不是唯一的。我们得到的初始因子解各主因子的典型代表变量不是很突出,容

6、易使因子的意义含糊不清,不便于对实际问题进行分析。出于这种考虑,可以对初始公共因子进行线性组合,即进行因子旋转,以期找到意义更为明确、实际意义更明显的公共因子。方法:因子旋转分为正交旋转与斜交旋转。正交旋转由初始载荷矩阵A右乘一正交阵得到斜交旋转则放弃了因子之间彼此独立这个限制,因而可能达到更为简洁的形式,其实际意义也更容易解释。,6.2.4 因子旋转6.2 因子载荷的求解原因:不管用何种方,6.2.5 因子得分,6.2 因子载荷的求解,6.2.5 因子得分6.2 因子载荷的求解,6.2.6 主成分分析与因子分析的区别,6.2 因子载荷的求解,6.2.6 主成分分析与因子分析的区别6.2 因子

7、载荷的求解,6.3 因子分析的步骤与逻辑框图,6.3.1 因子分析的步骤,(1)根据研究问题选取原始变量。(2)对原始变量进行标准化并求其相关阵,分析变量之间的相关性。(3)求解初始公共因子及因子载荷矩阵。(4)因子旋转。(5)计算因子得分。(6)根据因子得分做进一步分析。,进行因子分析应包括如下几步:,6.3 因子分析的步骤与逻辑框图6.3.1 因子分析的步骤(,6.3 因子分析的步骤与逻辑框图,6.3.2 因子分析的逻辑框图,6.3 因子分析的步骤与逻辑框图6.3.2 因子分析的逻辑框,6.4 因子分析的上机实现,【例6-1】为了与主成分分析进行比较,此处仍沿用例5-3的数据(见表5-4)

8、,对衡量水泥企业经济效益的7项指标建立因子分析模型。Step1:读入数据,选择因子个数。,6.4 因子分析的上机实现 【例6-1】为了与主成,6.4 因子分析的上机实现,Step1:读入数据,选择因子个数。,6.4 因子分析的上机实现10.#方差解释11.cu,6.4 因子分析的上机实现,Step2:计算因子载荷和因子得分。因子载荷阵是用标准化的主成分(公共因子)近似表示标准化原始变量的系数矩阵。,6.4 因子分析的上机实现1.#因子载荷2.load,6.4 因子分析的上机实现,Step2:计算因子载荷和因子得分。由主成分法求解公共因子时,因子得分系数与因子载荷之间存在密切联系。,6.4 因子

9、分析的上机实现13.#因子得分14.va,6.4 因子分析的上机实现,实际上,在进行因子分析前,我们往往先要了解变量之间的相关性,以判断是否适合对数据做因子分析。,6.4 因子分析的上机实现1.#协方差2.sigm ,6.4 因子分析的上机实现,KMO检验用于检查变量间的相关性和偏相关性,KMO统计量的取值在01之间。KMO统计量的取值越接近1,表明变量间的相关性越强,偏相关性越弱,因子分析的效果越好。实际分析中,当KMO统计量在0.7以上时,认为做因子分析的效果比较好;当KMO统计量在0.5以下时,不适合做因子分析,应考虑重新选取变量或者采用其他分析方法。如果变量间相互独立,则无法从中提取公

10、因子,也就无法应用因子分析法。Bartlett球形检验的原假设是相关阵为单位阵。如果拒绝原假设,则说明各变量间具有相关性,因子分析有效;如果不拒绝原假设,则说明变量间相互独立,不适合做因子分析。,6.4 因子分析的上机实现12.#检验 13.psy,6.4 因子分析的上机实现,另外,得到初始载荷矩阵与公共因子后,为了解释方便,往往需要对因子进行旋转。我们首先进行方差最大正交旋转。,6.4 因子分析的上机实现1.fit61_var-p,6.4 因子分析的上机实现,由输出结果可以看到,旋转后公共因子解释原始数据的能力没有提高,但因子载荷矩阵及因子得分系数矩阵都发生了变化,因子载荷矩阵中的元素更倾向

11、于0或1。,6.4 因子分析的上机实现19.#因子得分20.x,6.4 因子分析的上机实现,有时为了使公共因子的实际意义更容易解释,往往需要放弃公共因子之间互不相关的约束而进行斜交旋转,最常用的斜交旋转方法为Promax方法。,6.4 因子分析的上机实现1.fit61_pro-p,6.4 因子分析的上机实现,Pattern Matrix即因子载荷矩阵,Structure Matrix为公共因子与标准化原始变量的相关阵。上面给出的三个矩阵存在如下关系: Structure Matrix=Pattern MatrixCorrelation Matrix(接上文代码如下),6.4 因子分析的上机实现

12、18.X3 0.968 0.132,6.4 因子分析的上机实现,下面我们对因子得分值进行分析。两个变量的标准差均为1,变量均值为0。得到各样品的因子得分后,可以对样本进行分析,如用因子得分值代替原始数据进行归类分析或者回归分析等。同时,还可以在一张二维图上画出各数据点,描述各样本点之间的相关关系。,6.4 因子分析的上机实现1.summary(score,6.4 因子分析的上机实现,图形中添加辅助线,调整坐标轴刻度,则可得到散点图,6.4 因子分析的上机实现图形中添加辅助线,调整坐标轴刻度,6.4 因子分析的上机实现,6.4 因子分析的上机实现,6.4 因子分析的上机实现,Step1:读入数据

13、,进行KMO检验和Bartlett检验。,6.4 因子分析的上机实现1.ex6.2-read,6.4 因子分析的上机实现,Step1:KMO统计量的值等于0.66,说明勉强适合进行因子分析,Bartlett检验的结果显示,在0.01的显著性水平下,拒绝协方差阵为单位阵的原假设,适合做因子分析。,6.4 因子分析的上机实现15.#Bartlett检验16.,6.4 因子分析的上机实现,Step2:选择因子个数。,6.4 因子分析的上机实现1.#建模2.fit62_v,6.4 因子分析的上机实现,Step2:由方差解释表和碎石图可看出,前三个特征根较大,其余五个特征根较小,而且前三个公共因子的总方

14、差贡献率为84.1%,基本提取了样本所包含的信息,因此选择三个公共因子是合适的。我们也可以根据碎石图的变化趋势选择四个公共因子。,6.4 因子分析的上机实现18.#碎石图19.plot,6.4 因子分析的上机实现,Step3:计算因子载荷和因子得分。,6.4 因子分析的上机实现1.#因子载荷2.loa,6.4 因子分析的上机实现,Step3:计算因子载荷和因子得分。,6.4 因子分析的上机实现15.#因子得分16.xx,6.4 因子分析的上机实现,【例6-3】区域公用事业的发展是地区综合发展的重要组成部分,是促进社会发展的重要因素。因此,分析评价全国31个省、直辖市、自治区在城市公共交通、市政

15、、设施等各方面的建设,把握各地区公用事业的整体发展水平具有重要意义。下面应用因子分析模型,选取反映城市公用事业建设的12个指标作为原始变量,对全国各地区公用事业的整体发展水平做分析评价。这12个指标分别为X1:城区面积(平方公里);X2:建成区面积(平方公里);X3:人均公园绿地面积(平方米);X4:城市建设用地面积(平方公里);X5:年末实有道路长度(公里);X6:年末实有道路面积(万平方米);X7:城市排水管道长度(公里);X8:城市道路照明灯(千盏);X9:年末公共交通车辆运营数(辆);X10:运营线路总长度(公里);X11:每万人拥有公共交通车辆(标台);X12:出租汽车数量(辆)。原

16、始数据来源于2017年中国统计年鉴。步骤如下:Step1:读入数据,进行KMO检验和Bartlett检验。Step2:选择因子个数Step3:计算因子载荷和因子得分,6.4 因子分析的上机实现【例6-3】区域公用事业的发展是,6.4 因子分析的上机实现,Step1:读入数据,进行KMO检验和Bartlett检验。结果显示该例的数据非常适合做因子分析。,6.4 因子分析的上机实现1.ex6.3-read,6.4 因子分析的上机实现,Step2:选择因子个数,6.4 因子分析的上机实现1.#方差解释,6.4 因子分析的上机实现,Step2:选择因子个数,方差解释表和碎石图显示,前三个公共因子总的方差贡献率为90.8%,基本提取了样本所包含的信息;随着公共因子个数大于3,碎石图中曲线的变化趋势明显趋于平稳,因此确定选择三个公共因子。,6.4 因子分析的上机实现Step2:选择因子个数,方差解释,6.4 因子分析的上机实现,Step3:因子载荷和因子得分。,6.4 因子分析的上机实现Step3:因子载荷和因子得分。1,6.4 因子分析的上机实现,Step3:因子载荷和因子得分。,6.4 因子分析的上机实现Step3:因子载荷和因子得分。1,6.4 因子分析的上机实现,6.4 因子分析的上机实现,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号