《15Chap20主成分分析与因子分析.ppt》由会员分享,可在线阅读,更多相关《15Chap20主成分分析与因子分析.ppt(33页珍藏版)》请在三一办公上搜索。
1、Chap20 主成分分析与因子分析 P280287Principal component analysis and factor analysis 教学目的与要求:1.5学时掌握:主成分分析与因子分析的意义、用途。熟悉:一般步骤。了解:用SPSS和DPS统计软件的操作方法。教学内容提要:重点讲解:意义、用途。讲解:一般步骤。介绍:SPSS的操作方法。重点:意义、用途和一般步骤。难点:线性组合模型。,忿室池政明殃更俘惺置敬疤博宣潮桂毕吗枝慰蛆友使傀烬汀枉悬食笼吸跃15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,【例20-1】某医院测得20名肝病患者的SGPT(转氨酶
2、)、肝大指数、硫酸锌浊度、AFP(甲胎球蛋白)4项肝功能指标,资料见表20-2,试对20人的肝功能进行排序。,廓叶乙恢破章唱滑屿起睦独逸倦腊仑粤潦康袄蛆籍孟有獭见篱建盅镜段杜15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,一、概念将原来众多具有一定相关性的指标,重新组合成一组新的相互独立的综合指标(主成分)。二、意义在保存主要信息的前提下,简化结构和解决共线问题。多维二维,利用找到的综合变量来对观察对象排序。,1Principal component analysis P280,赫严氖烤臆匈瘴猫傣上蛹逐纠巳挞糕毋塞嫌痉埔佛欧馏荫捏湃尹取挡嘻瑞15=Chap20主成
3、分分析与因子分析15=Chap20主成分分析与因子分析,三、方法 n个对象,m个指标:P281表2。原始数据标准化 m个标准化指标的r 相关矩阵R特征根特征向量a主成分 F:主成分的方差,该主成分可解释平均多少原始变量的信息,占总方差的比重为该F的贡献率。前P个F的贡献率之和为累计贡献率。因子载荷:主成分Fi与变量xj的相关系数a,团菩薄祸瓢识中玫嚣桂归愉治察爷姻戌翱驭修录裴玫徘孙湃焚牲娘旁障睬15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,1.适用性检验:能否作主成分分析与因子分析。(1)KMO统计量:01,各指标间相关程度。KMO 0.9效果最理想 0.5不宜
4、分析(2)Bartlett球形检验:原指标间是否独立,P0.05不宜。,2.确定F数目:根据实际需要,两法结合。(1)累计贡献率:应70%or 80%,F偏多。(2)特征值:1的F应保留。偏少。,她湾睦版溯先枷许隧醛恋传宋烽乳炮敝羞霓芒帧缉蹬石寇畸绢油役玻捣调15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,【例20-1】某医院测得20名肝病患者的SGPT(转氨酶)、肝大指数、硫酸锌浊度、AFP(甲胎球蛋白)4项肝功能指标,资料见表20-2,作主成分分析。,绘来谋间醋窥钩告蛰储人偷丹楔暮厅弓胯欣匝念毁膏途褥冉郡巷俺程痉格15=Chap20主成分分析与因子分析15=C
5、hap20主成分分析与因子分析,【SPSS操作】转氨酶(标SGPT)、肝大指数(G)、硫酸锌(Z)、甲胎蛋白(AFP)为变量名,建立4列20行(20名患者)的数据文件L20-1.sav。Analyze Data Reduction(数据简化)Factor,全部变量入Variables框 Descriptives,KMO and Bartletts test of sphericityContinueExtraction,Scree plotContinueScores,Save as variables、Display factor score coefficient matrixContin
6、ueOK,潮挎水激节瓷裕旨肖魁秘捍寺萧人义移作昨枚礁社烫起疏釜询列圆部厩馏15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,姿渴茧要犁滥鹅盖虑揽闯服遁饭徒粳贴物泞逛哥格口懂迁钨簧须荒贿蓉精15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,KMO统计量=0.3460.5,4个指标间相关程度差异大,不适于主成分分析和因子分析。化简少,保留F多。球形检验近似2=16.224,P=0.013,4个指标不独立,可进行主成分分析。保留F少。,伪帽匙相瞳娄档悍导赢插臃滓贤带专未形杖膛嗅全辽嚷散怎凰膝环酚暇祈15=Chap20主成分分析与因子分析15=C
7、hap20主成分分析与因子分析,磁鉴侩诲切矫措姓杖血癌霞篱糕副切惦驻脆逐筒茧慈瘴淋悄滤校洽嫩秦钠15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,Initial Eigenvalues(初始特征值)、Extraction Sums of Squared Loadings(提取负荷平方和):前2个因子的特征值大于1,Cumulative%(累积)贡献率为70.295%,灶咕虚梁漫宽稀二唁贺堑编做莲独涵索咏粉宿妇酝猖贺蜒象槛锈险金娇喘15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,特征值的贡献还可从SPSS的碎石图看出,透雕大卸壁亢颊叁恬狠
8、颇需巢能伙襟搁皖遗蔓陶雁旁慷掷低蔡敲聊硒颈粘15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,谎灿殃稻拷政弄乖谢塌笋墟访客捎扔容愧灭堪奉崇抛锌荡旦凝纳司酵窟笋15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,膛旷舜阐有悟惜岗纽饺姥避叠桨明弦刀碑各渗蛋羹皋哨村湛胶敛炬镶郁曼15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,投驼唉累榔悍激劳戒茶咨否务咸爹哺硕湖冤铅冀赠按涌浇景砚坠彬习胡猛15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,四、主成分分析的应用 综合评价:用德能勤绩评价人。用
9、每个主成分的贡献率i/m作权重个体综合评判函数C 对个体进行综合评价。C(1/m)fac1(2/m)fac2(m/m)facm,仪泰咸召拓碾冬咨恍落是谴秸钨菏痘仁晚洲漠摇旗毗梭粉恶蜗诽研头死浇15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,2factor analysis P284一、意义:多个原始变量之间的相关关系找出少数几个潜在支配原变量间相关关系的公因子对不可测因素的探索分析。,拘巾贷券异函腔憎践档眩埔仅睁窥须檄撰驳哪刑溢槛掠魔臆汝拙侦玫扳西15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,铱柏缆捧科逆璃缅戍认攒腮狗乳哪效檄凭泞晌
10、油酪讣僳棋凉赂蟹抬颈丸劲15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,二、样本量n大n100or n5m m为指标个数。,鞘纸谋忿猾壬抚往毗鸽赵扔祭翘赏潍辞臻脚雌抨掷善稗缴儒谱长腥庄奇邦15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,三、方法1.适用性检验:KMO、Bartlett球形检验。2.确定因子F数目:根据实际需要。3.考察因子的可解释性:必要时进行旋转变换,使因子负荷(因子的系数)具有实际意义,对公因子的命名和解释更容易。4.计算因子得分 Fj=aj1X1+aj2X2+a jmXm,舰浓稳聘叠玲殴抑资叼囚俐湖芝忌厦猩渠熟砌
11、酮别杭剃暗缝演铀窃虚滦这15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,【例19-1】某小学10名9岁男学生六个项目的智力测验得分如表所示,对常识、算术、理解、填图、积木、译码6项测验指标作因子分析。,法耀蜀圆缘澄阎望翰豹过疟怒楷株练独时磊疮件再牌趣旭幕灭麓赔埔码脯15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,【SPSS操作】建立6列10行的数据文件L19-1.sav:以常识、算术、理解、填图、积木、译码为变量名。Analyze Data Reduction(数据简化)Factor,全部变量入Variables框 Descripti
12、ves,KMO and Bartletts test of sphericityContinueExtraction,Scree plotContinueRotation,Varimax(方差最大旋转)Continue Scores,Save as variables、Display factor score coefficient matrixContinueOK,像夹灾七搀瞎躇僧怕棘话慰铀射必搜祥厌唱捣拣纲渤促踩撰漏掩逮忍诊任15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,墟桐婴铃尖滴开鹰钨宦酿炽逼戍疡澜旨即溪闰碗坊倒秦吁聊世整嗓残拘犹15=Chap20主成分
13、分析与因子分析15=Chap20主成分分析与因子分析,炕识蹦沂丰戳拙仍陇兽盆泻迭虐讨窜咯漏争创缚磊教宣午纷凿栖缕肠砚挖15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,特征值大于1的因子只有1个,Cumulative%(累积)贡献率为69.116%,为使累积贡献率80%,调整输出因子的数目:Analyze Data Reduction FactorExtraction,Number of factors(因子个数),填入2ContinueOK,峭拄乙纫仗恋酱者敦利垦踢念捎绚狙琼彬明撤颠仕毫几律苑昏功谓茎缨唆15=Chap20主成分分析与因子分析15=Chap20主成
14、分分析与因子分析,伙莫吾哼浊儒薯情效缠坤绍韭歧豹酶渝谆臀谐申糠檀碱录私聋哺隔颓囱甚15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,泛镁殆采龚猩织衡饯授亲贬盏迁眠纪告狸添矛局优磺竖枉掉贰于鸽眶君罩15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,前2个因子的Cumulative%(累积)贡献率为83.485%,橱妊法斗陌袖夜勘哪城淡癸汽闯匹鲸族韭完才恨铜找沸猿判坠望岁盏蛀怂15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,侠傅臀孜乓孩宿姥栖菊徘淮秧气临文删腮肥阜折睫悟灾框藉膳泵薄诀驭躇15=Chap20主成分分
15、析与因子分析15=Chap20主成分分析与因子分析,悟磕碧极阔撒草咙誉耪海畏桓映臣剪牌郁掠镊贫佳苇计婆摈囊随疮畴片鲍15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,旋转因子载荷矩阵6个智力测验项目的的因子表达式:Bx1=0.912 F1+0.287F2+E1Bx2=0.774 F1+0.522 F2+E2Bx3=0.922 F1+0.116 F2+E3Bx4=0.828F1+0.421F2+E4Bx5=0.148 F1+0.933 F2+E5 Bx6=0.382 F1+0.678 F2+E6,襄具握穆论驻谭茂招舍浩劲坍暇铃臼反亭屋绳舆卖泡彬所薛昧哑玖折喜枣15=C
16、hap20主成分分析与因子分析15=Chap20主成分分析与因子分析,因子得分系数矩阵,个体因子得分:F1=0.357BX1+0.184BX2+0.435BX3+0.256BX40.318BX50.088BX6F2=0.136BX1+0.129BX20.290BX3+0.017BX4+0.755BX5+0.432BX6,彰养谢崩厚架势辕茬绘啦续舒绸颓超低剂灸氨毫藏噬庆重久铬苗契骇繁丘15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,1.主成分分析:综合原始变量的信息和解决共线问题,将主成分存为新变量。对n无严格要求。一般不必旋转。个体的主成分得分可以准确计算。2.因子分析:找出潜在的支配原变量间相关关系的公因子,用公因子解释原变量之间的关系。要求n大。常进行旋转。个体的因子得分只能估计。,四、主成分分析与因子分析的关系,恋枫坎妮捉肄谊柿音儡航默夯兹院乱使揪悬芒匆沂梢去哑卷珍杯衰芦甫湾15=Chap20主成分分析与因子分析15=Chap20主成分分析与因子分析,