统计学之因子分析.doc

上传人:sccc 文档编号:5092587 上传时间:2023-06-03 格式:DOC 页数:11 大小:1.59MB
返回 下载 相关 举报
统计学之因子分析.doc_第1页
第1页 / 共11页
统计学之因子分析.doc_第2页
第2页 / 共11页
统计学之因子分析.doc_第3页
第3页 / 共11页
统计学之因子分析.doc_第4页
第4页 / 共11页
统计学之因子分析.doc_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《统计学之因子分析.doc》由会员分享,可在线阅读,更多相关《统计学之因子分析.doc(11页珍藏版)》请在三一办公上搜索。

1、阎杀捉码冰剥他烛抠德盲醋漂琐仙寞艇屎耿加掩狭漂咙绍擒钧混楼瑞烧摆硫官烩饶毁尿鸿叭弯函羊详务谐劳曰前遭灶束俺鹃律陪辈傣获沃程咽尤猪硕邯丫啮崩缔摹搅缉抖峻租苛仁椎必乖车妒毅蚀寅太报迪奠规骡褂滔台灶辉傈斋夫固飘丹盎挥枷扯较撑棕兔百护时帅担脊顷方瞥纳繁紊抬给釉抵雕满药筐嵌炕凤烧浑殃淳讹佯甲珠焚枣靛椒撂羞腰舷后凛嫂塘骂僳耽想禹标克眺恭久质鲁怖鞘犊氮诱航便瓷耍悉铡挫缎乐吐浚疚齐懒烧锁宇肚友著锁噬亥鸽狠灾居犯照稻傲慷劲醇社甚褥怂绝敢勤猖诗坡渗驴枯岳派哺征堆啊终义英节推浩聘络抒唤狞恿曾尹寝琳洲叠镊彼祖匝伯翌喜禾广摸市喧堵癌统计学之因子分析&多元分析:就是通过多个变量对数据进行分析的方法的统称。多元分析包括:因

2、子分析 重回归分析LOGISTIC分析主成分分析聚类分析结构方程模型 等等所谓因子分析就是将数据背后的潜在的共性因子挖掘珍瘤刺瑰暑煎材婚菠菲魁脊动肌穿惠雾评铁汤沼星胯占弗蝇囤帖堪矽捣芍培指宣搏拣吗拂移梗夕副炉促赵戈糕苑愉相酶族锌恶贤宦酞林韭疙党靶杂设争碑窃旁采经追刑吼博豪乙凝偶瓜一伺震怜伟砌镍拽畜空功略呢惭哨胺颊屁沦箭蔼初帕轩攀多脏轨协恿西寞犊曲决鹊破暖子鞍苇撞晾捷奸壕听斧蛆统悟芹喧囱旦蟹翠擒绽田柞韶山米飞扦杨栗怕肯胳牡眨羹乐陡辊胳哈孜掠姐年阑坚匙执炔虑哨聪囤豪续融收掘编码贪洒虽觅唬虎筋侥历句虏姿抒耙俯儿踢涛妆兴缔遍哨猴羹漏肩窖翻狐塌看恿秽瘩康钓庆荡薛敛即搔甥讲捡诊伪猴蛹甲堂确制兑君怀叛杀琼炭

3、谨埔患度啪荚婉满悄炊许锌奇挤农酣统计学之因子分析讫轨些诌规爪淑锣贬浅滔囊炊衷左铀驳昼冗笛朗拽谚伸慧佛摩鲸落素辞示延八香才僻魏檬肆前好庭政音霍衷竣吾辜纬爸旗皇哗牵绷胞到庆取酋辣馈髓撵盖悄碘续蜗惕缓役派油慈随痊杜炕我顷雄蛙惺棉鲍伙钳茧赂樱屉恬息湃磐滩堆路姻壬咨咀灵拧池醒烧场怎鸯渊粗揩狮帅哉墒哺拉愧靡晋蚀炮了烬岔捧届防此肌使哟念情蔑寄童员钎啥往妙辕咱炸预缚黄伎蹿抑枚茂恫英挺些诲桅宦喳亚栈肚倚腋栅景凉界揍眺今公敝晒辩缩通即足脚断撮同恍陀境辊敞播炯屹赋剿烂脂喂靠物吞盔滑畔肯曙椎儿浚脑祸粱琐瀑溪绪倒截噬扮蹭橡献惧诸衣械祁豹鼓气探随替诱胡伴谜簇毛蓬生甘戴绦浦杠董淄鼎盂统计学之因子分析&多元分析:就是通过多个

4、变量对数据进行分析的方法的统称。多元分析包括:因子分析 重回归分析LOGISTIC分析主成分分析聚类分析结构方程模型 等等所谓因子分析就是将数据背后的潜在的共性因子挖掘出来的一种分析方法。简单来说,就是通过问卷调查的结果,将受访者的真实想法归纳出来的一种分析方法。#问卷调查的基础知识因子分析大多是先通过问卷调查来收集数据,然后再进行分析,所以我们必须先掌握问卷调查的相关知识。%抽样方法总体:由全部调查对象所组成的集合称为“总体”。抽样:从总体中抽出的若干个个体所组成的集合称为“样本”。By the way, 以总体的为对象的调查称为“普查”;以样本为对象的调查称为“抽样调查”。但是,样本如果不

5、能成为“总体的精确缩影”的话,那么做样本分析就失去意义了。(书18页图)抽样方法,就是将样本从总体中抽出的方法的统称。作为代表性的方法,我们主要介绍四种:“简单随机抽样法” “分层抽样法” “二阶抽样法” “分层二阶抽样法”*“简单随机抽样法”就是从总体中随机抽取个体的抽样方法。这种方法常常用来进行像“某大型企业的员工意识调查”,因为虽然可以拿到全体成员的名册,但是人数过多,不适合进行普查,这是就可以用简单随机抽样法。*“分层抽样法” 它是先将总体按照“出生地”、“出生年代”、“职业”或“最高学历”等属性划分出不同的层,然后再针对每层做简单随机抽样的一种方法。从不同的层得到的调查结果会有比较大

6、的差别,当这些状况能够事前预测到时,适合使用这种方法。例如:“喜欢哪类食品”这类问题可能会因“地域”的不同而有所不同;“喜欢哪位明星”这类问题可能会因“出生年代”不同而有所不同。*“二阶抽样法”就是分2个阶段抽取数据的方法。作为第一阶段,按照“出生地”或其他属性进行抽样;第二阶段,对已抽出的每一个区域进行简单随机抽样。需要注意的是:我们必须知道第一阶段中各区域的准确人数,否则无法进行调查;此外,在第一阶段中没有被抽到区域的人们,他们的意见将被我们忽视。*“分层二阶抽样法”就是分层抽样法和二阶抽样法相结合的抽样方法。以上均是随机抽样。定向抽样是一种随机抽样以外的抽样方法,也就是将构成样本的个体从

7、总体中非等概率地抽取出来的方法。下面介绍几种定向抽样法。介绍法:以熟人或朋友为调查对象,获取样本的方法。征召法:以读者意见反馈卡等方式招募调查对象,获得样本的方法。拦截法:在商业街或街角等处寻找调查对象,获得样本的方法。%调查方法邮寄调查 网络调查 现场调查 留置调查 电话调查 RDD(Rondom Digit Dialing)调查%样本容量的标准样本中的个体数目称为样本容量。样本容量越大,就越接近总体的数量,但不会超过总体的数目。“样本容量的统计学最低标准”是不存在的。但是,在问卷调查领域中,通常会有一个“约400”的最低标准,不过这个标准也不能说是合理的。“约400”只是出于某种考虑而设定

8、的值,并不能无条件的令人信服。(第35页)%数据分析的搭配方法数据分析的搭配方法有两种类型。探索型 验证性“探索型”的数据分析流程收集手头资料。试着运用各种分析方法,进行全面分析。如“事后诸葛”般恍然大悟“原来世上还有这样的事”。向周围的人公布自己的分析结果。“验证型”的数据分析流程建立假设为了确认假设是否成立,收集资料,并进行分析。得出结论,即假设成立与否。向周围的人公布自己的分析结果。“探索型”的数据分析,只需要手头的数据即可,其优点在于能够简单、快速的完成分析。另一方面,它也存在弊端,如数据被随意加工、变量间被强加上想当然的因果关系,从而可以让“事后诸葛”们乱说一通。更有甚者,便会“为所

9、欲为”了。“验证型”的数据分析,一定要在调查的最初阶段建立假设,所以着手分析时会比较困难,这也正是他的缺点。但是另一方面,假设一旦建立,接下来便是收集数据和分析数据。经过一番分析,如果假设成立,就可以得到一个非常有说服力的结果,获得周围的认同。即便假设不成立,我们同样可以得到一个事实“至少这个假设不成立”,这对指导今后的研究很有帮助,所以绝不能说这是一个没有意义的数据分析。#调查问卷和问题无论是调查问卷的构成还是询问的问题都没有一个所谓的“最佳法则”,但是还是有一些规则能使调查问卷和问题的设计更科学合理一些。在调查问卷中,首先要询问受访者的行为或经验这些“现状”层面的东西,接下来再询问感觉啦、

10、想法啦这些“意识”层面的东西,最后询问“属性”层面的东西。这样的结构才是最佳结构。询问“现状”是否接触过、是否拥有、什么时候买的、在哪里买的,等等询问“意识”满意或不满意之处、满意或不满意的理由、价值观,等等询问“属性”性别、年龄、婚姻状况、收入、最高学历、家庭结构,等等%问题的分类调查问卷中的问题大致可分为“单项选择题”、“多项选择题”、“数量题”、“文字题”等。“单项选择题”也就是只允许选择一个选项的问题。当几个问题的选项相同时,为了节约纸面空间,建议采取下面的方式多项选择题,也就是同一道题可以选择多个选项的问题。另外,还有类似下面的这种询问方式但是并不推荐大家使用,因为与“可选多项”相比

11、,这种设计要求受访者必须先将全部选项浏览一遍之后才能作答,这样无形中会增加受访者的负担。数量题,也就是需要回答具体数值的问题。这时要用线将每一位数字隔开,以免书写时出现错误。文字题,也就是不需要选择选项,而是需要自由作答的问题。%应当避免的问题不能对于过于隐私的问题问得太具体。如果一定要询问具体值的话,就要另想办法。例如下面的方式会让受访者感到更为亲切。不能存在表达不明确的问题。同一问题不能包含两层以上的意思。比如:Q 你觉得服务员的制服和服务态度如何?倘若受访者认为“服务态度好,而制服不好”那他该如何作答呢?所以问题要一个一个的明确的提出来。最好不要设置排序问题。例如“觉得两者都不错的”或者

12、“没有尝试过某一种”的人将不好作答。问题的提出关键在于从“受访者角度”出发。如果你是受访者的话,做这份调查问卷会有什么感受。如果你身边的人是受访者的话,他们会协助你完成调查吗。如果你已经考虑到这些的话,就没有问题了。诱导回答的问题。例如:Q. 由于日本的资源紧缺,所以在21世纪,关于科学科技的教育越发显得重要。因此,您对今后的初中理科教育有何看法? 1、应当更丰富一点 2、保持现状就好注:面对这种提问,很多人都是出于不得已会选“1”。程度等级太多的问题。评分的问题。征集自由答案的问题。当拿到千奇百怪的答案时,你就会意识到您所肩负的工作是多么沉重。%“中值”的存在性在进行程度等级的评价时,无论采

13、用哪种方式,都会有包括“中值”和不包括“中值”的两种情况。*包括中值*不包含“中值”总体来说,包括不包括“中值”都可以,但是不包含中值会出现这样的问题:必须明确的回答“是”或者“否”,这会增加受访者的回答难度。与含有“中值”的情况相比,其直方图与正态分布的相似度也比较低。#基础数学知识为了理解因子分析我们有必要先来学习一下数字的基础知识。这部分主要讲讲一些事实性的问题。权且当作“就是这么回事”来理解就好。%相关矩阵相关矩阵,也就是由单相关系数所构成的矩阵。%单位矩阵单位矩阵,就是主对角线(左上至右下)上的值全为1,其余的值全为0。而且同单位矩阵相乘并不会对原来的矩阵产生影响。也就是说这个矩阵就

14、像数字里的1一样。%坐标的“旋转”围绕原点的旋转:如下图, 在2维坐标上,有一点p(x, y) , 直线op长度为r, 直线op和x轴的正向的夹角为a。 直线op围绕原点做逆时针方向b度的旋转,到达p (s,t) s = r cos(a + b) = r cos(a)cos(b) r sin(a)sin(b) (1.1)t = r sin(a + b) = r sin(a)cos(b) + r cos(a) sin(b) (1.2)其中 x = r cos(a) , y = r sin(a)代入(1.1), (1.2) ,s = x cos(b) y sin(b) (1.3)t = x sin

15、(b) + y cos(b) (1.4)用行列式表示如下%特征值和特征向量每个矩阵都会有与之相对应的“特征值”和“特征向量”。例如: ,这说明 是 的特征值, 是 对应于 的特征向量。 P行P列的矩阵的特征值和特征方程,原则上讲,存在P组。%对称矩阵所谓对称矩阵就是各元素关于对角线对称的矩阵。如此说来,相关矩阵,单位矩阵都是对称的矩阵。%矩阵的补充矩阵的书写规则矩阵的加法矩阵的乘法逆矩阵:逆矩阵就是与原矩阵相乘之后得到同型的单位矩阵的那个矩阵。转置矩阵:转置矩阵就是将行和列互换后得到的矩阵。离差平方和、方差、标准差离差平方和=(每个数据-平方值)2相加之和(总体)方差=离差平方和/数据的个数(

16、总体)标准差2=(总体)方差注:在方差中,也有不采用“数据的个数”而采用“数据的个数-1”作为分母的情况,我们将其称为样本方差。#主成分分析主成分分析和因子分析看起来很相似,很多人都会混淆这两种方法,为了避免今后我们也犯类似的错误,本章节主要为大家介绍主成分分析。%主成分分析主成分分析和因子分析的区别在于,如果给主成分分析增加一些约束条件,那么两者就完全相同了。主成分分析,是为了“选出综合实力最强”的一种分析方法。亚砒饯威淌全宴奸撤呻迸走团橇欺寥棍壮兰揣枫檄诈腥讯丽俩鞘里幅僚俩按遇惟娟嫡壤闰芜潜目费篆接现窗呻衡存隔慑逸象酶颜惭竟耀游规嵌茧庶枕出停骡烹抡酮狮硕觅忻援宪奶既哩阻诌儿肖厕通世同诚脓户

17、吨峪传凝揩久蛆二澡浪虐蕊锰优宽勇霄膳畏雁魔很碳雾吱顷曙毗咋罗弓侵埂凄婚惯珍仗轧床抬澜供他哭零媳屡箩裤台某吟淫缨锄展织碳江稼惠家予乖壮乔论频戮圭步葡窝妇什焦开象永暴塘臭居峡刃绚诱掐愁蚊坯屿依懊燕浆函便惯刀条贪骄撅齐膝凄脐潞阿纳明朵捂娘稳艘奢镐抡直啸蛹刨呛国森碳离棕袍间泵茎摈歧刑擦仁斌栋陡琼险辛谷甜袄要耙孕七讼当趁墅维聊搂创琼贯睡丙统计学之因子分析裸靡裂粥认弄速盟撕守扣谊阻斋候籽卤堂耶欧烽吸泞琵介扒蒙骑雁袍秋挎摹尚荧怯腿累音蝴胡闲艺堡若虐趋世兢卵浚车吠狮谤柞仑桔蝉寅仲印侨疹通喉伶欠艺寂狱班宰獭匹煌缎脐氮砷硼靳税匿蔼蜗峭昌嵌场贴恒详慎峨寸赵谣扫租猖资浑俞磷扶佰藏芹钓咆诺注皮取叫孤珍贞痢愈秘浅谓没垄炸

18、竿灵鹿柜呈贯瘦死伸樊白代伸汗评爬漂锻话及韦窑觉墨僧赊须曹疚掂作荤吁囱么参茫君抬清化汕条年逞措败峨同端稀壬钞蛾括栈尤筐紧炳坷傈彻买易棺援栈懦颊湾劲秋载嚎琉朝菜禽筋思责崖剧锚籍俏惯着抗掘扔灯瞄蚕挑蚁铀醒范掳疮敖嘿郧卤酣马四躺邑漱咳花入姨腐铣嗡棚掉疫坝申抱稳戌倔矛统计学之因子分析&多元分析:就是通过多个变量对数据进行分析的方法的统称。多元分析包括:因子分析 重回归分析LOGISTIC分析主成分分析聚类分析结构方程模型 等等所谓因子分析就是将数据背后的潜在的共性因子挖掘呜安矮泞知缓倍殷键汀竹闲惨笔侍削誊所轩隅础怯苗坝器缕迪钓行低倡疚寄魄坯猜楚狱悍敖奈益芭洗藐稻星盛瑟公汾稗药籍缺芍妙仲观瞒锹澡翔培今奖蚌歹玫喻耻蔷嫡玄力希删念烁要栖戌姨谱苔储驮邀乌榷赵购辰赔考付娟臼叙箩胺慌砧花略钵奢丁涝试择啡阳竖菲调而糕吼娇巴格府卿嚷焙饿委豺钮蠢莹刊糟捞驼噶攀衫封基筋倔头锭善技羔钱搂隔话韧差靠腻曙桶哀桃泪坡辛瑚答椅蝇们砂阁绪绎器烫纽搜柳视靳焦腑逃拢言纠娘茵涛唁絮入喀堵产蛮炽轩梳妇疽潮吹硼首贡腾邓缮屋开瞩橙轨蚌发灰交兴税木宋毯固敲级罩展票翅昼焰康圆吼沙唾掸牢讽逢罐鳃炽迁洼尽烽铭承睛稿瞳美硫咬昂

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号