《《交叉列联分析》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《交叉列联分析》PPT课件.ppt(27页珍藏版)》请在三一办公上搜索。
1、第8章 列联表分析(Crosstabs),列联表是什么,可以用来做什么,采用卡方检验统计量,8.1 解释列联表,对分类数据的描述和分析通常使用列联表根据两个变量分组,汇总得到的结果称为列联表,可以用来分析两个变量之间的关系列联表中的数字为交叉单元格中的频数或频率以列联表为基础可以对两个变量之间的关系进行多种统计检验,列联表举例,条件频数酒店管理专业的男生2人,行变量,列变量,行边缘分布,列边缘分布,行百分比,列百分比,总百分比,条件频数反映了数据的分布,但不适合对比采取百分比分布更加直观,复式柱状图,列联表分析,交叉分组下的频数分析称为列联表分析两大基本任务根据收集到的样本数据编制交叉列联表在
2、交叉列联表的基础上,对两两变量间是否存在一定的相关性进行分析拟合优度检验,一、编制交叉列联表(EXCEL),比如分析性别与受教育程度之间的关系性别变量中1=男,2=女文化程度变量中编制交叉列联表,编制交叉列联表(SPSS),三维交叉列联表举例,【例】一个集团公司在四个不同的地区设有分公司,现该集团公司欲进行一项改革,此项改革可能涉及到各分公司的利益,故采用抽样调查方式,从四个分公司共抽取420个样本单位(人),了解职工对此项改革的看法,调查结果如下表每个分公司的看法是否相同,二、交叉列联表行列变量间关系的分析,描述统计-观察值的分布,行边缘分布行观察值的合计数的分布赞成改革方案和反对改革方案的
3、分别为279人,141人列边缘分布列观察值的合计数的分布四个公司接受调查的人数分别为100人120人,90人,110人,行边缘分布,列边缘分布,描述统计-百分比分布,在相同的基数上进行比较,可以计算相应的百分比,称为百分比分布行百分比:行的每一个观察频数除以相应的行合计数(fij/ri)列百分比:列的每一个观察频数除以相应的列合计数(fij/cj)总百分比:每一个观察值除以观察值的总个数(fij/n),总百分比,列百分比,行百分比,推断统计-进行卡方检验,检验行变量与列变量是否独立拟合优度检验(多个总体的比例是否相等),独立性检验(基本原理),原假设:行变量和列变量是相互独立的前提成立的情况下
4、,每个单元格的频数期望值称之为期望频数eij,如果期望频数和实际频数相差不大,不拒绝原假设,如果二者相差很大,拒绝原假设,例如,第1行和第1列的实际频数为 f11,它落在第1行的概率估计值为r1/n;它落在第1列的概率的估计值为c1/n。根据概率的乘法公式,该频数落在第1行和第1列的概率应为,期望频数的分布,由于观察频数的总数为n,所以f11 的期望频数 e11 应为,期望频数的分布,检验统计量,在零假设成立时,该统计量近似服从自由度为(r-1)(s-1)的c2分布。当该统计量的值很大(或p值很小)时,就可以拒绝零假设,认为这两个变量不相互独立。,列联表举例(美国的General Social
5、 Survey),检验步骤,提出原假设H0:婚姻状况和幸福状况这两个变量相互独立;H1:婚姻状况和幸福状况不相互独立。两个变量都是分类型,采用交叉列联分析采用SPSS操作,结果分析,结果分析,c2统计量的值为225.274,相应的p值为0.000。由于p值远远小于通常使用的显著性水平,因此检验的结论是拒绝原假设,不能认为婚姻状况和幸福状况相互独立。,三、交叉列联表卡方检验的前提,1、列联表各单元中期望频数大小的问题列联表中不应有期望频数小于1的单元格不应有大量的期望频数小于5的单元格(如果20%的单元格中的期望频数小于5,则不适用),这种情况应该采取似然率卡方检验等方法进行修正2、样本量大小的问题,