列联表和对应分析.ppt

上传人:小飞机 文档编号:5243390 上传时间:2023-06-17 格式:PPT 页数:34 大小:619.50KB
返回 下载 相关 举报
列联表和对应分析.ppt_第1页
第1页 / 共34页
列联表和对应分析.ppt_第2页
第2页 / 共34页
列联表和对应分析.ppt_第3页
第3页 / 共34页
列联表和对应分析.ppt_第4页
第4页 / 共34页
列联表和对应分析.ppt_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《列联表和对应分析.ppt》由会员分享,可在线阅读,更多相关《列联表和对应分析.ppt(34页珍藏版)》请在三一办公上搜索。

1、中央财经大学统计学院,第12章 列联表和对应分析,列联表中两个变量的独立性检验对应分析,中央财经大学统计学院 2,学习目标,列联表中两个变量独立性检验的原理和软件结果解释 对应分析的基本原理和软件结果分析,中央财经大学统计学院 3,3.1.2 列联表(Contingency table),如果对数据同时根据两个变量分组,汇总得到的结果称为列联表。列联表反映的是两个变量的联合分布,可以用来分析两个变量之间的关系。也称为交叉分组表(Cross tabulation)。列联表一般根据两个定性变量进行编制,如果是定量变量则需要先对单个变量进行分组。列联表中的数字为交叉单元格中的频数或频率。以列联表为基

2、础可以对两个变量之间的关系进行多种统计检验。,中央财经大学统计学院 4,列联表举例,市场营销专业的男生有10人。,中央财经大学统计学院 5,【例12.1】美国的General Social Survey,中央财经大学统计学院 6,二维列联表中的两个变量是否相互独立:c2检验,H0:婚姻状况和幸福状况这两个变量相互独立;H1:婚姻状况和幸福状况不相互独立。与单个变量的c2检验类似,中央财经大学统计学院 7,基本原理,行变量和列变量相互独立时,每个单元格频数的期望值 为如果期望频数和观测频数相差不大,则零假设可能是正确的;如果二者差别很大,则零假设可能不成立。,中央财经大学统计学院 8,检验统计量

3、,在零假设成立时,该统计量近似服从自由度为(r-1)(s-1)的c2分布。当该统计量的值很大(或p值很小)时,就可以拒绝零假设,认为这两个变量不相互独立。,中央财经大学统计学院 9,SPSS操作,“分析”“描述统计”“交叉表”,把“婚姻状况”设为行变量,把“幸福状况”设为列变量。接下来单击“统计量”,在弹出的对话框中选中“卡方”,单击“继续”;选择“单元格”,选中弹出对话框中的“期望值”,单击“继续”返回前一个是对话框,单击“确定”,中央财经大学统计学院 10,SPSS操作,中央财经大学统计学院 11,结果分析,中央财经大学统计学院 12,结果分析,c2统计量的值为225.274,相应的p值为

4、0.000。由于p值远远小于通常使用的显著性水平,因此检验的结论是拒绝原假设,不能认为婚姻状况和幸福状况相互独立。,中央财经大学统计学院 13,精确结果,当每个单元格的期望频数都大于5时检验统计量近似服从c2分布。在不满足这一条件时,需要把部分单元格合并,或者使用精确检验。在图12-1的对话框中选择“精确”,进行相应的设置后可以得出精确的检验结果。这时所涉及的不是c2分布,而是超几何分布。由于样本很大时超几何分布计算比较慢甚至无法计算,因此在大样本时通常使用c2统计量。,中央财经大学统计学院 14,对应分析,对应分析是一种描述性、探索性的数据分析方法,通常用于列联表的分析,以便用图形的方法观察

5、行变量和列变量取值之间的对应关系。对应分析可以按照相同的刻度同时对列联表中的行变量和列变量进行降维,用较少的维度(一般选用二维或三维)来代表数据表中的行变量和列变量,从而在同一个空间中用图形方法显示行变量和列变量类别之间的关系。,中央财经大学统计学院 15,对应分析图的绘制,在表12-1的列联表中,把3个幸福状况的取值看作3维空间中的坐标,我们可以把5个婚姻状况在3维空间中表示出来。如果使用因子分析的方法对3个幸福状况进行降维(同时最大限度地保留原始信息),则我们能够在2维甚至1维空间上把5个点表示出来。把表中婚姻状况的取值看作5维空间的坐标值,使用因子分析的方法进行降维,也可以把3个幸福状况

6、在低维空间中表示出来。,中央财经大学统计学院 16,对应分析图的绘制,如果能够保证两个因子分析中采用相同的刻度,则可以在同一个坐标系中把幸福状况的3个点和婚姻状况的5个点绘制出来,通过图形观察两个变量取值之间的关系。按上述方法得到的图形称为对应分析图。,中央财经大学统计学院 17,对应分析图的绘制,为了保证对行和列进行因子分析的结果之间的对应关系,在进行对应分析时并不是根据列联表中的频数直接进行因子分析的而是先计算相应的频率,再进行必要的变量变换,之后再用与因子分析类似的方法进行降维。,中央财经大学统计学院 18,对应分析图的分析,在对应分析图中,如果同一变量的不同类别在某个方向上靠得较近,则

7、说明这些类别在该维度上区别不大;落在图形中大致相同区域的不同变量的分类点彼此之间有联系。,中央财经大学统计学院 19,对应分析的软件操作,选择“分析”“降维”“对应分析”,把“婚姻状况”设为行变量;在弹出的对话框中单击“定义范围”,最小值设为1,最大值设为5,单击“更新”、“继续”;然后把“幸福状况”设为列变量,再通过“定义范围”对话框定义其取值范围为1-3;最后单击“确定”,中央财经大学统计学院 20,对应分析的软件操作,中央财经大学统计学院 21,对应分析结果的解释,中央财经大学统计学院 22,对应分析结果的解释,“惯量”类似于因子分析中特征值对应的方差;“惯量比例”一栏中,“解释”的惯量

8、比例类似于因子分析中的方差贡献率,“累积”的惯量比例类似于因子分析中的累积方差贡献率,这几个指标反映了每个维度的因子重要性和解释能力。表中的“卡方”是关于列联表行列独立性检验结果,自由度为(5-1)(3-1)=8。p值很小说明列联表的行与列之间有较强的相关性。,中央财经大学统计学院 23,行变量(婚姻状况)各水平的坐标,中央财经大学统计学院 24,行变量(婚姻状况)各水平的坐标,“质量”对应的英文为“Mass”,译为“密度”更为确切,反映的是每种婚姻状况的人数比例。表中给出了婚姻状况5个水平的坐标:已婚(-0.531,-0.016),丧偶(0.437,-0.660),离异(0.535,0.16

9、8),丧偶(0.041,0.979),未婚(0.389,0.257)。,中央财经大学统计学院 25,列变量(幸福状况)的坐标,中央财经大学统计学院 26,对应分析图,中央财经大学统计学院 27,对应分析图的解释,“婚姻状况”和“幸福状况”取值之间的对应关系:“已婚”和“非常幸福”最接近;“离异”、“未婚”和“比较幸福”比较接近;“丧偶”、“分居”和“不太幸福”比较接近。,中央财经大学统计学院 28,对应分析的一点说明,对应分析是一种探索性的描述统计方法,并不能保证所有的对应分析结果中两个变量的取值之间都有如此明确的对应关系。,中央财经大学统计学院 29,例2(课后习题),中央财经大学统计学院

10、30,软件操作,在SPSS软件中录入数据时,数据文件中应该有三个变量:头发颜色、眼睛颜色和频数,并在SPSS中选择“数据”“加权个案”,把“频数”变量指定为权数。,中央财经大学统计学院 31,数据表,中央财经大学统计学院 32,对应分析结果,从表中卡方检验的结果看两个变量不相互独立,中央财经大学统计学院 33,对应分析图,中央财经大学统计学院 34,小结,在列联表中,如果行变量和列变量相互独立,则每个单元格中观测到的频数与其期望频数应该比较接近,否则说明零假设是不成立的。基于这种思想可以构造检验统计量进行假设检验。对应分析是一种描述性、探索性的数据分析方法,也是一种数据降维技术。可以在同一个空间中用图形方法显示行变量和列变量类别之间的关系。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号