《【教学课件】第十章卡方检验.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第十章卡方检验.ppt(33页珍藏版)》请在三一办公上搜索。
1、第十章 卡方检验,教学目标,了解卡方检验的一般原理;掌握卡方检验的具体方法,例如配合度检验、独立性检验和同质性检验。,卡方检验适用情况,对计数数据进行统计分析,应该用卡方检验。如果测量数据的总体分布形态不清楚,也可以用卡方检验等非参数检验的方法进行分析。,主要内容,第一节 卡方检验的原理第二节 配合度检验第三节 独立性检验第四节 同质性检验,主要内容,第一节 卡方检验的原理第二节 配合度检验第三节 独立性检验第四节 同质性检验,为什么叫作卡方检验,计数数据一般应用属性统计方法,因为这类数据是按照事物属性进行多项分类的。而且,对这些计数数据的统计分析是根据卡方分布进行的。,卡方检验的功能,处理一
2、个因素两项或多项分类的实际观察频数与理论频数分布是否相一致的问题,或者说有无显著差异的问题。关于实际次数和理论次数实际频数:指在实验或调查中得到的计数资料。理论次数:指根据概率原理、某种理论、某种理论次数分布或经验次数分布计算出来的次数。,一、卡方检验的假设,分类相互排斥、互不包容;观测值相互独立;每一个单元格中的期望次数至少为5。,二、卡方检验的类别,配合度检验主要用来检验一个因素多项分类的实际观察数与某理论次数是否接近。独立性检验用来检验两个或两个以上因素各种分类之间是否有关联或是否具有独立性的问题。同质性检验主要目的在于检定不同人群母总体在某一个变量的反应是否具有显著差异。,三、卡方检验
3、的基本公式,f0为实际观察次数fe为理论次数,四、期望次数的计算,在配合度检验时,期望值为总体的实际数值,或是某一理论存在的数值。在独立性检验和同质性检验中,如果两个变量或两个样本无关联时,期望值为列联表中各单元格的理论次数,即各个单元格对应的两个边缘次数的积除以总次数。,五、小期望次数的连续性校正,如果个别单元格的理论次数小于5,处理方法有以下四种:1、单元格合并法2、增加样本数3、去除样本法4、使用校正公式,六、应用卡方检验应注意取样设计,注意取样的代表性,主要内容,第一节 卡方检验的原理第二节 配合度检验第三节 独立性检验第四节 同质性检验,配合度检验,配合度检验主要用于检验单一变量的实
4、际观察次数分布与某理论次数分布是否有差别。,一、配合度检验的一般问题,统计假设虚无假设:实际数等于理论数备择假设:实际数不等于理论数自由度的确定通常为分类数减去1理论次数的计算根据某种经验或理论,二、配合度检验的应用,1、检验无差假说理论次数=总数*1/分类项数例题p.3322、检验假设分布的概率理论次数的计算按照理论分布求得例题p.333,三、连续变量分布的吻合性检验,对于连续随机变量的计量数据,有时在实际研究中预先不知道其总体分布,而是要根据对样本的次数分布来判断是否服从某种指定的具有明确表达式的理论次数分布。关于分布的假设检验方法有很多,运用卡方值所做的配合度检验是最常用的一种。,举例:
5、正态分布吻合性检验,例题:p.336,四、比率或百分数的配合度检验,如果计数资料用百分数表示,最后计算出来的卡方值要乘以100/N后,再与查表所得的临界值进行比较。例题:p.337,五、二项分类的配合度检验与比率显著性检验的一致性,二者实质相同,只是表示方式不同。相比较而言,配合度检验计算方法更为简单。例题:p.338,六、卡方的连续性校正,当某一期望次数小于5时,应该利用校正公式计算卡方值。公式(p.340)例题:p.341如果三项分类或更多时,出现某一单元格内的理论次数小于5的情况,则不需要进行校正也能得到较为准确的结果。,主要内容,第一节 卡方检验的原理第二节 配合度检验第三节 独立性检
6、验第四节 同质性检验,独立性检验,独立性检验主要用于两个或两个以上因素多项分类的计数资料分析,也就是研究两类变量之间的关联性和依存性问题。如果两变量无关联即相互独立,说明对于其中一个变量而言,另一变量多项分类次数上的变化是在无差范围之内;如果两变量有关联即不独立,说明二者之间有交互作用存在。独立性检验的两个母总体指的是两个变量所代表的概念母总体,而非人口学上的母总体。,一、独立性检验的一般问题与步骤,统计假设虚无假设:多因素之间独立备择假设:多因素之间有关联或者说差异显著理论次数的计算单元格所对应的行的总合乘以对应的列的总合,然后再除以总数自由度的确定df=(R-1)(C-1)统计方法的选择(
7、不同情况有简便公式)结果及解释差异显著说明有关联,二、四格表的独立性检验,独立样本四格表卡方检验利用基本公式或简捷公式例题:p.347相关样本四格表卡方检验用简捷公式较为简单例题:p.349,二、四格表的独立性检验,四格表卡方值的近似校正当四格表的任一格理论次数小于5时,要用Yates连续性校正公式计算卡方值(具体公式见书p.349)。四格表的Fisher精确概率检验方法在理论次数小于5时,也可用费舍精确概率检验法,代替卡方检验法。公式和例题(p.350),三、R*C表独立性检验,基本方法与四格表的独立性检验相同。,四、多重列联表分析,如果有三个自变量,可以将其中一个人口学变量看作控制变量,对
8、于控制变量的不同水平进行单个列联表分析。若多个列联表呈现的结果一致,可以将数据合并;若不一致,则需要各自进行分别的解释。,主要内容,第一节 卡方检验的原理第二节 配合度检验第三节 独立性检验第四节 同质性检验,同质性检验,同质性检验目的在于检验不同人群母总体在某一个变量的反应是否具有显著差异。同质性检验与独立性检验的方法基本相同,但检验的目的不同。独立性检验是对同一样本的若干变量关联情形的检验,目的在于判明数据资料是相互关联还是彼此独立。同质性检验是对两个样本同一变量的分布状况的检验,是对几个样本数据是否同质作出统计决断。,一、单因素分类数据的同质性检验,步骤和例题(p.355),二、列联表形式的同质性检验,方法与单因素的相同。具体方法和例题(p.357),