第8章χ2检验ppt课件.ppt_三一办公31ppt.com

资源描述

《第8章χ2检验ppt课件.ppt》由会员分享，可在线阅读，更多相关《第8章χ2检验ppt课件.ppt（62页珍藏版）》请在三一办公上搜索。

1、第八章 2检验（Chi Square Test）,中南大学医学部王乐三,目的：推断两个总体率或构成比之间有无差别推断多个总体率或构成比之间有无差别检验统计量：2 应用：计数资料,第一节四格表资料的2 检验,目的：推断两个总体率（构成比）是否有差别要求：两样本的两分类个体数排列成四格表资料,例8.1 为了解某中药治疗原发性高血压的疗效，将70名高血压患者随机分为两组。试验组用该药加辅助治疗，对照组用安慰剂加辅助治疗，观察结果如表8-1，问该药治疗原发性高血压是否有效？,一、基本公式和基本思想,表8-1 两种疗法治疗原发性高血压的疗效,四格表资料的基本形式,A：实际频数（actual

2、frequency）T：理论频数（theoretical frequency）TRC：第R 行C 列的理论频数nR：相应的行合计，nC：相应的列合计,检验统计量2 值反映了实际频数与理论频数的吻合程度。若检验假设H0:1=2成立，四个格子的实际频数A 与理论频数T 相差不应该很大，即统计量2 不应该很大。如果2 值很大，即相对应的P 值很小，若 P，则反过来推断A与T相差太大，超出了抽样误差允许的范围，从而怀疑H0的正确性，继而拒绝H0，接受其对立假设H1，即12。,自由度愈大，2 值也会愈大；所以只有考虑了自由度的影响，2 值才能正确地反映实际频数A和理论频数T 的吻合程度。,检验的自由度取

3、决于可以自由取值的格子数目，而不是样本含量n。四格表资料只有两行两列,=1，即在周边合计数固定的情况下，4个基本数据当中只有一个可以自由取值。,（1）建立检验假设，确定检验水平。H0:1=2 即试验组与对照组的总体有效率相等 H1:12 即试验组与对照组的总体有效率不等=0.05。,假设检验步骤,T11=44(41/70)=25.8T12=44(29/70)=18.2 T21=26(41/70)=15.2 T22=26(29/70)=10.8,（2）求检验统计量值,(3)确定P 值，作出推断结论,P 0.005，按=0.05水准，拒绝H0，接受H1，可以认为两组治疗原发性高血压的总体有效率不等

4、，即可认为该中药治疗原发性高血压有效。,二、四格表资料检验的专用公式,三、四格表资料检验的校正公式,2分布是一连续型分布，而四格表资料属离散型分布，由此计算得的 2统计量的抽样分布亦呈离散性质。为改善2 统计量分布的连续性，则需行连续性校正(correction for continuity)。,2 连续性校正仅用于=1 的四格表资料，当2 时，一般不作校正。,四格表资料2 检验公式的选择：,，专用公式；，校正公式；，直接计算概率。,例8.2 某医学院抽样调查大学四年级和五年级学生近视眼患病情况，四年级学生的近视率为7.14%，五年级学生的近视率为35.71%,调查结果见表8-2。问该大学四年

5、级与五年级学生的近视眼患病率是否不同？,P 0.005，按=0.05水准，不拒绝H0，还不能认为四年级与五年级学生近视眼患病率不等。,本资料若不校正时，结论与之相反。,条件：理论依据：超几何分布。,四、四格表资料的Fisher确切概率法,基本思想,在四格表周边合计数固定不变的条件下，计算表内4个实际频数变动时的各种组合之概率Pi；再按检验假设用单侧或双侧的累计概率 P，依据所取的检验水准做出推断。,各组合概率Pi的计算在四格表周边合计数不变的条件下，表内4个实际频数 a,b,c,d 变动的组合数共有“周边合计中最小数+1”个。如例8.3，表内4个实际频数变动的组合数共有8+1=9个，见表8

6、-4。,各组合的概率Pi服从超几何分布，其和为1。,例8.3 将17名腰椎间盘脱出症患者随机分到两组，分别用两种方法治疗，结果见表8-3，问两种疗法的疗效是否不同？,二、检验步骤（本例n=1740）,计算表内四个格子数据的各种组合的概率Pi(表8-4)本例(a-T)*=2.24,P*=0.041464 确定累计概率值双侧检验 P=P(1)+P(2)+P(7)+P(8)+P(9)=0.057 单侧检验 P=P(7)+P(8)+P(9)=0.044,第二节配对四格表资料的 2 检验,与计量资料推断两总体均数是否有差别有成组设计和配对设计一样，计数资料推断两个总体率（构成比）是否有差别也有成组设计和

7、配对设计，即四格表资料和配对四格表资料。,例8.4 现有198份痰标本，每份标本分别用A、B两种培养基培养结核菌，结果见表8-5。问A、B两种培养基的阳性培养率是否不等？,上述配对设计实验中，就每个对子而言，两种处理的结果不外乎有四种可能:,A、B两种检测方法皆为阳性数(a)；A、B两种检测方法皆为阴性数(d)；A法为阳性、B法为阴性数(b)；A法为阴性、B法为阳性数(c)。,其中，a,d 为两法观察结果一致的两种情况，b,c为两法观察结果不一致的两种情况。,检验统计量(McNemar test),注意：,本法一般用于样本含量不太大的资料。因为它仅考虑了两法结果不一致的两种情况(b,c)，而未

8、考虑样本含量n和两法结果一致的两种情况(a,d)。所以，当 n 很大且 a 与 d 的数值很大（即两法的一致率较高），b 与 c 的数值相对较小时，即便是检验结果有统计学意义，其实际意义往往也不大。,检验步骤：,P 0.05.按=0.05水准，不拒绝H0。尚不能认为两种培养基的阳性培养率不同。,第三节,行列表资料的2检验,行列表资料,多个样本率比较时，有 R 行 2 列，称为 R 2表；两个样本的构成比比较时，有 2 行 C 列，称 2C 表；多个样本的构成比比较，有 R 行 C 列，称为 R C 表。,检验统计量,多个样本率的比较,例8.5 某医院用3种方案治疗急性无黄疸型病毒肝炎254例，

9、观察结果见表8-6，问3种疗法的有效率是否不同。,检验步骤：,H0：3种治疗方案的有效率相等H1：3种治疗方案的有效率不全相等=0.05,P 0.05，在=0.05的检验水准下，拒绝H0，接受H1，可以认为三种疗法的有效率有差别。,样本构成比的比较,例8.6 某研究人员收集了亚洲、欧洲和北美洲人的A、B、AB、O血型资料，结果见表8-7，问不同地区人群ABO血型分类构成比是否不同。,检验步骤,H0：不同地区人群血型分布总体构成比相同H1：不同地区人群血型分布总体构成比不全相同=0.05,P 0.05，在=0.05检验水准下，拒绝H0，认为三个不同地区的人群血型分布总体构成比有差别。,2分割法(

10、partitions of 2 method)Scheffe可信区间法 SNK法,多个样本率间的多重比较,行列表的分割,重新规定检验水准：I型错误的概率不变。检验水准的估计方法：根据分析目的,1多个实验组间的两两比较,K：为样本率的个数,2实验组与同一个对照组的比较,K：为样本率的个数,例8.7 对例8.5中表8-6的资料进行两两比较，以推断是否任两种疗法治疗急性无黄疸型病毒肝炎的有效率均有差别？,检验步骤,本例为3个实验组间的两两比较,例 8.8 以例8.5中表8-6资料中的中药治疗组为对照组，西药治疗组与中西药结合为试验组，试分析两试验组与对照组的总体有效率有无差别？,本例为各实验组与同一

11、对照组的比较,各试验组与同一对照组比较的P值结果见表8-9,可以认为中药与中西药结合治疗肝炎的有效率有差异，中西药结合的疗法好于单纯用中药的疗法。尚不能认为西药与中药治疗肝炎的有效率有差异。,三、行列表资料 2 检验的注意事项,1理论频数：行列表中的各格T1，并且1T5的格子数不宜超过1/5格子总数，否则可能产生偏性。处理方法有三种：,增大样本含量以达到增大理论频数的目的，属首选方法，只是有些研究无法增大样本含量，如同一批号试剂已用完等。,根据专业知识，删去理论频数太小的行或列，或将理论频数太小的行或列与性质相近的邻行或邻列合并。例如：不同年龄组可以合并，但不同血型就不能合并。改用双向无序RC表的Fisher确切概率法（可用SAS软件实现）。,2多个样本率比较：若所得统计推断为拒绝H0，接受H1时，只能认为各总体率之间总的来说有差别，但不能说明任两个总体率之间均有差别。要进一步推断哪两两总体率之间有差别，需进一步做多个样本率的多重比较。,3.实际应用中：对于行列表资料要根据其分类类型和研究目的选用恰当的检验方法。,学习愉快,

展开阅读全文