卡方检验(正式).ppt_三一办公31ppt.com

资源描述

《卡方检验(正式).ppt》由会员分享，可在线阅读，更多相关《卡方检验(正式).ppt（86页珍藏版）》请在三一办公上搜索。

1、1,2检验Chi-squared test,第7章,蒋红卫,2,讲课内容：,1.概述基本思想2.22表卡方检验3.配对四格表卡方检验4.Fisher确切概率检验5.RC表卡方检验6.多个样本率的多重比较7.有序分组资料的线性趋势检验,3,概念回顾,在总体率为的二项分布总体中做n1和n2抽样,样本率p1和p2与的差别,称为率抽样误差。在总体率为1和2的不同总体中抽样，得p1和p2，在n5，可通过率的u检验推断是否1=2。二项分布的两个样本率的检验同样可用2检验。,4,目的：推断两个总体率或构成比之间有无差别多个总体率或构成比之间有无差别多个样本率的多重比较两个分类变量之间有无关联性频数分

2、布拟合优度的检验。检验统计量：2 应用：计数资料,5,基本概念,例1 某院比较异梨醇（试验组）和氢氯塞嗪（对照组）降低颅内压的疗效，将200名患者随机分为两组，试验组104例中有效的99例,对照组96例中有效的78例,问两种药物对降低颅内压疗效有无差别？,6,表 200名颅内高压患者治疗情况,如何整理此类资料？如何分析此类资料？,7,四格表（fourfold table）资料的基本形式,实际频数(actual frequency)是指各分类实际发生或未发生计数值，记为A。,8,理论频数(theoretical frequency)是指按某H0假设计算各分类理论上的发生或未发生计数值，记为T。,

3、式中，TRC 为第R 行C 列的理论频数 nR 为相应的行合计 nC 为相应的列合计,9,残差设A代表某个类别的观察频数，T代表基于H0计算出的期望频数，A与T之差(A-T)被称为残差残差可以表示某一个类别观察值和理论值的偏离程度，但残差有正有负，相加后会彼此抵消，总和仍然为0。为此可以将残差平方后求和，以表示样本总的偏离无效假设的程度类似于方差的计算思想，,10,Pearson 2检验的基本公式,残差大小是一个相对的概念，相对于期望频数为10时，20的残差非常大；可相对于期望频数为1000时20就很小了。因此又将残差平方除以期望频数再求和，以标准化观察频数与期望频数的差别。卡方统计量，190

4、0年由英国统计学家K.Pearson首次提出。,Karl Pearson(1857 1936),11,从卡方的计算公式可见，当观察频数与期望频数完全一致时，卡方值为0；观察频数与期望频数越接近，两者之间的差异越小，卡方值越小；反之，观察频数与期望频数差别越大，两者之间的差异越大，卡方值越大。当然，卡方值的大小也和自由度有关检验的自由度取决于可以自由取值的格子数目，而不是样本含量n。理论上，在n40时下式值与2分布近似，在理论数5，近似程度较好。,12,连续型分布：正态分布（Normal distribution），学生氏t分布(Students t-distribution)，F分布(F di

5、stribution)另一个同样重要的分布2卡方分布(Chi-squared distribution)。此分布在1875年，首先由F.Helmet所提出，而且是由正态分布演变而来的，即标准正态分布Z值之平方而得,2分布,13,设Xi为来自正态总体的连续性变量。,称为自由度df=n的卡方值。,显然，卡方分布具有可加性。,14,3.84,7.81,12.59,P0.05的临界值,2分布的概率密度函数曲线,15,当=1时,16,第二节22表卡方检验,17,两组样本率比较的设计分类：1.两组(独立)样本率的比较组间数据是相互独立,非配对设计。22表卡方检验2.配对设计两组样本率的比较组间数据是相

6、关的，配对设计。配对四格表卡方检验,18,两组（不配对）样本率的比较,1）四格表形式2）四格表不配对资料检验的专用公式,二者结果等价,各组样本例数是固定的,19,例1（续）,20,H0:1=2 即试验组与对照组降低颅内压的总体有效率相等H1:12=0.05。,以=1查附表8的2界值表得P0.005。按=0.05检验水准拒绝H0，接受H1，可以认为两组降低颅内压总体有效率不等，即可认为异梨醇口服液降低颅内压的有效率高于氢氯噻嗪+地塞米松的有效率。,21,值得指出，成组设计四格表资料的2检验与前面学习过的两样本率比较的双侧u检验是等价的。若对同一资料作两种检验，两个统计量的关系为2=u2。其对应的

7、界值也为平方关系。两者的应用条件也是基本一致的，连续性校正也基本互相对应。,22,卡方检验假设的等价性,两组颅内压治疗有效率相同两组有效率的比较实际数据的频数分布和理论假设相同理论分布与实际分布的检验使用不同的药物并不会影响颅内压的治疗（两个分类变量间无关联）两变量的相关分析,23,四格表2值的校正,英国统计学家Yates认为，2分布是一种连续型分布，而四格表资料是分类资料，属离散型分布，由此计算的2值的抽样分布也应当是不连续的，当样本量较小时，两者间的差异不可忽略，应进行连续性校正（在每个单元格的残差中都减去0.5）若n 40，此时有 1 T 5时，需计算Yates连续性校正2值T 1，或n

8、40时，应改用Fisher确切概率法直接计算概率,24,(1)校正公式的条件：1T5,同时N40,用校正公式计算(2)连续校正(continuity correction)公式：,(3)当T1,或N40，用Fisher确切概率法,四格表2 检验的校正公式(两组不配对资料),25,例2 某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效，将78例脑血管疾病患者随机分为两组，结果见表7-2。问两种药物治疗脑血管疾病的有效率是否相等？,H0:1=2 即两种药物治疗脑血管疾病的总体有效率相等H1:12=0.05。,26,表两种药物治疗脑血管疾病有效率的比较,27,本例n=78，但T224.67，故

9、用四格表资料2检验的校正公式,不校正2=4.35，p0.05,以=1查附表8的2界值表得P0.05。按=0.05检验水准，不拒绝H0，无统计学意义，尚不能认为两种药物治疗脑血管疾病的有效率不等。,28,卡方检验的连续性校正问题,正方观点：卡方统计量抽样分布的连续性和平滑性得到改善，可以降低I类错误的概率；校正结果更接近于Fisher确切概率法；校正是有条件的。反方观点：经连续性校正后，P值有过分保守之嫌；连续性校正卡方检验的P值与Fisher确切概率法的P值没有可比性，这是因为Fisher确切概率法建立在四格表双边固定的假定下，而实际资料则是单边固定的四格表。,29,就应用而言，无论是否经过连

10、续性校正，若两种检验的结果一致，无须在此问题上纠缠。但是，当两种检验结果相互矛盾时，如例2，就需要谨慎解释结果了。为客观起见，建议将两种结论同时报告出来，以便他人判断。当然，如果两种结论一致，如均为有或无统计学意义，则只报道非连续性检验的结果即可。,30,第二节配对设计两个样本率的2检验（McNemer检验）,配对设计：通常为同源配对。对同一观察对象分别用两种方法处理，观察其阳性与阴性结果。基本用途：常用于比较两种检验方法或两种培养基的阳性率是否有差别。数据形式：配对四格表形式。,31,例3 某实验室采用两种方法对58名可疑红斑狼疮患者的血清抗体进行测定，问：两方法测定结果阳性检出率是否有差

11、别？测定结果为：阳性、阴性（共116标本，58对）方法（X）乳胶凝集法免疫荧光法对子例数 11 33 2 12,结果,32,上述配对设计实验中，就每个对子而言，两种处理的结果不外乎有四种可能:,两种检测方法皆为阳性数(a)；两种检测方法皆为阴性数(d)；免疫荧光法为阳性，乳胶凝集法为阴性数(b)；乳胶凝集法为阳性，免疫荧光法为阴性数(c)。,其中，a,d 为两法观察结果一致的两种情况，b,c为两法观察结果不一致的两种情况。,33,表两种方法的检测结果,34,方法原理,按照配对设计的思路进行分析，则首先应当求出各对的差值，然后考察样本中差值的分布是否按照H0假设的情况对称分布。按此分析

12、思路，最终可整理出如前所列的配对四格表。主对角线上两种检验方法的结论相同，对问题的解答不会有任何贡献斜对角线上两种检验方法的结论不相同，显示了检验方法间的差异,35,配对2检验统计量为,36,H0：b=c=(12+2)/2=7(两法总体阳性率相等)H1：b c（两方法总体阳性率不等）=0.05本例b+c=12+2=1440，用校正公式本例2=5.793.84，P0.05。在=0.05水准，拒绝H0，接受H1，有统计学意义。认为两方法的检测率不同，乳胶凝集法的阳性检测率22.41%低于免疫检测率39.66%。,37,注意事项,McNemar检验只会利用非主对角线单元格上的信息，即它只关心两者不一

13、致的评价情况，用于比较两个评价者间存在怎样的倾向。因此，对于一致性较好的大样本数据，McNemar检验可能会失去实用价值。例如对1万个案例进行一致性评价，9995个都是完全一致的，在主对角线上，另有5个分布在左下的三角区，显然，此时一致性相当的好。但如果使用McNemar检验，此时反而会得出两种评价有差异的结论来。,105,38,第三节,四格表资料的Fisher确切概率法,105,39,条件：理论依据：超几何分布（非2检验的范畴）,105,40,例4 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果，将33例HBsAg阳性孕妇随机分为预防注射组和非预防组，结果见表7-4。问两组新生儿的

14、HBV总体感染率有无差别？,105,41,表7-4 两组新生儿HBV感染率的比较,42,基本思想,在四格表周边合计数固定不变的条件下，计算表内4个实际频数变动时的各种组合之概率Pi；再按检验假设用单侧或双侧的累计概率P，依据所取的检验水准做出推断。,43,1各组合概率Pi的计算在四格表周边合计数不变的条件下，表内4个实际频数 a,b,c,d 变动的组合数共有“周边合计中最小数+1”个。如例7-4，表内4个实际频数变动的组合数共有9+1=10个，依次为：,44,各组合的概率Pi服从超几何分布，其和为1。,计算公式为,45,2累计概率的计算(单、双侧检验不同),46,47,48,检验步骤,49,

15、50,表5 例4的 Fisher确切概率法计算表,51,例5 某单位研究胆囊腺癌、腺瘤的P53基因表达，对同期手术切除的胆囊腺癌、腺瘤标本各10份，用免疫组化法检测P53基因，资料见表7-6。问胆囊腺癌和胆囊腺瘤的P53基因表达阳性率有无差别？,52,表6 胆囊腺癌与胆囊腺瘤P53基因表达阳性率的比较,53,本例 a+b+c+d=10，由表7-7可看出，四格表内各种组合以i=4和i=5的组合为中心呈对称分布。,表7 例5的Fisher确切概率法计算表,*为现有样本,54,（1）计算现有样本的D*和P*及各组合下四格表的Di。本例D*=50，P*=0.02708978。（2）计算满足Di50条件

16、的各组合下四格表的概率Pi。（3）计算同时满足Di50和PiP*条件的四格表的累计概率。本例为P7和P8，（4）计算双侧累计概率P。P0.05，按=0.05检验水准不拒绝H0，尚不能认为胆囊腺癌与胆囊腺瘤的P53基因表达阳性率不等。,55,56,一点补充,确切概率法的原理具有通用性，对于四格表以外的情况也适用，如行乘列表、配对、配伍表格均可对于较大的行乘列表，确切概率法的计算量将很大，有可能超出硬件系统可以支持的范围此时可以采用计算统计学中的其他统计计算技术加以解决，如Bootstrap方法等,57,第四节行列表的2检验,当比较组行或列分类数2，称为行列表，即RC表。研究者感兴趣的问题有:

17、(2检验的目的）1.多组(独立样本)样本率差别有无统计意义?2.两组(独立样本)构成比(分布)有无统计意义?3.两个分类变量分布是否独立(有关联)?,58,自由度=（行数-1）（列数-1）,等价,检验统计量,59,例6 某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效，资料见下表。问三种疗法的有效率有无差别？表7-8 三种疗法有效率的比较,60,H0：1=2=3=90.4（三组总体有效率相等）H1：三组总体率不等或不全等=0.05,结论:在=0.05水准，拒绝H0，P0.01,认为三组疗法有效率不等或不全等。注意:此结果不能得到各两两组比较的结论。,61,二、两组和多组

18、构成比的比较,例7 某医师在研究血管紧张素I转化酶(ACE)基因I/D多态（分3型）与2型糖尿病肾病(DN)的关系时，将249例2型糖尿病患者按有无糖尿病肾病分为两组，资料见表7-9。问两组2型糖尿病患者的ACE基因型总体分布有无差别？,表9 两组型糖尿病患者ACE基因分布比较,62,63,三、双向无序分类资料的关联性检验,RC表中两个分类变量皆为无序分类变量的行列表资料，又称为双向无序RC表资料。目的：检验两事物分类(行分类和列分类)是否独立,从而说明两事物分类是否有关系。需要注意的是:双向无序分类资料为两个或多个样本，做差别检验（例7）；若为单样本，做关联性检验。,64,统计分析:1.回答

19、两事物的分类是否独立(有关系)Pearson 2检验2.如有关,关系密切程度如何,度量指标:列联系数(Contingency coefficient)列联系数C取值范围在01之间。愈接近于0，关系愈不密切；愈接近于1，关系愈密切。,65,两分类变量独立与有关,两事物独立的假定:行或列各分类的构成比相同,或在 A事物不同水平下,B事物不同分类的作用(构成)相等.,66,例 8 测得某地5801人的ABO血型和MN血型结果如表7-10，问两种血型系统之间是否有关联？,表10 某地5801人的血型,67,H0：两种血型系统分类无关联（即行或列构成比相等）H1：两种血型系统分类有关联（即行或列构成比不

20、等）=0.05,结论:两种血型系统分类有关联。列联系数为0.1883。两种血型系统间虽然有关联性，但关系不太密切。,68,第五节多组样本率的两两比较的2 分割,当比较组k3时，2值有统计意义，可分解多个四格表了解各样本率两两间的差别。要进一步推断哪两两总体率有差别，若直接用四格表资料的检验进行多重比较，将会加大犯类错误的概率。多重比较的方法：2分割法；Scheffe可信区间法；SNK法。,69,2 分割法基本思想,检验水准,其目的是保证检验假设中I型错误的概率不变。因分析目的不同，主要有两类多重比较形式：多个实验组间的两两比较实验组与同一个对照组的比较,检验水准,70,多个实验组间的两两比

21、较,分析目的为k个实验组间，任意两个率均进行比较时，须进行k(k-1)/2次独立的四格表检验，再加上总的行列表资料的检验，共 k(k-1)/2+1次检验假设。故检验水准用下式估计,71,实验组与同一个对照组的比较,分析目的为各实验组与同一个对照组的比较，而各实验组间不须比较。检验水准用下式估计,72,表7-11=1时的2界值表（供多个样本率间的多重比用）,73,例9 对例6的资料进行两两比较，以推断是否任两种疗法治疗周围性面神经麻痹的有效率均有差别？1=2，即任意两对比组的总体有效率相等12，即任意两对比组的总体有效率不等=0.05 本例为3个实验组间的两两比较,74,表三种疗法有效率的

22、两两比较,拒绝H0，接收H1拒绝H0，接收H1不拒绝H0,75,例10 对例6资料的药物治疗组为对照组，物理疗法组与外用膏药组为试验组，试分析两试验组与对照组的总体有效率有无差别？T=C，即各试验组与对照组的总体有效率相等 TC，即各试验组与对照组的总体有效率不等=0.05 本例为各实验组与同一对照组的比较,76,物理疗法组与药物治疗组比较：2=6.76,P0.0125，按=0.0125检验水准,物理疗法组与药物治疗组拒绝H0,接受H1，可认为物理疗法组与药物治疗组的总体有效率有差别；外用膏药组与药物治疗组不拒绝H0，尚不能认为两总体有效率有差别。结合例7资料，物理疗法的有效率高于药物治疗。,

23、77,小结,基本公式,不配对四格表和校正公式,配对四格表公式,一.公式,78,二.2常解决的问题,目的:比较组间率和构成比的差别设计:抽自2个或多个独立样本目的:两个变量间有无关系或关联设计:2个变量来自同一对象或同一总体.相关的设计,79,三.适用条件,1.四格表资料2检验（1）n40且T5 用Pearson 2检验（2）n40且1T5连续性校正2检验（3）n40或T1 用Fisher确切概率法2.配对四格表资料2检验（1）b+c40 用Mcnemar 2检验（2）n40 连续性校正Mcnemar 2检验或精确概率法,80,四、RC表数据的注意事项,1行列表中的各格T1，并且1T5的格子数不宜超过1/5格子总数，否则可能产生偏性。处理方法有三种：首选方法：增大样本含量，增大理论频数。但是某些研究无法做到。根据专业知识，删去或合并理论频数太小的行或列。（会损失信息及损害样本的随机性，且不能随意合并行或列。如，不同年龄组可以合并，但不同血型就不能合并。）Fisher确切概率法。,81,82,83,一点补充,84,85,86,Thank you!,

展开阅读全文