卡方检验研究生.ppt

上传人:李司机 文档编号:4158651 上传时间:2023-04-07 格式:PPT 页数:64 大小:935KB
返回 下载 相关 举报
卡方检验研究生.ppt_第1页
第1页 / 共64页
卡方检验研究生.ppt_第2页
第2页 / 共64页
卡方检验研究生.ppt_第3页
第3页 / 共64页
卡方检验研究生.ppt_第4页
第4页 / 共64页
卡方检验研究生.ppt_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《卡方检验研究生.ppt》由会员分享,可在线阅读,更多相关《卡方检验研究生.ppt(64页珍藏版)》请在三一办公上搜索。

1、2 检验(Chi-square test)(3学时),2检验的应用,1.推断两个(多个)总体率或构成比之间是否有差别2.多个样本率间的多重比较3.两个分类变量之间有无关联性4.频数分布拟合优度检验,一、2检验的基本思想,例7-1 某医生用两种疗法治疗前列腺癌,出院后随访3年,甲疗法治疗86例。乙疗法治疗95例,结果见下表。问两种疗法治疗前列腺癌病人的3年生存率是否有差别?,表10-7 甲乙两种疗法治疗前列腺癌的3年生存率 处 理 生存数 死亡数 合 计 生存率(%)甲疗法 a52(46.09)b34(39.91)(a+b)86 60.47 乙疗法 c45(50.91)d50(44.09)(c+

2、d)95 47.37 合 计(a+c)97(b+d)84(n)181 53.59表中 为基本数据,称为实际频数,用AR.C表示,表中 是根据A计算得到的,称为理论频数,用TR.C表示。该资料称为四格表资料。,若假设两种疗法治疗前列腺癌病人的3年生存率相同,即H0:1=2=53.59%,则 T1.1=8697/181=46.09 T1.2=8684/181=39.91 T2.1=9597/181=50.91 T2.2=9584/181=44.09,TR.C=nRnc,n,2=(AT)2=(R1)(C1)=(21)(21)=1,T,假如H0:1=2成立,则A、T不会相差太大,那么2 会小;(A与T

3、的差别是由抽样误差所致)反之若检验假设H0不成立,则A、T会相差很大,那么2会大;(抽样误差不能引起A与T如此大的差别)判断结果,根据自由度的大小查2界值表当2 2,时,P,拒绝H0,接受H1当2 2,时,P,不拒绝H0.2反映了实际频数与理论频数的吻合程度,(一)、四格表的一般公式,二、一般四格表的2检验,2=(AT)2=(R1)(C1),T,以例10-7为例做2检验H0:1=2 即两种疗法治疗前列腺癌的3年生存率相同H1:12 即两种疗法治疗前列腺癌的3年生存率不相同=0.05 T1.1=8697/181=46.09 T1.2=8684/181=39.91T2.1=9597/181=50.

4、91 T2.2=9584/181=44.092=(AT)2=(52-46.09)2+(34-39.91)2+(45-50.91)2+(50-44.09)2=3.11=(21)(21)=1查2界值表得 20.05,1=3.84,20.05。按=0.05的水准,不拒绝H0,还不能认为两种疗法治疗前列腺癌的3年生存率不相同。,T,44.09,50.91,39.91,46.09,(二)、四格表的专用公式,当n40,T5时,用 2=,(adbc)2 n,(ab)(cd)(ac)(bd),a、b、c、d 为四格表的实际频数(ab),(cd),(ac),(bd)是四格表周边的合计数 n=abcd,为总的样本

5、含量对例10-7的计算2=3.11,(5250-3445)2181,(86959784),显然,计算结果与前相同,但该法避免了计算理论数的麻繁,(三)、四格表的校正公式,1.2检验的应用条件(1)当n40且T5时,用2检验的基本公式或四格表的专用公式;当P时,改用四格表的确切概率法。(2)当n40时但有1T5时,用四格表2的校正公式或用四格表的确切概率法(3)当n40时,或T1时,用四格表的确切概率法2.四格表2的校正公式,2=(AT0.5)2,T,2=,(adbcn/2)2 n,(ab)(cd)(ac)(bd),例7-2某医师用两种疗法治疗心绞痛,结果如表10-10,问两种疗法的疗效有无差别

6、?表10-10 两种疗法治疗心绞痛的效果率,H0:1=2 即两种疗法的疗效相等H1:1 2 即两种疗法的疗效不等=0.05 T=299/59=4.42(计算行合计和列合计均为最小的理论数)c2=0.61=1,查2界值表得,P0.05。按=0.05的水准不拒绝 H0,尚不能认为两种两种疗法的疗效不等.,(233627 59/2)259,2930509,三、配对四格表资料的2检验,配对四格表资料的2检验是对配对设计研究所获得的资料为计数资料进行比较。,配对设计包括:同一批样品用两种不同的处理方法观察对象根据配对条件配成对子,同一对子内的不同个体分别接受不同的处理在病因或危险因素的研究中,将病人和对

7、照按配对条件配成对子,研究是否存在某种病因或危险因素。,观察的结果只有阳性、阴性两种可能,清点成对资料时只有四种情况:a:甲+乙+b:甲+乙-c:甲-乙+d:甲-乙-列成下面四格表,适用于配对设计的计数资料配对资料的结果有 甲 乙 结果 a b c d,配对设计的计数资料,2=(bc)2/(bc),=1,(bc)40 c2=(bc 1)2/(bc),=1(bc)40,例 对120名确诊的乳腺癌病人,分别用甲乙两种方法来检测,甲方法检出阳性率为60%,乙方法检出阳性率为50%,甲乙一致检出阳性率为35%,问甲乙两方法检出阳性率有无差别?,表:两种方法的检测结果,H0:B=C(1=2)H1:B C

8、(1 2)=0.05,bc=3018=48402=(3018)2/(3018)=3.0=1,查 2界值表得 P0.05。按=0.05水准,不拒绝H0,还不能认为两种方法的检验结果不同。,配对四格表资料的关联性检验(P761),H0:两种方法无关(无一致性)H1:两种方法有关(有一致性)=0.052两种方法检测结果的相关系数rr必定等于kappa检验的kappa值,K0.75 一致性好0.40k 0.75 一致性较好K0.40 一致性差,例73 某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗体进行测定,结果见表73。问两种方法的检验结果有无差别?表73 两种方法的检测结

9、果,H0:B=C H1:B=C=0.05,bc=124=1440c2=(122 1)2/(122)=5.79=1,查2界值表得 0.01P0.025。按=0.05水准拒绝H0,接受H1,认为两种方法的检验结果不同,免疫荧光法的阳性检出率较高。,四、行列表资料的2检验,可以用于多个率及多个构成比资料的比较和双向无序分类资料关联性检验。其基本数据有三种情况:1、多个样本率比较。有R行2列,称为R2表2、两个样本的构成比比较,有2行C列,称为2C表3、多个样本的构成比比较,以及双向无序分类资料关联性检验,有R行C列,称为RC表,行列表检验的专用公式 2=n(A2/nRnC1)=(R1)(C1),(一

10、)多个样本率的比较,例7-6 某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见表7-8。问三种疗法的有效率有无差别?表7-8 三种疗法有效率的比较,H0:1=2=3,即三种疗法的有效率相等 H1:三种疗法的有效率不全相等=0.052=532(1992/20648172/20651262/144511)=21.04=(31)(21)=2 查2界值表:得P0.005.按=0.05 拒绝 H0,接受H1,可以认为三种疗法治疗周围性面神经麻痹的有效率有差别。,(二)样本构成比的比较例7-7 某医师在研究血管紧张素转化酶(ACE)基因I/D多态与2型糖尿病肾病(DN)的关

11、系时,将249例型糖尿病患肾病分为两组,资料见表79。问两组型糖尿病患者的ACE基因型总体分布有无差别?表7-9 DN组与无DN组型糖尿病患者ACE基因型分布,H0:两组2型糖尿病患者ACE基因型的总体构成比相同H1:两组2型糖尿病患者ACE基因型的总体构成比不同=0.05按公式(710)计算2=249(422/11172482/111120362/138571)=7.91=(21)(31)=2查2界值表得0.01P0.025。按=0.05拒绝H0,接受H1,认为DN与无DN的2型糖尿病患者的ACE基因型分布不同。,(三)双向无序分类资料的关联性检验,例7-8 测得某地5801人的ABO血型和

12、MN血型结果如表7-10,问两种血型系统之间是否有关联?表7-10 某地5801人的血型,H0:两种血型系统间无关联H1:两种血型系统间有关联=0.052=58014322/(18231451)4902/(18231666)322/(3482684)1=213.16=(41)(31)=6查2界值表得P0.005。按=0.05拒绝H0,接受H1,认为两种血型系统间有关联。,若需进一步分析关系的密切程度时,可计算Pearson列联系数C C取值范围在01之间。0 表示独立:1 表示完全相关;愈接近于0,关系愈不密切,愈接近于1,关系愈密切。,(四)、行列表资料检验的注意事项,1、理论频数T不应太小

13、;不宜有1/5以上的格子1T5;不宜有一个格子的T1若出现上述情况,处理的方法有:(1)最好是增加样本的含量(继续观察),使T增加(2)根据专业知识,考虑能否删去T太小的行或列,或T太小的行间或列间,进行合理的合并,(3)改用双向无序表的确切概率法 2、多个率比较,若所得统计推断为拒绝 H0,接受H1时,只能认为各总体率之间总的来说有差别。要进一步推断哪两两总体率之间有差别,需进一步做多个样本率的多重比较。3、对于有序的RC表资料不宜用 2检验(见后),(五)RC表的分类及其检验方法的选择,1、双向无序RC表:RC表中两个分类变量皆为无序分类变量,如表7-8、7-9、7-10。对于该类资料:若

14、研究目的为多个样本率(或构成比)的比较,可用R2表资料的2检验 若研究目的为分析两个分类变量之间有无关联性以及关系的密切程度时,可用RC表资料的2检验以及Pearson列联系数进行分析。,2、单向有序RC表:有两种形式 RC表中的分组变量是有序的(如年龄),而指标变量是无序的(如传染病的类型),其研究目的通常是分析不同年龄组各种传染病的构成情况,此种单向有序RC表资料可用行列资料的2检验。RC表中的分组变量为无序的(如疗法),而指标变量是有序的(如疗效按等级分组),其研究目的为比较不同方法的疗效,此种单向有序RC表资料宜用秩和检验进行分析。,3、双向有序属性相同的RC表:RC表中的两分类变量皆

15、为有序且属性相同。实际上是22配对设计的扩展,即水平数3的诊断试验配伍设计,如用两种检测方法同时对同一批样品的测定结果。其研究目的通常是分析两种检验方法的一致性,此时宜用一致性检验(Kappa检验),,4、双向有序属性不同的RC表:RC表中两分类变量皆为有序的,但属性不同,如表7-13。若目的为分析不同年龄组的疗效有无差别时,可把它视为单向有序RC表资料,选用秩和检验,若目的为分析两有序分类变量间是否存在相关关系,宜用等级相关分析或积矩相关分析或Pearson积矩相关分析若研究目的为分析两有序分类变量间是否存在线性变化趋势,宜用有序分组资料的线性趋势检验。,方法:1.2分割法(partitio

16、ns of 2 method)2.Scheffe可信区间法3.SNK法,五、多个样本率间的多重比较,(一)2分割法,1、基本思想多个样本率比较若结论为拒绝H0,接受H1时,需进一步做多重比较,即做两两之间的比较,说明每两个总体率之间是否有差异。方法:把R2表直接分割成多个独立的四格表,进行两两比较的2检验,但必须重新规定检验水准,其目的是保证检验假设中的型错误的概率不变。,表7-12:表7-8三个有效率的比较可分割成3个四格表,2、的调整方法多个率之间的每两两之间的比较:k个样本率每两两之间进行比较,共有 次独立的四格表2检验,加上总的行列表的2检验,共作了 1次检验。故其检验水准,各实验组与

17、对照组比较:(k-1)个实验组与对照组,其检验水准,3、多个率之间的每两两之间的比较,例7-9 对例7-6资料进行两两比较,以推断任何两种疗法治疗周围性面神经麻痹的有效率是否有差异?H0:A=B 即任何两种疗法的疗效相等H1:AB 即任何两种疗法的疗效不等=0.05本题为3个率的比较,K=3,,计算2值见表7-12,查表7-11界值表,确定P值,按=0.0125水准,可认为物理疗法与药物疗法及外用膏药疗法的疗效有差异,还不能认为药物疗法与外用膏药疗法的疗效有差异,4.各实验组与对照组比较,例7-10 对例7-6资料中以药物疗法为对照组,物理疗法和外用膏药疗法为实验组,试分析实验组的总体有效率与

18、对照疗法是否有差异?H0:T=C 即各实验组与对照组的总体有效率相等H1:TC 即各实验组与对照组的总体有效率不等=0.05 K=3,=0.0125可认为物理疗法与药物疗法的疗效有差异,还不能认为外用膏药疗法与疗药物法的疗效有差异.,四格表资料Fisher确切概率法,(2学时)吴成秋公共卫生学院卫生学教研室,一、基本思想例7-4 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表7-4。问两组新生儿的HBV总体感染率有无差别?表 7-4 两组新生儿的感染率,在四格表周边合计数固定不变的条件下表内4个实际频数变动的情况如下:变

19、动组合数=周边合计中最小数+1(1)(2)(3)(4)(5),adbc=-198 adbc=-165 adbc=-132 adbc=-99 adbc=-66,(6)(7)(8)(9)(10),abbc=-33 adbc=0 adbc=33 adbc=66 adbc=99,(ab)!(cd)!(ac)!(bd)!,a!b!c!d!n!,Pi=,1、计算各组合的概率 Pi服从超几何分布,其和为1,2、计算累计概率P:设现有样本四格表中的交叉积差a*d*b*c*=D*,其概率为P*,其余情况下的组合四格表的交叉积差记为Di,概率记为 Pi(1)单侧检验 若现有样本四格表中D*0,须计算满足DiD*和

20、PiP*条件的各种组合下四格表的累计概率。若D*0,则计算满足DiD*和PiP*条件的各种组合下四格表的累计概率。,(2)双侧检验 计算满足DiD*和PiP*条件的各种组合下四格表的累计概率。若ab=cd 或 ac=bd 时,四格表内各种组合的序列呈对称分布,此时按单侧检验规定条件只计算单侧累计概率,乘以2即得双侧累计概率。,确定P值和作出结论 P值是指由H0规定的总体中作随机抽样,获得等于及大于(和/或等于及小于)现有样本检验统计量值的概率。t(u)t,(u)Pt(u)=t,(u)P=,-t,-t 0 t+t,/2,/2,P/2,二、检验步骤1、计算现有样本的D*和P*及各组合下四格表的Di

21、2、计算满足DiD*条件的各组合下四格表的累计概率Pi3、计算同时满足Di66和PiP*条件的四格表的累计概率 P=P1P2P3P4P5P10 0.1210,表7-5 例7-4的Fisher确切概率法,例7-5 某单位研究胆囊线癌、线瘤的P53基因表达,对同期手术切除的胆囊线癌、线瘤标本各10份,用免疫组化法检测P53基因,资料见表7-6。问胆囊线癌和胆囊线瘤的P53基因表达阳性率有无差别?表7-6 胆囊线癌和胆囊线瘤的P53基因表达,H0:1=2H1:12=0.05 本例 ab=cd=10,四格表内各种组合以 i=4和 i=5的组合为中心呈对称分布。,表7-7 例7-5的Fisher确切概率

22、计算表,1、计算现有样本的D*和P*及各组合下四格表的Di2、计算满足Di50条件的各组合下四格表的累计概率Pi3、计算同时满足Di50和PiP*条件的四格表的累计概率 P=2(P7P8)0.057P0.05 按=0.05检验水准不拒绝H0,尚不能认为胆囊线癌 与胆囊线瘤的P53基因表达阳性率不等。,频数分布拟合优度的2检验,1、频数分布拟合优度检验:是一种推断某种现象的频数分布是否符合某一理论分布的假设检验方法2、2值反映了实际频数和理论频数的吻合程度,因此,2检验可用于频数分布拟合优度检验,可推断一个资料的频数分布是否符合正态分布、二项分布、Poisson 分布、负二项分布等。3、步骤,例

23、7-12 观察某克山病区克山病患者的空间分布情况,调查者将该区划分为279个取样单位,统计各取样单位历年的累计病例数,资料如表7-15,问此资料是否符合Poisson分布?,表7-15 Poisson 分布的拟合与检验,解:n=279,fx=686,fx2=2342x=fx/n=686/279=2.46 s2=fx2-(fx)2/n/(n-1)=(2342-6862)/279/(279-1)=2.36H0:本资料服从poisson分布H1:本资料服从poisson分布=0.10按照Poisson的理论求P(x)和理论频数Tx=P(x)n,及2,结果见上表。=2.462=2.05,P0.75,按=0.10的水准不拒绝H0,认为该资料服从poisson分布,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号