卫生统计学卡方检验ppt课件.pptx

上传人:牧羊曲112 文档编号:1662612 上传时间:2022-12-13 格式:PPTX 页数:94 大小:796.62KB
返回 下载 相关 举报
卫生统计学卡方检验ppt课件.pptx_第1页
第1页 / 共94页
卫生统计学卡方检验ppt课件.pptx_第2页
第2页 / 共94页
卫生统计学卡方检验ppt课件.pptx_第3页
第3页 / 共94页
卫生统计学卡方检验ppt课件.pptx_第4页
第4页 / 共94页
卫生统计学卡方检验ppt课件.pptx_第5页
第5页 / 共94页
点击查看更多>>
资源描述

《卫生统计学卡方检验ppt课件.pptx》由会员分享,可在线阅读,更多相关《卫生统计学卡方检验ppt课件.pptx(94页珍藏版)》请在三一办公上搜索。

1、检 验,卡方检验是英国统计学家K. Pearson于1900年提出的,以卡方分布和拟合优度为理论依据,一种用途较广的假设检验方法。常用于检验完全随机设计下两个或多个样本率(或构成比)之间有无差别,也可用于检验配对设计下两组频数分布差异,或者线性趋势卡方检验,推断两变量间有无相关关系等。,第一节 完全随机设计(独立样本)列联表资 料的 检验 在抽样研究中,由于个体间存在变异,必然存在着抽 样误差,率(或构成比)的抽样误差与均数的抽样误差 概念相同。,例1 将病情相似的169名消化道溃疡患者随机分成两组,分别用奥美拉唑与雷尼替丁两种药物治疗,4周后评价其疗效,结果见表1。问两药治疗消化道溃疡的愈合

2、率有无差别?,表1 两药治疗消化道溃疡4周后疗效 两组的愈合率不同有两种可能:1. 两药的总体愈合率无差别,两样本率的差别仅由抽 样误差所致。2. 两种药物的总体愈合率确有不同。,一、卡方检验的基本思想表1中,64、21、51、33 是整个表的基本数据,其余数据都是从这四个基本数据相加而得的,这种资料是两组两分类资料,称为四格表(fourfold table),亦称22表(22 table)。,表 两独立样本率比较的四格表,无效假设H0为 1=2,即两种药物治疗消化道溃疡的愈合率相同,两样本的愈合率的差别仅有抽样误差所致。由于此时总体情况未知,故用样本合计愈合率对总体愈合率进行估计,即H0为1

3、=2=68.05,在此基础上,可以推算每个格子的期望频数,称为理论频数(actual frequency),用符号T表示;从样本观察到的频数称为实际频数(theoretical frequency),用符号A表示。,若H0成立,则理论上:奥美拉唑组愈合人数:奥美拉唑组未愈合人数:雷尼替丁组愈合人数:雷尼替丁组未愈合人数:,为相应行的合计 为相应列的合计 n 为总例数。,表1 两药治疗消化道溃疡4周后疗效,检验的基本公式:从基本公式可以看出, 统计量值反映了实际频数和理论频数的吻合程度。如果假设检验H0 (1=2)成立,则实际频数和理论频数之差一 般不会相差太大, 值相应也不会太大; 反之,实际

4、频数和理论频数之差相差很大,则 值相应也会很大,相应的P值也就越小,当P,则有理由认为无效假设不成立,继而拒绝H0,作出统计推断。,由 统计量的公式(11.2)可以看出, ,格子数越多,非负数之和,则卡方值越大,即卡方值的大小除了与A与T的差别大小有关外,还与格子数量有关。因而考虑卡方值大小的同时,应同时考虑格子数的多少。引入自由度v。式中,k为格子数,s为估计的参数个数,R为行数,C为列数。如本例中,4个格子,估计甲乙两药的有效率,则k=4,s=2,v=4-1-2=(2-1)(2-1)=1。,分布是一种连续型随机变量的概率分布。如果Z服从标准正态分布,那么Z2服从自由度为1的 分布,其概率密

5、度在(0,+)区间上表现为L型,取较小值的可能性较大,取较大值的可能性较小。设有v 个相互独立的标准正态分布随机变量Z1, Z2, Zv, 则 的分布称为自由度为v的 分布,记为 。 分布的形状依赖于自由度v的大小,当自由度v1时,随着v的增加,曲线逐渐趋于对称,当自由度v趋于,时, 分布逼近正态分布。各种自由度的 分布右侧尾部面积为时的临界值记为 ,列于附表8。,二、22列联表资料的 检验。 (一) 22列联表资料 检验的步骤 现以例1说明22列联表资料 检验的步骤 建立假设 H0: 12 H1 : 12 确定检验水准 =0.05 计算统计量 值, 确定P值 自由度(行数1)(列数1)(21

6、)(21)1, 查 界值表得P0.05。 下结论 因为P0.05,按=0.05的水准,拒绝H0,接受H1, 差异有统计学意义。即可认为两药治疗消化 道溃 疡的愈合率有差别,其中奥美拉唑的愈合率比雷 尼替丁愈合率高。,(二) 四格表的专用公式 a、b、c、d 分别为四格表中的四个实际频数,n为总 例数。 本例:,(三) 四格表 统计量的连续性校正1. 当n40,且T5时,不须校正,直接用基本公式 (8-2)或专用公式(8-3)计算。2. 任一格子的1T5,且n40时,需计算校正 值, 或使用四格表的确切概率法。3. 任一格子的T1或n40时,需改用四格表确切概率法。,例2 某研究欲比较甲、乙两药

7、治疗下呼吸道感染的疗效,将65例下呼吸道感染者随机分为两组,进行随机双盲试验,结果见表2。两组纳入分析的病例数分别为32和33人。问两药治疗下呼吸道感染的有效率有无差别?表2 两药治疗下呼吸道感染的效果, 建立假设 H0: 12 H1 : 12 确定检验水准 =0.05 计算统计量 值 本例 ,而n40, 故应计算校正的卡方值。, 确定P值 自由度(行数1)(列数1)(21)(21)1, 查 界值表得P0.05。 下结论 因为P0.05,按=0.05的水准,还不拒绝H0,即 差异没有统计学意义。即还不能认为两药治疗下 呼吸道感染的有效率有差别。 注意:如果本例不校正,直接用公式(8-2)计算

8、值, ,则P0.05,按=0.05的水 准,拒绝H0,接受H1,差异有统计学意义。结论相反。,例 某医师用甲、乙两疗法治疗单纯消化不良,结 果如下表,问两种疗法的治愈率有无差别?表 两种疗法对单纯消化不良的治愈率比较, 建立假设 H0:1=2 H1:12 确定检验水准 =0.05 计算统计量 值 确定P值 (21) (21)1,查 界值表得P0.05。, 下结论 因为P0.05,按=0.05的水准,不拒绝H0,差 异无统计学意义。尚不能认为甲、乙两疗法对小 儿单纯性消化不良的治愈率不等。,三、RC列联表资料的 检验。当基本数据的行数或列数大于2时,统称为行列表或RC表。RC表的 检验主要用于多

9、个样本率(或构成比)的比较。行列资料 检验的专用公式n为总例数,A为每个格子的实际频数,nR为与A同 行的行合计,nC为与A同列的列合计。,(一) 多个样本率的比较例3 某研究者欲比较A、B、C 三种方案治疗轻、中度高血压的疗效,将年龄在5070岁的240例轻、中度高血压患者随机等分为3组,分别采用三种方案治疗。一个疗程后观察疗效,结果见表11.4。问三种方案治疗轻、中度高血压的有效率有无差别?,表3 三种方案治疗轻、中度高血压的效果, 建立假设 H0:123 H1: 三种方案治疗轻、中度高血压的有效率不等或 不全等 确定检验水准 =0.05 计算统计量 值, 确定P值 (31)(21)2,查

10、 界值表得P0.01。 下结论 因为P0.01,按=0.05的水准,拒绝H0,接受 H1,差异有统计学意义。即可认为三种方案治疗轻、 中度高血压的有效率不等或不全等,例 某市重污染区、一般污染区和农村的出生婴儿的致畸情况如下表,问三个地区的出生婴儿的致畸率有无差别?表 某市三个地区出生婴儿的致畸率比较, 建立假设 H0:123 H1:1,2,3之间不等或不全等。 确定检验水准 =0.05 计算统计量 值, 确定P值 (31)(21)2,查 界值表得P0.01。 下结论 因为P0.01,按=0.05的水准,拒绝H0,接受 H1,差异有统计学意义。即可认为三个地区的出 生婴儿的致畸率有差别。,例

11、为研究某镇痛药的不同剂量镇痛效果是否有差别,研 究人员在自愿的原则下,将条件相似的53名产妇随机分成 三组,分别按三种不同剂量服用该药,镇痛效果如下表。 试分析该药不同剂量的镇痛效果有无差别? 表 某药不同剂量的镇痛效果, 建立假设 H0:三种剂量的镇痛效果相同 H1:三种剂量的镇痛效果不同或不全相同 确定检验水准 =0.05 计算统计量 值, 确定P值 (31)(21)2,查 界值表得P0.05。 下结论 因为P0.05,按=0.05的水准,拒绝H0,接受 H1,差异有统计学意义。即可认为三种剂量的镇 痛效果不同或不全相同。,(二) 两个或多个构成比的比较例4 为了解新型农村合作医疗对于农村

12、贫困居民住院服务利用的影响,在经济条件相似的甲、乙两个国家级贫困县(其中甲县2006年已开展新型农村合作医疗,乙县2006年尚未开展)分别进行抽样调查,得到2006年应住院者未住院原因,见表11.5。问甲、乙两县应住院者未住院原因构成比是否不同?,表4甲、乙两县应住院者未住院原因构成比(%), 建立假设 H0:甲、乙两县应住院者未住院原因总体构成比相同同 H1:甲、乙两县应住院者未住院原因总体构成比不同 确定检验水准 =0.05 计算统计量 值, 确定P值 (21)(41)3,查 界值表得P0.05。 下结论 因为P0.05,按=0.05的水准,还不拒绝H0, 差异没有统计学意义。即尚不能认为

13、甲、乙两县 应住院者未住院原因总体构成比分布不同。,例5 1986年某地城市和农村20至40岁已婚妇女避孕 方法情况如下表5,试分析该地城市和农村避孕方法 的总体构成分布有无差别?,表5 某地城市和农村已婚妇女避孕方法情况, 建立假设 H0:城市和农村已婚妇女避孕方法的总体分布相同 H1:城市和农村已婚妇女避孕方法的总体分布不全同 确定检验水准 =0.05 计算统计量 值, 确定P值 (21)(41)3,查 界值表得P0.01。 下结论 因为P0.01,按=0.05的水准,拒绝H0,接受 H1,差异有统计学意义。即可认为城市和农村已 婚妇女避孕方法的总体分布不同,例 某医院研究急性白血病患者与

14、慢性白血病患者的血型构成情况,其资料如下表,问两组血型构成比是否不同?表 急性与慢性白血病患者的血型构成, 建立假设 H0:急性与慢性白血病患者的构成比相同。 H1:急性与慢性白血病患者的构成比不相同。 确定检验水准 =0.05 计算统计量 值, 确定P值 (21)(41)3,查 界值表得P0.05。 下结论 因为P0.05,按=0.05的水准,不拒绝H0,差 异无统计学意义。尚不能认为急性与慢性白血病 患者的构成比不相同。,行列表检验时的注意事项,计算2值时,只能用绝对数,不能用相对数2检验要求理论频数不宜太小, 一般认为行列表中不宜有1/5以上格子的理论频数小于5, 或有一个理论频数小于1

15、。关于单向有序行列表的统计处理。当多个样本率(或构成比)比较的检验, 结论为拒绝检验假设, 只能认为各总体率(或总体构成比)之间总的说来有差别, 但不能说明它们某两者间有差别。,理论频数太小有三种处理办法,增加样本例数以增大理论频数。删去上述理论频数太小的行或列。将太小理论频数所在行或列与性质相近的邻行邻列中的实际频数合并, 使重新计算的理论频数增大。,单向有序行列表的统计处理,当效应按强弱(或优劣)分为若干个级别, 比如分为-、+、+、+、 +等6个等级, 在比较各处理组的效应有无差别时, 宜用第12章的秩和检验法。 如作2 检验只说明各处理组的效应在构成比上有无差异。,多个样本率的两两比较

16、,当多个样本率(或构成比)比较的检验, 结论为拒绝检验假设, 只能认为各总体率(或总体构成比)之间总的说来有差别, 但不能说明它们某两者间有差别。两两比较的方法较多,大致分为三类: 调整水准后进行两两比较(本教材介绍此法); 2分割; 估计两率之差的置信区间。,例6 为研究某镇痛药的不同剂量镇痛效果是否有差别,研 究人员在自愿的原则下,将条件相似的53名产妇随机分成 三组,分别按三种不同剂量服用该药,镇痛效果如下表。 试分析该药不同剂量的镇痛效果有无差别? 表6 某药不同剂量的镇痛效果, 建立假设 H0:三种剂量的镇痛效果相同 H1:三种剂量的镇痛效果不全相同 确定检验水准 =0.05 计算统

17、计量 值, 确定P值 (31)(21)2,查 界值表得P0.05。 下结论 因为P0.05,按=0.05的水准,拒绝H0,接受 H1,差异有统计学意义。即可认为三种剂量的镇 痛效果不全相同。,对于比较多组独立样本的卡方检验,拒绝H0只能说各组总体率不全相同,即多组中至少有两组的有效率是不同的,但并不是多组有效率彼此间均不相同。若要明确哪两组间不同,还须进一步作多组间的两两比较。 两两比较的可能数量: 两两比较时新检验水准:,本例为三种剂量的镇痛效果进行比较。因为经假设检验,拒绝H0,接受H1,差异有统计学意义。即可认为三种剂量的镇痛效果不全相同。然后,可以进行三种剂量的镇痛效果的两两比较。 两

18、两比较的可能数量: 两两比较时新检验水准:,表 不同剂量有效率之间的两两比较注:表中“”表示差别没有统计学意义,“*”表示差别有有统计学意义,第二节 配对设计资料的 检验 一、配对22列联表资料的 检验(McNemar检验) 配对四格表资料作比较的目的是通过单一样本数据推断两种处理的结果有无差别。常用于判断两种检验方法、两种培养方法等的差别。 比较两种诊断方法的诊断效能有无差异时,要求所投入的检品是用标准法检出的阳性样品,或者受检对象是确诊的病例,以便判断两种方法的优劣。,配对设计且试验结果为“二分类”的资料,当配对的结果仅有四种情况时,称为配对22列联表或配对四格表,如下表: 表 配对四格表

19、格式,由上表可看出:由此可见,在配对四格表中,a、d 在比较两种属性的阳性率有无差异时不起作用,故只需比较甲+乙-的对子数b与甲-乙+的对子数c之间的差别来反映两种属性的阳性率的差异,则无效假设H0为B=C,即b、c代表的总体相等,b、c对应的理论频数为 。,将这两个格子的实际频数和理论频数代入卡方统计量的基本公式中(式11.2):,即配对设计四格表 检验公式为:上式又称McNemar 检验。,当b+c40时,需做连续性校正,公式如下:注意: a、d 反映的甲、乙两种属性一致的情况。由于a、d 两个格子不能反映差异,因此,当a、d 比较大,b、c 比较小时,若得到差异有统计学意义,需结合两样本

20、率差异的大小得出专业结论。,例7 有28份白喉病人的咽喉涂抹标本,把每份标本分 别接种在甲、乙两种白喉杆菌培养基上,结果如表7,问两种白喉杆菌培养基的效果有无差别? 表7 甲、乙两种白喉杆菌培养基的培养结果 甲培养基 乙 培 养 基 合计 11(a) 9(b) 20 1(c) 7(d) 8 合 计 12 16 28, 建立假设 H0:B=C H1:BC 确定检验水准 =0.05 计算统计量 值 本例b=9, c=1, b+c40, 故计算校正 值。 确定P值 R-12-1=1,查 界值表得P0.05。, 下结论 因为P0.05,按=0.05的水准,拒绝H0,接受 H1,差异有统计学意义。即可认

21、为甲、乙两种白 喉杆菌培养基的培养效果不同,甲培养基阳性率 较高。,例8 有某研究者欲比较心电图和生化测定诊断低钾血症的价值,分别采用两种方法对79名临床确诊的低钾血症患者进行检查,结果见表8。问两种方法的检测结果是否不同? 表8 两种方法诊断低钾血症的结果, 建立假设 H0:1=2 H1:12 确定检验水准 =0.05 计算统计量 值 本例b=25, c=4, b+c=2940, 故计算校正 值。 确定P值 R-12-1=1,查 界值表得P0.01。, 下结论 因为P0.01,按=0.05的水准,拒绝H0,接受 H1,差异有统计学意义。即可认为两种方法的检 测结果不同。由于心电图检测的阳性率

22、为88.62%, 生化测定方法的阳性率为62.03%,故心电图检测的 阳性率高于生化测定方法的阳性率。,二、配对设计的 RR 表资料的 检验 在配对四格表中,分类变量只有2个取值,即二分类,但在实际工作中,分类变量具有R(R2)个可能的取值,这样就构成了更一般的配对RR列联表。 表 配对设计的 RR 列联表资料,配对设计的 R R 表资料检验的T统计量 当R=2时,公式(11.11)与公式(11.9)完全等价,即该方 法是McNemar的推广。,例9 对某研究欲比较X线和CT对强直性脊柱炎(AS)骶髂关节病变的诊断价值,收集临床上诊断为AS的患者136 例,对272个骶髂关节分别拍摄X线平片和

23、CT扫描,结果见表9。问两种方法诊断骶髂关节病变的分级有无差别?,表9 两种方法诊断骶髂关节病变的分级情况, 建立假设 H0: 两种方法诊断骶髂关节病变分级的频率分布 相同 H1 : 两种方法诊断骶髂关节病变的分级频率分布不同 确定检验水准 =0.05 计算统计量T值, 确定P值 R13,查 界值表得P0.01。 下结论 因为P0.05,按=0.05的水准,拒绝H0,接受 H1,差异有统计学意义。即可认为两种方法诊断 骶髂关节病变的分级频率分布不同。,例10 对150名冠心病患者用两种方法检查室壁收缩运动的 情况,检查结果见下表。试比较两种方法测定结果的概率分布有无差别? 表10 两种方法检查

24、室壁收缩运动的情况, 建立假设 H0:两变量的频率分布相同 H1:两变量的频率分布不同 确定检验水准 =0.05 计算统计量T值, 确定P值 k12,查 界值表得P0.05。 下结论 因为P0.05,按=0.05的水准,不拒绝H0,差异 无统计学意义。即尚不能认为甲法测定结果的概 率分布与乙法测定结果的概率分布不同。,第三节 线性趋势 检验 当资料是按某自然顺序的等级分层,或连续型变量等计划后再分层的情况下,可采用Cochran Armitage 趋势检验以分析率随该分层因素变化的趋势,统计量计算公式如下:,式中,N 是总人数,n 是各组人数,T 是总阳性数,t 是各组阳性数,Z是各组的评分。

25、如果是按数量分组的资料,评分的原则与分组间隔相适应;如果是按性质分组的资料,评分的原则是1,2,3, 。,例11.9 对例11.9 为了解某市中学生的吸烟状况,抽样调查了891名中学生,结果见表11.13,问该市中学生吸烟率是否有随年级增加而增高的趋势? 表 某市不同年级中学生吸烟率, 建立假设 H0: 该市中学生吸烟率无随年级增加而增高的趋势 H1: 该市中学生吸烟率有随年级增加而增高的趋势 确定检验水准 =0.05, 计算 统计量 由于本例是按年级高低分组,相应的评分为1, 2, 3, 4, 5, 6,趋势检验的中间结果见表。, 确定P值 =12,查 界值表得P0.01。 下结论 因为P0

26、.01,按=0.05的水准,拒绝H0,接受 H1,差异有统计学意义。即可认为该市中学生吸 烟率有随年级增加而增高的趋势。,行列表的 检验的注意事项 行列表资料 检验时,如果有1/5以上的格子的 理论数小于5,或者有一个理论数小于1时,应将 相邻组合并以增加理论数。 多个样本率比较的 检验结论为拒绝H0,接受 H1,只能认为各总体率之间总的来说有参别,但 不能认为它们之间都有差别。若要比较彼此间的 差别,可用行 列表的 分割等方法进一步作多 重比较。,【例】某年某市三个区的肠道传染病发病情况如下表, 试计算各区的肠道传染病发病率。 表 某年某市三个区的肠道传染病发病情况,返回,【例】某正常人的白

27、细胞分类计数如下表,试计算其构 成比。 表 某正常人的白细胞分类计数构成比,返回,【例】2000年我国第五次人口普查结果,男子65355万 人,女子61228万人,试计算人口男女性别比。 【例】某市乙型脑炎的发病率1990年为4.48/10万, 2000年为0.88/10万,试计算相对比。,返回,例 根据以往经验,一般溃疡病患者有20发生胃出血症状。现某医院观察65岁以上溃疡病人304例,其中有34例发生胃出血症状。问老年患者胃出血情况与一般患者有无不同?,返回,例 某单位调查了50岁以上吸烟者205人中其中患慢性子气管炎43人,不吸烟者134人中患慢性子气管炎13人。问吸烟者与不吸烟者慢性子

28、气管炎的患病率有无差别?,Ztest返回,返回,表 吸烟者与不吸烟者的慢性子气管炎患病率比较 分 组 患病人数 未患病人数 合计 患病率() 吸烟者 43(33.86) 162(171.14) 205(a+b) 21.0 不吸烟者 13(22.14) 121(111.86) 134(c+d) 9.7 合 计 56(a+c) 283(b+d) 339(n) 16.5,返回p54,返回p53,例 某医师用甲、乙两疗法治疗单纯消化不良,结 果如下表,问两种疗法的治愈率有无差别? 表 两种疗法对单纯消化不良的治愈率比较,返回,例 某市重污染区、一般污染区和农村的出生婴儿 的致畸情况如下表,问三个地区的出生婴儿的致畸 率有无差别? 表 某市三个地区出生婴儿的致畸率比较,返回,例 某医院研究急性白血病患者与慢性白血病患者 的血型构成情况,其资料如下表,问两组血型构成 比是否不同? 表 急性与慢性白血病患者的血型构成,返回,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号