《卡方检验理论》PPT课件.ppt

上传人:小飞机 文档编号:5475773 上传时间:2023-07-11 格式:PPT 页数:80 大小:620.50KB
返回 下载 相关 举报
《卡方检验理论》PPT课件.ppt_第1页
第1页 / 共80页
《卡方检验理论》PPT课件.ppt_第2页
第2页 / 共80页
《卡方检验理论》PPT课件.ppt_第3页
第3页 / 共80页
《卡方检验理论》PPT课件.ppt_第4页
第4页 / 共80页
《卡方检验理论》PPT课件.ppt_第5页
第5页 / 共80页
点击查看更多>>
资源描述

《《卡方检验理论》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《卡方检验理论》PPT课件.ppt(80页珍藏版)》请在三一办公上搜索。

1、1,第8章 无序分类变量资料的统计分析,第二节计数资料的统计推断,2,检验 Chi-Square Test,3,4,一、检验的基本思想 分布,5,(1)分布是一种连续型分布:按分布的密度函数可给出自由度=1,2,3,的一簇分布曲线。(2)分布的一个基本性质是可加性:如果两个独立的随机变量X1和X2分别服从自由度1和2的分布,即,那么它们的和(X1+X2)服从自由度(1+2)的 分布,即。,分布特点,6,2 检验用途:.检验两个或多个样本率及构成比之间差异有无统计学意义;.检验配对计数资料差异有无统计学意义;.两属性变量间的关联分析;.频数分布的拟和优度检验等。,7,四格表资料的 检验,8,目的

2、:推断两个总体率(构成比)是 否有差别(和u检验等价)要求:两样本的两分类个体数排列成四格表资料,9,检验的基本思想,案例8-7 某地调查了50岁以上吸烟者200人患支气管炎者41人,患病率20.5%;不吸烟者162人患慢性支气管炎15人,患病率9.3%。根据以上资料能否说明吸烟者的支气管炎患病率高于不吸烟者?,10,11,本例资料经整理成四格表形式,即有两个处理组,每个处理组的例数由发生数和未发生数两部分组成。表内有 四个基本数据,其余数据均由此四个数据推算出来的,故称四格表资料。,12,四格表资料的基本形式,13,基本思想:可通过 检验的基本公式来理解。,式中,A为实际频数(actual

3、frequency),T为理论频数(theoretical frequency)。,14,理论频数 是根据检验假设,且用合 计率来估计 而定的。如本例,无效假设是吸烟组和不吸烟组的总体患病率相等,均等于合计的患病率15.5%。那么理论上,吸烟组的例理论上患病人数应为20015.5%=30.94,未患病人数为200(15.5%)=.06;同理,不吸烟组的例理论上患病人数应为15.5%=25.06,未患病人数为162(15.5%)=136.94。,15,理论频数由下式求得:,式中,TRC 为第R 行C 列的理论频数 nR 为相应的行合计 nC 为相应的列合计,16,实际频数,理论频数,17,检验统

4、计量 值反映了实际频数与理论频数的吻合程度。若检验假设H0:1=2成立,四个格子的实际频数A 与理论频数T 相差不应该很大,即统计量 不应该很大。如果 值很大,即相对应的P 值很小,若,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,即12。,18,由公式(-)还可以看出:值的大小还取决于 个数的多少(严格地说是自由度的大小)。由于各 皆是正值,故自由度愈大,值也会愈大;所以只有考虑了自由度的影响,值才能正确地反映实际频数A和理论频数T 的吻合程度。检验的自由度取决于可以自由取值的格子数目,而不是样本含量n。四格表资料只有两行两列,

5、=1,即在周边合计数固定的情况下,4个基本数据当中只有一个可以自由取值。,19,3.84,2,5.99,20,(1)建立检验假设,确定检验水准。H0:1=2 即吸烟组和不吸烟组慢性支气管炎总体患病率相等H1:12即吸烟组和不吸烟组慢性支气管炎总体患病率不相等=0.05。,假设检验步骤,21,(2)求检验统计量值,22,23,四格表资料检验的专用公式,24,计算题 某中药研究所试用某种草药预防流感,观察用药组和对照组(未用药组)的流感发病率,其结果下表。问两组流感发病率有无差别?,25,用药组和对照组流感发病率比较,26,表2 用药组和对照组流感发病率的比较,27,两种方法计算结果,28,分布是

6、一连续型分布,而四格表资料属离散型分布,由此计算得的统计量 的抽样分布亦呈离散性质。为改善 统计量 分布的连续性,则需行连续性校正。,29,四格表资料检验的校正公式,30,四格表资料 检验公式选择条件:,,专用公式;,校正公式;,四格表确切概率法。,31,案例8-8前列腺癌患者132例中,85例接受电切术,术后有合并症者11例;47例接受开放手术治疗,术后有合并症者2例。试分析两种手术的合并症发病率有无差别。,32,实际频数,理论频数,33,假设检验步骤,1.建立检验假设,确定检验水准H0:1=2 即两种手术的合并症发病率相等H1:12 即两种手术的合并症发病率不相等=0.05。,34,2.计

7、算检验统计量,35,3.确定P值,做出推断结论按检验水准0.05,不拒绝,差异没有统计学意义,还不可以认为两种手术的合并症发病率不同。,36,计算题 为观察甲、乙两药治疗胃溃疡的疗效,将70名患者随机分为两组,一组30人服用甲药,另一组40人服用乙药。问两种药物治疗胃溃疡的治愈率有无差别?,37,两种药物治疗胃溃疡的结果,38,本例,故用四格表资料 检验的校正公式,39,,查 界值表得。按 检验水准不拒绝,没有统计学意义,尚不能认为两种药物治疗胃溃疡的治愈率不等。,40,本资料若不校正时,结论与之相反。,41,配对四格表资料的 检验,42,与计量资料推断两总体均数是否有差别有成组设计和配对设计

8、一样,计数资料推断两个总体率(构成比)是否有差别也有成组设计和配对设计,即四格表资料和配对四格表资料。,43,配对四格表的形式,44,例8-9 有32份咽喉涂抹标本,把每份标本分别接种在、两种培养基上,观察两种培养基上白喉杆菌生长情况,结果见表8-8,培养基的阳性培养率为68.75,B培养基的阳性培养率为43.73。问:两种培养基的阳性生长率是否相同?,45,表-两种白喉培养基的培养结果比较,46,上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有四种可能:,两种培养基培养皆为阳性数(a);两种培养基培养皆为阴性数(d);A培养基培养为阳性,B培养基培养为阴性数(b);A培养基培养为阳

9、性,B培养基培养为阴性数(c)。,47,其中,a,d 为两法观察结果一致的两种情况,b,c为两法观察结果不一致的两种情况。,检验统计量:,校正公式(b+c或=40):,基本公式(b+c40):,48,注意:,本法一般用于样本含量不太大的资料。因为它仅考虑了两法结果不一致的两种情况(b,c),而未考虑样本含量n和两法结果一致的两种情况(a,d)。所以,当n很大且a与d的数值很大(即两法的一致率较高),b与c的数值相对较小时,即便是检验结果有统计学意义,其实际意义往往也不大。,49,本例检验步骤如下:,(1)建立检验假设 H0:总体B=C,即两种白喉杆菌培养基的生长情况相同 H1:总体BC,即两种

10、白喉杆菌培养基的生长情况不同=0.05(2)计算2值 本例b=10,c=2,b+c40,50,(3)确定P值及推断结论 X24.08X23.84,P0.05在=0.05的水准上,拒绝H0,接收H1,差异有统计学意义。可认为A、B两种白喉杆菌培养基的效果不同。,51,计算题 某抗癌新药的毒理研究中,将78只大鼠按性别、窝别、体重、年龄等因素配成39对,每个对子的两只大鼠经随机分配,分别接受甲剂量和乙剂量注射,试分析该新药两种不同剂量的毒性有无差异。,52,两种剂量的毒性结果比较,53,检验步骤:,54,行列表资料的 检验,55,行列表资料,多个样本率比较时,有R行2列,称为R 2表;两个样本的构

11、成比比较时,有2行C列,称2C表;多个样本的构成比比较,以及双向无序分类资料关联性检验时,称为R C表。,56,检验统计量,57,一、多个样本率的比较,58,案例8-10某市重污染区、一般市区和农村的出生婴儿的致畸情况如表8-9。问三个地区的出生婴儿的致畸率有无差别?,59,表8-9 三个地区的出生婴儿的致畸率,60,假设检验步骤:,61,2、计算检验统计量,=(31)(21)=2,62,3、确定P值及推断结论查界值表,167.11X20.005,210.60。P0.005在=0.05的水准上,拒绝H0,接受H1,差异有统计学意义。可认为三个地区出生婴儿的致畸率有差别。,63,计算题 将113

12、例尿路感染者随机分为3组,第1组44例,接受甲疗法;第2组45例接受乙疗法;第3组44例,接受丙疗法。一个疗程后观察疗效,结果下表。问:三种疗法的尿培养阴转率有无差别?,64,三种疗法对尿路感染患者的治疗效果,65,检验步骤:,66,二、样本构成比的比较,67,案例8-11 为了解血型分布与胃癌及消化性溃疡病的关系,某单位进行了调查,结果见表8-10。试比较各组血型构成有无差别?,68,69,假设检验步骤,建立检验假设,确定检验水准H0:胃癌、溃疡和对照三个组的血型总体构成比相同H1:胃癌、溃疡和对照三个组的血型总体构成比相不同或不全相同=0.05,70,计算检验统计量,71,确定值,作出推断

13、结论根据=查 2 界值表,得P 0.05,按=0.05的检验水准,拒绝H0,接受H。差异有统计学意义,可以认为胃癌、溃疡和对照三个组的血型总体构成有差异。,72,计算题:两组儿童发生意外伤害的种类,73,H0:两组儿童意外伤害类型分布相同H1:两组儿童意外伤害类型分布不同或 不全相同=0.05,74,根据=3 查 2 界值表,得P 0.05,按=0.05的检验水准,不拒绝H0,差异没有统计学意义,还不能认为两组儿童意外伤害类型分布不同。,75,三、行列表资料 检验的注意事项,76,1行列表中的各格T1,并且1T5的格子数不宜超过1/5格子总数,否则可能产生偏性。处理方法有三种:,77,增大样本含量以达到增大理论频数的目的,属首选方法,只是有些研究无法增大样本含量,如同一批号试剂已用完等。,78,根据专业知识,删去理论频数太小的行或列,或将理论频数太小的行或列与性质相近的邻行或邻列合并。这样做会损失信息及损害样本的随机性。改用双向无序RC表的Fisher确切概率法,79,80,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号