医学统计学课件.ppt

上传人:牧羊曲112 文档编号:2328165 上传时间:2023-02-11 格式:PPT 页数:43 大小:1.86MB
返回 下载 相关 举报
医学统计学课件.ppt_第1页
第1页 / 共43页
医学统计学课件.ppt_第2页
第2页 / 共43页
医学统计学课件.ppt_第3页
第3页 / 共43页
医学统计学课件.ppt_第4页
第4页 / 共43页
医学统计学课件.ppt_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《医学统计学课件.ppt》由会员分享,可在线阅读,更多相关《医学统计学课件.ppt(43页珍藏版)》请在三一办公上搜索。

1、2检验 2检验是英国统计学家Pearson提出的一种以2分布为理论基础,用途非常广泛的假设检验方法。下面介绍常用的几种2检验方法。,1.四格表(2*2列联表)资料的2检验 先看一个例子:某医生用A、B两种药物治疗急性下呼吸道感染,A药治疗74例,有效68例,B药治疗63例,有效52例,结果见下表。问两种药的有效率是否有差别?,这是一个假设检验问题。这里要检验的是两个样本率所代表的两个总体率是否相等,即检验如下的假设:H0:1 2 对于这种两样本率的检验,我们总可以将资料整理为如下格式:,由于这个表格中只有中间四个数是起决定作用的,其余的数均可由这四个数计算出来,故这个表格又称为四格表。,为了检

2、验这个假设,我们先计算出合并阳性率:pc=n1/n(合并阴性率:1 pc=n2/n)。并称:Tij=ni(nj/n)为理论数,而称Aij为实际数。,如果H0成立,我们假设两个总体率相等,且等于合并率,即H0:1 2pc 则可求出四个格子所对应的理论数:,Tij=ni(nj/n),而称Aij为实际数,我们要检验的假设实际上是:H0:1 2pc Pearson给出了如下的统计量:,Pearson还证明了当N(40)充分大时,如上定义的卡方统计量近似地服从自由度为(r-1)(c-1)的卡方分布。于是,可利用这个卡方统计量来对上述假设进行检验。由于这个统计量涉及到理论数T,一般应先计算T的值,然后再计

3、算卡方值。(Ex9.2),这个统计量反映的是实际数与理论数之间的差异,如果H0成立,则这个差异不应该很大。因此,如果这个差异大到一定程度,即可认为H0不成立。,例9-2 将病情相似的169名消化道溃疡患者随机分成两组,分别用洛赛克与雷尼替丁两种药物治疗,4周后疗效见表9-2。问两种药物治疗消化道溃疡的愈合率有无差别?表9-2 两种药物治疗消化道溃疡4周后疗效,3确定P值,做出推断 本例为2*2表,故自由度为(2-1)(2-1)=1 然后,查卡方界值表,20.05,1=3.84。本例2=4.13 3.84=20.05,1 可知P 0.05。在=0.05水平上拒绝H0,两样本频率的差异具有统计学意

4、义。因为洛赛克的愈合率为75.29%,雷尼替丁的愈合率为60.71%,可以认为洛赛克的愈合率比雷尼替丁的愈合率高。,四格表资料卡方检验的专用公式 为了便于计算,可先将四格表改写为如下形式:,于是,卡方统计量可改写为:,注意:上述公式应满足的条件是:n40且所有T5。当n40,但若有一个理论数 1T 5时,用下面的校正公式计算卡方值:,当n 40 或 有一个理论数 T 1时,则可采用确切概率法。,例 两种药物治疗白色葡萄球菌败血症疗效的试验结果见 下表,问两种药物的疗效有无差别?,两种药物治疗白色葡萄球菌败血症的有效率,H0:1 2pc 两种药物的有效率无差别 检验水准:=0.05计算检验统计量

5、:先计算最小理论数 T22=16*6/46=2.0940,故用连续性校正公式计算2值:,查2界值表,得20.05,1=3.84,于是,P0.05。故按=0.05的水准,不拒绝H0,尚不能认为两种药物的有效率有差别。,交叉分类2*2表的关联性分析 四格表资料的卡方检验还可用于关联性分析例 为观察婴儿腹泻是否与喂养方式有关,某医院儿科随机收集了消化不良的婴儿82例,若把该院儿科所有消化不良的患儿视为一个总体的话,则该82例患儿可看作是一份随机样本。对每个个体分别观察腹泻与否和喂养方式两种属性,结果见下表。试分析两种属性的关联性。,这里,实际上是用两个率的检验来推断两个定性变量之间的关联性。,H0:

6、喂养方式与腹泻之间相互独立。检验水准:=0.05计算检验统计量:本例最小理论数T12=40*35/82=17.055,且总例数n40,故直接计算2值:,查2界值表,得20.05,1=3.84,于是,P0.05。故按=0.05的水准,拒绝H0,可以认为婴儿腹泻与喂养方式有关。为了确定关联程度大小,可用下面的列联系数来度量。,列联系数 对于两个定性变量之间的关联程度,可用以下的Pearson列联系数来度量:,对于四格表资料而言,列联系数r的取值介于01之间,r值越接近于1,则说明两变量之间的关系越密切。本例的Pearson列联系数为:,3.配对四格表资料的2检验 计数资料配对设计的特点是:将一份标

7、本分为2份,分别用两种方法进行处理,然后将二分类的处理结果用下表形式表示出来。,这里要比较的是两种方法的检测结果是否一致?通过观察,发现a、d反映的是两种方法的一致性,而b、c反映的是两种方法的差异,故只需考虑b、c即可。,其检验假设为:H0:两种方法的检测结果一致 即:两种方法的总体检出率相同检验统计量为:,当b+c 40时,可用下式:,例 用两种不同的方法对53例肺癌患者进行诊断,结果见 下表,问两种方法的检测结果有无差别?,两种方法诊断肺癌的检测结果,H0:两种检测方法的总体检出率相同。检验水准:=0.05计算检验统计量:本例b=2,c=11,b+c40,故采用下式计算2值:,查2界值表

8、,得20.05,1=3.84,于是,P0.05。故按=0.05的水准,拒绝H0,可以认为两种方法的阳性检出率不同。,4.行*列表资料的2检验 四格表只涉及到两个率的比较,对于多个率的比较,则需要用到如下形式的表格,即行*列表的资料:,这时,需要比较多个率,即需要检验如下的假设:H0:1=2=k,其检验统计量仍为:,例 某医院用三种穴位针刺治疗急性腰扭伤,结果见下表,试比较三种穴位针刺效果有无差别。,针刺不同穴位治疗急性腰扭伤的治愈率,H0:1=2=3 三组治愈率相等H1:1、2、3 三组治愈率不全相等 检验水准:=0.05计算检验统计量:,查2界值表,得20.05,2=5.99,于是,P0.0

9、5。故按=0.05的水准,拒绝H0,可以认为三组治愈率不全相等。,多个样本率之间的多重比较 在上例中,如果我们希望进一步了解究竟是哪些比较组之间的治愈率不相等,这就需要进行多个率之间的两两比较。一般地,在进行多个样本率的比较时,如果检验结果为拒绝H0,即认为多个总体率之间存在差异。为了进一步了解哪两个总体率不同,就需要进行两两比较或称多重比较。若将行*列表拆分为多个2*k表分别进行比较,则将会增大犯I类错误的概率。例如有4个比较组(4个样本率的比较)需进行两两比较,则需拆分成6个2*k表来进行比较,即需作6次检验,每次检验的水准为=0.05,于是:,第1次比较时不犯一类错误的概率为:1-0.0

10、5前2次比较均不犯一类错误的概率为:(1-0.05)26次比较均不犯一类错误的概率为:(1-0.05)6,于是,6次比较中至少有一次犯一类错误的概率为:1-(1-0.05)6=0.26这个概率远大于0.05。因此,需要对检验水准进行调整,其调整原则是:,对于k个比较组时,需要比较的次数为:k(k-1)/2;对于各实验组与一个共用对照组比较时,需要比较的次数为:k-1。,例 某医院用三种穴位针刺治疗急性腰扭伤,结果见下表,试比较三种穴位针刺效果有无差别。,针刺不同穴位治疗急性腰扭伤的治愈率,经前面的检验已知,三组治愈率不全相等。现在的问题是三组中究竟哪些组之间的总体治愈率不相等?为了解决这个问题

11、,可将上表拆分为以下三个表格:,例 某医院用三种穴位针刺治疗急性腰扭伤,结果见下表,试比较三种穴位针刺效果有无差别。,针刺不同穴位治疗急性腰扭伤的治愈率,可将上表拆分为以下三个表格:,表2,表3,表1,H10:表1中两个对比组的总体治愈率相等 H20:表2中两个对比组的总体治愈率相等 H30:表3中两个对比组的总体治愈率相等 检验水准:=0.05 本例为三个实验组间的两两比较,其调整的检验水准为:,计算检验统计量:由表1,得 21=14.24 由表2,得 22=30.75 由表3,得 23=1.26,当=0.0167时,查表得:20.0167,1=5.73 由此可知,不能认为表3中的两个比较组

12、的总体治愈率不等,而可以认为其余两个表中所表示的两个比较组的总体治愈率不等。,秩和检验 假设检验:参数检验:总体分布已知,需要检验参数是否相等。非参数检验:总体分布未知,需要检验总体分布是否相同。非参数检验的方法很多,秩和检验就是其中一种。1.秩和检验的基本思想 例:测得铅作业与非铅作业工人的血铅值(g/100g)如下(将其各组观测值按从小到大的顺序排列):A(非铅组):5 6 7 9 12 15 19 21 n1=8B(铅作业组)17 18 20 25 34 43 n2=6 试推断两组血铅值有无差异?这个问题等价于:两样本所代表的两总体分布是否相同?或等价于:两样本是否来自同一总体?,我们这

13、样来考虑问题:先将所有数据按大小顺序编号编秩:A(非铅组):5 6 7 9 12 15 19 21 B(铅作业组):17 18 20 25 34 43 秩号:1 2 3 4 5 6 7 8 9 10 11 12 13 14 然后求出各组秩号之和秩和:Ti TA=41 TB=64这里,秩和反映了该组数据的位置趋势。,两总体分布相同,两组数据位置分布应较均匀,TA、TB之间的差异不大,两总体分布不同,两组数据的位置分布有倾向性差异,TA、TB之间的差异较大,在进行推断时,按给定的检验水准,确定相应的界值来判断各组秩和Ti之间的差异大小,从而对各样本所代表的总体是否相同作出推断。,2.两组独立样本资

14、料的比较,某医院采用随机双盲对照试验,比较新疗法与传统疗法对肾综合征出血热患者的降温效果。试验将病人随机分为两组,分别用新疗法与传统疗法治疗,以用药开始的体温降至正常值时所用的时间(小时)为疗效指标(每天固定时间测量体温四次),结果见下表,试比较两种疗法的退热时间有无差别?,1)建立假设 H0:两种疗法退热时间的总体分布相同。2)编秩 先将两组数据统一排序,然后编秩,注意遇到数值 相等的数据时,需取平均秩。3)求出秩和Ti,并确定T值 规定:n1 n2,令T=T1;若 n1=n2,令T=min(T1,T2)4)查表,定P值,作出推断 查T界值表,若T落入相应范围,则不拒绝H0,否则拒绝H0。,

15、若n1或n2-n1超出T界值表的范围,则需用下式作近似正态检验。,当相同秩次的情况较多时,采用下式进行校正:,其中tj 为相同秩次的个数,3.两组有序变量(等级资料)的秩和检验,例 在一项随机双盲对照临床试验中,研究者欲比较消炎痛与消炎痛+皮质激素制剂(简称合剂)治疗肾小球肾病的疗效;将64例肾小球肾病患者随机分为两组,分别用消炎痛与合剂治疗,全程用药后病情分为完全缓解、基本缓解、部分缓解与无效四个等级,结果见下表,试比较两种药物治疗肾小球肾病的疗效有无不同?,两种疗效对肾小球肾病的疗效比较,1.作假设:H0:两总体分布相同2.编秩3.求秩和4.统计量 本例n1=27,超出了T界值表的范围,进

16、行近似正态检验。,tj 为第j次相同秩次的个数,本例中,即为各等级的人数。,5.查正态分布表,可知P0.01,故可认为两总体分布不同。,多组计量资料的秩和检验例 某医院用3种不同方法治疗15例胰腺癌患者,每种方法各治疗5例。治疗后生存月数见表10-5第(1)、(3)、(5)栏,问这3种方法对胰腺癌患者的疗效有无差别?,1.建立检验假设,确定检验水准 H0:3种方法治疗后患者生存月数的总体分布相同 H1:3种方法治疗后患者生存月数的总体分布不同 0.052.计算检验统计量 值。(1)编秩 将三组数据由小到大统一编秩,遇相同数值编平均秩次。(2)求各组秩和Ti 将表10-5各组秩次相加即得,本例T

17、1 34,T2=60,T3=26。(3)计算检验统计量 值 按下式计算H值。,本例:,当相同秩次出现较多时,由上式求得的H值偏小,可下式进行校正。,tj 为第j次相同秩次的个数。,3.确定p 值,做出推断(1)查 H界值表(三样本比较的秩和检验用)当组数k 3,且各组例数均不大于5 时,可查H界值表得到 p值。本例 k3,且各组例数均为5,由H界值表查得p0.05。按照 0.05水准,拒绝H0,接受H1,故可认为3种方法治疗后胰腺癌患者的生存月数有差别。,4.配对资料的比较符号秩和检验 由于配对资料具有配对信息,因此需要考虑差值。,(2)查卡方界值表 当组数或各组例数超出H界值表时,由于H0

18、成立时H 值近似地服从自由度为k-1 的卡方分布,此时可由卡方界值表得到p 值。,若配对设计考虑的是两种处理间的差别,假定两种处理的效应相同,则差值的总体分布应是对称的,即差值总体的中位数为0;否则,差值总体的中位数就会偏离0.同样,如果配对设计考虑的是自身前后对照间某种处理的效应,假定该处理没有作用,则差值的总体中位数亦应为0,否则,差值总体的中位数就会偏离0.基于这种思想,对于配对设计的资料,采用如下步骤来进行秩和检验:1)作假设 H0:差值总体中位数为0;2)求差值 dj=xj-yj;3)编秩:按差值的绝对值从小到大编秩,并标上原来的符号;注意两种情况:(1)|di|=|dj|时,取平均

19、秩,然后分别标上符号;(2)当d=0时,舍去不计。4)分别求出T+、T-,并取T=min(T+,T-);5)查表确定P值,作出推断结论。,例 某单位欲研究某保健食品对小鼠是否具有抗疲劳作用,将同种属的小鼠按性别与年龄相同、体重相近配成对子,共14对,并将每对中的两只小鼠随机分配到两个不同的保健食品剂量组,测量小鼠负重游泳时间(min,负重5%体重),结果见表10-1,试比较不同剂量组的小鼠负重游泳时间有无差别?,T+73 T5,当n 50,可用式(10-1)(10-3)作正态近似法检验。,5.秩和检验的优缺点 优点:不受总体分布的限制、适用面广、计算简便。缺点:利用信息不充分,检验效率不够高。注意:能用参数检验时,首选参数检验。因为一般说来,参数法的检验效率要高于非参数法。但也不是绝对的,也就是说,并非是在任何情况下参数法的检验效率都比非参数法高。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号