第九章秩和检验ppt课件.ppt

上传人:牧羊曲112 文档编号:1432509 上传时间:2022-11-23 格式:PPT 页数:80 大小:598KB
返回 下载 相关 举报
第九章秩和检验ppt课件.ppt_第1页
第1页 / 共80页
第九章秩和检验ppt课件.ppt_第2页
第2页 / 共80页
第九章秩和检验ppt课件.ppt_第3页
第3页 / 共80页
第九章秩和检验ppt课件.ppt_第4页
第4页 / 共80页
第九章秩和检验ppt课件.ppt_第5页
第5页 / 共80页
点击查看更多>>
资源描述

《第九章秩和检验ppt课件.ppt》由会员分享,可在线阅读,更多相关《第九章秩和检验ppt课件.ppt(80页珍藏版)》请在三一办公上搜索。

1、Statistics,医学统计学 (Medical Statistics),院医室楼 4楼 Tel: 0759-2388590 E-mail: gdmyfyx gdmc. edu. cn,医学统计学教研室 Department of Statistical Medicine,Statistics,主讲:孔丹莉,2/45,rank sum test,第十一章 非参数检验,3/45,复习一下正态分布的判断方法,Statistics,4/45,利用频数表或频数图进行判断根据专业知识判断:疾病的潜伏期、住院天数和 临床生化指标大多为偏态正态性检验 正态分布的经验判断 若 ,则有理由怀疑资料呈偏态分布

2、若 ,可认为资料呈偏态分布,参数统计(parametric statistics),参数统计要求样本来自某种特定分布的总体,而该分布中的某些参数未知,统计分析的目的就是对这些未知参数进行估计或推断,如t检验、方差分析都要求原始数据来自于正态分布的总体,且方差齐性。,非参数统计(non-parametric statistics),有许多资料不符合参数统计的要求,不能用参数统计的方法进行检验,而需要一种不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验,称为非参数检验。,非参数分析方法的优缺点,优点: 不受总体分布条件的限制,适用范围广;某些不便准确测定,只能以严重程度,好坏优劣,次第先

3、后等作记录的资料也可应用。 对资料没有特殊要求,例如 不受分布的影响(偏态、分布不明的资料) 不受方差齐性的限制 不受变量类型的影响 不受样本量的影响,非参数分析方法的优缺点,缺点: 适用于参数检验的资料若用非参数检验会造成信息损失,导致检验效率较低。即当H0不真,非参数检验可能不如参数检验能较灵敏地拒绝H0 ,犯第二类错误的概率比参数检验大。 若资料适用于参数方法(如正态分布,方差齐性等,级就尽可能不用非参数方法),第一类错误与第二类错误,客观实际 拒绝H0 不拒绝H0,H0成立,第一类错误,(误诊率,假阳性率),推断正确,H0不成立,推断正确,第二类错误(漏诊率,假阴性率),优点: 对资料

4、的信息利用充分 统计分析的效率高 缺点: 对资料的要求高 适用范围有限,Statistics,7/45,参数分析方法的优缺点,常用的非参数检验方法,秩和检验Ridit 分析卡方检验K-S 法秩相关分析(等级相关分析)cpd 法(积差交叉法)游程检验,Statistics,9/45,秩 和 检 验,秩和检验(rank sum test)是最常用的的非参数检验方法,也称秩转换(rank transform- ation),该方法在非参数检验中占有重要地位。 原理: 是首先将原始数据从小到大,或 等级从弱到强转换成秩后,再对基于秩次的统计量(如秩和),进行检验,做出统计推断。故又称基于秩次的非参数检

5、验。,秩号:将各原始数据从小到大排列,分别给每个 数据一个顺序号,也就是秩号(rank)。 如: 9 6 7.5 13 秩号: 3 1 2 4 秩和:用秩次代替原始数据,在计算各组秩次之 和;秩和检验:基于秩和提供的信息,对不同总 体的平均水平进行假设检验。,秩和检验常用方法, 配对设计资料的符号秩和检验 两独立样本差别的秩和检验 完全随机设计多组差别的秩和检验 多个样本间两两比较的秩和检验,第一节 Wilcoxon 符号秩和检验,一、配对设计的两样本比较,Statistics,10/45,什么叫配对设计?,是将实验对象按一定条件配成对子,如将年龄、体重一致的动物配成对子,再随机分配每对中的两

6、个对象接受不同的处理方式;或同一样品用两种方法(或仪器等)检验的结果;或同一受试对象两个部位的数据。配对设计可增强组间的均衡性,提高实验效率。,Wilcoxon符号秩和检验(Wilcoxon 配对法,或Wilcoxon signed rank test) 是推断其差值是否来自中位数为零的总体的方法,可用于计量配对设计资料差值的比较和单一样本与总体中位数的比较,Statistics,11/45,请看课本P152例题11-1,为观察血浆置换法治疗出凝血功能异常的临床疗效, 某医师治疗了11例出凝血功能异常患者,置换前后各患者的凝血酶原时间见表11-1。该医师采用两样本均数比较的检验,结果,差异有统

7、计学意义,由此认为血浆置换治疗前后凝血酶原时间有差别。,Statistics,11/45,问题 (1)该资料为何种类型资料? (2)该研究属于何种设计方案? (3)该医师所选用的统计分析方法是否正 确?为什么? (4)该资料应采用何种统计方法进行分 析? 其步骤如何?,Statistics,11/45,Statistics,11/45,(1)该资料为计量资料。(2)该研究属自身配对设计方案。(3)该医师所选用的统计分析方法不正确。 原因在于:自身配对设计资料一般 选用配对检验,而该医师采用完全随 机设计两样本均数比较的t检验,统计 方法与设计类型不符;该医师未考 虑资料是否满足t检验的应用条件

8、。,建立检验假设,确定检验水准 H0:差值的总体中位数为零,即Md=0 H1:Md0 =0.05 计算检验统计量 求各对测量值的差值 编秩:编秩原则,12/45,按照差值的绝对值从小到大编秩,差值为 0 者不参加编秩,绝对值相等,符号相同时顺次编秩,绝对值相等,符号相反时取平均秩次,求秩和、确定检验统计量 T 值 分别求出正、负秩和,正秩和以T+ 表示,负 秩和以T- 表示。任取正秩和或负秩和为统计 量T值。其中 T+ + T- = n(n+1)/2,n 为有效对子数,确定P 值、作出统计推断结论,查表法:用于有效对子数 n50 (P345) 若T 值在上、下界值范围内,则 P0.05 若T

9、值在上、下界值上或范围外 ,则 P0.05,14/45,Statistics,Statistics,15/45,正态近似法:用于有效对子数 n50 1)当差值绝对值相同的个数n25%时 差值绝对值相同即指相同秩。指差值的绝对值相等者取平均秩。也就是秩次相等的个数,可用tj表示。如t1指第一个出现相同秩次的个数。本例中有两个秩次为2.5(指绝对值),则t1=2; 有两个秩次为6.5, 则t2=2。当tjn25%时,公式如下,2)当差值绝对值相同的个数n25%时 上式中,tj 为第 j 个差值绝对值相同的个数,Statistics,16/45,= ( 23-2 ) +( 23-2 )=12,如果还

10、有相同的,再相应加上,依此类推,(2)单一样本与总体中位数比较 (见课本P154例题11-2) 已知某地正常人尿汞含量的中位数为2.50g/L,某医师从该地某厂从事土法炼金(汞齐法)的汞作业工人中随机抽取10名工人,测得尿汞含量(g/L)为11.01,2.13,2.56,2.79,12.95,3.12,3.56,4.37,5.13,18.90。采用单样本检验对资料进行分析,得,按水准,拒绝H0,接受H1,差异有统计学意义,可以认为该厂工人尿汞含量与正常人尿汞含量不同。,Statistics,17/45,Statistics,17/45,建立检验假设,H0:工人的尿汞含量总体中位数等于2.15,

11、M =2.50H1:M 2.50单侧=0.05,计算检验统计量 求差值:这里的差值是各观察值与已知 总体中位数(2.50)之差 编秩:编秩原则同上 求秩和、确定检验统计量 T 值: 取T+ 和 T-的任意一个作为检验统计量 确定P值、作推断结论,本例n=10,T=4.5,查T界值表(配对比较的符号秩和检验用,附表10),得P0.01,按=0.05检验水准拒绝H0,接受H1,可认为该厂工人尿汞含量高于当地正常人。1. Wilcoxon符号秩和检验的基本思想:在H0成立的前提下,差值(配对差值、样本各测量值和已知总体中位数M0的差值)的总体分布是对称的,总体中位数应为0;T+与T-应接近n(n+1

12、)。若正、负秩和相差悬殊,则有理由怀疑H0的成立。,Statistics,18/45,2. Wilcoxon符号秩和检验用于推断配对设计资料差值的总体中位数是否为0;亦用于推断样本所来自总体的中位数与某已知总体中位数是否相等。3. Wilcoxon符号秩和检验适用于不满足t检验条件的配对设计的计量资料、等级资料和其它不能精确测量的资料。,Statistics,18/45,第二节 成组设计两样本比较的秩和检验,一、成组设计的两样本比较(Wilcoxon 两样本比较法),20/45,什么叫成组设计?,也叫完全随机设计,是将按纳入标准确定的受试对象随机的分配到实验组和对照组。这种设计方法既贯彻了随机

13、化原则,又设有对照。能更好反映出实验措施的效应。,Statistics,本法利用两样本观察值的秩和来推断样本分别代表的总体分布是否相同。,(1)原始数据的两样本比较 例7.3 研究不同饲料对雌鼠体重增加的关系,资料如下:,21/45,Statistics,方法步骤:建立检验假设,确定检验水准 H0: 喂高蛋白的鼠与喂低蛋白的鼠平均增加体重的总 体分布相同 H1: 喂高蛋白的鼠与喂低蛋白的鼠平均增加体重的总 体分布不同 =0.05计算检验统计量 编秩:编秩原则,22/45,Statistics,表7.3 不同饲料组雌鼠所增体重,23/45,编秩:编秩原则 将两组数据混合起来从小到大统一编秩 数值

14、相等且组别相同时顺次编秩 数值相等但组别不同时取平均秩次 求秩和、确定检验统计量 T 值: 两样本例数不等时, 以样本例数小的秩和为T 两样本例数相等时, 任取一组的秩和为T,24/45,Statistics,确定P 值、作出统计推断结论 查附表11(P246页)T界值表(两样本比较的秩和检验用),先从左侧找到n1(较小的n),本例为7,再从表上方找两组例数的差(n2-n1),本例n2-n1=12-7=5,在两者交叉处即为T的界值。将检验统计量T值与T界值相比,若T值在界值范围内,其P值大于相应的概率;若T值等于界值或在界值范围外,其P值等于或小于相应的概率,本例概率为双侧0.05对应的T界值

15、为4694,T=44.5不在该范围内,故P0.05。,25/45,Statistics,总的来说,P值可有如下两种方法确定 查表法:用于 n110 且 n2-n110 (n1 n2) 若T 值在上、下界值范围内,则 P0.05 若T 值在上、下界值上或范围外 ,则 P0.05 正态近似法:用于n110 或 n2-n110 (n1 n2) 1)当相同秩次的个数 n25%时,26/45,Statistics,2)当相同秩次的个数 n25%时 上式中, tj 为第 j 个相同秩次的个数 (2)频数表资料或等级资料的两样本比较 见课本P157例题11-4,Statistics,27/45,Statis

16、tics,28/45,例11-4 某医师为探讨斯康杜尼和利多卡因应用于深牙周袋刮治术的临床局部麻醉效果。将患有牙周病需进行深牙周袋刮治术的患者109人随机分为两组,观察斯康杜尼和利多卡因麻醉后的麻醉效果,结果见表11-5。为了解斯康杜尼和利多卡因麻醉效果是否有差异,该医师对此资料进行检验,得 232.61,查2界值表, 20.05,3=7.82, 2 20.05,3,故P0.05,按水准拒绝H0,接受H1,差异有统计学意义,可认为斯康杜尼和利多卡因麻醉效果不相同,斯康杜尼的麻醉效果好于利多卡因。,Statistics,28/45,1建立检验假设,确定检验水准H0:两种药物麻醉效果的总体分布相同

17、H1:两种药物麻醉效果的总体分布不同 =0.05,2计算检验统计量:详见课本P158例题 (代入公式如下),uc =4.79555/0.8881=5.40,Statistics,29/45,最后与1.96比较作出结论,P0.05,按 =0.05水准拒绝H0,接受H1,差异有统计学意义,可以认为斯康杜尼和利多卡因应用于深牙周袋刮治术的局部麻醉效果的总体分布不同,斯康杜尼的效果好于利多卡因。,两样本比较的Wilcoxon秩和检验用于完全随机(成组)设计两样本资料的比较,是针对呈偏态分布或方差不齐不满足t检验条件的计量资料、等级资料和其它不能精确测量的资料的比较。,31/45,第三节 成组设计多个样

18、本比较的秩和检验,一、Kruskal-Wallis 法,又称H 检验法,该法是由Kruskal和Wallis在Wilcoxon秩和检验的基础上扩展的方法,又称为K-W检验或H检验。本法利用多个样本的秩和来推断各样本分别代表的总体分布有无差别。,(1)原始数据的多个样本比较,见课本P159例题11-5,Statistics,例11-5为探讨血管紧张素转化酶抑制剂开博通抗动脉粥样硬化的机制,某医师将15只兔随机分为三组,即正常饮食组、高脂饮食组及高脂饮食加开博通组,喂养14周后测量兔血清总胆固醇(TC)水平,结果如下:正常饮食组:0.86 0.78 1.38 0.88 1.70高脂饮食组:40.3

19、5 41.79 44.00 40.72 27.05高脂饮食加开博通组:41.20 33.04 40.60 32.05 40.49,32/45,Statistics,该医师应用方差分析对资料进行分析,F=104.41,P0.05,差异有统计学意义,采用t检验进一步作两两比较,得高脂饮食组及高脂饮食加开博通组均与正常组差异有统计学意义;但高脂饮食组与高脂饮食加开博通组两组间差异无统计学意义,故认为高脂饮食组及高脂饮食加开博通组的兔血清总胆固醇显著高于正常组;开博通对血脂无影响。,方法步骤:建立检验假设,H0:三个总体的分布位置相同H1:三个总体的分布位置不全相同=0.05,Kruskal-Wall

20、is 法,计算检验统计量 编秩:将各组数据统一由小到大排序并编秩, 如遇有相等数值则取平均秩次。 求秩和:分别将各组秩次相加,得各组秩和 计算检验统计量 H 值,当相同秩次的个数 n25%时,用上式Ti为各组的秩和,ni为各组对应的例数。,33/45,Statistics,2)当相同秩次的个数 n25%时 tj 为第 j 个相同秩次的个数,34/45,Statistics,确定P 值、作出统计推断结论 查表法:组数 k = 3,每组例数 ni 5时, 可查H界值表 P347,近似法 若组数 k = 3,每组例数 ni 5;或者k 3 或者ni 5时,则H分布近似 服从自由度为 k-1 的 分布

21、, 可查 界值表确定P 值(2)频数表资料(或等级资料)的多个样本比较 步骤同上 (详见课本P160例题11-6,此略),35/45,Statistics,多个样本比较的秩和检验 (Kruskal-Wallis法,即H检验),例11-4 某医院外科用三种手术方法治疗肝癌患者15例,每组5例,进入各组的患者系用随机方法分配,每例术后生存月数如表11-6的第、栏。试问三种不同手术方法治疗肝癌的效果有无差别。,11-6 三种手术方法治疗肝癌患者的术后表生存月数,1. 建立假设: H0:三个总体分布的中心位置相同。 H1:三个总体分布的中心位置不全相同。 0.05,2. 编秩:将各组数据混合由小到大编

22、秩次,如遇相同数值时,若相同数值在不同组内,则取平均秩次。,表11-6 三种手术方法治疗肝癌患者的术后生存月数,3.求各组秩和: 4.计算检验统计量H值:,分子为H值,分母C为校正数,,校正后,HcH,P值减小。,4. 确定P值,判断结果: 查附表12,H界值表, H0.05 5.78,按=0.05水准,得P0.05,拒绝H0,故三种手术方法术后生存月数不全相等。,(二)频数表法:,例 比较不同孕周产妇的乳量。,表11-8 分娩时孕周与乳量的关系,1建立假设: H0:三个总体分布的中心位置相同。 H1:三个总体分布中心位置不全相同。 0.05,2编秩(第5、6、7列) 3求秩和(第8、9、10

23、列),4计算检验统计量:,5. 确定P值,判断结果: 当样本组数或样本例数超过H界值表的范围,则认为H值近似服从2分布,查2界值表。 本例:查2界值表,=k1=31=2, 2 0.005,2=10.60,得P0.005,可认为分娩时的孕周对乳量有影响。,第四节 随机区组设计的秩和检验,36/45,Statistics,一、随机区组设计的秩和检验,什么叫随机区组设计?,也叫配伍组设计,是配对设计的扩大,是将条件相近的实验对象(三个及以上)配成一组,每组中的不同对象分别给以不同的处理措施。此种设计增强了各组间的均衡性,可进一步控制混杂性偏倚。,本法是由M-Friedman在符号检验的基础上提出来的

24、,常称为Friedman检验,又称 M 检验。,36/45,Statistics,【例11-7】 某医师为探讨多发伤后血清内皮细胞特异性分子-1(ESM-1)的变化,将12窝小白鼠(每窝3只)制作成多发伤动物模型,再把每窝3只多发伤小白鼠随机分配到3个实验组,采静脉血4ml,分离血清,成批检测ESM-1(ng/ml),结果见表11-10。该医师采用两样本均数比较的t检验,结果三次两两比较的结果均为,差异均无统计学意义,故认为多发伤后三组的血清内皮细胞特异性分子-1(ESM-1)无差别。,(1)M 检验(Friedman法)查表法 (用于区组数b15,处理组数k15) 方法步骤:建立检验假设计算

25、检验统计量 编秩、求各处理组的秩和 Ri :每个区组的数 据由小到大分别编秩,相同数据取平均秩次 求平均秩和 b区组数 k处理组数 求检验统计量M 值 确定P 值、作出统计推断结论(P162例题11-7),37/45,(2)F 检验(用于区组数b15 或处理组数k15) 方法步骤:建立检验假设计算检验统计量 编秩:编秩原则 求各处理组的秩和 Ri 计算所有数据秩次的平方和A 值 : 若各区组内无相同秩次,可用:,38/45,Statistics,39/45,计算B 值 :计算检验统计量F 值:,确定P 值、作出统计推断结论 查F 界值表:1 = k-1 2 = (b-1) (k-1),Stat

26、istics,第五节 多个样本两两比较的秩和检验,成组设计多个样本两两比较的秩和检验 Nemenyi 法 例题11-8(以例题11-5为例),41/45,例11-5为探讨血管紧张素转化酶抑制剂开博通抗动脉粥样硬化的机制,某医师将15只兔随机分为三组,即正常饮食组、高脂饮食组及高脂饮食加开博通组,喂养14周后测量兔血清总胆固醇(TC)水平,结果如下:正常饮食组:0.86 0.78 1.38 0.88 1.70高脂饮食组:40.35 41.79 44.00 40.72 27.05高脂饮食加开博通组:41.20 33.04 40.60 32.05 40.49,该资料不服从正态分布,在进行多组间比较时

27、采用Kruskal-Wallis 检验,推断结论为拒绝,接受,这与前面所介绍的多组比较方差分析类似,只能得出三组资料总体分布不同或不全相同的结论,不能判断三组资料中哪些组间差异具有统计学意义。若要对每两个总体分布做出有无不同的推断,需要做组间的两两比较。,41/45,多组秩和检验中做进一步的两两比较,需调整检验水准。检验水准的调整:对k个样本组进行多次两两比较,会增加第I类错误的概率。为保证第I类错误的概率总共不超过,每次比较的第I类错误概率应采用式(11-12)进行调整。 = / 总的比较次数 (1) = 2 / k(k-1)(多组两两比较) (2) = / k-1 (实验组与同一对照组比)

28、,41/45,方法步骤:(P165)建立检验假设确定检验水准计算检验统计量 两两比较:设为k个样本组,和分别为比较的第i组和 第j组样本的秩和,其平均秩和分别为和。 (1)精确法: 样本含量较小时,应采用两样本秩和检验的 方法,求得统计量的数值后,借助SAS和SPSS软件的“exact” 功能得到相应的P值(包括该数值对应的概率和更极端情形的概率)。,41/45,(1)精确法: 样本含量较小时,应采用两样本秩和检验的 方法,求得统计量的数值后,借助SAS和SPSS软件的“exact” 功能得到相应的P值(包括该数值对应的概率和更极端情形的概率)。(2)正态近似法: 当各样本组例数较大时,按下式

29、(11-15)求得第i组和第j组样本比较的值。,41/45,平均秩次 , , 公式的分母为 的标准误。,经多个样本比较的秩和检验,各组间有差别,试再进一步作两两比较。,表11-12 三组兔血清总胆固醇水平(mmol/L)的两两比较利用标准正态分布或SAS和SPSS统计软件求得统计量数值所对应的P值。将P值与调整以后的检验水准比较,若P ,则拒绝H0。本例认为正常饮食组分别与高脂饮食组和高脂饮食加开博通组的兔血清总胆固醇水平的差别均有统计学意义,高脂饮食组和高脂饮食加开博通组的兔血清总胆固醇水平高于正常饮食组;而高脂饮食组与高脂饮食加开博通组的兔血清总胆固醇水平的差别无统计学意义。,表11-6

30、三种手术方法治疗肝癌患者的术后生存月数,1. 建立假设: H0:任何两个总体分布的中心位置相同。 H1:任何两个总体分布的中心位置不同。 0.05,2.计算各样本的平均秩次:,3. 计算t值: 本例N15,1组和2组比较: P0.05,1组和3组比较: P0.05,2组和3组比较: P0.05,4. 确定P值,判断结果: 按0.05水准,除了2组与3组比较,拒绝H0,其余每二组间均无差别,可认为乙法优于丙法。,二、随机区组设计多个样本间的多重比较 与完全随机设计多个样本组间的多重比较类似,对于随机区组设计资料,当用Friedman M检验拒绝后,同样需要对各处理组间进行多重比较。采用调整检验水

31、准,两两做相关样本的秩和检验,即配对wilcoxon符号秩和检验。,42/45,以例11-7说明随机区组设计资料多重比 较的基本步骤。(P162) 某医师为探讨多发伤后血清内皮细胞特异性分子-1(ESM-1)的变化,将12窝小白鼠(每窝3只)制作成多发伤动物模型,再把每窝3只多发伤小白鼠随机分配到3个实验组,采静脉血4ml,分离血清,成批检测ESM-1(ng/ml),结果见表11-10。,42/45,小 结,1. 掌握非参数检验的概念及秩和检验的优缺点。,2. 掌握配对设计资料、两组和多组完全随机设计资料秩和检验的编次方法。,3. 掌握如何确定配对设计资料、两组和多组完全随机设计资料秩和检验的检验统计量。,Thanks for listening !,If you have questions, please ask us or postGdmcyfyx ,44/45,Bye Bye!,Statistics,45/45,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号