《医学统计学秩和检验.ppt》由会员分享,可在线阅读,更多相关《医学统计学秩和检验.ppt(94页珍藏版)》请在三一办公上搜索。
1、,秩 和 检 验,rank sum test,分析资料的步骤:1、确定资料的类型:分类资料、定量资料;2、选择适当的统计方法;3、作出统计推断结论。,定量资料的分析:,t检验 Z检验 F检验,分类资料的分析:,检验,检验的应用范围 比较两个或多个样本的总体率(构成比)有无差异 分析两个分类变量之间的关联性 判断频数分布类型 分析率的线性趋势,t 检验的应用条件 未知且n 较小 样本取自正态总体 两样本均数比较时,两样本总体方差相等Z 检验的应用条件 样本取自正态总体,两样本总体方差相等 未知但n 较大(如 n 100),n 较小但 已知。F 检验的应用条件 各样本取自正态总体 各样本的总体方差
2、相等 各样本是相互独立的随机样本,例 某实验室观察局部温热治疗小鼠移植肿瘤的疗效,以生存日数作为观察指标,实验结果见表1,试检验两组小鼠生存日数有无差别?,表1 两组小鼠发癌后生存日数,内容:非参数检验的概念 Wilcoxon符号秩和检验 成组设计的两样本比较的秩和检验 多个样本比较的秩和检验 多个样本两两比较的秩和检验 随机区组设计的秩和检验,参数统计和非参数统计,非参数检验适用范围,1.等级资料(有序分类资料)。如疗效按治愈、显效、有效、无效分组的资料;临床化验结果按“、+、+、+”分组的资料等。(比较构成比有无差异)2.偏态分布资料。当观察值呈偏态或极度偏态分布,而又未经变量变换或虽经变
3、换但仍未达到正态或近似正态分布。3.分布不明的资料。如新指标分布形态不明;小样本,但不趋向正态分布资料。4.各组方差明显不齐,且不易变换达到齐性。5.组内个别观察值偏离过大的资料。6.开口分组资料。数据分组某一端或两端无明确数值的资料,只给出一个下限或上限,而没有具体数值,如60岁等。,非参数检验的优缺点,优点:1、不受总体分布的限制,适用范围广。2、不受资料类型的限制,可以是计量资料、等级资料以及一端或两端无确切数据的资料。,缺点:1、对于符合参数检验条件的资料,首先参数检验方法;如果用非参数检验,没有充分利用资料提供的信息,检验效能(power)低于参数检验。2、非参数检验一般犯第二类错误
4、的概率比参数检验大,若要使相同,非参数检验要比参数检验需要更多的样本例数。,非参数检验方法:秩和检验(rank sum test)等级相关分析符号检验游程检验,秩、秩和,秩 1 4 5 6 8 11 22 25 32 35 40 45 1 2 3 4 5 6 7 8 9 10 11 12秩和=1+3+4+5+8+9=30=2+6+7+10+11+12=48,秩和检验(rank sum test)将数据从小到大排序,该序号在统计学上称为秩(rank),用数据排序的秩来代替原数据进行假设检验,这种方法称为秩和检验。,秩(rank),秩和(rank sum),秩和检验(rank sum test),
5、1,4,10,2,3,11,13,12,14,15,5,6,7,8,9,16,Wilcoxon符号秩和检验(Wilcoxon signed rank test),配对设计计量差值比较 单一样本与总体中位数比较,配对设计资料主要是对差值进行分析。通过检验配对样本的差值是否来自中位数为0的总体,来推断两个总体中位数有无差别,即推断两种处理的效应是否不同。,配对设计两样本比较,配对设计的两样本比较例12.1 某研究用甲、乙两种方法对某地方性砷中毒地区水源中砷含量(mg/L)进行测定,检测10处,测量值如表12.1的(2)、(3)栏。问两种方法的测定结果有无差别?,表12.1 甲、乙两种方法测定某地区
6、10处水源中砷含量的结果(mg/L),配对差值经正态性检验得 W=0.717,P=0.001,(1)建立检验假设,确定检验水准。H0:两种方法测定结果差值的总体中位数为0 H1:两种方法测定结果差值的总体中位数不等于0=0.05,(2)计算检验统计量 T1、求差值,见表12.1(4)2、编秩 a:将差值的绝对值从小到大编秩 b:当差值为0,则不计该例(n随之减少)c:如两差值相等,则取其平均秩次3、给秩添加正负号4、求秩和并确定检验统计量:分别求出差值为正与负的秩和,任取差值为正或负秩和作为统计量。本例T21.5。,(3)确定P值,并作出统计推断。A.当n50时,查附表10,T界值表。N=9
7、0.10 837 0.05 540 0.02 342 0.01 144 检验统计量T值在上、下界值范围内,其P值大于相应的概率水平;若T值在上、下界值范围上或范围外,则P值等于或小于相应的概率水平。原则:内大外小 本例 T=21.5,以差值不等于0的数值对子数n=9查附表10,得P0.10,按照=0.05水准,不拒绝H0,差别无统计学意义。尚不能认为甲、乙两种方法测定水源中砷含量有差别。,由附表10可知,当n50时,如何确定P值?,注意:,(2)正态近似法 随着n的增大,T分布逼近均数为 n(n+1)/4、方差为n(n+1)(2n+1)/24的正态分布,用正态近似法(u检验),按式(12.1)
8、计算Z值。(12.1),当相同秩次(相持tie)多时(不包括 差值等于0),则用(12.2)校正式:(12.2),Wilcoxon配对符号秩和检验的基本思想:在配对样本中,由于随机误差的存在,其对差值的影响不可避免。假定两种处理的效应相同,则差值的总体分布为对称分布,并且差值的总体中位数为0。若此假设成立,样本差值的正秩和与负秩和应相差不大,均接近n(n+1)/4;当正负秩和相差悬殊,超出抽样误差可解释的范围时,则有理由怀疑该假设,从而拒绝H0。,单一样本与总体中位数比较Wilcoxon符号秩和检验 目的是推断样本中位数与已知总体中位数(常为标准值或大量观察的稳定值)有无差别 常用于不满足单样
9、本检验应用条件的资料。,例 某医生从其接诊的不明原因脱发患者中随机抽取14例,测得其发铜含量(g/g)见表2。已知该地健康人群发铜含量的中位数为11.2g/g。问脱发患者发铜含量是否低于健康人群?,(1)建立检验假设,确定检验水准。H0:差值的总体中位数等于0,即脱发患者发铜含 量与该地健康人群相同H1:差值的总体中位数小于0,即脱发患者发铜含 量低于该地健康人群 单侧=0.05,(2)计算检验统计量 T 求差值:编秩:方法同例12.1。求秩和:T+=4,T-=101 确定检验统计量T,本例T=4或T=101。,(3)确定P值,并作出统计推断。查附表10 T界值表(配对比较的符号秩和检验用),
10、本例n=14,得单侧P0.005,按=0.05水准,拒绝H0,接受H1,差别有统计学意义,故可以认为脱发患者发铜含量低于该地健康人群。,成组设计的两样本比较(Wilcoxon rank sum test),目的是推断连续型变量资料或有序变量资料的两个独立样本代表的总体分布位置是否有差别。,(1)原始数据的两样本比较例3 某地职业病防治欲比较使用二巯基丙磺酸钠与二巯基丁二酸钠的驱汞效果。将22例汞中毒患者随机分配到两组,分别测定并计算出两组驱汞的排汞比值,并将结果列于表12.3。试问两药驱汞效果有无差别?,表12.3 两种驱汞药物排汞效果比较,该资料为比值数据,不服从正态分布,现采用Wilcox
11、on秩和检验。,检验步骤:(1)建立检验假设,确定检验水准。H0:两种药物排汞比值的总体分布位置相同 H1:两种药物排汞比值的总体分布位置不同=0.05,(2)计算检验统计量 T 将两组数据由小到大统一编秩 两组中,相同数值在不同组,则必须取平均秩同 一 组内,可顺次编秩次。分别求出两组秩次的和 取较小样本的秩和记为T,本例n2 n1,T=75.5,(3)确定P值,并作出统计推断。查附表11 T界值表(两样本比较的秩和检验),P0.01,按=0.05水准拒绝H0,可认为两种驱汞药物的排汞效果有差别。丁二酸纳组平均秩次为75.5/10=7.55,丙磺酸钠组平均秩次为177.5/12=14.79,
12、可认为丙磺酸钠驱汞效果好于丁二酸钠。,若n1、n2-n1超出附表11的范围,则用正态近似法,可按式(12.3)计算Z值:(7.3)式中,N=n1+n2,0.5:连续性校正系数。,若持较多(如超过25),则用式(12.4)校正。(12.4),tj为第j次相持时相同秩次的个数。,秩次(rank),秩统计量 是指全部观察值按某种顺序排列的位序;在一定程度上反映了等级的高低;秩和(rank sum)同组秩次之和;在一定程度上反映了等级的分布位置。对等级的分析,转化为对秩次的分析。秩和检验就是通过秩次的排列求出秩和,进行假设检验。,(2)等级资料的两样本比较例12.4 某医生欲比较中西医疗法与西医疗法治
13、疗急性肾盂肾炎的临床疗效,将患者随机分为两组,分别给予中西医疗法或西医疗法治疗,并观察疗效,结果见表12.4,问两种疗法疗效是否有差别?,表12.4 两种疗法治疗急性肾盂肾炎的疗效,检验步骤:(1)建立检验假设,确定检验水准。H0:两种疗法治疗急性肾盂肾炎的疗效总体分布位置相同 H1:两种疗法治疗急性肾盂肾炎的疗效总体分布位置不同=0.05,(2)计算检验统计量 T求秩和:确定各等级的秩次范围,计算平均秩次;将各组段的平均秩次分别与各等级例数相乘,再求和得到T1,T2。,表12.4 两种疗法治疗急性肾盂肾炎的疗效,计算Z值 由于相持较多,故按式(12.3)和式(12.4)计算Zc值。,(3)确
14、定P值,并作出统计推断。Zc2.1415,0.02P0.05,按=0.05水准,拒绝H0,差别有统计学意义,可认为两种疗法疗效分布不同。中西医疗法组平均秩次为6820/92=74.1,西医疗法组平均秩次为6060/68=89.1,可以认为中西医疗法治疗急性肾盂肾炎效果较好。,Wilcoxon秩和检验的基本思想:假设含量为n1与n2的两个样本(且n1 n2),来自同一总体或分布相同的两个总体,则n1样本的秩和T1与其理论秩和n1(N+1)/2相差不大,即T1-n1(N+1)/2仅为抽样误差所致。当二者相差悬殊,超出抽样误差可解释的范围时,则有理由怀疑该假设,从而拒绝。,成组设计的多个样本比较的秩
15、和检验 Kruskal-Wallis test,用于推断非正态分布定量变量或有序分类变量的多个总体分布位置有无差别。,(1)原始数据的多个样本比较例12.5 某医师检测3种卵巢功能异常患者血清中促黄体素的含量(U/L)资料见表12.5第(1)、(3)、(5)栏。问3种患者血清中促黄体素的含量(U/L)是否有差别?,表12.5 三种卵巢功能异常患者血清中促黄体素的含量(U/L),这是定量资料多组独立样本的比较,并且该数据属于一端无确切值的资料,不能采用方差分析,现用Kruskal-Wallis H秩和检验进行分析。,检验步骤:(1)建立检验假设,确定检验水准。H0:3种卵巢功能异常患者血清中促黄
16、体素的 含量总体分布位置相同 H1:3种卵巢功能异常患者血清中促黄体素的 含量总体分布位置不全相同=0.05,(2)计算检验统计量 H 将三组数据由小到大统一编秩,遇相同数值在同一组内,可顺次编秩;当相同数值出现在不同组时,则必须求平均秩次。,表12.5 三种卵巢功能异常患者血清中促黄体素的含量(U/L),(2)计算检验统计量 H,(12.5),本例,当相持较多,按式(12.5)H值偏小,可用式(12.6)进行校正得Hc值。,(12.6),本例相同秩次较少,无需校正。,其中,tj为第j次相持时相同秩次的个数。,(3)确定P值,并作出统计推断。,Kruskal-Wallis H检验的基本思想:,
17、(2)等级资料的多样本比较例:某医院用三种复方小叶枇杷治疗老年慢性支气管炎,数据见表12.6第(1)(4)栏,试比较三种方剂的疗效有无差异。,(1)建立检验假设,确定检验水准。H0:3种方剂疗效的总体分布位置相同 H1:3种方剂疗效的总体分布位置不全相同=0.05,(2)计算检验统计量 H 编秩:与频数表两样本比较类似。先计算各等级的合计,再确定秩次范围,及平均秩次,见表第(5)、(6)、(7)栏。求各组秩和:与等级资料两样本比较类似,计算各组各等级的频数与平均秩次的乘积之和。,(3)计算检验统计量值H,由于相持出现较多,按式(12.6)计算Hc值。,(3)确定P值,并作出统计推断。因组数k=
18、3,=k1=2,近似服从=2的 分布,查 界值表,得P0.005。按=0.05水准拒绝H0,接受H1,差别有统计学意义,故可以认为3种复方小叶枇杷方剂治疗老年慢性支气管炎的疗效有差别。若要具体回答3种复方小叶枇杷方剂治疗老年慢性支气管炎的疗效每两种之间是否有差别,还需进一步做两两比较。,(三)成组设计多个样本资料的两两比较,多个样本的两两比较的秩和检验扩展的t检验法Nemenyi法等,扩展的t检验,统计量t值,(2)列出两两比较计算表,求得t值。见表12.7。,3.确定值,作出统计推断,但上述这些方法目前在常用SPSS、SAS、Stata统计软件中均无法直接实现,现介绍两种实际工作中借助软件较
19、易操作的方法。秩变换后进行方差分析及多重比较。调整 水准法 采用Bonferroni法调整 水准,调整后的 水准为:=/需要比较的次数,例如,三组间两两均需进行比较,则比较的次数为3次,检验水准调整为=/3=0.017。,第四节 随机区组设计的秩和检验,多个相关样本比较的Friedman M 检验,总结:非参数检验的正确应用,非参数检验是不依赖总体分布类型,也不对总体参数进行推断的一类统计方法。它具有广泛的适应性和较好的稳定性;但若资料符合参数检验条件,用非参数检验会损失部分信息,降低检验效能,因而在符合参数检验的条件下首选参数检验。,总结:非参数检验的正确应用,等级资料或者分布不明确资料进行
20、分析;可用于任意分布(distribution free)的资料;T检验与H检验的关系 T检验 H检验 t 检验 F检验,g 2,g=2,计量资料中:极度偏态资料,或个别数值偏离过大 各组离散度相差悬殊 资料中含有不确定值 大于5年 0.001 1:1024以上,总结:非参数检验的正确应用,秩和检验是将原数据转换为秩次,比较各组秩和的一类非参数检验方法。不同设计类型的秩和检验其编秩、求秩和、计算统计量、确定 值的方法有所不同。注意编秩时相同数据一般取平均秩次,以及相持现象较多时需对统计量进行校正。,总结:非参数检验的正确应用,需注意:有序分类变量资料运用秩和检验可推断各等级强度的差别,而列联表
21、 2检验是比较各组频数分布之间的差别。,总结:非参数检验的正确应用,心肌坏死面积例,用二种食物配方饲养大白鼠,观察心肌坏死面积。分析二组间的差异。A组:(n=29,mean 3.61)0,0,0,0,0,0,0,0,0,0,0.2,0.3,0.4,0.4,0.6,1,1.6,2.2,2.6,3.3,4.3,5.1,5.4,5.5,6.1,6.2,9.7,13.8,36B组:(n=28,mean1.06)0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0.2,0.2,0.2 0.3,0.4,0.4,0.9,0.9,1.3,1.7,2.8,7.4,13,特点:,0特别多,无论用什么变换
22、均不可能改变分布的偏性;0与其它数的区别是质的区别。,分析一:二组心肌坏死率比较,按四格表作2检验:,无心肌坏死 有心肌坏死 合计 心肌坏死率 甲组 10 19 29 65.5%乙组 15 13 28 46.4%c2=1.404,P=0.24,分析二:二组平均心肌坏死面积的比较,二组平均心肌坏死面积的 t 检验:t=1.7755,P=0.0814该分析是否恰当?,分析三:按等级资料处理:,两组秩和检验:n 秩和 理论秩和 A组29 968 841B组28 685 812合计57 1653 1653 Z=2.119,P=0.0341。,成组设计两样本比较,如资料满足 t 检验的条件,应该用 t 检验进行分析。此时,如果对这类资料用Wilcoxon秩和检验,实际上是将观察单位的具体数值舍弃不用,只保留了秩次的信息,使检验效能降低;尤其样本含量较小时,降低更加明显。如资料不满足 t 检验的条件,而用了t 检验,同样降低了检验效能。,秩变换检验,基本思想:将等级转换为秩次;对秩次作效应的参数检验(t检验,方差分析,相关等)。在样本含量较大时,秩变换检验与秩和检验结果相同或相近。,