《医学统计学-非参数检验秩和检验.ppt》由会员分享,可在线阅读,更多相关《医学统计学-非参数检验秩和检验.ppt(155页珍藏版)》请在三一办公上搜索。
1、医学统计学(7),两个独立样本比较的非参数检验多个独立样本比较的非参数检验配对样本比较的非参数检验随机区组设计多个样本比较的非参数检验,诊断试验ROC曲线分析,基于秩次的非参数检验,非参数检验又称为任意分布检验,这类方法并不依赖总体分布的具体形式,应用时可以不考虑研究变量为何种分布以及分布是否已知,进行的不是参数之间的检验,故称非参数检验。,基本特点:与分布无关基本方法:2 检验基于秩(等级,rank)的方法基于特定参照点(如中位数)的方法,非参数检验的优点:,适用范围广受限条件少。参数检验对总体分布等有特别限定,而非参数检验的假定条件少,也不受总体分布的限制,更适合一般的情况。具有稳健性。参
2、数检验是建立在严格的假设条件基础之上的,一旦不符合假设条件,其推断的正确性将受到怀疑;而非参数检验都是带有最弱的假定,所受的限制很少,稳健性好。,对符合用参数检验的资料,如用非参数检验,会丢失部分信息。虽然非参数检验计算简便,但有些问题的计算仍显繁冗。,非参数检验的缺点:,已知总体分布类型,对未知参数进行统计推断,依赖于特定分布类型,比较的是参数,参数检验(parametric test),非参数检验(nonparametric test),对总体的分布类型不作严格要求,不受分布类型的影响,比较的是总体分布位置,优点:方法简便、易学易用,易于推广使用、应用范围广;可用于参数检验难以处理的资料(
3、如等级资料,或含数值“50mg”等),缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数检验会损失部分信息,其检验效能较低;样本含量较大时,两者结论常相同,应用非参数检验的情况,1.不满足正态和方差齐性条件的小样本资料;2.总体分布类型不明的小样本资料;3.一端或两端是不确定数值(如0.002、65等)的资料(必选);4.单向(双向)有序列联表资料;5.各种资料的初步分析。,方法的起点排队与秩次,统计描述中排秩思想的成功应用百分位数、中位数排队的优点广泛适用于多种分布排队的结果将原始数据的比较转化为秩次的比较,秩次(rank)将数值变量值从小到大,或等级变量值从弱到强所排列的序号。例1 1
4、1只大鼠存活天数:存活天数4,10,7,50,3,15,2,9,13,60,60例2 9名 肺炎病人的治疗结果:疗效 治愈 治愈 死亡 无效 治愈 有效 治愈 有效 无效,秩次 3 6 4 9 2 8 1 5 7 10 11 10.5 10.5,平均秩次 2.5 2.5 9 7.5 2.5 5.5 2.5 5.5 7.5,秩次 1 2 9 7 3 5 4 6 8,SPSS中的菜单位置,两个独立样本比较的非参数检验多个独立样本比较的非参数检验配对样本比较的非参数检验随机区组设计多个样本比较的非参数检验,诊断试验ROC曲线分析,基于秩次的非参数检验,1建立检验假设,确定检验水准()H0:两总体分布
5、相同H1:两总体分布不同=0.05。,2编秩按数值由小到大排列,若有相同数据,取平均秩。,分析步骤:,基本思想,两样本来自同一总体,任一组秩和不应太大或太小,假定:两组样本的总体分布形状相同,T 与平均秩和应相差不大,3计算秩和,确定检验统计量秩和T值,当n110或(n2-n1)10时,则可采用正态近似法求u(Z)值来确定P值,其公式如下:,4确定P值和作出推断结论 当n1=10或(n2-n1)=10时,查表P值,若相同秩次较多,应作校正计算,【例1】某实验室观察缺氧条件下大鼠与小鼠的生存,以生存日数作为观察指标。试检验两组生存日数有无差别?,T=170146,P0.05,T在界值范围内 P
6、T在界值范围外 P T与界值相等 P=,SPSS软件操作,第一步:建立变量。,第二步:输入原始数据,第三步:非参数检验(1),第三步:非参数检验(2),第四步:结果解读(1),结果解读:例数、均数、标准差、中位数、四分位间距等。标准差较大,第四步:结果解读(2),结果解读:Z=3.630,P=0.000,【例2】20名正常人和32名铅作业工人尿铅定性检查结果如表。问铅作业工人尿铅是否高于正常人?,U检验:Zc=U,与1.96,2.58比较,SPSS软件操作,第一步:建立变量。,第二步:输入原始数据,第三步:加权个案,第四步:非参数检验,第五步:结果解读,结果解读:Z=4.503,P=0.000
7、,两个独立样本比较的非参数检验多个独立样本比较的非参数检验配对样本比较的非参数检验随机区组设计多个样本比较的非参数检验,诊断试验ROC曲线分析,基于秩次的非参数检验,完全随机设计多个样本比较的秩和检验由Kraskal和Wallis在Wilcoxon秩和检验基础上扩展而来,又称K-W检验或H检验。,1建立检验假设,确定检验水准()H0:k个总体分布相同;H1:k个总体分布不同或不全相同;=0.05。,2混合编秩 将各组数据混合,由小到大编秩。遇有原始数据相同时,若相同数据在同一组内,则仍按顺序编秩;若相同数据在不同组,则取它们的平均秩次。,分析步骤:,3求秩和并计算检验统计量H 将各组秩次分别相
8、加,求出各组的秩和Ri。检验统计量值H可按下式计算:式中,Ri为各组的秩和,ni为各组样本含量,N为总样本含量。,分析步骤:,当各组相同秩次较多时,可对H值进行校正,按下式求值。,分析步骤:,tj相同秩次的数量,4确定P值和作出推断结论 当组数K=3,每组样本含量ni5时,可查附表(H界值表)得到P值。若k3或ni5时,H值的分布近似于自由度为k-1的2分布,此时可查2界值表得到P值。最后按P值作出推断结论。,分析步骤:,【例3】比较小白鼠接种三种不同菌型伤寒杆菌9D、11C和DSC1后存活日数,结果见表。问小白鼠接种三种不同菌型伤寒杆菌的存活日数有无差别?,P=1-CDF.CHISQ(9.9
9、7,2),SPSS软件操作,第一步:建立变量。,第二步:输入原始数据,第三步:非参数检验,第四步:结果解读,结果解读:x2=9.940,P=0.007,【例4】四种疾病患者痰液内嗜酸性白细胞的检查结果见表。问四种疾病患者痰液内的嗜酸性白细胞有无差别?,P=1-CDF.CHISQ(15.52,3),SPSS软件操作,第一步:建立变量。,第二步:输入原始数据,第三步:加权个案,第四步:非参数检验,第五步:结果解读,结果解读:x2=15.506,P=0.001,【例5】某临床药理基地观察5组接受不同治疗的妇科病人,结果见表。问5组疗效有无差别?,P=1-CDF.CHISQ(195.50,4),SPS
10、S软件操作,第一步:建立变量。,第二步:输入原始数据,第三步:加权个案,第四步:非参数检验,第五步:结果解读,结果解读:x2=195.504,P=0.000,两个独立样本比较的非参数检验多个独立样本比较的非参数检验配对样本比较的非参数检验随机区组设计多个样本比较的非参数检验,诊断试验ROC曲线分析,基于秩次的非参数检验,配对设计差值比较的符号秩和检验由Wilcoxon1945年提出,又称Wilcoxon符号秩和检验,常用于检验差值的总体中位数是否等于零。,(1)建立检验假设,确定检验水准 Ho:差值总体中位数Md=0 H1:差值总体中位数Md0=0.05,分析步骤:,(2)编秩:求差值编秩方法
11、:依差值的绝对值从小到大编秩。编秩时注意两点:遇差值为0者,舍去不计,n相应减少 差值的绝对值相等,符号不同者应取平均秩次编秩后,按差值的正负给秩次冠上符号。,(3)求差值为正或负的秩和 差值为正的秩和以T+表示 差值为负的秩和以T-表示。T+T-=n(n+1)/2 T=min(T+,T-)(4)确定P值和作出推断结论:当n50时,查T界值表 T在界值范围内 P T在界值范围外 P T与界值相等 P=,分析步骤:,当n50,可采用正态近似法,计算u值。,正 态 近 似 法,若相同秩次较多,应作校正计算。Z 或 式中,tj为第j(j=1,2,)个相同差值的个数。,正 态 近 似 法,【例6】对1
12、0名患者分别用甲法与乙法,测得血汞值。问两种方法的结果有无差别?,n=10-1=9,T=min(26.5,18.5)=18.5n=9p0.05,SPSS软件操作,第一步:建立变量。,第二步:输入原始数据,第三步:非参数检验(1),第三步:非参数检验(2),第四步:结果解读(1),结果解读:例数、均数、标准差、中位数、四分位间距等。标准差较大,第四步:结果解读(2),结果解读:Z=0.474,P=0.635,【例7】对12份血清分别用原方法(检测时间20分钟)和新方法(检测时间10分钟)测谷-丙转氨酶,结果见表。问两法所得结果有无差别?,T=MIN(54.5,11.5)=11.5n=11P0.0
13、5,SPSS软件操作,第一步:建立变量。,第二步:输入原始数据,第三步:非参数检验(1),第三步:非参数检验(2),第四步:结果解读(1),结果解读:例数、均数、标准差、中位数、四分位间距等。标准差较大,第四步:结果解读(2),结果解读:Z=1.913,P=0.056,两个独立样本比较的非参数检验多个独立样本比较的非参数检验配对样本比较的非参数检验随机区组设计多个样本比较的非参数检验,诊断试验ROC曲线分析,基于秩次的非参数检验,随机区组设计资料比较,如果观察结果不满足方差分析条件,可用Friedman检验(Friedman test)。,1.建立检验假设和确定检验水准2.编秩:先在每一配伍组
14、内将数据从小到大编秩,如有相同数据,取平均秩次;再求各处理组秩和Ri,i=1,2,.,g。,分析步骤,3.计算检验统计量M值(1)查表法(n15,g15):M=(Rj-R)2(R=Rj/g)=M界值表基于2分布近似法得到2值查有关的2界值表(2)2分布近似法,分析步骤:,自由度为(g-1),当各区组间出现相同秩次时,需进行校正,校正公式为,b为区组个数,k为处理组个数,4确定P值和作出推断结论,【例8】8名受试对象在相同实验条件下分别接受4种不同频率声音的刺激,他们的反应率(%)资料见表。问4种频率声音刺激的反应率是否有差别?,SPSS软件操作,第一步:建立变量。,第二步:输入原始数据,第三步
15、:非参数检验(1),第三步:非参数检验(2),第四步:结果解读(1),结果解读:例数、均数、标准差、中位数、四分位间距等。,第四步:结果解读(2),结果解读:x2=15.152,P=0.002,一个讨论案例,【例9】某中医医院采用中西医结合方法治疗228例不同病情的脑卒中患者,疗效情况如下表。,SPSS软件操作,第一步:建立变量。,第二步:输入原始数据,第三步:加权个案,1、不同病情的脑卒中患者,疗效有无差别?,第三步:秩和检验,第四步:结果解读,结果解读:x2=24.319,P=0.000,2、脑卒中患者病情与疗效有无相关?,第三步:等级相关分析,第四步:结果解读,结果解读:rs=0.311
16、,P=0.000,3、脑卒中患者病情与疗效变化趋势如何?,第三步:线性趋势检验(1),第三步:线性趋势检验(2),输出4种卡方检验结果:1、pearson卡方2、卡方值的校正值3、似然比卡方,一般用于对数线性模型。4、fisher的精确检验,线性趋势检验,第四步:结果解读,结果解读:x2=21.797,P=0.000,线性趋势检验,计量资料线性回归等级有序资料线性趋势检验基本原则:将x2值进行分解,将总变异分为线性回归分量和偏离线性回归分量。,总变异,线性回归分量,两个独立样本比较的非参数检验多个独立样本比较的非参数检验配对样本比较的非参数检验随机区组设计多个样本比较的非参数检验,诊断试验RO
17、C曲线分析,基于秩次的非参数检验,诊断试验的概念,评价某种疾病诊断方法的临床试验。诊断试验的用途诊断疾病筛选无症状的病人判断疾病的严重程度估计疾病临床过程及预后估计对治疗的反应判断治疗效果,金标准,目标人群,病人,非病人,待评价诊断方法,评价指标,诊断试验原理,确定金标准,当前医学界公认的诊断某疾病最可靠、准确度最高的诊断方法。常用的金标准包括病理学诊断(活检、尸检)外科手术或诊断性操作特殊的影像学诊断权威机构颁布的综合诊断标准,选择研究对象,要求:代表性好、盲法试验组经金标准确诊为某疾病的患者,具有反应该疾病的全部特征,如病情、病程、症状体征、并发症、治疗或未治疗等。对照组经金标准证实未患该
18、疾病的患者(可患其它疾病)或正常人。,诊断试验结果表,诊断试验的评价指标,基本指标灵敏度、特异度、误诊率、漏诊率预测值阳性预测值、阴性预测值综合评价指标正确率、约登指数、优势比、似然比阳性似然比、阴性似然比,灵敏度(Sensitivity,Se)计算公式:Se=a/(a+c)又称真阳性率将实际有病的人正确判断为患者的能力漏诊率(omission diagnostic,)计算公式:=c/(a+c)又称假阴性率将实际有病的人错误判断为非患者的比例,高灵敏度试验的适用范围漏诊可能造成严重后果排除某病的其他诊断筛检无症状病人而且该病发病率较低,特异度(Specificity,Sp)计算公式:Sp=d/
19、(b+d)又称真阴性率将实际无病的人正确判断为非患者的能力误诊率(mistake diagnostic rate,)计算公式:=b/(b+d)又称假阳性率将实际无病的人错误判断为患者的比例,高特异度试验的适用范围假阳性会使病人受到严重危害确诊某病,灵敏度和特异度的关系,都是反映诊断试验准确性的最基本指标提高一方面水平,会降低另一方面水平一般选择敏感度和特异度都较高的试验作为诊断依据根据研究目的,调整灵敏度和特异度来确定临界值以产生漏诊和误诊之和最小时的数据确定临界值,ROC曲线评价方法,受试者工作特征曲线(Receiver Operator Characteristic curve,简称ROC
20、曲线)表示一个特定的诊断方法对区别特定的患者组与非患者组样本的检测性能。表示不同诊断水平的真阳性率对假阳性率的函数关系。,受试者工作特征曲线receiver operating characteristic curve,ROC,1 0.8 0.6 0.4 0.2 0 0.2 0.4 0.6 0.8 1,完全无价值的诊断试验其ROC曲线与机会线重合,而ROC曲线越偏离机会线,ROC曲线下面积就越大,则诊断试验的真实性也就越好。,ROC曲线评价方法,以灵敏度和假阳性率为两个轴的取值作的图性;通常用于测定值为连续或等级数据;常用于确定最佳临界值,也可用于比较两种和两种以上诊断试验的诊断价值。以试验灵
21、敏度为y轴,以假阳性率为x轴,由不同决策界值产生图中各个点,采用线段连接图中所有的点,绘制而成的线图。图中反映了随着灵敏度的增加,假阳性率也随之增加。,ROC曲线的特点,综合了灵敏度和特异度两个指标;不受患病率的影响;考虑了所有可能的诊断临界值的影响;全面客观地评价诊断试验的准确性;描述了诊断试验区分事件发生与不发生的固有能力。,ROC曲线下的面积,Area Under Curve,简称AUC以点(0,0)、(1,0)、(0、1)和(1,1)围成的面积做为1或100。ROC曲线和X轴围成的面积占总面积的百分比作为曲线面积的估计值。ROC曲线下面积的取值在01之间。,曲线越接近左上角,面积越接近
22、1,说明试验的准确度越高;越接近对角线,越接近0.5,则说明试验的准确度越差;一般认为:面积在0.50.7之间时诊断价值较低,在0.70.9之间时诊断价值中等,在0.9以上时诊断价值较高。,ROC曲线下的面积,最佳诊断界值的确定,ROC曲线上最靠近左上角的点所对应的灵敏度和特异度都是较大的,该点为ROC曲线的正切线与曲线相交的点,常以此点所对应的诊断界值作为最佳诊断界值。灵敏度+特异度最大的点就是最佳诊断界值。通过解拟合ROC曲线的方程寻找该点。,理想的正常人群与糖尿病病人血糖水平分布现实的正常人群与糖尿病病人血糖水平分布,采用不同血糖阳性界值所致假阳性和假阴性,病人与非病人某项诊断指标数值分
23、布示意图,ROC分析,ROC分析主要做三件事:计算ROC曲线下面积及其95%CI绘制ROC曲线图寻找截断点(cut off),【例10】为评价红细胞平均容积(MCV)对缺铁性贫血患者的诊断价值,以100例可疑为缺铁性贫血患者作诊断,并以骨髓诊断作为金标准。将金标准确诊为缺铁性贫血的34例作为病例组,其余66例作为对照组。然后对每组的每一例测量红细胞平均容积(MCV)。,SPSS软件操作,第一步:建立变量。,第二步:输入原始数据,第三步:ROC分析(1),第四步:初步结果,第五步:ROC分析(2),第六步:结果解读(1),结果解读:基本的例数描述,第六步:结果解读(2),结果解读:ROC曲线图,
24、第六步:结果解读(3),结果解读:ROC曲线下面积大小及统计学意义,ROC曲线下面积的临床意义,小于0.7,表示诊断准确度较低;0.70.9,表示诊断准确度为中等;大于0.9,表示诊断准确度较高。,第六步:结果解读(4),结果解读:给出不同截断点的灵敏度和1-特异度大小。,截断点(cut off)的选择,在该截断点下作的诊断:误诊率与漏诊率之和为最小;或灵敏度与特异度之和最大。,第七步:寻找截断点(1),将SPSS结果复制到EXCEL中,第七步:寻找截断点(2),利用EXCEL的函数功能进行计算(灵敏度+特异度)的值,第七步:寻找截断点(3),按照(灵敏度+特异度)由大到小排序,第七步:寻找截断点(4),按照(灵敏度+特异度)由大到小排序。(灵敏度+特异度)值最大的点所对应的MCV结果值就是截断点值。本例81.5就是所要找的截断点。,两条ROC曲线的比较,可信区间法:计算两条曲线AUC的可信区间如果两个可信区间有重合部分,则表示两种方法诊断价值的差异无统计学意义;反之则AUC值大的那种方法的价值更高。,谢 谢!,