《基于秩次的非参数检验.ppt》由会员分享,可在线阅读,更多相关《基于秩次的非参数检验.ppt(50页珍藏版)》请在三一办公上搜索。
1、基于秩次的非参数检验,流行病与卫生统计学教研室曹 明 芹,基于秩次的非参数检验,单样本和配对设计资料的符号秩和检验两组独立样本比较的秩和检验多组独立样本比较的秩和检验随机区组设计多组比较的秩和检验案例讨论,非参数检验,假设检验方法分为参数检验和非参数检验参数检验以特定的总体分布为前提,对未知的总体参数做推断非参数检验(任意分布检验)不以特定的总体分布为前提,也不针对总体分布的参数做推断,非参数检验,一般不直接用样本观察值做数据分析基于原始数据的排列顺序或符号,非参数检验,非参数检验具有广泛的适用性总体分布类型不清一端或两端无确切值等级资料或以秩次为数据的资料特别是对极端数据具有一定稳健性,非参
2、数检验,满足参数检验的资料采用非参数检验,会损失数据信息,降低检验效能秩和检验常用的且检验效能较高的非参数检验方法较完备的大样本抽样分布理论基础。以秩和为检验统计量,单样本和配对设计资料的符号秩和检验,Wilcoxon符号秩和检验推断总体中位数是否等于某个指定值(常数)可用于单样本设计或配对设计,定量资料不满足参数检验条件或等级资料的统计推断。,单样本资料的符号秩和检验,例10-1 已知某地正常人尿铅含量的中位数为2.50umol/L。今随机抽取16名工人,测定尿铅含量如下,问该厂工人的尿铅含量是否高于当地正常人,尿铅含量明显呈偏态分布,正态性检验W=0.8091,P=0.0036,极端值,单
3、样本资料的符号秩和检验,建立检验假设,确定检验水准H0:差值的总体中位数等于0,即该厂工人的尿铅含 量与正常人相同H1:差值的总体中位数大于0,即该厂工人的尿铅含量高于正常人单侧检验,,单样本资料的符号秩和检验,计算检验统计量秩和T求差值di=xi2.50编秩,按|di|由小到大编秩次分配秩次从116遇0舍弃不计,n相应减少,遇相同值(相持或结 tie)取平均秩次分配符号,将原差值di符号赋予相应秩次分别求两组秩和(T+和T-)T+T-=n(n1)/2确定检验统计量T(T+或T-),单样本资料的符号秩和检验,确定P值,做出推断查表法正态近似法,单样本资料的符号秩和检验,查表法根据n和T查附表9
4、(配对比较的符号秩和检验)若T值在上、下界值内,P值大于相应的概率;若T值等于上、下界值,P值等于相应概率;若T值在上、下界值范围外,P值小于相应的概率。本例:n=16,T=108或28,查表得0.01P0.025,单样本资料的符号秩和检验,正态近似法大样本,H0成立时,检验统计量T的抽样分布近似正态分布,均数为n(n+1)/4,方差为n(n+1)(2n+1)/24,因此,可采用Z检验,单样本资料的符号秩和检验,正态近似法,配对设计资料的符号秩和检验,配对设计配对设计参数检验(t检验)的条件符号秩和检验:差值分布的中位数是否为0,配对设计资料的符号秩和检验,例10-2 对11份工业污水测定氟离
5、子浓度(mg/L),每份水样同时采用电极法及分光光度法测定,结果见表10-2。问这两种方法的测定结果有无差别?差值经正态性检验得W=0.4561,P=0.0001,差值中存在极端值,配对设计符号秩和检验假设检验的基本步骤,配对设计资料的符号秩和检验,假设检验的基本思想对于配对设计,假定H0成立,则样本差值的正秩和与负秩和应相差不大,均应接近n(n+1)/4,当正负秩和相差悬殊,超出抽样误差的范围,则有理由怀疑该假设,从而拒绝H0。,两组独立样本比较的秩和检验,完全随机设计参数检验的条件Wilcoxon秩和检验统计推断目的:两总体分布位置(或总体中位数)是否有差别适用于定量资料统计推断不满足参数
6、检验条件及等级资料,定量资料两组独立样本比较的秩和检验,例10-3 两种药物杀灭钉螺,每批200300只活钉螺,用药后清点钉螺的死亡数,并计算死亡率(%),结果见表(181页),问两种药物杀死钉螺的效果有无差别?初步分析:设计类型 资料类型 是否满足参数检验条件,定量资料两组独立样本比较的秩和检验,如何计算秩和编秩:将两组数据混合在一起,由小到大编秩,遇相同数据(相持或结),取平均秩次。求各组秩和确定检验统计量秩和T以样本例数较小的组的秩和为检验统计量若两组样本例数相同,以任意组的秩和为检验统计量,定量资料两组独立样本比较的秩和检验,确定P值查表法:查附表10(两独立样本的秩和检验用)以n1,
7、n1n2查表,若T值在界值范围内,P值大于相应的概率;若T值等于界值,P值等于相应的概率;若T值在界值范围外,P值小于相应的概率。,定量资料两组独立样本比较的秩和检验,确定P值正态近似法(样本量较大),两独立样本秩和检验假设检验的基本步骤,有序分类变量两独立样本的秩和检验,例10-4 某医科大学营养教研室为了解居民体内核黄素营养状况,于某年夏冬两个季节收集成年居民口服5mg核黄素后4小时的负荷尿,测定体内核黄素含量,结果见表,试比较该地居民夏冬两个季节体内核黄素含量有无差别?初步分析:设计类型 资料类型,有序分类变量两独立样本的秩和检验,如何编秩,计算检验统计量T值将两组按等级顺序合并,按等级
8、顺序统一编秩;确定各等级的秩次范围,同一等级取平均秩次;分别求各组秩和确定检验统计量T值(同前):以样本例数较小组的秩和为检验统计量,两组独立样本比较的Wilcoxon秩和检验,假设检验的基本思想假设样本含量为n1和n2的两个样本,来自同一总体分布,则n1样本的秩和T1与其理论秩和n1(N+1)/2接近或相差不大,若其差别超出抽样误差的范围,则有理由怀疑其前提假设。,多组独立样本比较的秩和检验,用于完全随机设计多组比较参数检验条件Kruskal-Wallis H检验推断定量资料多组比较(不满足参数检验)等级资料(有序变量)多组比较,定量资料多组独立样本的秩和检验,例10-5 某医院用3种不同方
9、法治疗15例胰腺癌患者,每种方法治疗5例。治疗后生存月数见数据,问3种方法对胰腺癌患者的疗效有无差别?资料类型设计类型是否满足参数检验条件,定量资料多组独立样本的秩和检验,编秩方法同两组独立样本的秩和检验求各组秩和Ri检验统计量H,定量资料多组独立样本的秩和检验,确定P值查H界值表(比较组数k5,每组样本例数5时)查 界值表(,k为组数)(样本例数较大时,H0成立时,统计量H近似服从 分布),有序变量多组独立样本的秩和检验,例10-6 某医院用3种方法治疗慢性喉炎,结果见数据,问三种方法的疗效是否有差别?分析数据:资料类型 设计类型,有序变量多组独立样本的秩和检验,编秩求各组秩和Ri:同两组比
10、较统计量H,相持较多时需校正Hc确定P值,查 界值表多组比较拒绝H0,只能认为各组疗效不全相等,还需进行两两比较。,多个独立样本间的多重比较,方法很多教材介绍的为t检验属于非参数检验,随机区组设计多组比较的秩和检验,例10-8 欲用学生的综合评分来评价四种教学方式的不同,按照年龄、性别、年级、社会经济地位、学习动机相同和智力水平、学习情况相近作为配伍条件,将4名学生分为一组,共8组,每区组的4名学生随机分到四种不同的教学实验组,经过相同的一段时间后,测得学习成绩的综合评分,试比较四种教学方式对学生学习成绩的综合评分影响有无不同?,随机区组设计多组比较的秩和检验,Friedman秩和检验 检验统
11、计量M值编秩;按各区组编秩,按各处理组求秩和Ri,随机区组设计多组比较的秩和检验,确定P值样本例数较小时,查M界值表样本例数较大时,查 界值表,,随机区组设计多组比较的秩和检验,Friedman秩和检验的基本思想各区组内的观察值按从小到大的顺序进行编秩;如果各处理的效应相同,各区组内秩1,2,k应以相等的概率出现在各处理(列)中,各处理组的秩和应该大致相等,不太可能出现较大差别。如果按上述方法所得各处理样本秩和R1,R2,Rk相差很大,便有理由怀疑各处理组的总体分布不同。,基于秩次的非参数检验,单样本和配对设计资料的符号秩和检验两组独立样本比较的秩和检验多组独立样本比较的秩和检验随机区组设计多组比较的秩和检验,