《第八章秩转换的非参数检验讲解ppt课件.ppt》由会员分享,可在线阅读,更多相关《第八章秩转换的非参数检验讲解ppt课件.ppt(72页珍藏版)》请在三一办公上搜索。
1、1,第八章秩转换的非参数检验(Nonparametric Test),2,内 容配对样本比较的Wilcoxon符号秩检验两个独立样本比较的Wilcoxon秩和检验 完全随机设计多个样本比较的Kruskal-Wallis H 检验随机区组设计多个样本比较的Friedman M检验,3,参数检验如果总体分布为已知的正态或其它分布,对其总体参数作假设检验。如:t 检验和 F 检验。,非参数检验对总体分布不作严格假定,又称任意分 布检验(distribution-free test),它直接对总体分布作假设检验。,4,推断一个总体(分布位置)中位数M(非参数)和已知M0、两个或多个总体分布是否有差别。
2、先将数值变量从小到大,或等级从弱到强转换成秩后,再计算检验统计量。特点:假设检验的结果只对总体分布的位置差别作出推断(敏感),对总体分布的形状差别不推断(不敏感)。,秩转换的非参数检验,5,应用范围:对于计量资料:1.不满足正态和方差齐性条件的小样本资料;2.分布不明的小样本资料;3.一端或二端是不确定数值(如0.5、5.0等)的资料(必选);对于等级资料:若选行列表资料的 检验,只能推断构成比差别,而选秩转换的非参数检验,可推断等级强度差别。,6,注意:如果已知其计量资料满足(或近似满足)t检验或F检验条件,最好选t检验或F检验;若选秩转换的非参数检验,会降低检验效能。,7,第一节配对样本比
3、较的Wilcoxon符号秩检验,8,Wilcoxon符号秩检验,亦称符号秩和检验,用于配对样本差值的中位数和0比较;还可用于单个样本中位数和总体中位数比较。,9,1配对样本差值的中位数和0比较,目的是推断配对样本差值所代表的总体中位数是否和0有差别,即推断配对的两个相关样本所来自的两个总体中位数是否有差别。方法步骤见例8-1。,10,例8-1 对12份血清分别用原方法(检测时间20分钟)和新方法(检测时间10分钟)测谷-丙转氨酶,结果见表8-1的(2)、(3)栏。问两法所得结果有无差别?,11,表8-1 12份血清用原法和新法测血清谷-丙转氨酶(nmol S-1/L)结果的比较,12,本例配对
4、样本差值经正态性检验,推断得总体不服从正态分布(P0.1),现用Wilcoxon符号秩检验。,检验步骤建立检验假设,确定检验水平a H0:差值的总体中位数Md0H1:Md0a0.05,13,2.求检验统计量T值 省略所有差值为0的对子数,令余下的有效对子数为n,见表8-1第(4)栏,本例 n=11;若多个差值为0,可通过提高测量工具的精度来解决。,14,按差值的绝对值从小到大编秩,然后分别冠以正负号。遇差值绝对值相等则取平均秩,称为相同秩(ties)(样本较小时,如果相同秩较多,检验结果会存在偏性,因此应提高测量精度,尽量避免出现较多的相同秩),表8-1第(4)栏差值的绝对值为2有2个,其秩依
5、次应为1,2,皆取平均秩为1.5,见表8-1第(5)、(6)栏;任取正秩和或负秩和为T,本例取T=11.5。,15,3.确定P值,作出推断结论当n50时,查T界值表(附表9),判断原则:统计量T在T界值范围内,P大于相应的,在T界值范围外,或等于界值,P小于 或等于。本例n11,T=11.5,查附表9(P824)得双侧0.05P0.10,按a=0.05水准不拒绝H0,尚不能认为两法测谷-丙转氨酶结果有差别。,16,17,注意 配对等级资料采用符号秩检 验最好选用大样本。,18,2单个样本中位数和总体中位数比较,目的:是推断样本所来自的总体中位数M和某个已知的总体中位数M0是否有差别。计算样本各
6、变量值和M0的差值,即推断差值的总体中位数和0是否有差别。方法步骤见例8-2。,19,例8-2 已知某地正常人尿氟含量的中位数为45.30。今在该地某厂随机抽取12名工人,测得尿氟含量见表8-2第(1)栏。问该厂工人的尿氟含量是否高于当地正常人的尿氟含量?,20,21,本例样本资料经正态性检验,推断得总体不服从正态分布(P0.05),现用Wilcoxon符号秩检验。,检验步骤,H0:尿氟含量的总体中位数M=45.30H1:M45.30a=0.05,22,据表8-2第(3)、(4)栏,取T=1.5。有效差值个数n=11。据n=11和T=1.5查附表9(P534),得单侧P0.005,按a=0.0
7、5水准拒绝H0,接受H1,可认为该厂工人的尿氟含量高于当地正常人的尿氟含量。,23,第二节两个独立样本比较的Wilcoxon秩和检验,24,Wilcoxon秩和检验,用于推断两个独立样本所来自的两个总体分布是否有差别。在理论上检验假设H0应为两个总体分布相同,对立的备择假设H1不能为两个总体分布不同,而只能为两个总体分布位置不同(对单侧检验可写作某个总体分布位置比另一个总体分布位置要右或要左一些)。,25,考虑到对方差不等、即总体分布不同的两个正态分布,可用秩和检验来推断两个总体分布位置是否有差别,故在实际应用中检验假设H0可写作两个总体分布位置相同。不管两个总体分布的形状有无差别,秩和检验的
8、目的是推断两个总体分布的位置是否有差别,两个总体分布位置不同,实际情况一般是两个总体分布形状相同或类似,这时可简化为两个总体中位数不等。,26,1原始数据的两样本比较,例8-3 对10例肺癌病人和12例矽肺0期工人用X光片测量肺门横径右侧距RD值(cm),结果见表8-5。问肺癌病人的RD值是否高于矽肺0期工人的RD值?,27,表8-5 肺癌病人和矽肺0期工人的RD值(cm)比较,本例两样本资料经方差齐性检验,推断得两总体方差不等(P0.01),28,检验步骤,求检验统计量T值:把两样本数据混合从小到大编秩,遇数据相等者取平均秩;以样本例数小者为n1,其秩和(T1)为T,若两样本例数相等,可任取
9、一样本的秩和(T1或T2)为T,本例T=141.5。,H0:肺癌病人和矽肺0期工人的RD值总体分布位置相同 H1:肺癌病人的RD值高于矽肺0期工人的RD值a=0.05,29,确定P值,作出推断结论:,当n110和n2-n110时,查T界值表(附表10,P535)。本例n1=10,n2-n1=2,T=141.5,查附表10,得单侧0.025P0.05,按a=0.05水准拒绝H0,接受H1,可认为肺癌病人的RD值高于矽肺0期工人的RD值。,30,式中tj(j=1,2,L)为第j个相同秩的个数,若n110或n2-n110,超出附表10的范围,可用正态近似法作u检验,令n1+n2=N,按下式计算u值。
10、,31,例8-4 39名吸烟工人和40名不吸烟工人的碳氧血红蛋白HbCO(%)含量见表8-6。问吸烟工人的HbCO(%)含量是否高于不吸烟工人的HbCO(%)含量?,2频数表资料和等级资料的两样本比较 计量资料为频数表资料,是按数量区间分组;等级资料是按等级分组。现以等级资料为例,方法步骤见例8-4。,32,表8-6 吸烟工人和不吸烟工人的HbCO(%)含量比较,两组单向有序资料,33,检验步骤H0:吸烟工人和不吸烟工人的HbCO含量总体分布位置相同H1:吸烟工人的HbCO含量高于不吸烟工人的HbCO含量a=0.05,先确定各等级的合计人数、秩范围和平均秩,见表8-6的(4)栏、(5)栏和(6
11、)栏,再计算两样本各等级的秩和,见(7)栏和(8)栏;本例T=1917;,34,35,第三节完全随机设计多个样本比较的 Kruskal-Wallis H 检验,36,一、多个独立样本比较的 Kruskal-Wallis H 检验,37,Kruskal-Wallis H检验,用于推断计量资料或等级资料的多个独立样本所来自的多个总体分布是否有差别。在理论上检验假设H0应为多个总体分布相同,即多个样本来自同一总体。由于H检验对多个总体分布的形状差别不敏感,故在实际应用中检验假设H0可写作多个总体分布位置相同。对立的备择假设H1为多个总体分布位置不全相同。,38,1原始数据的多个样本比较,例8-5 用
12、三种药物杀灭钉螺,每批用200只活钉螺,用药后清点每批钉螺的死亡数、再计算死亡率(%),结果见表8-9。问三种药物杀灭钉螺的效果有无差别?,39,表8-9 三种药物杀灭钉螺的死亡率(%)比较,40,41,本例,确定P值,作出推断结论:当样本个数g=3和每个样本例数ni5时,查H界值表(附表11,P536)本例N=15,n1=n2=n3=5,查附表11得P0.01,按a0.05水准拒绝H0,接受H1,可认为三种药物杀灭钉螺的效果不同。,42,43,例8-6 比较小白鼠接种三种不同菌型伤寒杆菌9D、11C和DSC1后存活日数,结果见表8-10。问小白鼠接种三种不同菌型伤寒杆菌的存活日数有无差别?,
13、44,表8-10 小白鼠接种三种不同菌型伤寒杆菌的存活日数比较,45,本例为时间资料,不是正态分布,现用Kruskal-Wallis H检验。,H0:接种三种总体分布位置相同 H1:接种三种总体分布位置不全相同a=0.05,46,47,例8-7 四种疾病患者痰液内嗜酸性白细胞的检查结果见表8-11。问四种疾病患者痰液内的嗜酸性白细胞有无差别?,2频数表资料和等级资料的多个样本比较,48,表8-11 四种疾病患者痰液内的嗜酸性白细胞比较,多组单向有序分类资料,49,检验步骤,H0:四种疾病总体分布位置相同 H1:四种疾病总体分布位置不全相同a=0.05 如表8-11第栏的秩和R1是用第栏各等级的
14、频数与第(8)栏平均秩相乘再求和,即R1=0(6)+2(21)+9(40.5)+6(55.5)=739.5,仿此得表8-11下部Ri行。,50,v=4-1=3。查附表8(界值表,P533)得P0.005,按a=0.05水准拒绝H0,接受H1,可认为四种疾病患者痰液内的嗜酸性白细胞有差别。,51,两独立样本比较,若n1和n2较大,如为频数表资料或等级资料时,本章第二节介绍了用Wilcoxon秩和检验的公式(8-2),也可以用本节介绍的Kruskal-Wallis H检验的公式(8-4)或公式(8-5)。两者的关系是:H(或HC)=u2。,52,二、多个独立样本两两比较的 Nemenyi法检验,5
15、3,当经过多个独立样本比较的kruskal-Wallis H检验拒绝H0,接受H1,认为多个总体分布位置不全相同时,若要进一步推断是哪两两总体分布位置不同,可用Nemenyi法检验(Nemenyi test)。,54,例8-8 对例8-6资料(表8-10)作三个样本间的两两比较。,H0:任意两存活日数总体分布位置相同H1:任意两存活日数总体分布位置不同a=0.05 设为g个样本。当各样本例数较大时,按下式求第i个样本和第j个样本比较的 值。,55,例8-6中已算得校正系数C=0.98,故据表8-10下部ni行和 行数据,得同样可算得:,,56,v=3-1=2。据 查 界值表得0.025P0.0
16、5,可认为小白鼠接种11C的存活日数高于接种9D的存活日数;据 查附表8得0.01P0.025,可认为小白鼠接种DSC1的存活日数高于接种9D的存活日数;据 查附表8得0.99P0.995,尚不能认为小白鼠接种11C与接种DSC1的存活日数有差别。,57,第四节随机区组设计多个样本比较的Friedman M检验,58,一、多个相关样本比较的Friedman M检验,59,Friedman M检验,用于推断随机区组设计的多个相关样本所来自的多个总体分布是否有差别。检验假设H0和备择假设H1和多个独立样本比较的Kruskal-Wallis H检验相同。,60,例8-9 8名受试对象在相同实验条件下
17、分别接受4种不同频率声音的刺激,他们的反应率(%)资料见表8-12。问4种频率声音刺激的反应率是否有差别?,61,表8-12 8名受试对象对4种不同频率声音刺激的反应率(%),62,本例n=8,g=4,N=ng=32,为百分率资料,不符合正态分布,故用Friedman M检验。H0:4种频率声音刺激的反应率总体分布位置相同H1:4种频率声音刺激的反应率总体分布位置不全 相同a=0.05,63,求检验统计量M值:将每个区组的数据由小到大分别编秩,遇数据相等者取平均秩;计算各样本的秩和,平均秩和为;按下式求M值。,64,确定P值,作出推断结论:当n15和g15时,查M界值表(附表12)。本例n=8
18、和g=4,查附表12得P0.05,按a=0.05水准拒绝H0,接受H1,可认为4种频率声音刺激的反应率有差别。,65,66,二、多个相关样本两两比较的检验,当经过多个相关样本比较的Friedman M检验拒绝H0,接受H1,认为多个总体分布位置不全相同时,若要进一步推断是哪两两总体分布位置不同,可用q检验。,67,例8-10 对例8-9资料(表8-12)作四个样本间的两两比较。,H0:任意两反应率总体分布位置相同H1:任意两反应率总体分布位置不同a=0.05 设有g个相关样本,当区组个数n较多时,按下式求第i个样本和第j个样本比较的q值。,68,q的自由度v=(n-1)(g-1),样本间跨度a
19、指把g个样本秩和从小到大排列后Ri和Rj之间涵盖的秩和个数(包括Ri和Rj自身在内)。,69,本例根据表8-12有:n=8,g=4,70,71,v=(8-1)(4-1)=21。据相关样本两两比较的q值及v、a查附表4(q界值表),所得P值见表8-15。可认为频率A、B和频率C、D声音刺激的反应率有差别;尚不能认为频率A和频率B、频率C和频率D声音刺激的反应率有差别。,72,小 结1 非参数统计的概念、非参数检验与参数检验比较有哪些优缺点、非参数检验的适用范围;2 配对设计差值的符号秩和检验计算方法,了解其基本思想;3 成组设计两样本比较的秩和检验计算方法,了解其基本思想;4 成组设计多个样本比较的秩和检验计算方法;5.随机区组设计多个样本比较秩和检验。,