秩转换的非参数检验分析课件.ppt

上传人:小飞机 文档编号:1824804 上传时间:2022-12-20 格式:PPT 页数:82 大小:1.33MB
返回 下载 相关 举报
秩转换的非参数检验分析课件.ppt_第1页
第1页 / 共82页
秩转换的非参数检验分析课件.ppt_第2页
第2页 / 共82页
秩转换的非参数检验分析课件.ppt_第3页
第3页 / 共82页
秩转换的非参数检验分析课件.ppt_第4页
第4页 / 共82页
秩转换的非参数检验分析课件.ppt_第5页
第5页 / 共82页
点击查看更多>>
资源描述

《秩转换的非参数检验分析课件.ppt》由会员分享,可在线阅读,更多相关《秩转换的非参数检验分析课件.ppt(82页珍藏版)》请在三一办公上搜索。

1、第八章秩转换的非参数检验 (Nonparametric Test),主要内容,第一节 配对样本资料的Wilcoxon符号秩检验第二节 两个独立样本比较的Wilcoxon秩和检验第三节 完全随机设计多个样本比较的Kruskal- Wallis H检验第四节 随机区组设计多个样本的Friedman M检验,参数检验,参数检验方法:t 检验,方差分析;总体分布假定:各组样本所来自的总体为正态分布(已知的分布形式),各组样本所来自的总体方差齐性。,非参数检验,定义:不依赖于总体的分布类型,对样本所来自总体的分布不作严格假定的统计推断方法,称为非参数检验(nonparametric test)。直接对总

2、体分布做假设检验。 又称为任意分布检验(distribution-free test)。,注意:如果已知其计量资料满足(或近似满足) 检验或 检验条件,当然选 检验或 检验,因为这时若选秩转换的非参数检验,会降低检验效能。,非参数检验是一类统计学方法的总称,基于秩转换(rank transformation)的非参数检验只是其中的一种。,秩转换的非参数检验,秩次(rank):某种测量值按照从小到大的顺序排序后,每一测量值所对应的序号。秩转换:将某一变量值从小到大排序后,获得每一变量值的秩次,并用此秩次代替原有变量值的过程。,秩转换的非参数检验,秩和检验的方法-秩转换,秩和检验的基本计算步骤:1

3、.将数据(x)按大小转化为秩次(i),用秩次的大小反映变量值的大小。2.对各组”秩次”求和,称为秩和(T =i)。3.对各组秩和(T)做检验的方法称为秩和检验。,例: 秩转换的基本方法,将两组比较原始数据(X)混合按大小编秩,如x相同取平均秩, 分别对各组的秩求和(T).甲组(x) 3 5 10 20 22 秩和秩号 (i) 1 3 5 7 8 T1=24乙组(x) 4 9 15 25 35秩号(i) 2 4 6 9 10 T2=31,总秩和,T=10(10+1)/2=55,例: 两组比较的等级数据编秩,A组 : 、 +、 +、 +、 + 秩(i) : 1 2 4.5 4.5 4.5 8.5秩

4、和 : TA25 (组间相同,求平均秩) B组 : +、+、+、+、+、+ 秩(i) :4.5 8.5 8.5 8.5 11 12 秩和 : TB53 (组内相同,不影响求秩和),总秩和 : TA+TB=12(12+1)/2=78,秩次:在一定程度上反映了原始数据大小(等级)的信息。秩和:反映了一组数据在分布上的范围位置。平均秩次:反映一组数据平均水平 A组平均秩次=23.5/6=3.92 B组平均秩次=54.5/6=9.08,A组(x) 3, 5, 7, 9 11 14 (i) 1 2 3 4 5 8.5 T=23.5B组(x) 12 13 14 16 20 22 (i) 6 7 8.5 1

5、0 11 12 T=54.5,非参数检验的应用场合,计量资料:不满足参数检验的条件,且无适当的变量变换方法解决此问题时;分布类型无法获知的小样本计量资料;一端或两端存在不确定数值(如1000IU)的计量资料;等级资料:比较各组间等级强度的差别。,非参数检验的优缺点:,优点: 适用范围广 对数据要求不严 方法简便、易于理解和掌握缺点: 损失信息、检验效能低,第一节 配对样本比较的Wilcoxon符号秩检验,Wilcoxon符号秩检验简介,符号秩检验由Wilcoxon于1945年提出;应用:配对样本差值的中位数与0比较;单个样本中位数与总体中位数(给定值)的比较。,符号秩检验的基本思想,在H0成立

6、(两配对样本差值的总体中位数为0)的条件下,两配对样本的差值的正负及其绝对值的相对大小是随机的;在此情况下,正秩和与负秩和之间应当相近,差别不会太大;如果正秩和与负秩和之间相差足够大,则可认为H0成立的可能性很小,从而加以拒绝。,配对样本差值的中位数与0比较 配对设计两组处理效应的比较一般采用配对t 检验,如果差数严重偏离正态分布,可采用Wilcoxon符号秩检验。,例8-1:两种方法测量12份血清ALT测量结果,例8-1:两种方法测量12份血清ALT测量结果,例8-1分析结果,取负秩和为T,则T=11.5;查T界值表得0.05P0.1;结论:不拒绝H0,不能认为两种方法检测ALT的结果有差别

7、。,正态近似法:,n25时,T分布近似正态分布可用正态近似法作u检验:,相同秩次较多时的校正值:,注意:仍为非参数检验,2.配对设计等级资料的符号秩检验,1. 把等级从弱到强转换成秩,如某指标的检测结果为-,+,+,+,可转化为相应的秩次1,2,3,4;2. 求各对秩次的差值,省略所有差值为0的对子数,令余下的有效对子数为n;3. 按n个差值编正秩与负秩,求正秩和与负秩和 注意:由于等级资料相同秩多,此时小样本的检验结果会存在偏性,最好用大样本。,3. 单个样本中位数和指定的总体中位数比较,例8-2:12名工人尿氟含量与45.3比较,假设检验过程,与配对资料符号秩检验基本相同。此处先计算每一测

8、量值与给定的值的差数;然后对此差数进行秩转换,进行与配对资料符号秩检验完全相同的操作过程。此例得T=1.5,查表得P0.005;拒绝H0,认为该厂工人的尿氟含量高于当地正常人的水平。,第二节 两个独立样本比较的 Wilcoxon秩和检验,Wilcoxon秩和检验,Wilcoxon秩和检验(rank sum test)用于推断计量资料或等级资料的两个独立样本所来自总体的分布位置是否有差别。对分布的形状不加考虑,因此应注意分布位置和分布(包括位置和形状)的区别。分布形状相同或类似的两个总体分布位置比较,可以简化地理解为两总体中位数的比较。,1. 计量资料两样本比较,例8-3 两类肺病患者RD值比较

9、,(1)建立检验假设,确定检验水准,H0:两组患者RD值总体分布位置相同H1:肺癌病人RD值高于矽肺0期工人RD值=0.05,(2)混合编秩,求统计量T,将两样本数据混合,从小到大排序;对混合数据进行秩转换,获得每一观察值对应的秩次;观察值相等者取平均秩次;分别计算两样本的秩和;取样本量较小者为n1,其秩和作为统计量T;两样本量相等者任取其中一个作为统计量T(通常取秩和较小者)。,(3)确定P值,作出结论,若n110且n2-n110,可通过查阅T界值表(附表10)确定P值;若两样本量不满足上述条件,则可采用正态近似法作u检验,按公式(8-2)计算u值。,正态近似法,例8-3分析结果,本例n1=

10、10, n2-n1=2,T=T1=141.5,满足查T界值表的条件;查表得单侧0.025P0.05;拒绝H0 ,认为肺癌病人的RD值高于矽肺0期病人的RD值。,2. 等级资料两样本比较,例8-4 吸烟和不吸烟工人HbCO含量比较,(1)建立检验假设,确定检验水准,H0:两组工人HbCO含量总体分布位置相同H1:吸烟工人HbCO含量高于不吸烟工人=0.05,(2)混合编秩,求统计量T,确定各等级的合计人数;根据各等级的合计人数确定其秩次范围和平均秩;分别计算两样本的秩和;取样本量较小者为n1,其秩和(T1)作为统计量T;根据公式(8-2)计算u值,执行u检验过程。,例8-4分析结果,本例n1=3

11、9, n2=40,T=T1=1917;计算得u=3.7023,查表得单侧P0.0005;拒绝H0,认为吸烟工人HbCO含量高于不吸烟工人HbCO含量。,(3)确定P值,作出结论,第三节:完全随机设计多个样本比较的Kruskal-Wallis H检验,Kruskal-Wallis H应用,Kruskal-Wallis H检验用于推断计量资料或等级资料的多个独立样本所来自总体的分布位置是否有差别。,1. 计量资料多个样本比较,例8-5 三种药物杀灭钉螺的死亡率(%)比较,(1)建立检验假设,确定检验水准,H0:三种药物杀灭钉螺的死亡率总体分布位置相同H1:三种药物杀灭钉螺的死亡率总体分布位置不全相

12、同=0.05,(2)混合编秩,分组求秩和,将多组样本数据混合,从小到大排序;对混合数据进行秩转换,获得每一观察值对应的秩次;观察值相等者取平均秩次;分别计算各组样本的秩和Ri及样本量ni;,(3)求统计量H,(3)确定P值,作出结论,若组数g=3且每个样本例数ni5时,可通过查阅H界值表(附表11)确定P值;若组数g=3且最大样本例数5或g3时,则H或Hc近似服从=g-1的卡方分布,可通过查阅卡方界值表确定P值。,例8-5分析结果,本例n1=n2=n3=5,N=15,满足查H界值表的条件;计算得H=9.74,查表得双侧P0.01;拒绝H0 ,认为三种药物杀灭钉螺的效果不同。,2. 等级资料多个

13、样本比较,例8-7 四种疾病患者痰液内噬酸粒细胞比较,(1)建立检验假设,确定检验水准,H0:四种疾病患者痰液内噬酸粒细胞总体分布位置相同H1:四种疾病患者痰液内噬酸粒细胞总体分布位置不全相同=0.05,(2)混合编秩,求统计量H,确定各等级的合计人数根据各等级的合计人数确定其秩次范围和平均秩分别计算各组样本的秩和,即各组中各等级的频数乘以相应的平均秩,然后求和按照公式(8-4)和公式(8-5)求统计量Hc,(3)确定P值,作出结论,确定P值的方法和计量资料多组样本比较的情形相同;此处g3,通过查卡方界值表(附表8)确定P值;,例8-7分析结果,本例计算得H=14.28,Hc =15.52,查

14、卡方界值表得双侧P0.005;拒绝H0 ,认为四种疾病患者痰液内噬酸粒细胞有差别。,秩和检验的两两比较,方法有:1、Nemenyi法检验2、扩展的t检验3、q检验,几种方法理论上仍存在争议,故SAS、SPSS等软件没有提供这方面的分析,3. 多个独立样本两两比较的Nemenyi检验,Nemenyi检验方法简介,类似于多组样本比较方差分析的情形,当经过多个独立样本比较的Kruskal-Wallis H检验拒绝H0之后,可进一步进行组间两两比较;Nemenyi检验即为执行此类统计学比较的方法之一。,例8-8 小白鼠接种三种伤寒菌的存活日数,三组样本所来自的总体分布位置比较,三组样本所来自的总体分布

15、位置比较的操作过程与例8-5完全相同;本例得Hc=9.97,P0.01,拒绝H0;认为接种三种伤寒杆菌的存活日数有差别;为进一步观察不同伤寒杆菌之间的差别,可进一步进行三组间的两两比较。,任意两组间分布位置的比较,计算各组的平均秩和,根据公式(8-6)计算任意两组之间比较的卡方值;自由度取组数减一,即=g-1;查表确定相应的P值,进行统计推断。,例8-8分析结果,,0.025P0.05 ,0.01P0.025 ,0.99P0.995推论:9D组与11C组和DSC1组间差别均有统计学意义;11C组与DSC1组间差别无统计学意义。,第四节:随机区组设计多个样本比较的Friedman M检验,Fri

16、edman M检验简介,Friedman M检验用于推断随机区组设计的多个相关样本所来自总体的分布位置是否有差别。对分布的形状不加考虑。,1. 多个相关样本比较的Friedman M检验,例8-9 8名受试者对4种频率声音的反应率,(1)建立检验假设,确定检验水准,H0:四种频率声音刺激的反应率总体分布位置相同H1:四种频率声音刺激的反应率总体分布位置不全相同=0.05,(2)区组内编秩,求统计量M,将每个区组内的数据从小到大排列;在每个区组内进行秩转换,获得每个数据的秩次数据相等时取平均秩次;计算各组样本的秩和Ri,平均秩和 按照公式(8-7)求统计量M。,(3)确定P值,作出结论,当区组个

17、数n15且处理组数g15时,可通过查阅M界值表(附表12)获得P值;M值大于相应界值时,P值小于对应的界值。当区组个数n15或处理组数g15时,则通过公式(8-8)进行近似卡方检验,确定P值。实际上当g4,或者g=4且n5,或者g=3且n9 ,即可采用近似卡方检验方法。,例8-9分析结果,本例计算得M=199.5,查M界值表得双侧P0.05;拒绝H0 ,认为四种频率声音刺激的反应率有差别。,2. 多个相关样本两两比较的q检验,q检验方法简介,当经过多个相关样本比较的Friedman M检验拒绝H0之后,可进一步执行组间两两比较的操作;q检验可用以执行多个相关样本的两两比较过程。,q检验方法操作过程,操作过程类似于方差分析组间两两比较的SNK-q检验;任意两组间比较的q值通过公式(8-9)和公式(8-10)计算;自由度=(n-1)(g-1),样本跨度a是指g个样本秩和从小到大排序后所比较的两个秩和间所涵盖的秩和个数(包括二者本身);根据计算结果查阅q界值表(附表4),获得P值,例8-9数据的两两比较结果,秩转换非参数检验小结,1. 参数检验与非参数检验的对比,2. 参数检验和非参数检验的对应关系,谢谢大家!,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号