第八章 秩转换的非参数检验孙振球 ppt课件.ppt

上传人:sccc 文档编号:5696531 上传时间:2023-08-10 格式:PPT 页数:124 大小:3.23MB
返回 下载 相关 举报
第八章 秩转换的非参数检验孙振球 ppt课件.ppt_第1页
第1页 / 共124页
第八章 秩转换的非参数检验孙振球 ppt课件.ppt_第2页
第2页 / 共124页
第八章 秩转换的非参数检验孙振球 ppt课件.ppt_第3页
第3页 / 共124页
第八章 秩转换的非参数检验孙振球 ppt课件.ppt_第4页
第4页 / 共124页
第八章 秩转换的非参数检验孙振球 ppt课件.ppt_第5页
第5页 / 共124页
点击查看更多>>
资源描述

《第八章 秩转换的非参数检验孙振球 ppt课件.ppt》由会员分享,可在线阅读,更多相关《第八章 秩转换的非参数检验孙振球 ppt课件.ppt(124页珍藏版)》请在三一办公上搜索。

1、第八章,秩转换的非参数检验,(nonparametric test),非参检验,参数检验无法使用的情况下:资料分布不满足参数检验条件;不满足方差齐性;数据不能精确测量,如“50mg”;结局变量为有序分类的资料。,2,非参检验,经典统计的多数检验都假定了总体的背景分布。但也有些没有假定总体分布的具体形式,仅仅依赖于数据观测值的相对大小(秩)或零假设下等可能的概率等和数据本身的具体总体分布无关的性质进行检验。这都称为非参数检验在资料能够进行参数检验或者能够通过转换符合参数检验的条件下,首选参数检验,因为非参仅仅考虑参数的位置分布,而忽略了详细的信息,检验效能降低。,3,2008年8月,方法小节,非

2、参数检验,非参数检验的方法选择多样:独立两样本所来自总体比较:Wilconxon rank sum test/Wilconxon Mann-Whitney UKolmogorov-Smimov Z:检验样本是否来自同一总体Moses extreme reactions:当样本中同时含有正值和负值时选用的方法。Wald-Wolfowitz runs:检验两个样本所在总体的任一点分布情况是否相同,5,1.成组设计两样本的比较!,配对/相关两样本所来自的总体的比较:Wilcoxon:Wilcoxon符号秩和检验,为相关样本差值的秩和检验,系统默认值;Sign:符号检验,利用正负号检验,效率低McNe

3、mar:常用的配对卡方检验,只用于两分类资料,检验两组间分类有差异的频数,不考虑相同分类的频数;Marginal Homogeneity:与McNemar类似,只分析有差异的情况!,6,非参数检验,2.配对设计两样本的比较!,多个样本所来自的总体均数的比较:Kruskal-Wallis H:最为常用的多个样本所来自的总体比较的秩和检验Median/中位数:检验效能最低Jonckheere-Terpstra:用于双向有序变量资料分析时,检验效能高于Kruskal-Wallis H检验,7,非参数检验,3.成组设计多个样本的比较!,多组配伍/相关样本所来自总体均数的检验:Friedman:M检验,

4、k个相关样本最常用的检验;Kendalls W检验:Kendall协和系数检验,表示k个指标间相互关联的程度;Cochrans Q检验:适用于二分类变量,是两相关样本McNemar在多个样本情况下的推广。,8,非参数检验,4.配伍设计多个样本的比较!,非参检验资料的几种类型,一、成组设计两样本比较的秩和检验(Wilcoxon 两样本比较法)二、配对设计差值的符号秩和检验(Wilcoxon 配对法)三、成组设计多个样本比较的秩和检验(Kruskal-Wallis法)四、随机区组设计资料的秩和检验(Friedman法),9,数据格式:1个分组变量“group”,1个反应变量“x”。步骤:Analy

5、ze Nonparametric Tests 2 Independent Samples Test Variable List:x Grouping Variable:group Test Type:Mann-Whitney U,一、两独立样本比较的秩和检验(原始数据),10,例1:两独立样本比较的秩和检验,某实验室观察某种抗癌新药治疗小鼠移植性肿瘤的疗效,两组各10只小鼠,以生存日数作为观察指标,结果如下,试检验两组小鼠生存日数有无差别?试验组:24 26 27 30 32 34 36 40 60天以上对照组:4 6 7 9 10 10 12 13 16 16,11,12,资料的读数中,“6

6、0”不是确定值,因而只能采用非参数检验的方法进行处理!,13,资料的读数中,如果“60”是确定值,该资料能够采用参数检验的方法进行处理吗!,14,15,发现“确定”按钮没有激活的情况,需要考虑是否存在未完成的选项!,16,检验步骤计算Wilcoxon统计量W和Mann-Whitney统计量U分别求出两个样本的秩的和,Wx和Wy。若mn,统计量W=Wy;若m=n,统计量为第一个变量值所在样本组的W值Mann-Whitney统计量定义为小样本情况下,统计量服从Mann-Whitney分布,大样本情况下,近似服从正态分布,检验统计量为根据P值作出决策,两个独立样本Mann-Whitney检验,(k为

7、W对应样本组的样本数据个数),Mann-Whitney 检验,18,数据格式:1个分组变量“group”,1个反应变量“x”,1个频数变量“freq”。步骤:Data Weight Cases Weight cases by:freq Analyze Nonparametric Tests 2 Independent Samples Test Variable List:x Grouping Variable:group Test Type:Mann-Whitney U,一、两独立样本比较的秩和检验(频数资料),19,例2、两独立样本比较的秩和检验,为研究甲乙两种药物对某一疾病的治疗效果,观察

8、采用不同药物治疗后的208名患者,结果如下,问,甲乙两种药物对这一疾病的治疗效果有无差异?,20,21,22,二、配对设计差值的符号秩和检验,数据格式:2个反应变量,分别为“X1”和“X2”。步骤:Analyze Nonparametric Tests 2 Related Samples Test Pair(s)List:X1X2 Test Type:Wilcoxon,23,例3:配对设计差值的符号秩和检验,尿铅的传统测定方法比较繁琐,现有人希望用新方法代替原有方法,10份样本分别采用两种方法进行测定,结果如下,试分析两种方法的测定结果有无差别?,24,25,26,27,28,与配对t检验相比

9、,有什么异同?,29,数据格式:1个分组变量“group”,1个反应 变量“x”。步骤:Analyze Nonparametric Tests K Independent Samples Test Variable List:x Grouping Variable:group Test Type:Kruskal Wallis H,三、多个独立样本比较的秩和检验(原始数据),30,例3、多个独立样本比较的秩和检验,测得某中学教室中6个采样点不同时间空气中的CO2含量,结果如下,问不同时间空气中的CO2含量有无差别?(本例未将同一采样点作为一个区组设置,实际工作中要考虑有无设置区组的必要),31,

10、32,33,34,35,数据格式:1个分组变量“group”,1个反应变量“x”,1个频数变量“frequncy”。步骤:Data Weight Cases Weight cases by:freqAnalyze Nonparametric Tests K Independent Samples Test Variable List:x Grouping Variable:group Test Type:Kruskal Wallis H,三、多个独立样本比较的秩和检验(频数表),36,例4、多个独立样本比较的秩和检验,三种病人肺切除术的针麻效果,见下表,问,此三种病人肺切除术的针麻效果有无差异

11、?,37,38,卡方检验统计量不能够体现出结局为等级资料的等级差异对结果的影响,所以不能在此类资料的分析中采用!,39,Kruskal-Wallis 检验,40,中值检验,41,数据格式:反应变量分别为“X1”,“X2”,“X3”,“X4”步骤:Analyze Nonparametric Tests K Related Samples Test Variables:X1 X2 X3 X4 Test Type:Friedman,四、随机区组设计资料的秩和检验,42,例5、随机区组设计资料的秩和检验,受试者5人,每人穿4种防护服,测得脉搏数结果见下表,问,5个受试者穿4种防护服测得脉搏数有无差别?

12、,43,44,注意此资料的录入格式与随机区组设计的方差分析有什么区别?变量个数?录入的形式?,项目编号不是分析所必须的,但是一个区组的或者说有关联的样本要在一行上录入。,Friedman 检验,Kendall W 检验,45,双向有序列联表的检验,1.虽然分组变量和研究变量均为有序,但是研究者仅仅对分组产生的研究结果感兴趣,则可以按单向有序的资料进行分析;2.如果想要明确两变量之间的相关关系,则需要采用Spearman相关分析;3.可以采用Jonckheere-Terptra检验,该检验对双向有序资料的检验效率较其它方法高;4.如果是多中心临床试验的结果,那么不同中心结果可能会不一致,要考虑混

13、杂因素的影响,可进行Cochran-Mantel-Haenszel分析。,46,47,医疗形式与患者对医疗服务的满意度之间的关系,48,Jonckheere-Terpstra过程的操作提示,图7-6 选择Jonckheere-Terpstra检验 图7-7 选择精确概率检验,49,例3、二位放射科医生对一批矽肺胸片独自做出矽肺分级诊断,见下表,问他们的诊断结果是否一致,诊断水平有无差异?,注意区别以下适合配对卡方分析的情况,50,2008年8月,方法小节,总结2:非参数检验,1、成组设计两样本比较的秩和检验 2 Independent Samples Mann-Whitney U 2、配对设计

14、差值的符号秩和检验 2 Related SamplesTest Type:Wilcoxon 3、成组设计多个样本比较的秩和检验 K Independent SamplesTest Type:Kruskal Wallis H 4、随机区组设计资料的秩和检验K Related SamplesTest Type:Friedman,在利用SPSS进行非参数检验的时候,如何根据条件进行方法的选择?,52,参数检验 parametric test(1)总体分布类型已知,如率服从二项分布、样本均数服从正态分布;(2)由样本参数推断未知总体参数。这时,基于一定的参数分布对总体参数的假设检验称为参数检验。如 t

15、 检验:F 检验:,非参数检验(nonparametric test)对数据的总体分布类型不作严格假定,又称任意分布检验(distribution-free test),它直接对总体分布的位置作假设检验。,参数统计:通常要求样本来自正态总体,或方差齐等,在此基础上用样本统计量对总体参数进行推断或作假设检验的统计分析方法。,非参数统计:有许多资料不符合参数统计的要求,分布未知,不能用参数统计的方法进行检验,而需要一种不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验,而是对总体的分布或分布位置进行检验,称为非参数检验。,参数检验与非参数检验比较,将数值变量值从小到大,或等级变量值从弱到强

16、转换成秩次。例1 11只大鼠存活天数:存活天数4,10,7,50,3,15,2,9,13,60,60秩次 3 6 4 9 2 8 1 5 7 10 11 10.5 10.5例2 7名 肺炎病人的治疗结果:危险程度 治愈 治愈 死亡 无效 治愈 有效 治愈秩次 1 2 7 6 3 5 4 2.5 2.5 7 6 2.5 5 2.5,秩转换 rank transformation,秩相同取平均秩!,秩相同取平均秩!,已知总体分布类型,对未知参数进行统计推断,依赖于特定分布类型,比较的是参数,参数检验(parametric test),非参数检验(nonparametric test),对总体的分布

17、类型不作严格要求,不受分布类型的影响,比较的是总体分布位置,优点:方法简便、易学易用,易于推广使用、应用范围广;可用于参数检验难以处理的资料(如等级资料,或含数值“50mg”等),缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数检验会损失部分信息,其检验效能较低;样本含量较大时,两者结论常相同,以下情况首选非参数检验:,1.不满足正态和方差齐性条件的小样本资料;2.总体分布类型不明的小样本资料;3.一端或二端是不确定数值(如0.002、65等)的资料(必选);4.单向有序列联表资料;5.各种资料的初步分析。,在资料符合参数检验的条件下,请一定采用参数检验的方法。非参数检验中所利用的信息量

18、有限,在同等条件下的检验效能低于参数检验。,非参数检验,第一节 配对样本比较的Wilcoxon符号秩和检验第二节 两个独立样本比较的Wilcoxon秩和检验第三节 完全随机设计多个样本比较的Kruskal-Wallis H 检验第四节 随机区组设计多个样本比较的Friedman M 检验,第一节,配对样本比较的Wilcoxon符号秩检验(Wilcoxon signed-rank test)常用于以下两种情况:,1配对样本差值的中位数与0的比较2单个样本中位数和总体中位数比较,常见的配对设计类型,1.同一研究对象处理前后的比较;2.同一研究对象分别接受不同的处理;3.不同研究对象,根据研究因素以

19、外的会影响研究结果的重要因素配成对子,分别接受不同的处理,比较不同处理的效果。,例8-1 12份血清原方法(检测时间20分钟)新方法(检测时间10分钟)测谷-丙转氨酶问两法所得结果有无差别?,1配对样本差值的中位数和0比较,表8-1 12份血清两法测血清谷-丙转氨酶(nmol S-1/L)的比较,配对秩和检验编秩规则:算出各对值的代数差;根据差值的绝对值大小编秩,从小到大;将秩次按差值正负冠以正负号,计算正、负秩和(T+,T-);用不为“0”的对子数作为n(5)取绝对值小的秩和作为统计量T,表8-1 12份血清两法测血清谷-丙转氨酶(nmol S-1/L)的比较,*下面资料中新法测定的结果中有

20、未能确定的值,所以必须采用非参数检验的方法。,编秩的方法为按照绝对值的大小从小到大编。,1.建立检验假设,确定检验水平,2.求检验统计量T值,省略所有差值为0的对子数,余下的有效对子数记录为n,见表8-1第(4)栏,本例 n=11;,检验步骤,按差值的绝对值从小到大编秩,然后分别冠以正负号。遇差值绝对值相等【称为相同秩(ties)】则取平均秩,(样本较小时,如果相同秩较多,检验结果会存在偏性,因此应提高测量精度,尽量避免出现较多的相同秩),一般取较小者为T,本例取T=11.5。,3.确定P值,作出推断结论,(1)当n50时,查T界值表(附表9,p716)判断原则:T 在范围之外,P(T范围越小

21、,P越大)n=11,=0.10:13-53=0.05:10-56,所查到的界值是在H0成立的情况下,根据预先设定的和相应的样本量,可以接受的T值范围。,(2)若当n50,超出附表9范围,可用正态近似法作Z检验。,重复秩次的个数,如果H0成立,即两总体无差异,在理论上的样本的正负秩和相等,即 T值应为总秩和(T总=n(n+1)/2)的一半,即 T=n(n+1)/4。若T值在界值范围内,不拒绝H0,当T值在界值上或界值范围外,H0成立的概率很小,拒绝H0,认为两总体分布不同,配对资料符号秩和检验的基本思想,例8-2 已知某地正常人尿氟含量的中位数为45.30。(总体中位数)12名工人尿氟含量见表8

22、-2第(1)栏(样本)。问该厂工人的尿氟含量是否高于当地正常人?,2单个样本中位数和总体中位数比较,如果资料符合进行参数检验的条件,则应该采用样本均数与总体均数比较的t检验。,表8-2 12名工人的尿氟含量与45.30()比较,本例由于存在数值不明的资料,所以采用非参数检验。,据表8-2第(3)、(4)栏,取T=1.5。,第二节,两个独立样本比较的Wilcoxon秩和检验Wilcoxon rank sum test,表8-5 肺癌病人和矽肺0期工人的RD值(cm)比较,例8-3,1原始数据的两样本比较,在不符合参数检验条件时,计量资料两独立样本的比较不能采用两独立样本均数 t 检验,需考虑非参

23、数检验,表8-5 肺癌病人和矽肺0期工人的RD值(cm)比较,例8-3,检验步骤,求检验统计量T 值:,(同一组可直接写秩号),确定P值,作出推断结论:,在H0成立的情况下,含量为n1样本的秩和T1应在n1(N+1)/2的左右变化。,两独立样本比较的秩和检验采用Z检验的原理,适用条件:完全随机设计的两个样本比较,若不满足参数检验的应用条件,则用本法,此外两个等级资料比较也采用本方法。基本思想:如果H 0成立,在两样本来自分布相同的总体,两样本的平均秩次应相等或很接近,与总的平均秩次(N+1)/2相差较小。含量为n1样本的秩和T1应在n1(N+1)/2的左右变化。若T值偏离此值太远,H 0发生的

24、可能性就很小。若偏离出给定的值所确定的范围时,即P,拒绝 H 0,表8-6 吸烟工人和不吸烟工人的HbCO(%)含量比较,2两样本频数表和等级资料的比较,表8-6 吸烟工人和不吸烟工人的HbCO(%)含量比较,先确定各等级的合计人数、秩范围和平均秩,见表8-6的(4)栏、(5)栏和(6)栏,再计算两样本各等级的秩和,见(7)栏和(8)栏;本例T=1917;,计算Z值,3Mann-Whitney U检验 两独立样本比较还常用Mann-Whitney U检验原理:把第一个样本的n1(小于等于n2)个变量值的每一个值,与第二个样本的每个变量值X逐个进行比较,每次比较均记录比较的结果:小于X记1,与X

25、相等记0.5,大于X记0。比较结果之和即为U值。例如:表8-5资料,表8-5 肺癌病人和矽肺0期工人的RD值(cm)比较,代入P129公式(8-3)计算Z值,小于X记1,与X相等记0.5,大于X记0,两独立样本资料进行比较时,在资料不符合参数检验的条件下,除上述方法外,还可以采用中位数检验,median test。中位数检验的检验效能在非参数检验中相对较低,结论比较保守。,对于同一份资料,用Mann-Whitney U和Wilcoxon方法计算得到的Z值是相等的,所下的统计结论也是等价的。,第三节,完全随机设计多个样本比较的Kruskal-Wallis H检验,一、多个独立样本(计量)比较的K

26、ruskal-Wallis H检验,H0:多个总体分布位置相同;H1:多个总体分布位置不全相同。,基本思想:如果各总体分布相同,则各组混合编秩的平均秩次应该相差不大,如果满足参数条件,这类资料一般作完全随机设计ANOVA,例8-5,样本数据存在相同秩的情况,例8-6 比较小白鼠接种三种不同菌型伤寒杆菌9D、11C和DSC1后存活日数,结果见表8-10。问小白鼠接种三种不同菌型伤寒杆菌的存活日数有无差别?,2.多个有序(等级)数据样本的比较 例8-7,二、多个独立样本作两两比较的Nemenyi法检验 当经过多个独立样本比较的kruskal-Wallis H检验拒绝H0,接受H1,认为多个总体分布

27、位置不全相同时,若要进一步推断是哪两两总体分布位置不同,可用Nemenyi法检验(Nemenyi test)。,第四节,随机区组设计多个样本比较的Friedman M检验,例8-9 8名受试对象在相同实验条件下分别接受4种不同频率声音的刺激,他们的反应率(%)资料见表8-12。问4种频率声音刺激的反应率是否有差别?,一、Friedman M检验方法,二、两两比较的q检验,当经过多个相关样本比较的Friedman M检验拒绝H0,接受H1,认为多个总体分布位置不全相同时,若要进一步推断是哪两两总体分布位置不同,可用q检验。,.,对四组大白鼠用不同剂量的某种激素后,测量耻骨间隙宽度的增加量(),结

28、果如下表,请问各组的增加量有无差异?A组 0.15 0.3 0.4 0.5B组 1.2 1.35 1.4 1.5 1.9 2.3C组 0.5 1.2 1.42 2.2 2.2D组 1.5 1.5 2.5 2.5,请用比较下表资料中新旧防护服的防护效果。,1.资料及资料收集背景:拿到资料时,首先查看资料提供者的研究设计,资料分析计划和分析目的;2.统计描述:对资料进行观察,在观察的基础上,分计量和计数资料进行统计描述,通过统计指标确定计量资料的分布类型和计数资料的特点;3.统计推断:在掌握资料中变量分布特征的基础上,进行总体参数的置信区间估计,针对研究目的,处理因素的多少以及影响因素的情况,选择

29、合适的方法进行假设检验。,资料的统计描述统计指标、统计图表 t检验 u检验 方差分析卡方检验 非参数检验相关与回归分析,统计推断,资料的统计分析,统计方法的选择,反应变量是单变量、双变量还是多变量,反应变量是何类型(定量、无序分类、有序分类),资料为单因素还是多因素,单样本、两样本、多样本,配对设计、配伍设计,检验方法的条件,分析的目的,单变量计量资料的分析,样本均数与总体均数,样本均数与总体均数比较的t检验,非参数检验方法,满足正态分布否?,是,否,两个相关样本的比较,差值正态分布满足否,配对T检验,符号秩检验,是,否,方差齐性,方差不齐,两个独立样本的比较,成组设计的t检验,t检验,两独立

30、样本秩和检验,两样本分别服从正态分布否,否,是,多样本均数比较,单因素多样本均数的比较,两因素多样本均数的比较,三因素多样本均数的比较,多因素多样本均数的比较,重复测量资料多样本均数的比较,单因素方差分析,Kruskal-Wails检验,两因素方差分析,Friedman秩和检验,正态性,方差齐性满足,不满足,正态性,方差齐性满足,不满足,拉丁方设计、两阶段交叉设计,析因设计、正交设计、嵌套设计、裂区设计,单变量计数资料的分析,两个率,总体与样本,u检验和二项分布的确切概率法,两样本,配对,非配对,配对卡方检验,卡方检验、确切概率法、u检验,RC表,双向无序,多个样本率或构成比,卡方检验,关联度,列联系数分析,单向有序,分组变量有序,反应变量有序,卡方检验,秩和检验,双向有序,配对/配伍组设计,McNemar检验/K系数检验,非配对/配伍设计,秩相关分析/线性趋势检验,双变量资料的分析,简单相关分析,Pearson积距相关分析,Spearman秩相关分析,线性回归分析,曲线回归分析,指数曲线、多项式曲线、生长曲线、logistic曲线,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号