《单因素方差分析非参数检验用.ppt》由会员分享,可在线阅读,更多相关《单因素方差分析非参数检验用.ppt(77页珍藏版)》请在三一办公上搜索。
1、,单因素方差分析,方差分析入门 单因素方差分析 均数两两比较的方法 小结,内容提要,前面提到的有关统计推断的方法,如单样本、两样本t检验等,其所涉及的对象千变万化,但归根结底都可以视为两组间的比较,如果是有一组的总体均数已知,则为单样本t检验,如果两组都只有样本信息,则为两样本t检验。但是如果遇到以下情形,该如何处理?,方差分析入门,案例 对于大学新生的入学成绩,可以通过t检验来考察男女学生间的入学成绩是否有差异?但要是想知道来自于江苏、浙江、上海、安徽等省份的学生,其入学成绩是否有差异,那么是否可以用6次t 检验来达成目的?,方差分析入门,在以上例子中,涉及的问题其实就是在单一处理因素之下,
2、多个不同水平(多组)之间的连续性观察值的比较,目的是通过对多个样本的研究,来推断这些样本是否来自于同一个总体。那么能否使用两两t 检验,例如做三组比较,则分别进行三次t检验来解决此问题呢?这样做在统计上是不妥的。因为统计学的结论都是概率性的,存在犯错误的可能。,方差分析入门,分析:用6次t 检验来考察4个省份的大学生新生入学成绩是否相同,对于某一次比较,其犯I类错误的概率为,那么连续进行6次比较,其犯I类错误的概率是多少呢?不是 6,而是1-(1-)6。也就是说,如果检验水准取0.05,那么连续进行6次t 检验,犯I类错误的概率将上升为0.2649!这是一个令人震惊的数字!结论:多个均数比较不
3、宜采用t 检验作两两比较;而应该采用方差分析!,方差分析入门,R.A.Fisher 提出的方差分析的理论基础:将总变异分解为由研究因素所造成的部分和由抽样误差所造成的部分,通过比较来自于不同部分的变异,借助F分布作出统计推断。后人又将线性模型的思想引入方差分析,为这一方法提供了近乎无穷的发展空间。,方差分析入门,总变异 随机变异 处理因素导致的变异,总变异 组内变异 组间变异,SS总 SS组内 SS组间,这样,我们就可以采用一定的方法来比较组内变异和组间变异的大小,如果后者远远大于前者,则说明处理因素的确存在,如果两者相差无几,则说明该影响不存在,以上即方差分析的基本思想。,方差分析入门,方差
4、分析的原假设和备择假设为:H0:12=kH1:k个总体均数不同或者不全相同,方差分析入门,独立性(independence)观察对象是所研究因素的各个水平下的独立随机抽样 正态性(normality)每个水平下的应变量应当服从正态分布 方差齐性(homoscedascity)各水平下的总体具有相同的方差。但实际上,只要最大/最小 方差小于3,分析结果都是稳定的,应用条件,有时原始资料不满足方差分析的要求,除了求助于非参数检验方法外,也可以考虑变量变换。常用的变量变换方法有:,对数转换:用于服从对数正态分布的资料等;平方根转换:可用于服从Possion分布的资料等;平方根反正弦转换:可用于原始资
5、料为率,且取值广泛的资料;其它:平方变换、倒数变换等。,应用条件,例1 为了研究烫伤后不同时间切痂对大鼠肝脏三磷酸腺苷(ATP)的影响,将30只雄性大鼠随机等分成三组,每组10只:A组为烫伤对照组、B组为烫伤后24小时切 痂组,C组为烫伤后96小时切 痂组。全部大鼠在烫伤168小时候处死并测量其肝脏ATP含量,数据见数据文件F1.sav,试检验3组大鼠肝脏ATP总体均数是否不同?,单因素方差分析,分析:对于单因素方差分析,其资料在SPSS中的数据结构应当由两列数据构成,其中一列是观察指标的变量值,另一列是用以表示分组变量。实际上,几乎所有的统计分析软件,包括SAS,STATA等,都要求方差分析
6、采用这种数据输入形式,这一点也暗示了方差分析与线性模型间千丝万缕的联系。,单因素方差分析,预分析(重要):检验其应用条件,单因素方差分析,选择data 中的split file,出现如下对话框:,单因素方差分析,正态性检验 A 单击AnalyzeNonparametric 1-Sample K-S,单因素方差分析,单因素方差分析,这里仅取其中一组结果,表明该资料符合分组正态性的条件。,使用Explore菜单,B,带检验的正态图,AnalyzeDescriptive StatisticsExplore将分析的变量导入Dependent List变量列表中将分组变量导入Factor List框中单
7、击Plot按钮选中Normality plots with test,并取消其他勾选continueOK,单因素方差分析,注意分组检验正态性后,要先回到data菜单下的split file,如下操作取消拆分后才能进行后续的方差分析:,单因素方差分析,单因素方差分析,选入分组变量,选入因变量,给出各组间样本均数的折线图,指定进行方差齐性检验,单因素方差分析,结果分析,单因素方差分析,(1)方差齐性检验,Levene方法检验统计量为1.333,其P值为0.281,可认为样本所来自的总体满足方差齐性的要求。,单因素方差分析,结果分析,(2)方差分析表,第1列为变异来源,第2、3、4列分别为离均差平方
8、和、自由度、均方,检验统计量F值为15.767,P0.001,组间均数差别统计学意义,可认为各组的ATP不同或不完全相同。,变异来源,单因素方差分析,结果分析,(3)各组样本均数折线图,Means plots 选项给出,更直观。注意:当分组变量体现出顺序的趋势时,绘制这种折线图可以提示我们选择正确的趋势分析模型。,通过以上分析得到了拒绝H0的结论,但实际上单因素方差分析并不这样简单。在解决实际问题时,往往仍需要回答多个均数间到底是哪些存在差异。虽然结论提示不同组别个体的ATP量不同,但研究者并不知道到底是三者之间均有差别,还是某一组与其他两组有差别。这就应当通过两两比较(多重比较)进行考察。,
9、均数两两比较方法,直接校正检验水准(相对粗糙)专用的两两比较方法:对比(Planned Comparisons)事后检验:非计划的多重比较(PostHoc Comparisons),均数两两比较方法,Contrasts按钮对某因素个水平均数的变动趋势进行比较,Post Hoc按钮,点击单因素方差分析主对话框中的Post Hoc按钮,总共有14种两两比较的方法,如下:,均数两两比较方法,LSD法:最灵敏,会犯假阳性错误;Sidak法:比LSD法保守;Bonferroni法:比Sidak法更为保守一些;Scheffe法:多用于进行比较的两组间样本含量不等时;Dunnet法:常用于多个试验组与一个对
10、照组的比较;S-N-K法:寻找同质亚组的方法;Turkey法:最迟钝,要求各组样本含量相同;Duncan法:与Sidak法类似。,均数两两比较方法,仍以例1为例,LSD法的输出格式:,均数两两比较方法,结果分析,仍以例1为例,SNK法的输出格式:,结果分析,均数两两比较方法,该方法的目的是寻找同质子集,故各组在表格的纵向上,均数按大小排序,然后根据多重比较的结果将所有的组分为若干个子集,子集间有差别,子集内均数无差别。,例4-4 某研究者采用随机区组设计进行实验,比较三种抗癌药物对小白鼠肉瘤抑瘤效果,先将15只染有肉瘤小白鼠按体重大小配成5个区组,每个区组内3只小白鼠随机接受三种抗癌药物(具体
11、分配结果见例4-3),以肉瘤的重量为指标,试验结果见表4-9。问三种不同的药物的抑瘤效果有无差别?表4-9 不同药物作用后小白鼠肉瘤重量(g),随机区组设计的方差分析,随机区组设计的方差分析,单因素方差分析所针对的是多组均数间的比较,其基本思想是变异分解,即将总变异分解为组间变异和组内变异,再利用F分布做出有关的统计推断。单因素方差分析要求资料满足正态性、独立性和方差齐性的条件。方差分析拒绝H0只能说明各组之间存在差异,但不足以说明各组之间的关系。利用多重比较可以初步判断各组间的关系。,小 结,非参数检验,两个独立样本的非参数检验(等级资料)多个独立样本的非参数检验(等级资料)两个配对样本的非
12、参数检验多个相关样本的非参数检验,内容提要,非参数检验,参数统计方法往往假设统计总体的分布形态已知,但是在更多的实际场合,常常由于缺乏足够信息,无法合理地去假设一个总体具有某种分布形式,此时就不能使用相应的参数方法了。因此,应该放弃对总体分布参数的依赖,转而寻求更多的纯粹来自数据的信息,这就是非参数统计方法。,非参数检验,和参数方法相比,非参数检验方法的优势如下,稳健性。因为对总体分布的约束条件大大放宽,不至于因为对统计中的假设过分理想化而无法切合实际情况,从而对个别偏离较大的数据不至于太敏感。对数据的测量尺度无约束,对数据的要求也不严格,什么数据类型都可以做。适合于小样本、无分布样本、数据污
13、染样本、混杂样本等。,非参数检验,例1 以下为治疗前后,病人某项指标的测量值,数据见npa.sav,治疗前(x):24.00 16.70 21.60 23.70 37.50 31.40 14.90 37.30 17.90 15.50 29.00 19.90,治疗后(Y):23.10 20.40 17.70 20.70 42.1 36.10 21.80 40.30 26.00 15.50 35.40 25.50,配对样本的非参数检验,配对样本的非参数检验,Wilcoxon符号检验 适用于连续变量 sign符号检验 适用于对无法用数字计量的情况进行比较,如两分类,对于 连续资料最好不要使用 McN
14、emar 实际上就是常用的配对2检验,只适用于二分类资料 Marginal Homogeneity 是McNemar法向多分类情形下的扩展,适用于资料为有序 分类情况,配对样本的非参数检验,共12对指标,指标值治疗后小于治疗前的有3对,其平均秩次为2.83,总秩和为8.50;治疗后大于治疗前的有8对,其平均秩次为7.19,总秩和为57.50;治疗后等于治疗前的有1对。,分析结果,(1)秩次表,配对样本的非参数检验,Wilcoxon符号秩检验的统计量Z值-2.179,近似概率(Asymp.sig.)P0.029,按0.05的水准可以认为治疗前后该指标值的差别具有统计学意义。,分析结果,(2)检验
15、统计量,配对样本的非参数检验,例4 三批甘蓝叶样本分别在甲、乙、丙、丁四种条件下测量核黄素浓度,试验结果如下。问四种条件下的测量结果的差异是否具有统计学意义?数据见npd.sav:,多个相关样本的非参数检验,多个相关样本的非参数检验,Friedman:常用的多个配伍样本的非参数检验,Kendalls W:可进一步给出一致性程度,Cochrans Q:是两配对样本McNemar方法的推广,只适合二分类变量,多个相关样本的非参数检验,分析结果,(1)秩次表,经Friedman Test,近似概率(Asymp.sig.)P0.042,小于0.05,故拒绝原假设,认为四种条件下测量结果的差别具有统计学
16、意义的。,(2)检验统计量,多个相关样本的非参数检验,例2 在缺氧条件下,观察4只猫与12只兔的生存时间(分钟),结果如下。试判断猫、兔在缺氧条件下生存时间的差异是否具有统计学意义。数据见npb.sav:,生存时间(猫):25 34 44 46 46,生存时间(兔):15 15 16 17 19 21 21 23 25 27 28 28 30 35,两独立样本的非参数检验,两独立样本的非参数检验,两独立样本的非参数检验,两独立样本的非参数检验,默认的Mann-Whitney U检验最常用,两独立样本的非参数检验,生存时间样本共19例,其中猫的生存时间5例,其平均秩次为15.70,总秩和为78.
17、50;兔的生存时间14例,其平均秩次为7.96,总秩和为111.50。,(1)秩次表,两独立样本的非参数检验,给出Mann-Whitney U、Wilcoxon W 统计量和Z值,近似值概率(Asymp.Sig)和精确概率值(Exact.sig)均小于0.05,结论一致,表明猫、兔在缺氧条件下的生存时间的差异具有统计学意义,由平均秩次猫(15.7)、兔(7.96)来看,可以认为缺氧条件下猫的生存时间长于兔。,分析结果,两独立样本的非参数检验,(2)检验统计量,两组有序分类资料的秩和检验例9-4(P177),两组有序分类资料的秩和检验,两组有序分类资料的秩和检验,两组有序分类资料的秩和检验,例3
18、 14名新生儿出生体重按其母亲的吸烟习惯分组(A组:每日吸烟多于20支;B组:每日吸烟少于20支;C组:过去吸烟而现已戒烟;D组:从不吸烟),具体如下。试问四个吸烟组出生体重分布是否相同?数据见npc.sav:,A组:2.7 2.4 2.2 3.4,B组:2.9 3.2 3.2,C组:3.3 3.6 3.4 3.4,多个独立样本的非参数检验,D组:3.5 3.6 3.7,多个独立样本的非参数检验,多个独立样本的非参数检验,设置组别变量的最小值1、最大值4,多个独立样本的非参数检验,多个独立样本的非参数检验,Kruskal-Wallis H检验:k=3个独立随机连续分布样本的比较,而正态性假设及
19、等方差假设存在问题时,它可以进行总体是否相同的检验。(不依赖总体分布),Median:中位数检验,检验多个样本是否来自具有相同中位数总体,在三种方法中检验效能最低,,Jonckheere-Terpstra:对连续性资料或有序分类资料都适用,并当分组变量为有序分类资料时(即双向有序资料),此法的检验效能要高于Kruskal-Wallis法。,多个独立样本的非参数检验,母亲每日吸烟多于20支组共4名新生儿,体重平均秩次3.75;每日吸烟少于20支组共3名新生儿,体重平均秩次5.00;过去吸烟现已戒烟组共4名新生儿,体重平均秩次9.38;从不吸烟组共3名新生儿,平均秩次12.50。,分析结果,多个独立样本的非参数检验,(1)秩次表,Kruskal-Wallis H统计量的近似显著概率为0.023,按0.05的水准拒绝原假设,可认为四个组中至少有两组出生体重的总体分布不同。,分析结果,(2)检验统计量,多个独立样本的非参数检验,多组有序变量资料的秩和检验例9-6(P180)比较甲乙丙三种方法的治疗效果(无效、好转、显效、痊愈),多组有序变量资料的秩和检验,多组有序变量资料的秩和检验,多组有序变量资料的秩和检验,