方差分析与秩和检验.ppt

上传人:小飞机 文档编号:6136849 上传时间:2023-09-27 格式:PPT 页数:75 大小:774KB
返回 下载 相关 举报
方差分析与秩和检验.ppt_第1页
第1页 / 共75页
方差分析与秩和检验.ppt_第2页
第2页 / 共75页
方差分析与秩和检验.ppt_第3页
第3页 / 共75页
方差分析与秩和检验.ppt_第4页
第4页 / 共75页
方差分析与秩和检验.ppt_第5页
第5页 / 共75页
点击查看更多>>
资源描述

《方差分析与秩和检验.ppt》由会员分享,可在线阅读,更多相关《方差分析与秩和检验.ppt(75页珍藏版)》请在三一办公上搜索。

1、方差分析与秩和检验,第五讲,两两比较次数同类指标数(数量越多)亚组分析与期中分析,方差分析(analysis of variance)ANOVA基本思想,根据资料的设计类型,即变异的不同来源,将全部观察值总的离均差平方和以及自由度分解为两个或多个部分,每个部分的变异与自由度组成均方(MS),均方比值(统计量)服从F分布,由此做出统计推断,从而了解各因素对观察指标影响有无统计学意义。,第一部分 方差分析Analysis Of Variance(ANOVA),R Fisher(1890-1962)在20世纪30年代发表以F分布为基础的用于多组计量资料均数比较假设检验-方差分析,有时又被称为变异分析

2、或 F检验等。,R A Fisher,the founder of statistical inference,working on amechanical calculator,Within group variance is large compared to variability between means.Unclear separation of means.,x,y,-4,-3,-2,-1,0,1,2,3,4,F统计量的抽样分布,方差分析的理论基础:F分布,F分布是方差分析的基础,通过F分布确定P值F分布也是一簇连续性分布,分布类型与第一、二自由度有关。当第一、二自由度固定时,F

3、值越大,其对应的P值越小;反之亦然。,方差分析的概述,方差分析核心是变异的分解:将所有观察值之间的变异分解成几部分,每一部分均反映了特定的内容(如某因素的作用、交互作用)通过变异间的相互比较,并构建统计量F值,基于F分布,计算P值。方差分析的用途很广,按照设计类型又可细为很多亚型。,方差分析的主要设计类型,成组设计(完全随机设计):单因素多组配伍设计:研究因素/配伍因素多组交叉设计:多个因素析因设计:两因素及其交互作用拉丁方设计:正交试验设计:多因素,多水平。,方差分析主要用途,推断两个及以上总体均数有无区别;分析两个或多个因素主效应及其交互作用回归方程的线性假设检验。,一、成组设计资料的方差

4、分析(实例分析),例1、某医院对31名石棉矿工中的石棉肺患者、可疑患者、非患者进行了用力肺活量测定,结果见下,问三组石棉矿工的用力肺活量有无差别?,表1 三组石棉矿工的用力肺活量 石棉肺患者 可疑患者 非患者 1.8 2.3 2.9 1.4 2.1 3.2 1.5 2.1 2.7 2.1 2.1 2.8 1.9 2.6 2.7 1.7 2.5 3.0 1.8 2.3 3.4 1.9 2.4 3.0 1.8 2.4 3.4 1.8 3.3 2.0 3.5均数 1.79 2.31 3.4 2.51(合)例数 11 9 11,1、成组设计方差分析的变异分解,总变异=组间变异+组内变异,(1.79-2

5、.51)+(1.8-1.79),(1.8-2.51)=,表1 三组石棉矿工的用力肺活量 石棉肺患者 可疑患者 非患者 1.8 2.3 2.9 1.4 2.1 3.2 1.5 2.1 2.7 2.1 2.1 2.8 1.9 2.6 2.7 1.7 2.5 3.0 1.8 2.3 3.4 1.9 2.4 3.0 1.8 2.4 3.4 1.8 3.3 2.0 3.5均数 1.79 2.31 3.4 2.51(合)例数 11 9 11第一组第一例变异(1.8-1.79)+(1.79-2.51),总变异,31名矿工的用力肺活量的测试值大小不等,这种变异称为总变异。其大小SS总=(Xij-X)2,即每个

6、观察值与总均数X 的离均差平均和。,组内变异,每个组内的个体测量值也大小不等,这种变异称为组内变异(SS组内),反映了随机误差的大小。SS组内(Xij-Xi)2,因SS组内与样本例数有关,为排除其影响,用组内均方代替:组内SS组内(N-K),组间变异,三组间的均数大小不等,称为组间变异(SS组间),反映了干预效应与随机误差SS组间ni(Xi-X)2,为排除组数多少的影响,用组间均方代替:组间SS组间(K)。变异的分解:SS总SS组间SS组内自由度的分解:总组间组内,组间变异(MS组间)/组内变异(MS组内)=F组数减1为第一自由度,合并例数减组数为第二自由度.根据F统计量与一、二自由度确定F分

7、布,计算P值.,2、方差分析过程,变异原因 变异 统计量,3、假设检验的步骤,建立假设:H0:三组矿工用力肺活量的总体均数相等,H1:三组矿工用力肺活量的总体均数不等或不全等 12=3,1=23,1=3 2,123=0.05构筑统计量:F=组间变异/组内变异=组间组内,确定 P 值:假设无效假设成立的情况下,干预无效应,即组间与组内接近,则值接近于,在附近出现的机率多,而出现较大值的机率小,当值大到一定界值时,根据小概率事件原则,就有理由认为无效假设不成立,从而拒绝0,而接受H1。,表2 方差分析结果,变异来源 SS 总 10.8 30 组间 9.266 2 4.633 84.54 0.01组

8、内 1.534 28 0.0548,按照=0.05的水准,拒绝H0,接受H1,可认为三组矿工的用力肺活量不同。,SPSS分析结果,4、方差分析及两两比较,方差分析只能表明三组工人的用力肺活量的总体均数有差别,还不能说明任何两组间是否有差别,还需做两两比较检验。;两两比较:任两个均数比较以及多个实验组与一个对照组比较两个类型。计算组间比较的均数差值及95%可信区间。,5、两两比较与95%可信区间,效应量及其95%可信区间,5、成组设计的方差分析资料特点,本例资料为成组设计的单因素计量资料,进行多组均数间比较。,总变异,组间变异,组内变异,6、方差分析的应用条件,各样本来自正态总体:中等程度、大样

9、本方差齐性:最好是例数相等,敏感(变量变换、修剪)各样本为相互独立的随机样本(独立性,代表性)基线均衡性与效应可加性,二、配伍设计多个样本均数比较,1、资料特点分析,是配对设计的扩展。具体做法是:先按影响试验结果的非处理因素(如性别、体重、年龄、职业、病情、病程等)将受试对象配成区组(block),再分别将各区组内的受试对象随机分配到各处理或对照组。,1、资料特点分析,研究因素有两个:A:药物因素-不同药物组的重量是否 有差别?B:个体变异因素-不同个体间重量有否差 别?方差分析变异的分解:SS总SS组间SS配伍 SS组内,总组间配伍 组内,2、变异的分解,总变异,组间变异,组内变异,配伍变异

10、,3、方差分析过程,建立假设:假设1:药物因素0:三种药物作用后的肉瘤重量总体均数相等,H1:三种药物作用后肉瘤重量总体均数不等或不全等=0.05 假设2:个体变异因素0:5个区组重量的总体均数相等 H1:5个区组重量的均数不等或不全等=0.05,确定P值和做出结论,以1=2,2=8,查F界值表,得P0.05,按照=0.05的水准,拒绝0,而接受H1,可认为不同药物的肿瘤重量不同。以1=4,2=8,查F界值表,得P0.05,按照=0.05的水准,拒绝0,而接受H1,可认为不同区组的重量不同。,两两比较及计算效应量的95%可信区间,药物因素(不同药物):两两比较的q检验及其均数差值的95%可信区

11、间。,两两比较及计算效应量的95%可信区间,个体变异因素两两比较的q检验,以及计算均数差值的95%可信区间。?,4、设计方案与检验效能的关系,成组设计与配伍设计的区别在于后者考虑了个体变异因素,使检验效能增加。配伍设计:总变异=药物变异+个体(配伍)变异+组内变异 成组设计:总变异=药物变异+(个体变异+组内变异)设计阶段不能控制个体变异,可以测量后在分析阶段使用协方差分析。,组内变异,三、析因设计的方差分析,表4 家兔神经缝合后的轴突通过率(%),比较不同缝合方法及缝合后时间对轴突通过率的影响。,B因素(时间2水平)缝合后1月 缝合后2月,2因素2水平析因试验示意图,A因素(缝合2水平)外膜

12、缝合 束膜缝合,组1:24 组2:44 组3:28 组4:52,1.A、B因素主效应,2.交互作用:当某因素的各个单独效应随另一因素变化而变化时,则称这两个因素间存在交互作用(interaction)。,图2 两因素交互作用示意图,表5 家兔神经缝合后的轴突通过率(%),方差分析,表6 析因试验结果方差分析表,结论:尚不能认为两种缝合方法对神经轴突通过率有影响;可以认为缝合后2月与1月相比,神经轴突通过率提高。鉴于析因设计需要样本量大且组间例数相等,用于临床试验不宜实现。,3、变异的分解,总变异,组间变异,组内变异,A,B,AB,四、交叉试验设计的方差分析,1、资料特点,交叉设计能均衡试验顺序

13、的影响,同时把处理效应和时间先后顺序的效应区分开。前后处理间有一洗脱期;适用于慢性并需要长期维持治疗的疾病。总变异可以分成四部分,即个体间变异,阶段间变异,处理间变异和误差变异。SS总SS处理SS阶段SS个体+SS误差,总处理阶段个体误差,例4 假定有12名高血压病人,要研究A B两种治疗方案的疗效差别.用随机的方法让其6名病人先以A法治疗,后用B法治疗,另外6名病人先以B法治疗,后用A法治疗,分别记录了如下的结果:,表7 12名病人用不同方法治疗血压的下降值,阶段 病人的编号 阶段合计 疗法合计 1 2 3 9 10 11 12 B B A B B B A I 23 10 33 8 17 2

14、6 18 240 252 A A B A A A BII 21 11 28 11 14 26 13 216 204个体合计 44 21 61 19 31 52 31 456 456,2、交叉试验变异的分解,总变异,处理间变异,阶段间变异,个体间变异,组内变异,表8 交叉设计方差分析结果,变异来源 SS MS FP处理 96 1 96 4.57 0.05阶段 24 1 24 1.14 0.05个体 1008 11 91.36 4.36 0.05误差 210 10 21 总变异 1338 23 从结果来看:只有个体间的差异有统计学意义,不同治疗方案,不同阶段均无统计学意义。,六、方差分析的误用,例

15、5 为观察764-3(丹参的有效成分)对低氧性肺动脉高压及右心室肥厚等是否有保护作用进行了如下试验:取180-220G雄性大鼠141只,随机分成三组:即正常组,单纯低氧组,764-3处理低氧组每组再分成2个小组,分别于3天,21天时处死大鼠,测量相关指标的数值。,表9 764-3对低氧所致右心室收缩压变化的影响,组别 收缩压(xSE)3天 21天对照 3.060.12 3.020.12单纯低氧 3.370.12*3.850.12*764-3+低氧 3.350.15 3.330.09*注:原作者采用t检验分析资料,得:与对照组比,p0.05,*P0.01,与单纯低氧组比p0.05。存在的问题?,

16、七、方差分析的小结,方差分析的目的是推断多个总体均数间有无差别:不能检验那些有差别、那些无差别;不能说明差别的显著程度;需通过两两比较,计算效应量及其95%可信区间;两两比较不同于多个t检验比较.,两两比较的方法优选事先设置比较:检验水准校正法Bonferroni(或Dunns)多重比较过程(次数较少)界值扩大因子(与比较次数及自由度有关)ANOVA后Post hoc两两比较非成对比较(Scheff过程)任意两对均数比较(Tukey HSD,SNK)多组干预与对照组比较(Dunnett)建议不要使用:LSD Duncan,根据设计类型选择具体方差分析方法.设计方案决定检验效能的大小成组设计;配

17、伍设计;交叉设计;析因设计;拉丁方设计;正交设计,方差分析要求:基本条件:资料的正态性、方差齐性、独立性其中对方差齐性要求最高,采用Levene检验若方差不齐,变量变换(四种),否则秩和检验额外条件:均衡性、效应可加性;,考察各组均数与方差的关系,变量变换的参考依据,第二部分 秩和检验,参数统计:总体分布类型已知,对总体参数进行估计或检验。非参数统计:总体分布类型未知或已知分布类型与其应用条件不符,并非是参数间的比较,而是用于分布间的比较。,一、“应用条件”,优:非参数检验不受总体分布的限定,且对等级资料、不能被准确测量的资料、有不确定值的资料等均可进行。劣:与参数检验相比,检验效能降低。根据

18、不同的资料特点与设计类型选用不同秩和检验方法。,二、秩和检验,配对设计数值变量资料的秩和检验(Wilcoxon配对法,1945)例6 某研究者对病人治疗前后的生存质量进行了测量,资料见下,问病人生存质量治疗前后有无变化?,表8 病人治疗前后的生存质量评分,病人编号 治疗前 治疗后 评分差值 秩次1 7 10 3+9 2 7 9 2+6 3 7 7 0 4 6 7 1+3 5 7 10 3+9 6 7 6-1-3 7 8 9 1+3 8 2 6 4+11 9 9 8-1-3 10 6 9 3+9 11 4 6 2+7 12 6 6 0 13 6 7 1+3,秩和检验的基本步骤,建立假设:0:生存

19、质量差值的总体中位数Md=0 H1:Md 0=0.05计算差值并编秩:依差值的绝对值从小到大编秩,再根据差值的正负给秩次冠以正负号;差值为0时不编秩;差值相等符号相同仍按顺序编秩;差值相等符号不同取平均秩次。求秩和并确定检验统计量:分别计算正、负秩次之和,任取其一为T。确定P值和做出推断结论:当n50时,超出T界值表范围,采用正态近似法。,成组设计两样本比较的秩和检验(Wilcoxon两样本比较法),例7 某实验室观察局部温热治疗小鼠移植性肿瘤的疗效,以生存日数作为观察指标,实验结果见下表,试检验两组小鼠生存日数有无差别?,表9 两组小鼠发癌后生存天数,实验组 对照组生存天数 秩次 生存天数

20、秩次 10 9.5 2 1 12 12.5 3 2 15 15 4 3 15 16 5 4 16 17 6 5 17 18 7 6 18 19 8 7 20 20 9 8 23 21 10 9.5 90以上 22 11 11 12 12.5 13 14,资料特点与基本步骤,两组比较成组设计资料,存在截尾值。基本步骤:1:建立假设:0:两组小鼠生存天数总体分布相同 H1:两组小鼠生存天数总体分布不同=0.05 2:编秩及计算秩和:将两组数据由小到大统一编秩。原始数据相同时,若相同数据在同一组按顺序编秩;若相同数据在不同组时,取平均秩次。当两组样本例数不等时,以样本例数较小者的秩和为T;当例数相等

21、时,任取其中一个秩和为T。3:确定P值和做出推断结论:当n111,n2-n111时,查T界值表,T分布同上;当样本量较大超出T界值表范围时,采用正态近似法。,多组比较的秩和检验,1、多组成组设计的秩和检验及两两比较Kruskal-Wallis检验两两比较采用Wilcoxon两组比较秩和检验+2、配伍设计的秩和检验及两两比较Friedman秩和检验两两比较符号秩和检验+自由度校正,实例分析,表11 恶性滋养细胞肿瘤患者灌注治疗前后hcG值(pmol/L)病例号 疗前值(X1)疗后值(X2)lgX1 lgX2 1 1280000 210000 6.1072 5.3222 2 75500 3300

22、4.8779 3.5185 3 12450 2210 4.0952 3.3444 4 1500000 9.3 6.1761 0.9685 5 10000 2500 4.0000 3.3979 6 9700 1203 3.9868 3.0803 7 15588 4825 4.1928 3.6835 8 4223 914 3.6256 2.9609 原文注:由于本组数据相差较大,故取其对数使之满足正态条件,经t检验得P0.05。差错分析及处理?,四、秩和检验的注意事项,因秩和检验的检验效能较低,当P0.05时,结果解释应慎重,在符合参数检验的条件下,尽可能采用参数检验。对于频数表资料,相同秩次较多,结果需要校正应考虑样本含量的大小,当样本含量较大时(n30),可按正态近似法处理。一般统计分析软件,能直接计算P值,不需要查表.,参数统计和非参数统计优缺点,参数统计(t,F检验)优点:对资料的分析利用充分统计分析的效率高缺点:对资料的要求高适用范围有限,非参数统计(秩和检验)优点:对资料的没有特殊要求不受分布的影响(偏态、分布不明的资料)不受方差齐性的限制不受变量类型的影响不受样本量的影响缺点:检验效率低(易犯型错误)对信息的利用不充分。,单因素的方差分析,例4-2,双因素的方差分析,配伍设计的方差分析,例4-4,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号