方差分析解析ppt课件.ppt

上传人:牧羊曲112 文档编号:2121979 上传时间:2023-01-14 格式:PPT 页数:69 大小:1.52MB
返回 下载 相关 举报
方差分析解析ppt课件.ppt_第1页
第1页 / 共69页
方差分析解析ppt课件.ppt_第2页
第2页 / 共69页
方差分析解析ppt课件.ppt_第3页
第3页 / 共69页
方差分析解析ppt课件.ppt_第4页
第4页 / 共69页
方差分析解析ppt课件.ppt_第5页
第5页 / 共69页
点击查看更多>>
资源描述

《方差分析解析ppt课件.ppt》由会员分享,可在线阅读,更多相关《方差分析解析ppt课件.ppt(69页珍藏版)》请在三一办公上搜索。

1、方差分析,Analysis of variance,前一章介绍了两个样本均数比较的假设检验方法,但对于3个、4个、5个均数或更多个的比较,t检验或u检验就无能为力了,或许有人会想起将几个均数两两比较分别得到结论,再将结论综合,其实这种做法是错误的。试想假设检验时通常检验水平取0.05,亦即弃真概率控制在0.05以内,但将3个均数作两两比较,要作三次比较,可靠度成为(1-0.05)3=0.857四均数比较作6次(1-0.05)6=0.735五均数比较作10次(1-0.05)10=0.599六均数比较作15次(1-0.05)15=0.463鉴于以上的原因,对多组均数的比较问题我们采用方差分析(an

2、alysis of variance),简称ANOVA。方差分析采用F检验统计量,也称F检验。,方差分析,F分布,Analysis of Variance(ANOVA)由英国统计学家R.A.Fisher首创,为纪念Fisher,以F命名,故方差分析又称F检验(F test)。用于推断多个总体均数有无差异。方差分析的理论基础是F分布。F分布是一种连续性分布,它是两个相互独立的变量分别除以各自的自由度后的比值,即 在实际应用中,F等于两个方差或两均方之比。,方差分析,F分布,F分布的密度函数,自由度,式中 为-函数在 处的函数值,余仿此。已知,就能绘制出F分布的图形。,F分布,F分布的分布函数和F

3、分布的分位数,1.F分布的分布函数为:,式中 为F分布的密度函数,的几何意义是F分布曲线下从0到某给定F值的面积,如图2(a),2.F分布的分位数 当,确定后,F分布曲线下,右侧尾部的面积为指定 时,横轴上相应的界值F,记做 如图2(b),这就是F分布的分位数,此值有F表可查。做F检验时,先求得观察样本的统计量F值后,按,由界值表可查得P值的大小。F检验一般为双侧检验,但界值表中,只给出了单侧界值,这是因为在F检验中,规定了较大(方差)均方作为分子,较小的作为分母,故F值不会小于1。这样,界值表中只列出单侧值即可。,方差分析,方差分析的基本思想,其基本思想是把全部观察值之间的变异-总变异,按设

4、计和需要分为两个或多个组成部分,然后进行比较,评价由某种因素所引起的变异是否具有统计学意义。,方差分析,方差分析的基本思想,例:用四种不同的饲料喂养大白鼠,每组4只,喂养8周后处死,然后测其肝重占体重的比值(%),见表1。,问:四种不同饲料喂养大白鼠对其肝重比值的影响是否相同?,方差分析,方差分析的基本思想,方差分析,方差分析的基本思想,方差分析,方差分析的基本思想,方差分析,方差分析的基本思想,个数据存在差异(变异)的原因可分为两种:一种是饲料的不同,而引起的各组肝重比值差别;另一种是随机因素(包括个体变异、测量)的作用。16个数据的全部变异又是以两种方式表现出来的:组间变异(可从各组均数之

5、间差异看出来);组内变异:即各组内数值之间的差异。,方差分析,方差分析的基本思想,组间变异:是由不同处理因素(即饲料种类)和随机因素的贡献而得来;组内变异:只是由随机因素所贡献的。若简单地用T来表示不同饲料的作用,用E来表示随机因素的作用(又称误差作用)。在我们计算出,方差分析,方差分析的基本思想,组间变异均方MS组间:,组内变异均方:,用F值来表示这两者的比值:,数理统计上可以证明该比值服从自由度,分布。,方差分析,方差分析的基本思想,(1)当不同饲料的作用并无不同,即T=0时,F值约为1;(2)当不同饲料的作用不同,即T不等于0时,F值会大于1;(3)F值为1或接近于1时,就意味着各饲料的

6、作用差别无统计学意义;(4)当F值明显地大于1时,就意味着各饲料的作用可能是不同的。以上便是方差分析原理的直观理解。,查F界值表后,按所取检验水准作出结论。,方差分析,方差分析的应用条件,方差分析,完全随机设计的单因素方差分析,完全随机设计是采用完全随机化的分组方法,将全部试验对象分配到K个处理组(水平组),各组分别接受相同的处理,试验结束后比较各组均数之间的差别有无统计学意义,推论处理因素的效应。,例:按完全随机设计方法将15名患者随机分为甲,乙,丙3组先按患者的就诊顺序编号;再从附表“随机排列表”中任意指定一行,如第21行,依次将014之间的随机数字录于各患者编号下(遇14以上的数字应舍去

7、);按预先规定,将随机数字为04的患者分入甲组,59的患者分入乙组,1014的患者分入丙组。结果如下:,随机分组的结果是第4、6、8、11、15号患者分入甲组,第3、5、9、12、14号患者分入乙组,第1、2、7、10、13号患者分入丙组。,方差分析,完全随机设计的单因素方差分析,以上述例题为例,说明分析步骤:,方差分析,完全随机设计的单因素方差分析,根据表2下半部分的初步计算结果,然后根据下表中的方差分析用公式计算F值。,方差分析,完全随机设计的单因素方差分析,方差分析,完全随机设计的单因素方差分析,方差分析,完全随机设计的单因素方差分析,方差分析,完全随机设计的单因素方差分析,5.各均数间

8、的两两比较以上方差分析结果差异有显著性,是对各组均数的整体而言,不能推论其中任何两组间差异都有显著性,只能认为至少有两组均数差异有显著性。故需进一步确定哪两个总体均数间有差别,哪两个间没有差别,为此可以用方差分析提供的信息作样本均数间的两两比较,又称多重比较,方法有多种,这里仅介绍q检验法(Newman-kenls法),公式为,式中:为两两比较中的任何两个对比组均数之差值;为差值的标准误,按各处理组的样本含量 是否相等,分别计算为:,相等:,不相等:,式中 为样本例数,分别为第A组和第B组例数,,方差分析,完全随机设计的单因素方差分析,5.各均数间的两两比较,方差分析,完全随机设计的单因素方差

9、分析,5.各均数间的两两比较,方差分析,完全随机设计的单因素方差分析,5.各均数间的两两比较,方差分析,完全随机设计的单因素方差分析,SAS 运行结果,例题:为了解轻度和重度再生障碍性贫血患者血清中可容性CD8抗原水平(U/ml)与正常人的差别有无统计学意义,从这三种人群中分别随机抽取10人,测得CD8抗原水平如下,试对该资料做统计分析。正常组:234 318 402 382 621 408 243 141 42 98轻度组:509 518 555 758 845 712 585 448 753 896重度组:851 562 918 631 653 843 659 849 762 901,方差

10、分析,完全随机设计的单因素方差分析,SAS 运行结果,方差分析,完全随机设计的单因素方差分析,SAS 运行结果,Group=1,Group=2,Group=3,方差分析,完全随机设计的单因素方差分析,SAS 运行结果,方差分析,完全随机设计的单因素方差分析,SAS 运行结果,方差分析,完全随机设计的单因素方差分析,SAS 运行结果,方差分析,完全随机设计的单因素方差分析,SAS 运行结果,方差分析,完全随机设计的单因素方差分析,SAS 运行结果,例题:调查得到健康男子各年龄组淋巴细胞转化率()如下,问各组间淋巴细胞转化率的差异是否有统计学意义?11-20岁:58 61 61 62 63 68

11、70 70 74 7821-60岁:54 57 57 58 60 60 63 64 6661-75岁:43 52 55 56 60,该例与前例相比,数据结构有何特点?,方差分析,完全随机设计的单因素方差分析,SAS 运行结果,方差分析,完全随机设计的单因素方差分析,SAS 运行结果,方差分析,完全随机设计的单因素方差分析,SAS 运行结果,方差分析,完全随机设计的单因素方差分析,SAS 运行结果,方差分析,完全随机设计的单因素方差分析,SAS 运行结果,方差分析,完全随机设计的单因素方差分析,SAS 运行结果,方差分析,配伍组(双因素)设计的多个样本均数间的比较,配伍组设计,又称随机区组设计(

12、randomized block design)是配对设计的扩展。具体做法是:先按影响试验结果的非处理因素(如性别、体重、年龄、职业、病情、病程等)将受试对象配成区组(block),再分别将各区组内的受试对象随机分配到各处理或对照组。,A 接受甲处理实验对象配成区组随机分配区组中 B 接受乙处理 C 接受丙处理 D 接受丁处理,方差分析,配伍组(双因素)设计的多个样本均数间的比较,例 按体重和年龄为配比条件将12只雌性小鼠配成4个区组,试对每个区组内的3只小鼠随机分配,分别给予甲、乙、丙3种饲料。,先给动物编号:第1配伍组为13号,第2配伍组为46号,第3配伍组为79号,第4配伍组为1012号

13、;再从随机排列表中,任意指定连续的4行,如第1215行,每行只取随机数字13,其余舍去,依次列于各配伍组的受试者编号下,并规定随机数字为1的小鼠喂以甲饲料,为2的小鼠喂以乙饲料,为3的小鼠喂以丙饲料。分配结果如下:,方差分析,配伍组(双因素)设计的多个样本均数间的比较,方差分析,配伍组(双因素)设计的多个样本均数间的比较,例2,为了研究雌激素,对子宫发育的作用,以四个种系的未成年雌性大白鼠每窝各3只,每只按一种剂量注射雌激素,经一定时间,取出子宫称重,结果见表7-6。试比较不同剂量及不同种系间的子宫重量有无差别?,方差分析,配伍组(双因素)设计的多个样本均数间的比较,例2,为了研究雌激素,对子

14、宫发育的作用,以四个种系的未成年雌性大白鼠每窝各3只,每只按一种剂量注射雌激素,经一定时间,取出子宫称重,结果见表7-6。试比较不同剂量及不同种系间的子宫重量有无差别?,方差分析,配伍组(双因素)设计的多个样本均数间的比较,方差分析,配伍组(双因素)设计的多个样本均数间的比较,方差分析,配伍组(双因素)设计的多个样本均数间的比较,方差分析,配伍组(双因素)设计的多个样本均数间的比较,方差分析,配伍组(双因素)设计的多个样本均数间的比较,方差分析,配伍组(双因素)设计的多个样本均数间的比较,4.推断结论因处理间和配伍间的p0.01,在=0.05水准上都拒绝H0接受H1,差异有高度显著性。认为注射

15、不同剂量的雌激素对大白鼠子宫发育有影响;大白鼠不同种系间子宫的发育也有差别。,方差分析,配伍组(双因素)设计的多个样本均数间的比较,5.各均数间的两两比较以上方差分析结果差异有显著性,是对各组均数的整体而言,不能推论其中任何两组间差异都有显著性。故需进一步确定哪两个总体均数间有差别,哪两个间没有差别,为此可以用方差分析提供的信息作样本均数间的两两比较,又称多重比较,方法有多种,仍可用前面介绍的q检验法(Newman-kenls法)。,方差分析,配伍组(双因素)设计的多个样本均数间的比较,例题:用4种不同方法治疗8名患者,其血浆凝固时间的资料如下表,试分析影响血浆凝固时间的因素。,方差分析,配伍

16、组(双因素)设计的多个样本均数间的比较,SAS code,方差分析,配伍组(双因素)设计的多个样本均数间的比较,SAS output,方差分析,配伍组(双因素)设计的多个样本均数间的比较,SAS output,方差分析,配伍组(双因素)设计的多个样本均数间的比较,SAS output,方差分析,配伍组(双因素)设计的多个样本均数间的比较,SAS output,方差分析,配伍组(双因素)设计的多个样本均数间的比较,SAS output,方差分析,配伍组(双因素)设计的多个样本均数间的比较,SAS output,注意:本例若对治疗方法的检验不校正个体差异,结果如何?,请看该程序的输出结果.,方差分

17、析,配伍组(双因素)设计的多个样本均数间的比较,SAS output,该输出结果说明什么问题?,方差分析,配伍组(双因素)设计的多个样本均数间的比较,SAS output,该输出结果说明什么问题?,多个方差的齐性检验,1.Bartlett检验法2.Levene等3.最大方差与最小方差之比3,初步认为方差齐同。,方差分析,方差分析的用途,(1)两个或多个样本均数间的比较(2)同时分析多个因素的作用(3)分析因素间的交互作用(4)方差齐性检验(5)回归系数的显著性检验,方差分析,方差分析的注意事项,要求原始数据呈正态分布,但这一要求并不十分严格,因为当比较大(即每一组的样本含量不太小)时,它们的均

18、数仍可看作是正态分布,仍可做方差分析。要求方差齐性,必要时作方差齐性检验。从方差分析的数学原理上讲,在方差分析中要求各种因素的效应是线性可加的。方差分析只能判断是否所有总体均数全相等,要研究某两个或某几个总体均数是否相等,必须做两两比较。有些资料虽然呈偏态或方差不齐,经过适当变量变换后,可达到方差分析的要求,常见变量变换有:对数转换、平方根转换、百分位数反正弦转换、倒数转换等。对于转换后仍达不到方差分析要求的,应做非参数检验。,方差分析,变量变换,它的目的是:(1)使各组达到方差齐;(2)使资料转化为正态分布,以满足方差分析和t检验的应用条件,通常情况下,一种适当的函数转换可以使上述两个目的同

19、时达到。(3)直线化,常用于曲线拟合。(举例),方差分析,对数变换,对数变换常用于:(1)使服从对数正态分布资料正态化。(2)使资料达到方差齐要求,特别是各样本的标准差与均数之比(cv)比较接近时。(3)使指数曲线直线化,用于曲线拟合。,方差分析,变量变换,平方根变换,平方根转换常用于:(1)服从Poisson分布的分类资料或轻度偏态资料的正态化,如放射性物质的计数一般认为是服从Poisson分布,可用平方根变换正态化。(2)当各样本的方差与均数间呈正相关时,即均数大,方差也大,可使资料达到方差齐的要求。,方差分析,变量变换,倒数变换,倒数变换常用于数据两端波动较大的资料,可使极端值的影响减少。,平方根反正弦变换,平方根反正弦变换用于:以率为观察值的偏态分布的正态化。如发病率、感染率、病死率、白细胞的分类计数、淋巴细胞转换率、畸变细胞出现率等。,方差分析,变量变换,Thank you!,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号