多重均值比较与方差分析前提假设的检验ppt课件.ppt

上传人:小飞机 文档编号:1901088 上传时间:2022-12-24 格式:PPT 页数:43 大小:1.11MB
返回 下载 相关 举报
多重均值比较与方差分析前提假设的检验ppt课件.ppt_第1页
第1页 / 共43页
多重均值比较与方差分析前提假设的检验ppt课件.ppt_第2页
第2页 / 共43页
多重均值比较与方差分析前提假设的检验ppt课件.ppt_第3页
第3页 / 共43页
多重均值比较与方差分析前提假设的检验ppt课件.ppt_第4页
第4页 / 共43页
多重均值比较与方差分析前提假设的检验ppt课件.ppt_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《多重均值比较与方差分析前提假设的检验ppt课件.ppt》由会员分享,可在线阅读,更多相关《多重均值比较与方差分析前提假设的检验ppt课件.ppt(43页珍藏版)》请在三一办公上搜索。

1、2022/12/24,1,学习目标,掌握单因素方差分析的方法及应用;初步了解多重均值比较方法的应用;,2022/12/24,2,失业保险案例:为什么要进行方差分析?,为了减小失业保险支出、促进就业,政府试图为失业者提供再就业奖励:如果失业者可以在限定的时间内重新就业,他将可以获得一定数额的奖金。政策会有效吗?,2022/12/24,3,试验数据,2022/12/24,4,要研究的问题,总体1,1(奖金=1),总体2,2 (奖金=2),总体3,3(奖金=3),总体4,4(奖金=4),2022/12/24,5,各个总体的均值相等吗?,2022/12/24,6,失业保险案例:实验结果,1=无奖金 2

2、=低奖金 3=中奖金 4=高奖金。根据实验结果,可以认为各总体的平均失业时间相同吗?,2022/12/24,7,研究方法:两样本的t检验?,如果采用t检验法对多个总体均值进行差异显著性检验 ,会出现如下问题:全部检验过程烦琐,做法不经济 无统一的总体方差估计 ,检验的精度降低犯第一类错误的概率增大,检验的可靠性降低,2022/12/24,8,思考,7岁儿童的平均身高为102,现测得某班12名7岁儿童身高分别为:97、99、103、100、104、97、105、110、99、98、103、99请问该班儿童身高与平均水平是否存在差异?,2022/12/24,9,方差分析可以用来比较多个均值,方差分

3、析(Analysis of variance,ANOVA)的主要目的是通过对方差的比较来同时检验多个均值之间差异的显著性。可以看作t检验的扩展,只比较两个均值时与t检验等价。20世纪20年代由英国统计学家费喧(R. A. Fisher)最早提出的,开始应用于生物和农业田间试验,以后在许多学科中得到了广泛应用。,2022/12/24,10,ANOVA (analysis of variance),由于方差分析法是通过比较有关方差的大小而得到结论的,所以在统计中,常常把运用方差分析法的活动称为方差分析。方差分析的内容很广泛,既涉及到实验设计的模式,又关乎数据分析模型中因素效应的性质。本章在完全随机

4、试验设计下,讨论固定效应模型方差分析的基本原理与方法,重点介绍单因素方差分析。,2022/12/24,11,方差分析中的基本假设,(1)在各个总体中因变量都服从正态分布;(2)在各个总体中因变量的方差都相等;(3)各个观测值之间是相互独立的。,2022/12/24,12,同一试验条件下的数据变异-随机因素影响不同试验条件下,试验数据变异-随机因素和可能存在的系统性因素即试验因素共同影响,试验数据变异原因(误差来源)分析,2022/12/24,13,实验数据误差类型,随机误差因素的同一水平(总体)下,样本各观察值之间的差异比如,同一奖金水平下不同不同人的失业时间是不同的这种差异可以看成是随机因素

5、影响的结果,称为随机误差 系统误差因素的不同水平(不同总体)下,各观察值之间的差异比如,不同奖金水平之间的失业时间之间的差异这种差异可能是由于抽样的随机性所造成的,也可能是由于奖金本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差,2022/12/24,14,方差分析的实质与分析目的,方差分析的实质:观测值变异原因的数量分析。方差分析的目的:系统中是否存在显著性影响因素,2022/12/24,15,单因素方差分析模型(1),单因素方差分析: 模型中有一个自变量(因素)和一个因变量。在失业保险实验中,假设张三在高奖金组,则张三的失业时间=高奖金组的平均失业时间 + 随机因素带来的影

6、响=总平均失业时间 +高奖金组平均值与总平均值之差 + 随机因素带来的影响,2022/12/24,16,单因素方差分析模型(2),2022/12/24,17,总变差(离差平方和)的分解,数据的误差用离差平方和(sum of squares)描述。组内离差平方和(within groups)因素的同一水平(同一个总体)下样本数据的变异比如,同一奖金水平下失业时间的差异组内离差平方和只包含随机误差组间离差平方和(between groups)因素的不同水平(不同总体)下各样本之间的变异比如,四个奖金水平之间失业时间的差异组间离差平方和既包括随机误差,也包括系统误差,2022/12/24,18,总变

7、差(离差平方和)分解的图示,组间变异,总变异,组内变异,2022/12/24,19,2022/12/24,20,离差平方和的自由度与均方,三个平方和的自由度分别是SST 的自由度为nk-1,nk为全部观察值的个数SSA的自由度为k-1,其中k为因素水平的个数SSE 的自由度为nk-k各离差平方和的大小与观察值的多少有关,为了消除观察值多少对离差平方和大小的影响,需要将其平均,这就是均方,也称为方差。均方的计算方法是用离差平方和除以相应的自由度。,2022/12/24,21,2022/12/24,22,F比值,如果因素A的不同水平对结果没有影响,那么在组间方差中只包含有随机误差,两个方差的比值会

8、接近1如果不同水平对结果有影响,组间方差就会大于组内方差,组间方差与组内方差的比值就会大于1当这个比值大到某种程度时,就可以说不同水平之间存在显著差异,或者说因素A对结果有显著影响。,2022/12/24,23,F比的分布,F 分布曲线,2022/12/24,24,F分布与拒绝域,2022/12/24,25,方差分析的基本思想,将k个水平(处理)的观测值作为一个整体看待,利用方差的可分解性,把观测值总变异的离差平方和及自由度分解为相应于不同变异来源的离差平方和及自由度,进而获得不同变异来源总体方差估计值;通过计算这些总体方差估计值的适当比值,即F比值,并以此比值的大小来判断各样本所属总体平均数

9、是否相等。目的是检查所讨论因素是否作为系统性因素来影响试验结果。,2022/12/24,26,思考题,有三台机器生产规格相同的铝合金薄板,为检验三台机器生产薄板的厚度是否相同,随机从每台机器生产的薄板中各抽取了5个样品,测得结果如下:机器1:0.236,0.238,0.248,0.245,0.243机器2:0.257,0.253,0.255,0.254,0.261机器3:0.258,0.264,0.259,0.267,0.262问:三台机器生产薄板的厚度是否有显著差异?,2022/12/24,27,思考:有无差异?,某化肥生产商需要检验三种新产品的效果,在同一地区选取3块同样大小的农田进行试验

10、,甲农田中使用甲化肥,在乙农田使用乙化肥,在丙地使用丙化肥,得到6次试验的结果如表2所示,试在0.05的显著性水平下分析甲乙丙化肥的肥效是否存在差异?、,甲504649524848、乙495047474649、丙51 50 49 46 50 50,2022/12/24,28,方差分析检验的步骤,1.检验数据是否符合方差分析的假设条件。2.提出零假设和备择假设:零假设:各总体的均值之间没有显著差异,即备择假设:至少有两个均值不相等,即,2022/12/24,29,方差分析的步骤,3.根据样本计算F统计量的值。,方差分析表,2022/12/24,30,方差分析的步骤,4.确定决策规则并根据实际值与

11、临界值的比较,或者p-值与的比较得出检验结论。 在零假设成立时组间方差与组内方差的比值服从服从自由度为(k-1, nk-k) 的 F 分布,2022/12/24,31,失业保险的例子(1),在失业保险实验中,设显著性水平=0.05,试分析奖金水平对失业时间的影响是否显著 。,2022/12/24,32,失业保险的例子(2),1、根据前面的分析,数据符合方差分析的假设条件。2、提出零假设和备择假设:H0:1234,H1:1、2、3、4 不全相等。,2022/12/24,33,失业保险的例子(3),3、计算F统计量的实际值。手工计算可以按照方差分析表的内容逐步计算。由于计算量大,实际应用中一般要借

12、助于统计软件。下面是Excel计算的方差分析表。,2022/12/24,34,失业保险的例子(4),4、样本的F值为3.04。由于因此我们应拒绝零假设,从而得出奖金水平对再就业时间有显著影响的结论。类似的,由于 ,可以得出同样的结论。,2.9,0.0433,0.05,3.04,2022/12/24,35,例2 热带雨林 (1),各水平下的样本容量不同时单因素方差分析的方法也完全适用,只是公式的形式稍有不同,在使用软件进行分析时几乎看不出这种差别。,一份研究伐木业对热带雨林影响的统计研究报告指出,“环保主义者对于林木采伐、开垦和焚烧导致的热带雨林的破坏几近绝望”。这项研究比较了类似地块上树木的数

13、量,这些地块有的从未采伐过,有的1年前采伐过,有的8年前采伐过。根据数据,采伐对树木数量有显著影响吗?显著性水平=0.05。,2022/12/24,36,例2 热带雨林 (2),1、正态性检验:直方图,2022/12/24,37,例2 热带雨林 (3),同方差性检验:最大值与最小值之比等于33.19 / 4.81=1.34,明显小于4,因此可以认为是等方差的。,2022/12/24,38,例2 热带雨林 (4),2、提出零假设和备择假设零假设:雨林采伐对林木数量没有显著影响(各组均值相等);备择假设:雨林采伐对是有显著影响(各组均值不全相等)。,2022/12/24,39,例2 热带雨林 (5

14、),3、方差分析表4、结论。F值=11.433.32,p-值=0.00020.05,因此检验的结论是采伐对林木数量有显著影响。,2022/12/24,40,思考:是否意味着每两个处理平均数间的差异都显著或极显著 ?,例:测定东北、内蒙古、河北、安徽、贵州5个地区黄鼬冬季针毛的长度,每个地区随机抽取4个样本,测定的结果如表,试比较各地区黄鼬针毛长度差异显著性。,2022/12/24,41,方差分析中的多重比较,在方差分析中,不拒绝零假设H0,表示拒绝总体均数相等的证据不足,分析终止;当零假设H0被拒绝时,我们可以确定至少有两个总体的均值有显著差异。但要进一步检验哪些均值之间有显著差异还需要采用多

15、重比较的方法进行分析。这在方差分析中称为事后检验(Post Hoc test)。 多重比较是同时对各个总体均值进行的两两比较。方法很多,如Fisher最小显著差异(Least Significant Difference,LSD)方法、Tukey的诚实显著差异(HSD)方法或Bonferroni的方法等。这里我们只介绍最小显著差异方法。,2022/12/24,42,用LSD法进行多重比较的步骤,1、提出假设H0: mi = mjH1: mi mj2、计算检验的统计量 3a、 如果 或 则拒绝H0。 3b、计算 的置信区间:如果0包含在该置信区间内则不能拒绝H0,否则拒绝H0。,2022/12/24,43,实例:热带雨林采伐,很多统计软件都可以直接进行多重比较。下表是SPSS对热带雨林例子的输出结果。置信区间5.3114.03,3.2612.68不包括0,差异显著。置信区间-6.043.02包括了0,差异不显著。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号