《第七章 方差分析基础.ppt》由会员分享,可在线阅读,更多相关《第七章 方差分析基础.ppt(70页珍藏版)》请在三一办公上搜索。
1、第七章 方差分析基础,7.1方差分析的必要性与作用7.2方差分析及基本原理7.3多重比较7.4方差分析的数学模型7.5方差分析的基本假定与数据转换7.6方差分析的类型与分析步骤,7.1方差分析的必要性与作用,一、方差分析的必要性,前面学习了两个样本平均数的假设测验,该法只适用于比较两个试验处理的优劣。用于多个平均数间差异显著性测验,就会表现出如下一些问题:,若进行5个样本平均数的差异显著性比较,则需进行10次两两均数差异显著性测验:H0:1=2,1=3,1=4,1=5;2=3,2=4,2=5;3=4,3=5;4=5.,1多个处理用t测验计算麻烦,因此,当样本平均数的个数k3时,采用上章学习的方
2、法进行差异显著性测验,工作量是相当大的。,两个样本平均数比较采用t测验,=0.05时犯第一类错误的概率为0.05,推断的可靠性为1-=0.95。若对5个处理采用t测验进行比较,=0.05,需进行10次两两比较,每次比较的可靠性为1-=0.95,10次推断的可靠性由0.95降到0.5987,犯第一类错误的概率则由0.05上升0.4013.,2.推断的可靠性降低,犯错误的概率增大,采用t测验法,每次只能利用两组观察值估计试验误差,与利用全部观察值估计的试验误差相比,精确性低,误差的自由度也低,从而使检验的灵敏度也降低,容易掩盖差异的显著性,增大犯第二类错误的可能。,3.误差估计的精确性和检验的灵敏
3、性降低,因此对多个处理平均数进行差异显著性测验,不宜采用t测验,而需采用方差分析法。,1、在单因素试验中,可以分辨出最优的水平。2、在多因素试验中,可以分辨出最 优的水平组合。,二、方差分析的作用,解决多个处理的比较问题,充分利用资料的全部信息,提高分析的精确度。,方差分析的概念:变异原因的数量分析 将试验数据的总变异分解为不同来源的变异,从而评定不同变异来源的相对重要性的一种统计方法。,7.2方差分析及基本原理,设有k个处理,每个处理有n个观察值,则共有nk个观察值,其数据结构和符号如表7.1。,一、数据结构与变异来源的分解,表7.1 K个处理n个观察值的符号表,每一个观察值的线性模型为:,
4、处理间变异i=(i-),处理内变异ij=(xij-i),由此可推知:nk个观察值的总变异可分解为处理间的变异和处理内的变异两部分。,总体符号,表示全试验观测值总体的平均数,二、自由度与平方和的分解,1、总平方和分解 由表7.1可以看出,nk个观察值的变异构成了整个资料的总变异,总变异的平方和即:,(7.1),记 为C(矫正数),SST分解,处理间平方和乃各处理的平均数的变异,即,处理内(误差)平方和乃各组的n个观察值与其相应平均数的离差平方和,即,2.自由度的分解,1、总变异的自由度:dfT=nk-12、处理间的自由度:dft=k-13、整个资料处理内(即误差项)自由度为:dfe=df1+df
5、2+dfk=k(n-1),由上述分析可知,整个资料的变异来源可分为:处理间和处理内两个部分。因此,总平方和=处理间平方和+处理内平方和 SST=SSt+SSe,总自由度=处理间自由度+处理内自由度 dfT=dft+dfe,于是,处理间均方:处理内均方:总变异均方:,注意,表6.2 表6.1资料的方差分析,例6.1以A,B,C,D4种药剂处理水稻种子其中A为对照,处理各得4个苗高观察值(cm)其结果如表6.2,试进行方差分析。,表6.2 水稻不同处理苗高(cm),总和,平均,第一步:统计假设H0:,第二步:整理资料,计算矫正数及各种平方和,第三步:列方差分析表并进行F测验,三、F分布与F测验,由
6、前面的分析可知,表6.1中nk个观察值的大小不尽相同,它们之间的变异构成了整个数据的总变异,其总变异又可分为处理间变异和处理内变异。,1、F测验的基本原理,同一处理内的各个观察值不完全相同,各个处理内的随机变异之和就构成了整个资料的误差项变异。,处理内变异,当处理间真实差异=0时,处理间变异=处理内变异,当处理间真实差异0时,处理间变异处理内变异,因此:,处理间变异=处理间真实差异+处理内变异,利用这种关系,将处理间变异与处理内变异的比值定义为F值,,如果F与“1”相差不多,表明各处理效应在本质上相同,即处理间差异不显著。如果F比“1”大得多,超出了通常偶然因素所能解释的范围,那就说明各处理效
7、应有本质差异。,关于F值的大小,如何判断是否超过了用误差解释的范围?必须借助F测验。,F分布 有一个平均数为,方差为 的正态总体,从中随机抽取两个样本,其容量分别为n1 和n2,则其自由度分别为df1=n1-1和df2=n2-1,方差为,令两个方差之比为F,即,2、F分布与F测验,在给定的 样本容量n1 和n2下,从该总体进行一系列的抽样,则可获得一系列F值,各个F值所具有的概率构成一种分布,这一分布称为F分布。,F分布的平均数 F分布的取值范围为0,故F分布只有一尾概率(即右尾概率),进行的F测验仅为一尾测验。,F分布是随自由度df1 和df2的改变而改变的一组偏态曲线,只有当df1和df2
8、都趋向于时,F分布趋于对称分布。因此,F分布某一特定曲线的形状取决于参数df1和df2。,F分布下一定区间的概率可以从已制成的统计表(附表5)中查出。,F测验 测验某项变异因素的效应是否真实存在。若各处理的均数相等或者差异不显著,可以推断处理间不存在真实差异;若各处理的均数不等且差异显著,可以推断处理间有真实差异。,第三步:列方差分析表并进行F测验,F测验结论:药剂间对苗高的效应差异达极显著。,*,第四步:多重比较,首先 计算比较标准(常用三种LSD法、SSR法、q法),其次 进行均数间两两比较列梯形表法2、划线法3、标记字母法,要明确各个处理平均数彼此间的差异显著性,还必须对各个平均数作相互
9、比较,这种比较称为多重比较。常用的有以下几种:,7.3多重比较,第一:计算平均数差数的标准误,其中,为平均数的差数标准误;MSe为方差分析的误差项均方;n为样本容量(每一处理内观察值的个数);,具体方法如下:,一、最小显著差数法(LSD),实质是两个平均数相比较的t测验。,第三:将任意两个处理平均数的差与LSD相比较 若,第二:计算出显著水平下的最小显著差数LSD,第四步:多重比较(LSD法),首先 计算比较标准,其次 进行均数间两两比较列梯形表法,平均数(,已算出LSD0.05=4.40 LSD0.01=6.17,划线法,已算出LSD0.05=4.40 LSD0.01=6.17,标记字母法,
10、该试验除A与C处理无显著差异外,D与B及A、C处理间差异显著性达到,0.05水平。处理B与A、D与B、A与C无极,显著差异;D与A、C,B与C呈极显著差异。,已算出LSD0.05=4.40 LSD0.01=6.17,根据dfe,P查SSR表,计算最小显著极差值LSR,不同平均数间的比较采用不同的显著尺度 1、新复极差测验法(SSR法或Duncan法),二、最小显著极差法(LSR),计算平均数的标准误,P 为某两个极差间所包含的平均数个数,根据dfe,P查 q 表,计算最小显著极差值LSR,计算平均数的标准误,P 为某两个极差间所包含的平均数个数,2、q 测验法(或Tukey测验),第三步:列方
11、差分析表并进行F测验,F测验结论:药剂间对苗高的效应差异达极显著。,*,第四步:多重比较,首先 计算比较标准(常用三种LSD法、SSR法、q法),其次 进行均数间两两比较列梯形表法2、划线法3、标记字母法,上例:,表6.2资料LSR值的计算(复新极差测验或SSR法),表6.2资料,值的计算(q测验),1.列梯形表法,平均数(,其次 进行均数间两两比较,查LSRa,划线法,查LSRa,标记字母法,该试验除A与C处理无显著差异外,D与B及A、C处理间差异显著性达到,0.05水平。处理B与A、D与B、A与C无极,显著差异;D与A、C,B与C呈极显著差异。,查LSRa,第四步多重比较(q法或Tukey
12、测验),LSD或SSR,犯错误的风险较大;犯错误的风险小,犯错误的风险较大;犯错误的风险小,q测验,三、多重比较方法的选择,表6.2资料LSR值的计算(复新极差测验),表6.2资料LSR值的计算(q法),SSR法与q法比较,在农业和生物学上,由于试验工作者通常都寄希望于否定H0,所以LSD和SSR得到较为广泛的应用。如果试验是几个处理都与一个对照相比,则可选用LSD法;如果试验是每两个处理都要进行相互比较,则宜选用SSR法。,1、方差分析的数学模型,指试验资料的数据结构,或者说指每一观察值的线性组成部分。,一、方差分析的数学模型与期望均方,&7.4 方差分析的数学模型,进行方差分析的基础;自由
13、度与平方和分解的依据。,数学模型:,设在一平均数为、方差为2 的正态总体中随机抽取容量为n的一组样本。由于随机误差,每一个xi都和总体平均数有差别,这个差量就是随机误差i。,表7.1 K个处理n个观察值的符号表,其中,iN(0,2),故,因而每一个观察值都具有线性可加模型:,任一观察值xij所具有的线性模型为:,式中:i=(i-),并满足 i=0;ij=(xij-i)是相互独立,并具 有分布N(0,2)。,i=1,2,.,k;j=1,2,n,2、方差分析的期望均方 若A是B的无偏估计,则称B是A的数学期望。数理统计已经证明,MSe(样本的误差均方)是样本所在总体的误差方差2的无偏估计值。于是,
14、MSe的数学期望为2。因为2 为均方的数学期望,故又称期望均方。,MSt的期望均方不是t2,因为它是由处理平均数计算得到的,它由两个可能的部分构成:a.平均数的抽样方差 b.处理平均数本身差异的方差,即处理方差t2,又因每个处理的平均数由n个数据得到,故有:为MSt的数学期望,或处理效应的期望均方。,当t2=0时,F=1,表示处理间无差异;当F值很大时,表明t2 0即处理间存在差异。,因为,EMS作用:是正确进行F测验的基础,二、固定模型与随机模型 对于处理效应,由于试验目的的不同而有不同的解释,从而产生了方差分析的两种数学模型:固定模型和随机模型,指试验的各个处理都抽自特定的处理总体,因而处
15、理效应是固定的,我们的目的就是研究各个处理效应,所作的推断也仅限于供试处理的范围之内。,固定模型:,一般的栽培试验,如肥料试验、农药试验、密度试验、品比试验等都属于固定模型。,特点,a.抽样方式是固定有标准的;,b.试验的目的是估计个别处理的效应,c.H0:i=0或=对 HA:i0,d.推断仅限于供试处理范围内,e.F测验后,要进行均数的多重比较,指试验中的各个处理皆抽自同一总体的一组随机样本,因而处理效应是随机的,我们的目的不在于研究供试处理本身的效应,而在于研究处理效应的变异度,所以我们的推断也不是关于某些供试处理,而是关于抽出这些处理的整个总体。,随机模型:,随机模型在遗传、育种和生态试
16、验方面,有较广泛的应用。,特点:,a.抽样方式是随机的,没有固定的标准;,b.试验的目的是估计样本所在总体的变异;,c.,d.推断关于样本所在总体的变异;,e.F测验后,不进行均数的多重比较,而需估计方差;,形式的区别:,固定效应用 表示,随机效应用 表示,模型的不同仅与F测验分母项的选择和统计推断有关,而方差分析过程中DF、SS、MS的分解和计算都是一致的。,一、方差分析的基本假定,7.5方差分析的基本假定与数据转换,二、数据转换常用的数据转换方法有:,原观察值,处理的成数,原观察值,非正态性、非可加性、均方的异质性,1、平方根转换:适用于稀有现象的计数资料,2、对数转换:适用于倍加性资料*
17、,3、反正弦转换:适用于成数或百分数资料,7.6方差分析的类型与分析步骤,一、方差分析的种类:单方面分类的方差分析 有重复但没实行局部控制的试验资料 如:完全随机排列或大区试验取样点的资料,双方面分类的方差分析 实行单方面局部控制 如随机区组设计,SSTSSt+SSe,SSTSSt+SSR+SSe,三方面分类的方差分析 实行双方面局部控制 如:拉丁方设计,SSTSSt+SSR+SSC+SSe,其他方差分析 设计更讲究 精确度更高 裂区设计 复因子试验的分析等,二、方差分析的步骤,第一步:计算各项平方和与自由度;第二步:列出方差分析表,进行F检验;第三步:若F检验显著,则进行多重比较。多重比较的方法有最小显著差数法(LSD法)和最小显著极差法(LSR法:包括q检验法和新复极差法)。表示多重比较结果的方法有列梯形表法、划线法和标记字母法。第四步:统计结论,归纳如下:,表6.2 水稻不同处理苗高(cm),总和,平均,