《方差分析(生物统计学).ppt.ppt》由会员分享,可在线阅读,更多相关《方差分析(生物统计学).ppt.ppt(76页珍藏版)》请在三一办公上搜索。
1、第八章方差分析,第八章 方差分析,某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼20尾,投喂不同的饲料,经1个月以后,各组鱼的增重(g)结果列于下表。,表6-1 不同饲料饲喂鱼增重的数据(g),20个样本,4个平均数,(2)试验误差不统一,误差估计的精确性和检验的灵敏性低。,t检验:C42 6次,6个标准误,(1)检验过程烦琐。,判断两组数据平均数间的差异显著性,6次都接受Ho,错误,(3)推断的可靠性低,检验时犯错误概率大。,t 检验,自由度较小,P=(0.95)60.735,P1-0.7350.265,将所有这些组数据放在一起,一次比较就对所有各组平均数间是否有
2、差异作出判断。,方差分析,又称为变量分析,是英国著名统计学家R.A.Fisher于1923年提出的。方差分析是对平均数差异检验的一种引申,方差分析是对两个或多个样本平均数差异显著性检验的方法。,一、相关术语,(一)试验因素,试验中所研究的影响试验指标的原因或原因组合称为试验因素。,试验因素也称为处理因素,简称为因素或因子。,为衡量试验结果的好坏和处理效应的高低,在实验中具体测定的性状或观测的项目称为试验指标。例如日增重、酶活性、产量等。,(一)试验因素,在试验中可以人为调控的因素,在试验中不能人为调控的因素,可控因素(固定因素),非控因素(随机因素),试验因素常用大写字母A、B、C、等来表示。
3、,因素的水平不能严格控制,或水平能控制,其效应为随机变量;,重复时可得到相同的结果。,因素的水平可准确控制,且水平固定后,其效应也固定;,重复时不易得到相同的结果。,每个试验因素的不同状态(处理的某种特定状态或数量上的差别)称为因素水平,简称为水平。,(二)因素水平,因素是一个抽象的概念,水平是一个较为具体的概念。,温度,酶活性,水平用代表该因素的字母加下标1、2、3、等来表示。如A1、A2、A3、,B1、B2、B3、等。,一、相关术语,(三)试验处理,试验处理常称为处理,指对受试对象给予的某种外部干预(或措施),是试验中实施的因子水平的一个组合。,单因素处理,多因素处理,一、相关术语,(四)
4、试验误差,试验误差是指试验中由于无法控制的因素所引起的差异,简称为误差。,一、相关术语,(五)试验单位,(六)重复,在实验中能接受不同试验处理的独立的试验载体,即根据研究目的而确定的观测总体。,在试验中,将一个处理实施在两个或两个以上的试验单位上。处理实施的试验单位数即处理的重复数。,表-1 不同饲料饲喂鱼增重的数据(g),试验指标,单因素,水 平,重 复,基本思想:将测量数据的总变异按照变异原因不同分解 为处理效应和试验误差,并作出其数量估计。,二、方差分析基本思想 p143,中心目标:比较处理效应和误差效应在总变异中所占的比例。,处理效应,试验误差,相差不大,说明试验处理对指标影响不大。,
5、相差较大,即处理效应比试验误差大得多,说明试验处理影响是很大的,不可忽视。,表-2 每组具n个观测值的k组样本符号表,三、数学模型,第i个处理的第j个观测值,第i个处理n个观测值的和,全部观测值的和,第i个处理的平均数,全部观测值的总平均数,表-2 每组具n个观测值的k组样本符号表,三、数学模型,第i个处理观测值总体平均数,试验误差,三、数学模型,第i个处理的效应,即处理i对试验结果产生的影响,u是总平均值a 是处理效应,处理间的变异,处理内的变异,方差,总平方和,总自由度,处理间,处理内,处理间,处理内,四、平方和与自由度的分解,四、平方和与自由度的分解 p145,(一)平方和分解,0,每一
6、处理n个观测值离均差平方和累加,k个处理的离均差平方和累加,总平方和 SST,处理内平方和 SSe,处理间平方和 SSt,C(矫正数),四、平方和与自由度的分解,(二)自由度分解,表-1 不同饲料饲喂鱼增重的数据(g),k=4n=5nk=20,(1)平方和计算,(2)自由度计算,(3)方差计算,五、显著性检验F检验,1 提出假设,2确定显著性水平,3计算统计量,4统计推断,否定Ho,接受HA,说明不同饲料饲喂鱼的增重差异是极显著的,用不同的饲料饲喂,增重是不同的。,在方差分析中,通常将变异来源、平方和、自由度、均方和F值整理成一张方差分析表。,在实际进行方差分析时,只须计算出各项平方和与自由度
7、,各项均方的计算及F检验可在方差分析表上进行。,*,表中的F值应与相应的被检验因素齐行。,表-3 不同饲料饲喂鱼增重的方差分析表,统计上把多个平均数两两间的相互比较称为多重比较。,六、多重比较,最小显著差数法(LSD法),最小显著极差法(LSR法),LSD法,由统计学家R.A.Fisher提出的,其实质是两个平均数相比较的t检验法。,(least significant difference),在F检验显著的前提下,先计算出显著水平为的最小显著差数 LSD,然后将任意两个处理平均数的差数的绝对值与其比较。,在水平上差异显著,在水平上差异不显著,LSD检验,均数差值标准误,误差方差,两组数据,误
8、差均方的自由度,t自由度,被比较的两个均数,t 检验,LSD法,(1)计算最小显著差数 LSD;,(2)列出平均数的多重比较表,比较表中各处理按其平均数从大到小自上而下排列;,(3)将平均数多重比较表中两两平均数的差数与LSD 比较,作出统计推断。,方法步骤,饲料 平均数 差异显著性,A1 311.8 64.4*49.0*32.0*A4 279.8 32.4*17.0A2 262.8 15.4A3 247.4,表-4 4种饲料饲喂鱼增重差异显著性表,梯形表示法(三角形法),饲料 平均数 差异显著性 0.05 0.01A1 311.8 A4 279.8 A2 262.8A3 247.4,字母标记
9、法,(1)全部平均数从大到小依次排列;,a,b,b,c,A,B,A,B,(2)在最大的平均数上标字母a,将该平均数与以下各平均数相比,凡相差不显著的标a,直至某个与之相差显著的则标以字母b;,(3)以该标有b的平均数为标准,与各个比它大的平均数比较,凡差数差异不显著的在字母a的右边加标字母b;,(4)以标b的最大平均数为标准与以下未曾标有字母的平均数比较,凡差数不显著的继续标以字母b,直至差异显著的平均数标以字母c,再与上面的平均数比较;,(5)重复进行,直至最小的平均数有了标记字母,并与上面的平均数比较后为止。,(6)差异极显著标记方法同上,用大写字母标记。,c,B,饲料 平均数 差异显著性
10、,A1 311.8 64.4*49.0*32.0*A4 279.8 32.4*17.0A2 262.8 15.4A3 247.4,平均数间有一个相同字母的即为差异不显著,凡无相同字母的即为差异显著。,小写拉丁字母表示显著水平=0.05,大写拉丁字母表示显著水平=0.01。,方差分析,步骤,定义,总平方和与自由度的分解;,(2)列方差分析表,进行F检验;,(3)若F检验显著,进行多重比较(注明方法),方差分析是对两个或多个样本平均数差异显著性检验的方法。它是将测量数据的总变异按照变异来源分解为处理效应和试验误差,并作出其数量估计。,第二节 单因素方差分析,单因素方差分析 的目的:正确判断该试验因
11、素各水平的相对效果。,组内观测次数相等的方差分析,组内观测次数不等的方差分析,一、组内观测次数相等的方差分析,例7.2 测定东北、内蒙古、河北、安徽、贵州5个地区黄鼬冬季针毛的长度,每个地区随机抽取4个样本,测定的结果如下表所示,比较其差异显著性。,表-10 不同地区黄鼬冬季针毛长度(mm),(1)平方和计算,(2)自由度计算,(3)方差计算,(4)F检验,*,表-11 不同地区黄鼬冬季针毛长度方差分析表,地区 平均数 差异显著性 0.05 0.01东 北 31.60内蒙古 27.40河 北 26.03安 徽 24.75贵 州 22.85,表-12 不同地区黄鼬冬季针毛长度显著性比较(LSD检
12、验),a,b,b,c,c,d,A,B,B,C,C,D,D,第三节 二因素方差分析,两个因素共同影响试验指标的试验处理。,主效,各试验因素的相对独立作用称为该因素的主效应,简称为主效。,它是由于因素水平的改变而造成因素效应的改变。,互作,互作效应是由于两个或多个试验因素的相互作用而产生的效应。,某一因素在另一因素的不同水平上所产生的效应不同,则二因素间存在交互作用,简称互作。,因素间的交互作用显著与否关系到主效应的利用价值。,若交互作用显著,则各因素的效应就不能累加,最优处理组合的选定应根据各处理组合的直接表现选定。,二因素间是否存在交互作用有专门的统计判断方法,有时也可根据专业知识判断。,若交
13、互作用不显著,则各因素的效应可以累加。,各因素的最优水平组合,即为最优的处理组合。,有时交互作用相当大,甚至可以忽略主效应。,第三节 二因素方差分析,无重复观测值的二因素方差分析,有重复观测值的二因素方差分析,无重复观测值的二因素方差分析,二因素无交互作用时,每个处理可只设一个观测值。,A因素a个水平,B因素b个水平,每个处理组合只有1个观测值。,表-15 无重复观测值的二因素数据资料,(1)平方和的分解,(2)自由度的分解,(3)计算方差,(4)F值的计算:,例7.4将一种生长激素配成M1、M2、M3、M4、M5五种浓度,并用H1、H2、H3三种时间浸渍某大豆品种的种子,出苗45天后的各处理
14、每一植株的平均干物重(g)。,表6-15 激素处理对大豆干物重的影响(g),激素浓度和时间均为固定因素,适应于固定模型。,(1)平均和计算,(2)自由度的计算,F 检验结果表明,不同激素浓度对大豆干物重有极显著差异。,(4)进行多重比较(用SSR检验),表16 激素处理对大豆干物重影响的方差分析,浓度间的平均数标准误均为,b=3是每一浓度的观测值数目。,如果要比较时间间的效应,由于每一时间有a=5个观测值,其平均数的标准误应为,(3)列方差分析表,表-17不同浓度大豆干物重多重比较SSR和LSR值,查SSR值表,当dfe=8,M=2,3,4,5时SSR值、LSR值列于下表,表-18不同浓度大豆
15、干物重差异显著性检验(SSR检验),对固定模型而言,结论只能适用于参加试验的几个水平,不能任意推广到其他水平上去。,如果存在两个因素的互作,方差分析中就不能用互作来估计误差,必须在有重复观测值的情况下对试验误差进行估计。,无重复观测值的二因素方差分析,所估计的误差实际上是这两个因素的相互作用,这是在两个因素不存在互作,或互作很小的情况下进行估计的。,A因素a水平,B因素有b水平,每一重复都包括ab次实验,设试验重复n次。,有重复观测值的二因素方差分析,A因素i水平,B因素j水平,第k次重复观测值,总平均值,A因素i水平的效应,B因素j水平的效应,A因素i水平和B因素j水平的交互作用,随机误差,
16、(1)平方和的分解为:,A因素a水平,B因素有b水平,每一重复都包括ab次实验,设试验重复n次。,abn,SSt,(3)各项的方差分别为,(2)自由度的分解为,例7.5 为了研究某种昆虫滞育期长短与环境的关系,在给定的温度和光照条件下在实验室培养,每一处理记录4只昆虫的滞育天数,结果列于表中,试对该材料进行方差分析。,表-19 不同温度及光照条件下某种昆虫滞育天数,由于温度和光照条件都是人为控制的,为固定因素,可依固定因素分析。,将表-19 中数字均减去80,整理得下表,(1)平方和计算,(2)自由度分解,(4)列方差分析表,F 检验结果表明,浓度间和时间间的F 值大于F0.01,即昆虫滞育期
17、长短主要决定于光照和温度,而与两者之间的互作关系不大。,表-20 昆虫滞育天数方差分析表,(3)计算方差,了解各种光照时间及温度对滞育期的影响,需进行不同光照间及不同温度间的多重比较。,(5)多重比较,光照(A)间平均数标准误,温度(B)间平均数标准误,例7.6 在啤酒生产中,为了研究烘烤方式(A)与大麦水分(B)对糖化时间的影响,选了两种烘烤方式,4种水分共8种处理,每一处理重复三次,结果如下表。,表-21 不同烘烤方式及水分的糖化时间,A 固定因素,B 随机因素,混合模型,(1)平方和的分解,(2)自由度分解,表-22 大麦糖化时间方差分析表,(3)列方差分析表,F 检验结果表明,水分和A
18、B的F 值大于F0.01,大麦中的水分及水分与烘烤方式之间的互作对糖化时间的影响达到了极显著水平。,表-22 大麦糖化时间方差分析表,烘烤方式对糖化时间的作用不显著。,在生产上应注意大麦的含水量及根据含水量来选择合适的烘烤方式。,方差分析,步骤,定义,总平方和与自由度的分解;,(2)列方差分析表,进行F检验;,(3)若F检验显著,进行多重比较(注明方法),方差分析是对两个或多个样本平均数差异显著性检验的方法。它是将测量数据的总变异按照变异来源分解为处理效应和试验误差,并作出其数量估计。,单因素,观测次数相等,观测次数不等,总平方和分解,二因素,无重复观测值,有重复观测值,(3)各项的方差分别为,(2)自由度的分解为,(4)列方差分析表,表中的F值应与相应的被检验因素齐行。,方差分析表,常用的差异显著性表示方法有梯形法和字母法。,(6)根据多重比较的结果,对实例进行分析。,