《两因素方差分析.ppt》由会员分享,可在线阅读,更多相关《两因素方差分析.ppt(92页珍藏版)》请在三一办公上搜索。
1、第三节 两因素试验的方差分析,3.1 交叉分组资料(crossover classification)的方差分析 设试验考察A、B两个因素,A因素分a个水平,B因素分b个水平。所谓交叉分组是指A因素每个水平与B因素的每个水平都要搭配,两者交叉搭配形成ab个水平组合即处理,试验因素A、B在试验中处于平等地位。如果将试验单元分成 ab 个组,每组随机接受一种处理,因而试验数据也按两因素两方向分组,这种试验数据资料称为两向分组资料,也叫交叉分组资料。分无重复观测值和重复观测值两种类型。,对于A、B两个试验因素的全部ab个水平组合,每个水平组合只有一个观测值(无重复),全试验共有ab个观测值,其数据模
2、式如下表所示。,3.1.1 两因素无重复试验资料的方差分析,表 两因素无重复观测值的试验数据模式,注:A因素有a个水平,B因素有b个水平,共计有ab个水平组合,每一组合观测一次,有ab个观测值(表5),xij 为A的第i水平与B的第j水平组合观测值。,两因素无重复观测值试验资料的数学模型为:式中,为总平均数;,(5-26),i,j分别为Ai、Bj的效应;i=i-,j=j-,i、j分别为Ai、Bj观测值总体平均数,且i=0,j=0;ij为随机误差,相互独立,且服从N(0,2),A因素的每个水平有b次重复,B因素的每个水平有a次重复,每个观测值同时受到A、B 两因素及随机误差的作用。因此全部 ab
3、 个观测值的总变异可以分解为 A 因素水平间变异、B因素水平间变异及试验误差三部分;自由度也相应分解。,离差平方和与自由度的分解如下:,矫正数 总平方和 A因素离差平方和 B因素离差平方和,各项离差平方和与自由度的计算公式为:,误差平方和 SSe=SST-SSA-SSB 总自由度 dfT=ab-1 A因素自由度 dfA=a-1 B因素自由度 dfB=b-1 误差自由度 dfe=dfT-dfA dfB=(a-1)(b-1),相应均方为,【例1】某厂现有化验员3人,担任该厂牛奶酸度(T)的检验。每天从牛奶中抽样一次进行检验,连续10天的检验分析结果见表6。试分析3名化验员的化验技术有无差异,以及每
4、天的原料牛奶酸度有无差异(新鲜牛奶的酸度不超过20 T)。,表1 牛奶酸度测定结果,A因素(化验员)有3个水平,即a=3;B因素(天数)有10个水平,即 b=10,共有ab=310=30个观测值。,1 计算各项离差平方和与自由度,2 列出方差分析表,进行F检验,表2 资料的方差分析表,结果表明,3个化验员的化验技术没有显著差异,不同日期牛奶的酸度有极显著差异。,注:F0.01(9,18)=3.60,3 多重比较 在两因素无重复观测值试验中,A因素每一水平的重复数恰为B因素的水平数b,故A因素的标准误为;同理,B 因 素 的 标准误,对例1分析,a=3,MSe=0.0258。故,根据 dfe=1
5、8,秩次距 k=2,3,10,查临界 q 值,计算最小显著极差LSR,见表3。,表3 q值与LSR值,B因素各水平均值多重比较结果见表4,表4不同测定日牛奶酸度多重比较结果(q法),附表:多重比较结果字母表示,结果表明,除B2与B5,B1与B9,B4与B3,B8与B3、B4,B10与B3、B4、B8差异不显著外,其余不同测定日间牛奶酸度均差异极显著或显著。酸度最高的是B7,最低的是B5和B2。从牛奶质量要求看,连续10d的牛奶酸度均在鲜奶范围内。,在进行两个因素或多个因素的试验时,除了要研究每一个因素对试验指标的影响外,往往更希望知道因素之间的交互作用对试验指标的影响情况。通过研究环境温度、湿
6、度、光照、气体成分等环境条件对导致食品腐烂变质的酶和微生物的活动的影响有无交互作用,对有效控制酶和微生物活动,保持食品质量有着重要意义。,两个因素无重复观测值试验只适用于两个因素间无交互作用的情况;若两因素间有交互作用,则每个水平组合中只设 一个试验单位(观察单位)的试验设计是不正确的或不完善的。这是因为:,(1)在这种情况下,SSe,dfe实际上是A、B 两因素交互作用平方和与自由度,所算得的MSe是交互作用均方,主要反映由交互作用引起的变异。(2)这时若仍按前述方法进行方差分析,由于误差均方值大(包含交互作用在内),有可能掩盖试验因素的显著性,从而增大犯型错误的概率。(3)每个水平组合只有
7、一个观测值,无法估计真正的试验误差,因而不可能对因素的交互作用进行研究。,交互作用交互作用:在多因素试验中一个因素对试验结果的影响依赖于另一因素所取的水平时,称两因素有交互作用。在多因素对比试验中,某些因素对指标的影响往往是互相制约、互相联系的。即在试验中不仅因素起作用,而且因素间有时联合起来起作用,这种联合作用并不等于各因素单独作用所产生的影响之和,称这种联合作用为交互作用。例:某农场对四块大豆试验田作施肥试验。每块田以不同的方式施以磷肥和氮肥,其产量如下:,可以看出 当施氮肥和不施氮肥时,施以4公斤磷肥后的增产数量是不同的 当施磷肥和不施磷肥时,施以6公斤氮肥后的增产数量是不同的 若N,P
8、分别起作用时增产为50,30kg。但同时施时其效果并不是50+30=80kg,而是增产560-400=160kg,增加的80公斤则为交互作用的效果。,对两因素和多因素等重复试验结果进行分析,可以研究因素的简单效应、主效应和因素间的交互作用(互作效应)。,3.1.2 交叉分组两因素等重复试验的方差分析,三种效应,1简单效应(simple effect)是指在某一因素同一个水平上,比较另一因素不同水平对试验指标的影响。,三种效应,2主效应(main effect)是指某一因素各水平间的平均差别。它与简单效应的区别是,主效应指的是某一因素各水平间的平均差别是综合了另一因素各水平与该因素每一水平所有组
9、合的情况。,三种效应,3.互作效应(interaction effect)如果某一因素的各简单效应随另一因素的水平变化而变化,而且变化的幅度超出随机波动的程度,则称两个因素间存在互作效应。,设A、B两因素,A因素有a个水平,B因素有b个水平,共有ab个水平组合,每个水平组合有n次重复试验,则全试验共有abn个观测值。试验结果的数据模式如表5所示。,两因素等重复试验的方差分析,表5 两因素等重复观测值试验数据模式,两因素等重复试验数据模式(部分),表5中,每个组合处理n 次重复之和,B因素第j水平an个数据之和,abn个数据总和,A因素第i水平bn个数据之和,其中,为总平均数;i为Ai的效应;j
10、为Bj的效应;()ij为Ai与Bj的互作效应。,(5-32),两因素等重复试验资料的数学模型为:,分别为Ai、Bj、Ai Bj观测值总体平均数;且,3.1.2.1 离差平方和与自由度分解,其中,SSAB,dfAB为A因素与B因素交互作用平方和与自由度。,为随机误差,相互独立,且服从N(0,2)。,若用SSAB,dfAB表示A、B水平组合间的平方和与自由度,即处理间平方和与自由度,则处理引起的变异可进一步剖分为A因素、B因素及A、B交互作用三部分,于是SSAB、dfAB可分解为:,矫正数,总平方和与自由度,因素水平组合平方和与自由度,A因素平方和与自由度,各项平方和、自由度及均方的计算公式如下:
11、,B因素平方和与自由度,交互作用平方和与自由度,误差平方和与自由度,所以,相应均方为,因素A的方差,因素B的方差,A、B互作的方差,误差方差,3.1.2.2 列方差分析表,进行F检验,FA显著,应对A因素各水平的平均数作多重比较,其平均数标准误为:,FB显著,应对B因素各水平的平均数作多重比较,其平均数标准误为:,FAB显著,应对各组合的平均数作多重比较,其平均数标准误为:,3.1.2.3 多重比较,表6 3种温度对3种pH值对酶活性的影响,【例2】现有3种温度3种pH值对酶活性的影响试验结果,试作方差分析,A因素(温度)有3个水平,即a=3;B因素(pH值)有3个水平,即b=3;共有ab=3
12、3=9个水平组合;每个水平组合重复数n=3;全试验共有=333=27个观测值。,(1)计算各项平方和与自由度,表7 方差分析表,(2)列出方差分析表,进行F检验,查临界F值:F0.05(2,18)=3.55,F0.01(2,18)=6.01;F0.01(4,18)=4.58。因为,FAF0.05(2,18);FBF0.05(2,18);FABF0.01(4,18),表明不同温度、pH值与温度之间的互作对酶活性有显著或极显著影响,而pH间的差异不显著。因此,应进一步进行不同温度处理均数间、各水平均数间 的多重比较。,温度 因为A因素各水平的重复数为bn,故A因素各水平的标准误为:对本例而言,,(
13、3)多重比较,由dfe=18,秩次距k=2,3,从附表5中查出SSR0.05与SSR0.01的 临 界值,计算LSR值,结果列于表8。,表8 配方各水平均数比较SSR值与LSR值,表9 配方间平均数多重比较结果(SSR法),因素A主效应分析,结果表明温度A3与A1之间差异极显著,A2与A1差异显著,A2与A3差异不显著。,因B因素各水平的重复数为an,故B因素各水平的标准误为:,在本例,B因素的影响不显著,不必进行多重比较。,以上所进行的多重比较,实际上是A、B两因素主效应的检验。若A、B因素交互作用不显著,则可从主效应检验中分别选出A、B因素的最优水平,得到最优水平组合;若A、B因素交互作用
14、显著,则应进行水平组合平均数间的多重比较,以 选出最优水平组合,同时可进行简单效应的检验。,因为水平组合数通常较大(本例ab=33=9),采用最小显著极差法进行各水平组合平均数的比较,计算较麻烦。为了简便起见,常采用LSD法。,因为水平组合的重复数为n,故水平组合的标准误为:本例,各水平组合平均数间的比较,表15个水平组合平均数多重比较结果(SSR法),分析结果表明,A3B3,A2B1,A1B1为优组合,按此组合选用温度和pH值可望得到较好的酶活性。,以上的比较结果可以看出,当A、B因素的交互作用显著时,一般不必进行两个因素主效应的显著性检验(因为这时主效应的显著性在实用意义上并不重要),而直
15、接进行各水平组合平均数的多重比较,选出最优水平组合。,简单效应的检验简单效应实际上是特定水平组合平均数间的差数。检验尺度仍为互作效应检验中的LSD,有人设计3个罗非鱼品种A1、A2、A3和A4不同蛋白质水平饵料B1、B2、B3,每个处理配置两个鱼池进行试验。试验期内每池的产鱼量(kg)如下表。试作方差分析。,试验期内的产鱼量(kg),解:1、提出假设,2、平方和、自由度的分解,(2)、方差分析表,因为互作不显著,则将互作合并到误差项中,(2)、方差分析表,(3)对B因素进行比较多重比较(SSR法),多重比较表(字母标记法),3.2 系统分组资料的方差分析,系统分组(hierarchical c
16、lassification)设计,又称为巢式设计、树状设计、多因子嵌套设计假设有 A、B 两个因子,这两个因子的搭配组成不再是上一节的交叉构成,而是 B 因子嵌套在 A 因子内,即 B 因子为次级因子:A 因子的某一个水平包含了 B 因子部分水平A 因子的另一个水平包含了 B 因子的另一部分水平即:B 因子的水平仅从属于 A 因子的一个水平而 A 因子的水平并不包含 B 因子的所有水平,如果有第三个因子 C,则 C 因子嵌套在 B 因子内如果有第四个因子 D,则 D 因子嵌套在 C 因子内以此类推其数据结构呈现树状结构如行政区划,就是典型的系统结构:国家包含若干个省(A)、一个省(A)包含若干
17、个市(B)、一个市(B)包含若干个县(C)、一个县(C)包含若干个镇(D)、一个镇(D)包含若干个村(E)再如:植物生理学实验中:不同植株(A)、同一植株不同枝条(B)、同一枝条不同部位(C),在这种数据结构中,各 因子的重要性是不完全相等的,下一级因子的重要性往往低于上一级因子 A1 Ai AaB11 B12 B1b Bi1 Bi2 Bib Ba1 Ba2 Bab C111 C112 C11c Ca11 Ca12 Ca1c A 因子称为一级因子,B 因子称为二级因子,因子之间是一种从属关系,而非上一节 A、B 因子的交叉构成中所讨论的那种平行关系,下面我们写出两因子系统分组资料的数据结构:A
18、因子 B因子 观测值 B因子和 A因子和 T A1 B11 x111 x112 x11.B12 x121 x122 x12.x1.A2 B21 x211 x212 x21.B22 x221 x222 x22.x2.Ai Bi1 xi11 xi12 xi1.Bi2 xi21 xi22 xi2.xi.Ap Bp1 xp11 xp12 xp1.Bp2 xp21 xp22 xp2.xp.x,根据这一数据结构我们可以写出其数学模型:式中,为总体平均i为 A 因子第 i 个水平的效应ij为 A 因子第 i 个水平下的 B 因子第 j 个水平的效应ijk为随机误差,且p为 A 因子的水平数;qi为第 i 个
19、 A 因子水平下 B 因子的水平数;nij为第 i 个 A 水平中第 j 个 B 水平中的观测值,平方和及自由度的分解,总离均差,因素A离均差平方和,因素B离均差平方和,试验误差,平方和分解,上式中,右手第二项称为 A因子内 B因子水平间 SS,自由度分解,满足不等式;,双因素系统实验方差分析程序,1.提出原假设和备择假设,2.计算统计量,首先:确定二级因素的显著性,对于给定的显著水平a,查F分布分位数表,若,判定二级因素影响显著,否则判定其不显著,3.构造统计量F,并进行F检验,其中:,若B显著,若B不显著,对于给定的显著水平a,查F分布分位数表,若,或,判定A显著,否则不显著,其次:确定一
20、级因素的显著性,4.列方差分析表,4.列方差分析表,例1:随机选取4株植物,在每一植株内随机选取两片叶子,用取样器从每一片叶子上选取同样面积的三个样品,称取湿重xijk(g),得数据如下表(数据已经过了简化),S D xijk r br xij.平均 xi.平均1 1 2.2 2.3 2.0 3 6.5 2.17 2 2.0 2.1 2.3 3 6 6.4 2.13 12.9 2.152 3 1.6 1.5 1.7 3 4.8 1.60 4 1.8 2.0 1.7 3 6 5.5 1.83 10.3 1.723 5 2.6 2.5 2.2 3 7.3 2.43 6 2.4 2.4 2.2 3
21、6 7.0 2.33 14.3 2.38 4 7 1.8 1.5 1.7 3 5.0 1.67 8 1.5 1.6 1.4 3 6 4.5 1.50 9.5 1.58 24 24 47.0 47,上表中,a=4,b=2,r=3 N=24校正值 C=92.0417SST=(2.22+2.32+.1.42)-C=95.02-C=2.9783SSS=(12.92+9.52)/6-C=94.54-C=2.4983(一级样本间)SSD(S)=(6.52+4.52)/3-(12.92+9.52)/6=94.68-94.54=0.14(二级样本间)SSe=SST SSS-SSD(S)=2.9783-2.49
22、83-0.14=0.34,自由度:dfT=423 1=23dfS=4 1=3dfD(S)=4(2-1)=4dfe=42(3-1)=16 将平方和及自由度填入方差分析表中,并计算各均方和 F 值:,方差分析表:变异来源 SS df MS F F0.05 F0.01植株间S 2.4983 3 0.8328 23.79*6.59 16.69叶片间D 0.14 4 0.035 1.64 3.01误 差e 0.34 16 0.02125 T 2.9783 23 上述计算中,,即:两个不同级别的 F 值均由下一级的 MS 作为比较标准,而不再是统一由误差项均方作为比较标准而查 F所用的自由度也应作相应的变
23、动,即:FS的自由度分别为 df1=3,df2=4FD的自由度分别为 df1=4,df2=16由于不同植株间的湿重差异极显著,而叶片间差异不显著,因此,应对植株间(一级样本)作多重比较:,R 2 3 4 植株 0.05 0.01 q0.05 3.93 5.00 5.76 3 2.38 a A q0.01 6.51 8.12 9.17 1 2.15 a ABLSR0.05 0.30 0.38 0.44 2 1.72 b BLSR0.01 0.50 0.62 0.70 4 1.58 b B如果叶片间差异亦显著,由于不是我们研究的重点,故可不进行多重比比较。,3.3 方差分析处理效应分类,固定因子:
24、如果一个因子的各个水平是我们有目的地挑选出来的,而我们的研究目的是要比较这些因子之间有无差异或估计这些水平的效应,则称之为固定因子,该因子各个水平的效应称为固定效应。随机因子:如果一个因子的各个水平是从该因子的所有可能水平中随机抽取的,我们的研究目的不仅仅是要比较这些水平之间有无差异,而是了解该因子不同水平的总体变异情况,即对该总体的方差进行检验或估计,则称之为随机因子,该因子各个水平的效应称为随机效应。,若按处理效应的类别来划分方差分析的模型,在单因素试验中,有2种,即固定模型和随机模型;在多因素试验中,有3种,即固定模型、随机模型和混合模型。就试验资料的具体统计分析过程而言,这3种模型的差
25、别并不大,但从解释和理论基础而言,它们之间是有很重要的区别的。不论设计试验、解释实验结果,还是最后进行统计推断,都必须了解这3种模型的意思和区别。,方差分析的基本思想,方差分析的实质就是检验多个正态总体均值是否相等。,数据波动由两方面引起:因素水平的不同引起;偶然误差引起,方差分析的基本思想:试验数据波动分解成两部分,一部分反映由因素水平不同引起的波动,另一部分反映由试验误差引起的波动。总偏差平方和分解为反映必然性的各个因素的偏差平方和与反映偶然性的误差平方和,并计算它们的平均偏差平方和(方差)。将两者进行比较,借助F检验法,检验假设H0:012,从而确定因素对试验结果的的影响是否显著。,SPSS例题:两因素无重复观测值,为了考察pH值和硫酸酮溶液浓度对化验血清中的白蛋白与球蛋白的影响,对pH值取4个水平(A),对硫酸酮溶液浓度取3个水平(B),在不同组合下测定白蛋白与球蛋白之比,具体见下表.试检验两个因素对化验结果有无显著影响?,3种温度对3种pH值对酶活性的影响,【SPSS例题:两因素有重复观测值】现有3种温度3种pH值对酶活性的影响试验结果,试作方差分析,【SPSS例题:两因素系统分组方差分析】:对5个杂交水稻品种的干物质累计过程进行系统测定,每次测定随机取2个样点,每个样点取5株。测定结果如下,试作方差分析。,