《多因素试验结果的统计分析教学.ppt》由会员分享,可在线阅读,更多相关《多因素试验结果的统计分析教学.ppt(156页珍藏版)》请在三一办公上搜索。
1、第十三章 多因素试验结果的统计分析,第一节 多因素完全随机和随机区组 试验的统计分析第二节 裂区试验的统计分析第三节 一组相同试验方案数据的联合分析第四节 多因素混杂和部分实施试验的 设计和分析(正交试验法)第五节 响应面分析,第一节 多因素完全随机和随机区组 试验的统计分析,一、二 因素试验的统计分析二、三因素试验的统计分析,一、二因素试验的统计分析,(一)二因素随机区组试验结果的分析设有A和B两个试验因素,各具a和b个水平,那么共有ab个处理组合,作随机区组设计,有r次重复,则该试验共得rab个观察值。它与单因素随机区组试验比较,在变异来源上的区别仅在于前者的处理项可分解为A因素水平间(简
2、记为A)、B因素水平间(简记为B)、和AB互作间(简记为AB)三个部分。,(131)(132),其中,j=1,2,r;k=1,2,a;l=1,2,b;、和 分别为第r个区组平均数、A因素第k个水平平均数、B因素第l个水平平均数、处理组合AkBl平均数和总平均数。表13.1 二因素随机区组试验自由度的分解,SSR=,SSt=,SST=,(二)二因素随机区组试验的线性模型和期望均方,二因素随机区组试验的线性模型为:(133),表13.8 二因素随机区组设计的期望均方,二、三因素试验的统计分析,(一)三因素完全随机试验的统计分析 在三因素试验中,可供选择的一种试验设计为三因素完全随机试验设计,它不设
3、置区组,每一个处理组合均有若干个(n个)重复观察值,以重复观察值间的变异作为环境误差的度量。,1.结果整理 2.自由度和平方和的分解总变异可以分解为处理组合变异加上误差变异。处理组合变异又可作分解:处理 DF=DFA+DFB+DFC+DFAB+DFAC+DFBC+DFABC 处理 SS=SSA+SSB+SSC+SSAB+SSAC+SSBC+SSABC,表13.13 三因素完全随机试验的平方和及自由度分解,3.多重比较的标准误公式,A因素间比较时单个平均数的标准误B因素间比较时单个平均数的标准误C因素间比较时单个平均数的标准误AB处理组合的平均数的标准误为:(二)三因素随机区组试验结果的分析 设
4、有A、B、C三个试验因素,各具a、b、c个水平,,作随机区组设计,设有r个区组,则该试验共有rabc个观察值,其各项变异来源及自由度的分解见表13.15。,表13.15 三因素随机区组试验的平方和及自由度分解,DFt=DFA+DFB+DFC+DFAB+DFAC+DFBC+DFABC(134)SSt=SSA+SSB+SSC+SSAB+SSAC+SSBC+SSABC(135)(三)三因素试验的线性模型和期望均方1.完全随机设计三因素完全随机试验每一观察值 yijkl 的线性模型为:(136),表13.21 三因素随机试验设计的期望均方,2.随机区组设计三因素随机区组试验每一观察值yjklm的线性模
5、型为:其中,代表区组效应,固定模型时有,随机模型时,其余参数参见三因素完全随机设计的情形。,(137),表13.22 三因素随机区组设计的期望均方,由F=MS1/MS2可测验 对 0。其有效自由度为:,(138),第二节 裂区试验的统计分析,一、裂区试验结果统计分析示例二、裂区试验的缺区估计三、裂区试验的线性模型和期望均方四、再裂区设计的分析五、条区设计的分析,一、裂区试验结果统计分析示例,设有A和B两个试验因素,A因素为主处理,具a个水平,B因素为副处理,具b个水平,设有r个区组,则该试验共得rab个观察值。其各项变异来源和相应的自由度见表13.23。,表13.23 二裂式裂区试验自由度的分
6、解,例13.4 设有一小麦中耕次数(A)和施肥量(B)试验,主处理为A,分A1、A2、A3 3个水平,副处理为B,分B1、B2、B3、B4 4个水平,裂区设计,重复3次(r=3),副区计产面积33m2,其田间排列和产量(kg)见图13.3,试作分析。,图13.3 小麦中耕次数和施肥量裂区试验的田间排列和产量(kg/33m2),(1)结果整理 将图13.3资料按区组和处理作两向分组整理成表13.24,按A因素和B因素作两向分类整理成表13.25。表13.24 图13.3资料区组和处理两向表,表13.25 图13.3资料A和B的两向表(2)自由度和平方和的分解根据表13.23将各项变异来源的自由度
7、直接填入表13.26。首先,计算总平方和,,然后,根据A因素与区组两向表计算主区总SSM,并分解为区组SSR、SSA和三部分,,主区总,主区总SSM-SSR-SSA=122-32.67-80.17=9.16,根据A与B两向表(表13.25)计算处理平方和SSt,并分解为SSA、SSB和SSAB三部分,,处理,SSAB=处理 SSt-SSA-SSB=7.16,因而,,总SST-主区总SSM-SSB-SSAB=2355-122-2179.67-7.16=46.17,或 总SST-SSR-处理SS-2355-32.67-2267-9.16=46.17至此,平方和分解全部完成,将结果填入表13.26。
8、表13.26 小麦裂区试验的方差分析,(3)F 测验表13.26中,Ea是主区误差,Eb为副区误差。当选用固定模型时,Ea可用以测验区组间和主处理(A)水平间均方的显著性;Eb可用以测验副处理(B)水平间和AB互作均方的显著性。由表13.26得到:区组间、A因素水平间、B因素水平间均有显著差异,但AB互作不显著。由此说明:本试验的区组在控制土壤肥力上有显著效果,从而显著地减小了误差;不同的中耕次数间有显著差异;,不同的施肥量间有显著差异;中耕的效应不因施肥量多少而异,施肥量的效应也不因中耕次数多少而异。(4)效应和互作的显著性测验在此以亩产量进行测验。中耕次数间 表13.25各个TA值为rb=
9、34=12区产量之和,故 cf=666.7/(1233)=1.6835据此可算得各中耕处理的亩产量于表13.27。求得亩,产量的标准误故有,p=2,LSR0.01,4=57.3,LSR0.05,4=34.6(kg/亩);p=3,LSR0.01,4=71.5,LSR0.05,4=44.4(kg/亩)以上述LSR值测验表13.27中A因素各水平的差数,得知A1与A3间的差异达0.05水平,A1与A2间的差异达0.01水平,故以A1为最优。施肥量间 表13.25各个TB值为ra=33=9区产量之和,故 cf=666.7/(933)=2.2448,p=2,LSR0.01,18=44.0,LSR0.05
10、,18=32.1 p=3,LSR0.01,18=50.8,LSR0.05,18=39.0 p=4,LSR0.01,18=54.9,LSR0.05,18=43.2,表13.27 三种中耕处理亩产量的新复极差测验,表13.28 四种施肥量处理亩产量的新复极差测验,以上述LSR值测验表13.28各个亩产量的差数,得知施肥量以B2最好,它与B1、B4、B5都有极显著的差异。比较本例中副处理(施肥量)与主处理(中耕次数)的相应LSR值,前者小,因而鉴别差数的显著性将更灵敏些。究其原因,在于Eb具有较大的自由度而较小的SSR值。如果试验能进一步降低Eb,则灵敏性将更高,这里说明裂区设计对副处理具有较高精确
11、性的优点。,中耕次数施肥量的互作 经F测验为不显著,说明中耕次数和施肥量的作用是彼此独立的,最佳A处理与最佳B处理的组合将为最优处理组合,如本例中的A1B2,所以不需再测验互作效应。如果该互作的F测验显著,则需象表13.6那样将试验结果分裂成各中耕次数下施肥的简单效应或各施肥量下中耕的简单效应,进行测验。其标准误的公式为:A相同B不同时,,任何二个处理或B相同A不同时,,(139),(1310),(5)试验结论本试验中耕次数的A1显著优于A2、A3,施肥量的B2极显著优于B1、B3、B4。由于AB互作不存在,故A、B效应可直接相加,最优组合必为A1B2。,二、裂区试验的缺区估计裂区试验的每一个
12、主区处理都可看作是一个具有b个副区处理的独立试验,各具r次重复;因而每一主区处理内的误差(Eb)也是独立的。故在裂区试验中,如有副区缺失,可采用与随机区组相同的原理估计之。,例13.5 设表13.24资料A1B1在区组I缺失,其结果如表13.29。试作估计。很明显,表13.29中的缺区ye仅对A1处理有影响,而对A2和A3无关。但是A1下的这4个副处理实际上就是随机区组类别,可估计之。,所以 ye=33.3,表13.29 缺失1区产量的裂区试验,或,如果另一缺区在其他主区处理内出现,可同样估计。如果在同一主区处理内出现两个以上缺区,则仍可 应用采用解方程法。,具缺区的处理与其他处理小区平均数比
13、较时各种平 均数标准误SE 的公式如下:,其中,在缺一个副区时,,其中,在缺一个副区时,,k=缺失副区数,c=有缺区的重复数,d=缺区最多的处理组合中缺失的副区数。,若缺失副区在2或2个以上,,三、裂区试验的线性模型和期望均方,在裂区试验中,对于j(=1,2,r)区组、k(=1,2,a)主处理和l(=1,2,b)副处理观察值yjkl的线性模型为:(1312),表13.31 裂区试验的期望均方,四、再裂区设计的分析,若参加试验的因素有三个,可以在裂区中再划分小区称为再裂区试验。设A、B、C三因素分别具有a、b、c个水平,重复r次,主区、裂区、再裂区均为随机区组式排列,则其自由度的分解列如表13.
14、32。,表13.32 各处理均为随机区组式的再裂区设计自由度分解,再裂区试验中各项比较的平均数标准误SE公式如下:,再裂区试验观察值的线性模型为:(1314)(1314)中 N(0,);N(0,);N(0,)。A,B,C,(AB),(AC),(BC),(ABC)通常为固定模型,其限制条件为;。,五、条区设计的分析条区设计:在多因素试验中由于实施试验处理的需要,希望每一因素的各水平都有较大的面积,因而在裂区设计的基础上将同一副处理也连成一片。这样A、B两个因素互为主,副处理,两者的交叉处理为各该水平的处理组合。,若A、B两因素各具a、b个水平,重复r次,则A、B两因素均为随机区组式的条区设计自由
15、度分解列于表13.33。表13.33 A、B两因素均为随机区组式的条区设计自由度分解,图13.4 甘薯垄宽、栽插期条区试验的田间排列和产量结果(kg/80 m2),例13.7 设一甘薯垄宽和栽插期的两因素试验,垄宽(A)具三水平:A1=50cm,A2=60cm,A3=70cm;栽插期(B)具三水平:B1=5月16日,B2=6月6日,B3=6月26日,A、B均为随机区组式排列,6个重复的田间排列与试验结果列于图13.4。(1)结果整理将图13.4资料整理成表13.34(区组与A),表13.35(区组与B),表13.36(A与B)3个两向表,有关符号在表中,意义自明。,表13.34 各区组垄宽产量
16、总和表(TAr)表13.35 各区组栽插期产量总和表(TBr),表13.36 垄宽与栽插期处理组合产量总和表(TAB),(2)平方和与自由度的分解由表13.34进行区组与A两向分组资料的方差分析:区组与垄宽总,=SSAr-SSR-SSA=6583.75,由表13.35进行区组与B两向分组资料的方差分析:区组与栽插期总,88739.03,总SSBr SSR-SSB=4569.30,由表13.36进行A与B两向分组资料的方差分析:垄宽与栽插期总SS3=193719.03 SSAB=总SS3-SSA-SSB=176.30由图13.4计算全试验的总平方和:,全试验总,全试验总SS SSR-总SS3-,
17、=2053.48,按表13.33分解自由度,将平方和与自由度的计算结 果归纳成表13.37。,表13.37 甘薯条区试验方差分析表,(3)F 测验垄宽用区组垄宽(Ea)进行测验;栽插期用区组栽插期(Eb)测验;垄宽栽插期则用剩余误差(Ec)测验。其结果两个因素的主效均极显著,而互作并不显著。因此只须比较各因素主效间的差异、最佳的垄宽及最佳的栽插期为预期将为最佳的处理组合。(4)各效应间比较的显著性测验小区平均数间比较时,平均数标准误SE 的公式如下:,(1315),本例只需做A处理及B处理的比较。,垄宽间的比较:,而LSR0.05,(2,10)=6.053.15=19.06(kg/区),LSR
18、0.05,(3,10)=19.97(kg/区),LSR0.01,(2,10)=27.10(kg/区),LSR0.01,(3,10)=28.62(kg/区),因此可将测验结果列于表13.38,垄宽60cm最佳。,栽插期间的比较:,而LSR0.05,(2,10)=5.043.15=15.87(kg/区),LSR0.05,(3,10)=16.63(kg/区),LSR0.01,(3,10)=22.57(kg/区),LSR0.01,(2,10)=23.83(kg/区)。因此可将测验结果列于表13.39。6月6日栽插效果最好。两者的组合A2B1为试验中最佳处理组合。表13.36同样说明这一结论。,表13.
19、38 垄宽间的比较 表13.39 栽插期间的比较,条区试验观察值的线性模型为:(1316)中 N(0,);N(0,);N(0,)。A,B,(AB)通常为固定模型,其限制条件为;。,(1316),第三节 一组相同试验方案数据的联合分析,农业研究往往需要在多个地点、多个年份甚至多个批次进行试验,各地点、各年份均按相同的试验方案实施,以更好的研究作物对环境的反映。对于这种进行多个相同的方案的试验,应该联合起来分析。,品种区域试验的目的是:确定品种在某一个区域内的平均表现,以确定品种的在该区域生产潜力。确定品种在某地点的平均表现相对于该地点内各品种的平均表现的回归系数大小,以明确品种的稳产性和试验地区
20、。多个试验的联合分析要根据试验的目的选择地点。多个试验的联合分析首先要对各个试验进行分析,然后检验各个试验的误差是否同质,如不同质则不可进行联合方差分析。,例13.8 设一个水稻品种区域试验,包括对照种在内共有5个供试品种,在4个地点进行2年试验,每点每次试验均统一采用相同小区面积重复3次的随机区组设计,其结果列于表13.40。现以此为例说明其分析方法。若令供试品种数为v,试点数为s,年份数为y,每次试验重复数为r,则此试验中,v=5,s=4,y=2,r=3,令y表示各小区的产量;Ts、Ty及Tv等分别代表每一试点、年份、及品种的总和;Tvs、Tvy、Tsy分别代表品种与地点组合的总和、品种与
21、年份组合的总和、年份与地点组合的总和;Tvsy、Trsy分别代表,品种、地点、年份组合的总和,每年份、地点每区组的总和;T代表全部试验数据的总和,各类总和的符号分别标在13.40及表13.44中。区域试验结果的综合分析,不仅要比较供试品种的平均表现;还要了解品种试点、品种年份、以及品种试点年份的互作效应,即了解不同品种在各试点、各年份的差异反应,从而进一步了解品种的稳产性及区域适应性。多年多点统一随机区组设计的自由度分析列于表13.41。,表13.40 水稻品种区域试验产量(kg/33m2),表13.41 多年多点统一随机区组设计的自由度分析表,(1)试验误差的同质性测验在综合分析前,先对各次
22、试验按随机区组设计逐个分析,计算出各次试验单独的误差,测验其误差是否同质,以便确定是否可将误差合并进行统一的比较分析,这可采用Bartlett方差同质性测验法。该法采用统计数进行测验(见第七章)。表13.42为各次试验单独的平方和计算结果。表13.43为误差方差同质性测验的计算过程。本例中,,查 表得,卡方的自由度DF=8-1=7时,=9.80,故P0.20。式中,k 为被测验的方差个数;(ni-1)为每一方差的自由度,本例中实为(v-1)(r-1);19.087为各次试验合并的误差均方。,表13.42 各次试验的平方和计算结果 表13.43 误差方差同质性测验计算表,(2)平方和的分解按表1
23、3.41的自由度分析,计算各部分平方和。Tvs及Tsy的二向表已包括在表13.40中,这里需要列出Tvy的二向表(表13.44)。各主效及处理组合平方和的计算公式及过程列在表13.45。表13.44 品种与年份组合产量总和(Tvy)二向表,表13.45 主效及处理组合平方和计算表,各种交互作用平方和均用减去法计算。试点年份SS=试点与年份组合SS-试点SS-年份SS=16572.05-9324.58-5819.96=1427.51 品种试点SS=品种与试点组合SS-品种SS-试点SS=11583.70-965.71-9324.58=1293.41 品种年份SS=品种与年份组合SS-品种SS-年
24、份SS=7299.21-965.71-5819.96=513.54,品种试点年份SS=品种、试点、年份组合SS-品种SS-试点SS-年份SS-品种试点SS-品种年份SS-试点年份SS=21365.26-965.71-93324.58-819.96-1293.41-513.54-1427.51=2020.55品种SS+品种试点SS+品种年份SS+品种试点年份SS=965.71+1293.41+513.54+2020.55=4793.21它与表13.42中各试验品种平方和的总和相等。,试验内区组间平方和可由各试验分别求出区组平方和再相加,即表13.42中的1706.13,或由表13.45求得:区组
25、、试点、年份组合SS-试点、年份组合 SS=18278.17-16572.05=1706.12两者结果相同。全试验误差平方和可由表13.42中各试验的误差平方和相加,即1221.55,或由总平方和减去其它各主效、区组、一级互作以及二级互作等,这剩余部分即合并的误差SS,其结果也应为1221.55。(3)方差分析方差分析结果列于表13.46。,表13.46 水稻品种区域试验方差分析表,表13.47 多年多点试验的期望均方,F 测验结果说明品种之间平均效应有显著差异;品种与年份、地点的一级和二级互作均显著,因而品种在不同试点、不同年份具有差异反应,需对各品种的地区适应性及稳产性进行具体分析,品种试
26、点年份的显著性说明与试点互作在年份反应不一致。(4)品种间的比较因品种与试点及年份均有极显著互作,此处主要比较在不同环境下的品种表现,列出品种与试点,组合、品种与年份组合平均产量表(表13.48、13.49)表13.48 各品种在各试点的平均产量(kg)表13.49 各品种在各年份的平均产量表(kg),误差均方=19.09(kg)2,品种平均数标准误(kg),因此用LSR法作测验(DF=60),结果列于表13.49的右半部分。若以品种A为CK,则品种E增产达0.01水准,D达0.05水准,E与D之间差异不显著。品种与试点组合标准误(kg)品种与年份组合标准误(kg),由此可以计算一系列LSR值
27、,以进行组合间的全部比较。进一步看E、D两品种在各试点的表现(表13.48),在乙试点两者表现相近,而在甲试点D优于E。在丙丁两试点则E优于D。故E的地区适应性广于D,在试点间表现较稳定。再看E、D两品种在不同年份的表现(表13.49左半边),第一年D低于E,第二年D高于E。故D在年份间的波动大,而E在年份间较稳定。若将v、s、y、r等符号代表各变异原因的效应值,则上述多年多点试验(随机区组设计)的线性模型为:,(1317),固定模型及随机模型时的期望均方列于表13.47。本试验作固定模型考虑,故各效应均与合并误差比较。若试验属随机模型性质,则有关效应的F 测验应根据期望均方组成分别确定其所用
28、以比较的均方。,第四节 多因素混杂和部分实施试验的设计和分析(正交试验法),一、多因素试验的混杂设计和分析二、多因素部分重复试验的设计与分析三、正交试验方案设计的要点,一、多因素试验的混杂设计和分析,多因素试验中,因素间的关系有三类,一类是套叠式(分枝式)的(如第6章表6.16的数据结构),一类是正交式的,还有一类是混合式的。混杂设计(comfounding design):即将处理组合分为两组或几组,每一组安排为一个区组,这样的区组称为不完全区组。此时试验中的某些效应和区组混杂在一起而不能区分出来。这种用牺牲某些效应以使区组缩小,减少误差的设计方法称为混杂设计。,(一)222试验的混杂设计方
29、法,设一个小麦氮、磷、钾肥料试验,每一要素有不施和施用二个级别,例如氮肥不用或用30kg/亩硫酸铵、磷肥不用或用40kg/亩过磷酸钙,钾肥不用或用10kg/亩硫酸钾,则共有222=8个处理组合,即:n1p1k1,n2p1k1,n1p2k1,n1p1k2,n2p2k1,n2p1k2,n1p2k2,n2p2k2,为方便起见,简写为:(1)n p k np nk pk npk。习惯上以字母大写,如N,P,NP等,代表主效及互作的平均数,以大写字母加括弧代表主效及互作的总和数。,由以上8个处理组合可以分析出N、P、K三个主效,NP、NK、PK三个一级互作,NPK一个二级互作。以总和表示的N的主效,可根
30、据以下四种比较而得到:,N的效应,所以,(N)=(n)-(1)+(nk)-(k)+(np)-(p)+(npk)-(pk)=(n)+(np)+(nk)+(npk)-(1)+(p)+(k)+(pk),这样,(N)也可看为有n的处理之和减去无n 处理之和。同样,(P)=(p)-(1)+(np)-(n)+(pk)-(k)+(npk)-(nk)=(p)+(np)+(pk)+(npk)-(1)+(n)+(k)+(nk)(K)=(k)-(1)+(nk)-(n)+(pk)-(p)+(npk)-(np)=(k)+(nk)+(pk)+(npk)-(1)+(n)+(p)+(np)两个因子互作效应,例如NP互作,可以
31、在相同K水平的条件下研究在有P时N的效应与没有P时N的效应,其不一致程度(差数)即为NP互作。即:,N的效应,所以(NP)=(npk)-(pk)-(nk)-(k)+(np)-(p)-(n)-(1)=(npk)+(np)+(k)+(1)-(nk)+(pk)+(n)+(k)同样(NK)=(npk)+(nk)+(p)+(1)-(np)+(pk)+(n)+(k)(PK)=(npk)+(pk)+(n)+(1)-(np)+(nk)+(p)+(k),三因子间的互作可以看为NP互作在有K时与无K时的相差。(NPK)=(npk)-(pk)-(nk)-(k)-(np)-(p)-(n)-(1)=(npk)+(n)+
32、(p)+(k)-(np)+(nk)+(pk)+(1),(1318),三因子间的互作也可以看为NK互作在有P与无P时的效应,或看PK互作在有N与N时的效应,其计算结果是一样的。以上各种效应的计算可按(+)、(-)号归纳成表13.50,以便于计算。,表13.50中各互作项的符号为其同列内相应各主效符号的相乘结果。表13.50 222因子试验主效及互作计算符号表,如果需要全面地考察以上全部七个效应,那么在同一区组中必须包含全部8个处理组合,通常可以应用随机区组设计。如果需要缩小区组增加地区控制的效果而同时可以牺牲实际意义不大的二级互作NPK,那么可以按(NPK)=(npk)+(n)+(p)+(k)-
33、(np)+(nk)+(pk)+(1)将8个处理组合分为两组,左边四个具有(+)号的设置一个区组,右边四个具有(-)号的另设置一个区组,如图13.5a和b等区组所示。,图13.5 小麦肥料试验田间排列图(混杂NPK,附小区产量公斤数),这时,因(+)组和(-)组分别在两个区组,肥力不相同,NPK互作和区组效应混合在一起区分不开,因而牺牲了NPK互作效应的估计或称混杂了NPK效应。但是由于区组缩小一半,可以降低试验误差,增加了其他三个主效,三个一级互作的准确性和精确性。若要混杂其他效应,只需按表13.50中相应效应的符号区分为(+)组(-)组即可。图13.5为混杂NPK四次重复的设计,这种在各重复
34、中均混杂同一效应的混杂方法称完全混杂法。,完全混杂设计使 NPK 全部舍弃,无法估计。如果试验希望了解 NPK 的交互作用,又不希望舍弃其他效应,这时可以采取部分混杂设计的方法。例如全试验有四次重复,第一重复混杂 NPK,第二重复混杂NP,第三重复混杂 NK,第四重复混杂 PK。其排列如图13.6所示。,图13.6 四个重复的222部分混杂设计图示,这种部分混杂设计中,N、P、K三个主效可从四个重复计算:NP、NK、PK、NPK 四个交互作用各可从三个重复计算,因而不至于舍弃任何一个效应。上面以23试验为列说明混杂的基本方法,由23的混杂方法可以推广至2n试验的混杂。,(二)222混杂设计的分
35、析1.完全混杂时的分析222混杂设计的线性模型,除混杂效应缺失外,其他均同三因素试验的线性模型,但一般处理效应均为固定模型。完全混杂时的分析例13.9 以图13.5中的数据为例说明。若这试验为四次重复的随机区组设计则处理组合平方和可进一步分析为各主效平方和及互作平方和。在本例2水,平的情况下,各效应平方和的简法计算为:为比较混杂设计方差分析的特点,今将此试验先暂按随机区组设计计算如下:(1)列一区组与处理组合的二向表13.51。(2)计算随机区组各部分平方和,(1319),表13.51 小麦222肥料试验产量表(kg/区),(3)计算各主效及互作平方和先计算各效应的总和(N)=(n)+(np)
36、+(nk)+(npk)-(1)+(p)+(k)+(pk)=111+178+119+181-43+127+42+149=589-361=228,依次,(P)=320;(K)=32;(NP)=-62;(NK)=-10;(PK)=18;(NPK)=-28再按(1319)计算各效应的平方和:,(4)列出方差分析表13.52。表13.52 小麦222肥料试验方差分析表,今若按混杂NPK的设计进行分析,则(1)区组与处理组合的二向表应如表13.53。在表中分别计算区组总和Tr。(2)计算各部分平方和时,总 这两项同前。区组 与前不同。,表13.53 小麦222完全混杂(NPK)设计产量表(kg/区),这里
37、区组平方和共有7个自由度,包括重复间3个,重复内a、b两区组间4个(包括NPK互作1个),合计区组间共7个。其相应的平方和:重复间SSR=61.38(见以前计算结果)重复内a、b两区组间其中包括SS(NPK)=24.50,见前,所以区组=重复间SSR+重复内a、b两区组间SS(a-b)=99.38处理组合SSt中SS(NPK)已与区组混杂应扣去,故 处理=处理组合SSt-SS(NPK)=4989.88误差SSe=总SST-区组-处理=-4989.88=111.62(3)各因子主效及互作平方和计算方法同前,SS(NPK)已混杂于区组中,不包括在这里。(4)方差分析表将如表13.54。,表13.5
38、4 23完全混杂(NPK)设计方差分析表,F 测验结果同前,各种因子效应的分析也同前,这里从略。比较混杂设计的分析结果和完全区组的分析结果,误差项平方和通过混杂NPK的效应从125.12降低到111.62,但自由度从21减到18,所以误差项均方反而由5.95增加到6.20。似乎混杂NPK后效果并不好,这是因为在222的情况下原来完全区组只包括8个处理组合,并不算大,因而通过混杂设计以降低试验误差作用不明显。,2.部分混杂时的分析例13.10 设若表13.51的资料来自图13.6的部分混杂设计,今将其分析如下:(1)按图13.6及表13.51中数据计算各区组总和(表13.55)表13.55 各区
39、组总和表(Tr),(2)按未混杂的方法计算各种效应及其平方和。表13.56 各主效及互作均未混杂的效应与平方和计算表,平方和=,表13.56中主效部分为实际结果,四个互作效应为假定未混杂时的结果。(3)计算混杂后的四个互作效应及其平方和。(NP)由、,(NK)由、,(PK)由、,(NPK)由、计算。表13.57 混杂后四个互作效应及其平方和计算表,平方和=,(4)计算各部分平方和以下两项仍同前区组 与前又不同 处理 的计算如下:,第一步 先算出处理组合第二步 在表13.57中计算混杂后四个互作效应平方和的总和,这里为108.84。第三步 从表13.56中计算假定四个互作效应未混杂时平方和的总和
40、,这里为:120.12+3.12+10.12+24.50=157.86由第三步所获平方和的总和与第二步所获平方和的总和之差=49.02表示每重复各和区组混杂了一个效应的平方和的总和数。,第四步 由处理组合SS中扣除已混杂掉的各效应平方和即为处理平方和。处理=5014.38-49.02=4965.36 误差SSe=总SST-处理-区组-148.38=87.14(5)列出方差分析表13.57F 测验结果说明若表13.51的数据为图13.6的部分混杂设计,则除N、P、K、NP的效应显著外,NPK三因子互作也呈现显著性。部分混杂设计没有舍弃这,部分互作效应,否则若按完全混杂方法将这部分效应与区组混杂就
41、得不到这方面的结果,这体现了部分混杂设计的长处。,表13.58 23部分混杂设计方差分析表,二、多因素部分重复试验的设计与分析,部分重复(fractional replication)试验:若一个多因素试验中可以忽略的效应较多,则可进一步采用部分实施(即部分处理组合)进行试验,将不重要的效应(常是互作效应)相互混杂,从而缩小试验规模,提高准确性和精确性。(一)正交表的性质和应用1.正交表及其类型,表13.59 几个常用的正交表及其附表,1 L4(23),任二列的交互作用为另一列,任二列的互作为另外二列,3 L8(27),4 L8(27)的交互作用列,5 L8(27)的表头设计,2.正交表的主要
42、性质,(1)均衡分散、综合可比 正交表中:任意一列内不同数字出现的次数相同;任意两列间,同横行的数字对,如L4(23)中的(1,2),(1,2),(2,1),(2,2),其次数也相同L4(23)中均为一对,L8(27)中均为二对。(2)可伸可缩,效应明确 正交表中j代表最多可以考察的效应数,若各因子只要考察主效,则可以安排j个因子。,3.选用正交表设计试验方案的步骤,(1)确定试验因素和每个试验因素的变化水平。(2)根据试验因素和水平数的多少以及是否需要估计互作等,选择合适的正交表。(3)在所选正交表上进行表头设计,写出试验的各个处理组合,形成试验方案。表头设计:将试验因素和需要估计的互作,排
43、入正交表的表头各列;必须注意,各列下的水平数必须,和该列试验因素的水平数相同;然后,根据各试验因素列下的水平,写出该试验的各个处理组合,即作成了试验方案。(二)部分重复试验的分析 1.无交互作用的试验部分重复试验一般可采用随机区组设计,供试处理组合少时也可考虑用拉丁方设计。其分析方法仍同原各种设计,但试验处理平方和的进一步分解可以籍助于正交表而简化并便于校核。,例13.13 设为了解温度(高、中、低),菌系(甲、乙、丙),培养时间(长、中、短)对根瘤菌生长的影响,进行培养试验,据以往经验,三因素间无明显交互作用,目的在考察三因子的主效并筛选最佳组合,选用L9(34)表,将A、B、C 分别放在1
44、,2,4列,重复试验二次,随机区组设计。每10视野根瘤菌计数结果及其分析列在表13.60。(1)按随机区组设计计算各部分平方和(表13.60右下角)。(2)计算正交表中每一列的平方和。(3)列出方差分析表13.61。正交表中第3列为(AB),(BC),(AC)各互作效应一部分数量,的混杂,既然预先估计因子间无互作,这一列便可作误差看待。因而表13.60的误差项为随机区组的误差与第3列误差的合并,以增加自由度。F测验结果,各因子的主次为B,A,C,其中C的效应无显著性。(4)各因子主效差异的测验同前。若按表13.60中所列各水平(T1、T2、T3)比较,则,在无互作效应时,正交试验的效率很高,可
45、以节省大量的试验工作量。本试验9个处理2次重复=18小区,使每因子水平均重复6次,若将各因子分开做单因子试验就需要633=54个小区。(5)最佳组合可从各显著因子水平的组合估计,这里以a1b3为最佳。因c因子无显著性,任何水平均可采用。按A、B两因子可估得33=9个组合的理论值。,表13.60 根瘤菌培养温度、菌系、时间三因子部分重复试验每10视野细菌数结果,=15633368.06,表13.61 根瘤菌三因子试验方差分析表,2.有交互作用的试验例13.14 赤霉菌培养方法试验,供试因素及水平如表13.62。表13.62 供试因素和水平,根据实验经验,有些因子间有交互作用,重点拟考察A、B、C
46、之间的交互作用。因此,按正交表L27(313)设计,共27个处理组合实施比例为1/(34)=1/81,重复2次,每次做一个重复,考察指标为赤霉素效价单位数,其表头设计及结果列在表13.63中。表13.64方差分析结果主效的主次顺序为D、C、F、E,其中D、E、F三个因子均有显著性,因它们间无交互作用,故最佳水平即为最佳组合,最佳水平可用以下LSD值测验T1、T2、T3间的差异。,测验结果:d2,d3,e1,e2,f3较佳,G因子无显著性,各水平都可采用。A、B、C三因子,相互间的一级交互作用均显著;主次顺序为AC、BC、AB,说明各该最佳的主效水平不一定是最佳组合,要具体分析,故每用以下LSD
47、0.05值对表13.65中各二因子处理组合总和间进行t测验:,(千单位),(千单位),表13.63 按正交表L27(313)的设计和试验结果计算表,表13.64 赤霉菌培养配方试验方差分析表,表13.65 A、B、C各二因子水平组合总和表各组合表内凡有横线的,组合间无显著差异,是该二因子最佳的组合,即:(按主次顺序)AC表中的a1c2,a3c1,a3c2,a2c1;BC表中的b3c1,b2c2,b3c2,b1c1,b1c2,b2c3;AB表中的a3b2,a1b2,a2b3,a3b3。,以AC表中最佳二因子组合为基础,综合A、B、C三因子的最佳组合将为:a1b2c2,a3b3c1,a3b2c2,
48、a2b3c1等。若从节约成本方面考虑a3b3c1及a2b3c1较好。再加上D、E、F因子一起考虑,选用d2,e1,f3较省时省料,故全部因子的最佳组合将为a3b3c1d2e1f3或a2b3c1d2e1f3,这两个组合是由试验分析出来而供试组合中所没有的。由表13.64及13.62可以计算出显著效应的c1,d2,e1,f3,a3b3,a3c1,b3c1或c1,d2,e1,f3,a2b3,a2e1,b3a1的效应值从而估计出这两个最佳处理组合的理论效价单位分别为30.7及29.0,具体过程不再赘述。,采用正交设计,减少设施比例,由于伴随着要混杂掉部分效应,需要对各种效应事先有所估计,以便使混杂的这
49、部分效应在实际是不存在的。这种估计一般只能凭经验,也可能会有出入,所以有些正交试验中往往出现分析所得的最佳组合在实际供试组合中的表现并不是最好的。这时不能说全部试验报废,供试处理组合间的比较仍是有效的,不过在推论各种效应及未经试验比较的处理组合时,需要慎重推敲。本试验如果不分析各种效应而直接比较供试处理组合的优劣,则:,得下面几个处理组合较佳:23号 a3b2c2d2e1f3g2 26.5(千单位),19号 a3b1c1d3e2f3g2 25.2(千单位),25号a3b3c1d2e1f1g3 23.4(千单位),26号 a3b3c2d3e2f2g1 22.4(千单位),2号 a1b1c2d2e
50、2f2g2 22.4千单位),10号 a2b1c1d2e3f2g3 21.4(千单位)。,比较本例中推论的最佳处理组合与实际试验的最佳处理组合两者结果是比较相符的。,三、正交试验方案设计的要点,进行正交试验时,应着重注意以下要点:1.表头的设计 如果对各种试验因素的作用都不甚明了,希望初步筛选出一些较主要的因素,以便进一步研究,则应用正交试验是十分合适的。此时可暂不管主效和互作的混杂,在各列上排满试验因素。2.重复区的设置 有些实验室试验常采用一次重复的全面试验,这时常将高阶(二阶以上)互作作为误差的估计。,3.处理数目的限制 试验误差的减小在相当程度上依赖于区组的局部控制作用。区组愈大,局部