不完全区组设计和统计分析.ppt

上传人:牧羊曲112 文档编号:5906865 上传时间:2023-09-02 格式:PPT 页数:102 大小:684KB
返回 下载 相关 举报
不完全区组设计和统计分析.ppt_第1页
第1页 / 共102页
不完全区组设计和统计分析.ppt_第2页
第2页 / 共102页
不完全区组设计和统计分析.ppt_第3页
第3页 / 共102页
不完全区组设计和统计分析.ppt_第4页
第4页 / 共102页
不完全区组设计和统计分析.ppt_第5页
第5页 / 共102页
点击查看更多>>
资源描述

《不完全区组设计和统计分析.ppt》由会员分享,可在线阅读,更多相关《不完全区组设计和统计分析.ppt(102页珍藏版)》请在三一办公上搜索。

1、第十四章 不完全区组设计和统计分析,第一节 不完全区组设计的主要类型第二节 重复内分组和分组内重复设计的统计分析第三节 简单格子设计的统计分析第四节 平衡不完全区组设计的统计分析,第一节 不完全区组设计的主要类型,一、田间试验常用设计的归类二、重复内分组和分组内重复设计三、格子设计四、平衡不完全区组设计,一、田间试验常用设计的归类,完全区组(complete block):每一区组包含全套处理。不完全区组(incomplete block):即一套处理分成几个区组,或一个区组并不包含全部处理,但同样要通过区组实施地区控制。,二、重复内分组和分组内重复设计,重复内分组设计(block in re

2、plication):将供试品种分为几个组,看作为主区,每个组内包含的各个品种看作为副区,重复若干次,主副区都按随机区组布置的设计。例如20个品种,分为4组,每组包含5个品种,若重复3次,则田间布置可设计如下图:,重复内分组设计的田间布置该例中重复内分组设计的自由度分析如下:,变 异 来 源 DF重 复 2组 间 3误 差(Ea)6组内品种间 16误 差(Eb)32总 59组内品种间比较的误差将为:;,各组平均数间比较的误差将为:;不同组品种间比较的误差(仿照裂区的情况)将为:。由于Ea与Eb常取不同数值,Ea往往大于Eb,例如=3,若如此,则:组内品种间比较的误差将为:不同组品种间比较的误差

3、将为:,两者比值为:即不同组品种间比较的方差将比组内品种间比较的方差大40%,因而像这种不完全区组设计的方法,并不能保证任何两个品种间比较具有相近的精确度。分组内重复设计(replication in block):将供试材料分组后放在连片土地上的几组随机区组试验,通过土地连片而进行联合分析与比较。,分组内重复设计,三、格子设计,格子设计(lattice design):为了克服重复内分组设计中组间品种比较和组内品种比较精确度悬殊的问题,对品种分组的方法可考虑从固定的分组改进为不固定的分组,使一个品种有机会和许多其他品种,甚至其他各个品种都在同一区组中相遇过。,(一)格子设计的类别平方格子设计

4、(squared lattice):供试品种数为区组内品种数的平方,区组内品种数为p,供试品种数为p2;立方格子设计(cubic lattice):供试品种数为区组内品种数的立方,区组内品种数为p,供试品种数为p3;矩形格子设计:区组内品种数为p,供试品种数为p(p+1)。,(二)平方格子设计1.仿照随机区组式的设计 按品种分组方法的变换次数有:(1)简单格子设计(simple lattice)品种分组方法为二种,试验重复次数为2或2的倍数。,(2)三重格子设计(triple lattice):品种分组方法为三种,即在简单格子设计二种分组方法的基础上再增加对角线分组一种,重复次数为3或3的倍数

5、。(3)四重格子设计(quadruple lattice):在三重格子设计的基础上,再增加对角线一组,,(4)平衡格子设计(balanced lattice):品种分组方法增加到使每一对品种都能在同一区组中相遇一次。,55四重格子设计方法,2.仿照拉丁方的格子设计(1)平衡格子方设计(balanced lattice square)重复数r=(p+1)/2,每对品种在行或列区组中共相遇一次;,33平衡格子设计,33平衡格子方设计在行或列中相遇一次,r=(p+1)/2,重复数r=(p+1),每对品种在行及列区组中均相遇一次,亦即共相遇二次。,44平衡格子方设计在行及列中共相遇二次,r=(p+1)

6、,(2)部分平衡格子方设计(partially balanced lattice square):重复次数少于最小平衡重复数。与三重、四重格子设计类似,不一定每一对品种都在行或列区组中相遇。格子设计的优点是:考虑了供试品种间平衡比较的问题。但由于供试品种数多,这常只能实施部分平衡,而事实上很难实施完全平衡,因为完全平衡所需的重复次数导致试验规模过大。,育种工作中产量比较在早、中期阶段,因供试材料多需要考虑适合大量处理的设计,但这时每份材料的种子数少,一般不可能进行小区较大的精确试验,因而实际应用中部分平衡的格子设计已可满足要求。,四、平衡不完全区组设计,平衡不完全区组设计(balanced i

7、ncomplete block design):设计的供试处理数不多,不须按格子设计那样每一重复包含有区组大小为k的k个区组,而可将各重复寓于全部区组之中,区组数与区组大小不一定相等,即全试验包括大小为k的区组共t(处理数)或 t 倍个。,图14.7 一种平衡不完全区组设计例如品尝试验,对于一个人的味觉来说,品尝的对象增加太多时鉴别差异的灵敏度便下降,因而每个人只能品尝一部分。图14.7的情况,若有7个水果品种供鉴评,每人品尝3个,请7位品尝家作鉴评,便共品尝21次,每个品种品尝3次。此处每位专家,便是一个区组,每区组包含3个品种。这时尽管每人并未将7个品种全部鉴评过,但因是均衡的,每个品种至

8、少和其他6个品种比较过1次。这一试验可增加至14位专家则每对品种相遇2次,21位专家则相遇3次。因而可以请许多专家作出综合评判。,第二节 重复内分组和分组内重复设计的统计分析,一、重复内分组设计的统计分析二、分组内重复设计的统计分析,一、重复内分组设计的统计分析,重复内分组用于品种(系)试验时有二种情况:一是大量品种(系)间的比较目的在于选拔高产优系(固定模型试验);另一是从一个群体内随机抽出大量家系进行试验,通过供试的样本推论总体的情况(随机模型试验)。,假定重复内分组设计的供试品种为m=ab个,分a组,每组有b个品种(系),重复r次,则重复内分组设计的线性模型为:(141)固定模型时:,;

9、随机模型时:Ak,Bkl,。,重复内分组设计的自由度及期望均方,固定模型时分组间差异的测验,F=MS2/MS3;分组内品种(系)间差异的测验 F=MS4/MS5。重复内分组设计着重在分组内品种间的比较,其分组间比较,其,(143),(142),不同组品种间比较,其(144)随机模型时分组间变异的测验:(145)分组内变异的测验:F=MS4/MS5(146),F=(MS2+MS5)/(MS3+MS4)时,其有效自由度可用 Satterthwaite公式计算:(147)(147)中fi为各均方对应的自由度。由(145)及(146)的关系可分别估计出及。,二、分组内重复设计的统计分析,分组内重复的设

10、计的线性模型为:(148)固定模型时:,;随机模型时,Ak,Bkl,,。分组内重复设计的自由度及期望均方,固定模型时分组间差异的测验,F=MS1/MS4;分组内品种(系)间差异的测验F=MS2/MS4。分组内重复设计着重在分组内品种间的比较,其(149)分组间可以比较,其(1410),不同组品种间的比较,其(1411)随机模型时分组间差异的测验:(1412)其有效自由度按Satterthwaite公式。分组内品种间差异测验:F=MS2/MS4(1413),由(1412)及(1413)测验 及。在各分组品种(系)均为总体一随机样本的前题下,可假定分组平均数相等,从而对品种(系)平均数作统一调整。

11、重复内分组和分组内重复是目前品系产量早期比较试验较常用的设计,并常用于遗传参数的估计,尤其前者更为常用。,第三节 简单格子设计的统计分析,一、简单格子设计分析的基本原理二、简单格子设计的例题,一、简单格子设计分析的基本原理,设有9个品种,重复2次的简单格子设计试验,这9个品种分别给以二位数的代号如下:品种按横行、纵行分组,分别设置为一个重复,则其分组安排如下:,由重复所得产量以x表示,重复以y表示,各品种总和以t表示,则可以将试验结果整理如表14.3的形式(虚线表示区组)。,简单格子设计试验结果符号表,横行总和作为试验因子A(X分组)的效应,纵列为B(Y分组)的效应。此试验可看作为每个因子各具

12、3个级别的二因子试验,其自由度为:由于重复中A因子的效应和区组效应混杂,重复 中B因子与区组混杂,整个试验相当于一个虚拟的二因子部分混杂试验,其混杂的效应是A与B主效。,若将重复当作区组,那么本试验可按随机区组的方法进行方差分析,其自由度为(左图)现在每一重复又划分为区组,要把区组的变异从误差中扣去以减小试验误差,故其自由度分析将为(右图),由t11、t12、t33计算品种平方和中包含有区组的效应,夸大了品种的效应;由X1、X2、X3,Y1、Y2、Y3计算区组平方和则又包含了品种的效应,夸大了区组的效应。关键:从品种效应中扣去区组部分,得到可以共同比较的调整的品种平均数及品种平方和;估计出除去

13、品种效应的区组间变异,得到一个无偏的试验误差估计,进行合理的统计推断。,(一)品种调整平均数的计算 1=T1/6 为A因子第一级别的未调整平均数;1=T1/6 为B因子第一级别的未调整平均数。如品种12的未调整平均数为v12,则:(1414)其中,m为全试验总平均数。,(1414)说明任一品种总的离均差为横行离均差、纵 行离均差以及横行纵行互作效应三部分之和。令:Ai表示不包含区组效应A因子效应估计值;Bi表示不包含区组效应B因子效应估计值。则:A因子第一个级别的估计值,B因子第一个级别的估计值,又令Ab 表示与区组混杂的A因子效应估计值,Bb 表示与区组混杂的B因子效应估计值则 A因子第一个

14、级别的估计值,B因子第一个级别的估计值 若A0,B0分别表示X组及Y组综合在一起未调整的A因子及B因子效应,则:,求A及B的调整值比较合理的方法是以Ai、Bi及Ab、Bb各分组所获得结果的可靠程度进行加权平均,这里Ai、Bi效应没有区组效应在内,可用 衡量其可靠程度,其中 代表区组内误差的理论方差。Ab、Bb效应混有区组效应,区组效应越大,Ab、Bb估计A及B的可靠程度越小,可用 衡量其可靠程度,代表重复内区组间的理论方差(以小区为单位)。,(1415),(1416)当区组间没有真实差异时,Ai、Bi和Ab、Bb 同等重要,故:,得到A及B的估计值后,可得:(1417)因未调整的(v0-A0-

15、B0+m)与调整后的(v-A-B+m)应是相等的,两者相减 v-v0=(A-A0)+(B-B0)(1418)表示调整的品种平均数可由v0、(A-A0)及(B-B0)三部分计算。,由(1416)及(1415)可得:令 则,(1419),以品种11为例,需求出A及B各第一级别的A0、Ab、B0及Bb,其中,若令以上二矫正数分别以及代表,则:(1420)其中vef 中的ef代表以二位数字表示的某品种,在具有二个重复参试材料为p2的简单格子设计中 及 的通式可写为:,如果简单格子设计,每种分组重复二次,全试验共有四次重复,则:,(1421),(1422),在品种平均数的横行及纵行旁求出,求 出,就可计

16、算出各个品种的调整平均数。但为便于计算,一般直接在品种总和表旁求出品种总和的矫正数,计算出各个品种的调整总和,再求调整平均数。2次重复时调整品种总和为:(1423),(二)与 及w与 的估计上述品种调整平均数的计算需按,进行调整。可以由区组内均方Ei直接估计,主要需估计出。区组间均方的计算需由二部分平方和合并,要了解清楚这二部分平方和的计算,从一个四次重复的试验比较容易说明。,表14.4 四次重复简单格子设计试验结果符号表,在X、Y 两种分组各有重复时,从相同品种组的区组两次重复间的差异的效应扣去整个重复间差异的效应,可以估计出区组效应。其计算方法为(1424)二式之和。,(1424),这部分

17、平方和相当于A因子与重复的互作和B因子与 重复的互作之和,称为成分(a)。两种分组方法各对应X1与Y1之间差异的效应扣去整个分组方法总差异间的效应,也将属于区组的效应,其计算方法为(1425)二式之和。,(1425),这部分平方和相当于A因子与分组方法的互作和B因 子与分组方法的互作之和,称为成分(b)。因 T1-2X1=(X1+Y1-2X1)=Y1-X1故成分(b)也可写为:(1426),在33简单格子设计具有4个重复时,成分(a)具有 2+2=4个自由度,成分(b)也具有2+2=4个自由度,(a)与(b)两者相加共有8个区组自由度。在只有2个重复时,显然成分(a)无从计算,因此仅由成分(b

18、)代表区组的平方和。不过(1426)中分母将相应改变为23及29。,分析成分(a)均方所估计的方差分量为,其中 为区组内误差,为区组间的方差。成分(b)均方所估计的方差分量为,这是因为成分(b)的两部分是从同一材料计算来的,所以只估计了。当只有二个重复时,只能由成分(b)计得区组的均方(),但是由方差分析原理,正常的区组项均方应由 组成。所以对区组的理论方差的估计要作适当调整。,所以,(1427)当有四次重复时,成分(a)与(b)综合的均方所估计的分量为,即,所以,(1428)(三)品种平均数间比较的误差计算同区组内品种间比较:,异区组品种间比较:不论区组异同,品种间相互比较:,(1429),

19、(1430),若 由成分(a)单独估计,则,。当EbEi时,上列各公式均变为,这就类似随机区组时的公式。当Eb很大时,接近于1,(1429)、(1430)、(1431)三公式相应变为:,(1431),,和这种情况下,A与B的效应相当于由Ai及Bi单独估计,Ab及Bb对A、B均未提供信息。(四)品种平方和的调整直接按格子设计进行测验,则要对品种平方和进行调整,对于简单格子设计,其矫正数为:,(1432)其中,Ku为未调整的成分(b)平方和,Kb为调整的成分(b)平方和。Kb由(1425)计算,表14.3中的Ku可由下式计算:,(1433),表14.5 简单格子设计方差分析表,(五)期望均方简单格

20、子设计用于单因素试验,其期望均方和随机区组的情况一样,区组内误差估计了,调整的品种均方估计了(随机模型)或(固定模型)。二、简单格子设计的例题(一)二次重复简单格子设计的例题,例14.1 表14.6为一个55大豆品种重复二次简单格子设计的试验结果。其田间排列是随机的。随机的步骤:在每一重复内分别独立地随机安排区组;在每一区组内分别独立地随机安排品种代号;将各品种随机决定品种代号。,表14.6 55大豆品种简单格子设计的产量试验结果(r=2,kg/区),分析步骤如下:1.从表14.6计算各区组总和(这里即Xe及Yf),重复总和(这里即X及Y)各品种(未调整)总和(tef)以及Te、Tf值。并按随

21、机区组进行方差分析。结果列于表14.7。随机区组方差分析结果品种间无显著差异。进一步再按格子设计分析。,表14.7 随机区组方差分析表2.计算消去品种效应的区组平方和。由成分(b)单独估计。按(1425),r=2时为:,在表14.6上分别计算Te-2Xe及Tf-2Yf值,代进上式得:3.列出分解有区组变异的方差分析表(表14.8)。,=501.84,表14.8 55简单格子设计(r=2)方差分析表,调整后重复内区组间的变异很显著,说明将区组划出是很必要的。4.计算调整的品种总和()。由(1423),在简单格子设计两个重复时:,=0.7820,=0.1564,调整品种总和=在表14.6中分别计算

22、 及 然后计算各品种调整的总和,以品种(1)为例:=30+9.5-1.4=38.1。其余类推,全部结果列于表14.6的末端。5.计算品种平均数间比较的误差。同区组品种平均数间比较:,异区组品种平均数间比较:,全试验品种平均数相互比较:,一般用2.93作标准误进行品种间比较即可。,6.计算调整的品种平方和再进一步测验品种差异的显著性.按(1432)品种平方和的矫正数为:,其中Ku仿(1433)为:,Kb为调整的区组成分(b)平方和,即表14.9中的501.84。w=1/Ei=1/13.66=0.07321,1/(2Eb-Ei)=1/(262.73-13.66)=0.008945,=559.28+

23、85.30=644.58,故调整品种平方和,调整的品种均方及F 测验如下:,按照简单格子设计的分析结果调整以后的品种均方比 未调整时增大了,误差比随机区组时降低了,因而提高了试验的精确性。它与随机区组设计相比较,所提高的效率可估计如下:,即提高了74。本试验品种间无显著差异,所以不必进一步再做品种平均数间的比较。,(二)四次重复简单格子设计的例题例14.2 上例55大豆试验,原为一个四次重复的简单格子设计,若表14.6中的是第一重复及第三重复,今将第二重复,第四重复的结果补充列在表14.9中,重复与重复属同一种分组,重复与重复属另一种分组。分析步骤如下:1.从表14.6及14.9计算各重复各区

24、组的总和g,重复总和G,同品种的两个区组总和Xe及Yf,各品种,表14.9 55大豆品种简单格子设计、重复的产量结果(r=2,kg/区),(未调整)总和tef以及Te、Tf值。按随机区组预先进行方差分析(表14.10)。随机区组方差分析结果品种间无显著差异,进一步按格子设计分析。表14.10 随机区组方差分析表,2.计算消去品种效应的区组平方和。这里包括成分(a)及成分(b)两部分。成分(a)的计算:,成分(a)的另一种计算方法可适用于更多次重复的分析。即由相同分组方法内品种组与二次重复的交互作用项计算。区组平方和(区组总SS),重复间平方和(重复SS),品种组间平方和(品种组SS),成分(a

25、)=区组总SS-重复SS-品种组SS=602.18=164.72计算结果与前相同。成分(b)r=4时,为:3.列出分解有区组变异的方差分析表(表14.11)。,表14.11 55简单格子设计(r=4)方差分析表,4.计算调整的品种总和。,调整品种总和,在表14.9中分别计算出,及,然后计算各品种调整的总和,方法同上例。如品种15,=72+(+8.8)+(-61)=74.7,余类推。全部计算结果列于表14.9的末端。,5.计算品种平均数间比较的误差。,同区组品种,异区组品种,全试验品种,6.计算调整品种平方和并进一步测验品种差异的 显著性。,此即计算成分(a)时的品种组间平方和一项。调整品种平方

26、和,=791.24+154.33=945.57,调整的品种均方及F 测验如下:按格子设计分析,扣除了重复内区组间的变异,降低了试验误差,使品种间的变异呈现出显著性。7.进一步可以计算出调整的平均数,并由全试验品种SE 计算LSD 进行品种间的比较。方法同随机区组,此处从略。,第四节 平衡不完全区组设计的统计分析,例14.3 设若对某种水果7个品种进行风味品尝,请7位专家评分,每位专家按图14.7的计划鉴评3个品种,其第1号为对照品种,评分范围为最低0分,最高5分,结果列于表14.12。该试验具有处理数t=7,区组数k=3,重复数r=k=3,两两品种在同一区组相遇1次。这一设计的线性模型为:(1

27、434),表14.12 七个品种风味的专家评分结果(平衡不完全区组设计),其分析步骤如下:1.在表14.12中计算未调整的区组总和(B)及全试验总和(G)。计算未调整的品种总和(Tt)列于表14.13;同时计算出品种所在区组各区组总和的和数(Bt),如品种1为11.4+12.2+13.4=37.0等,列于表14.13。应与kG 相等,可用以验算数据。2.计算各品种的W 值。W=(t-k)T-(t-1)Bt+(k-1)G=4T-6Bt+2G(本例情况)。按(1434)将各小区的线性组成相加、减,可以发现不同品种的W值只包含区组效应,因而W值间的变异表示了调整后区组间的变异,其总和W 应为0。,表

28、14.13 平衡不完全区组设计数据分析表,调整处理平均 数,3.进行方差分析。全试验21个小区的总变异中包含有品种间纯变异、区组间纯变异、由于区组不完全而导致的品种与区组相混杂的一部分变异、以及区组内的误差四部分。其中品种与区组相混杂的一部分变异包含在处理总和(T)间的变异中,也包含在区组总和(B)间的变异中。因混杂的这一部分变异不论在前者还是在后者是同一个成分,因此在方差分析中只须考虑一个方面便可。由W 值计算调整的区组间平方和的公式为:,(1435)本例中为 342)=0.6629未调整的品种平方和:,全试验总平方和,区组内平方和=0.4238,表14.14 平衡不完全区组设计的方差分析表

29、 此处所获的Ee,实际上只是一个初步估计值,并不立即用于进行F测验,而需作进一步调整。4.计算加权因子w,并调整处理总和及平方和。(1436),按(Tt+wW)计算调整的品种总和(Tc),如品种1(CK)为11.4+(-3.8)(0.0370)=11.26等,填入表14.13。(1437),本例中,本例中,相应的均方为 2.5665/6=0.4278。,5.计算有效误差并作进一步方差分析。有效误差E=Ee1+(t-k)w 本例中E=0.0531+(7-3)0.0370=0.0608将调整的品种均方和有效误差填入表14.14右端,这时可进行F 测验。F 测验的结果表明品种间风味评价上有很显著的差异。必须说明平衡不完全区组设计的方差分析中根据加权因子w 调整的处理均方和误差均方都是近似的,包括w 值本身也有抽样波动,所以这一F 测验也是一种近似的测验。,6.处理间的比较。处理平均数间比较可用LSD 法,此例中已经F 测验证实品种间有显著差异,故实际上已用了Fisher保护最小显著差数法(FPLSD)。,FPLSD0.05=,测验结果如下:,比较结果,品种2、5、3与对照间无显著差异,品种4、6、7的风味评价均优于对照,尤其品种7最佳,优于品种3、4。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号