第八章 单因素试验结果的统计分析《试验设计与统计分析》课件.ppt

上传人:牧羊曲112 文档编号:4040997 上传时间:2023-04-02 格式:PPT 页数:100 大小:1.53MB
返回 下载 相关 举报
第八章 单因素试验结果的统计分析《试验设计与统计分析》课件.ppt_第1页
第1页 / 共100页
第八章 单因素试验结果的统计分析《试验设计与统计分析》课件.ppt_第2页
第2页 / 共100页
第八章 单因素试验结果的统计分析《试验设计与统计分析》课件.ppt_第3页
第3页 / 共100页
第八章 单因素试验结果的统计分析《试验设计与统计分析》课件.ppt_第4页
第4页 / 共100页
第八章 单因素试验结果的统计分析《试验设计与统计分析》课件.ppt_第5页
第5页 / 共100页
点击查看更多>>
资源描述

《第八章 单因素试验结果的统计分析《试验设计与统计分析》课件.ppt》由会员分享,可在线阅读,更多相关《第八章 单因素试验结果的统计分析《试验设计与统计分析》课件.ppt(100页珍藏版)》请在三一办公上搜索。

1、第八章 单因素试验结果的统计分析,第八章 单因素试验结果的统计分析单因素试验指仅研究一个供试因素若干处理间的效应是否有显著差异的试验.按试验设计的类型单因素试验可分为:顺序排列试验单因素完全随机试验单因素随机区组试验拉丁方试验,第一节 对比和间比试验的统计分析(自学)第二节 完全随机试验设计的统计分析完全随机设计:是所有的处理和重复小区在整个试验空间完全随机排列的设计方法。只满足试验设计三项基本原则中的重复和随机排列两项原则。,如:k=5,n=3的完全随机排列示意图,C E C B D A D E A C E B A D B,常用于温室和盆栽试验以及处理内变异相差较大的遗传试验等。可用三套(1

2、5张)小纸片,即3张A、3张B.3张E,混匀后摆成3排,每排摆5张,从而完成随机。,主要优点:对各处理的重复次数没有限制,可以相等也可以不相等不足之处:没有遵循局部控制原则,所以要求试验地较为均匀一致,不存在有明显方向性的肥力差异,一般不用于田间试验。,根据每一处理的重复次数或重复的设计方法不同,又分为:组内观察值数目相等;组内观察值数目不等的完全随机试验;组内又可分为亚组的完全随机试验,一、组内观察值数目相等的完全随机试验设计的统计分析组内观察值数目相等的完全随机试验是各处理重复次数相等的试验。设有k个处理,每处理均有n个重复观察值,共设kn个观察值;其资料的数据结构模式类型见第7章表7.1

3、。其试验结果的方差分析方法列于表8.1。,表7.1 k个处理每处理n个重复观察值的完全随机试验数据符号表,表7.1 nk个观察值的单向分组资料模式,表8.1 组内观察值数目相等的完全随机试验的方差分析,例8.1研究6种棉花种子包衣剂对棉花生长的影响,设TW1为对照。采用盆栽试验,各种子包衣剂处理播种5盆,完全随机设计。出苗一定时期后测定棉花苗高(cm),其结果如下。试检验各种子包衣剂与对照的棉花平均苗高差异显著性及各种子包衣剂棉花平均苗高间的差异显著性。,表8.2 6种棉花种子包衣剂的棉花苗高结果(cm),解:已知:处理数k=6,重复次数n=5,共有kn=65=30个观察值。1、自由度及平方和

4、的分解 总自由度 dfT=nk 1=6 5 1=30 1=29 处理自由度 dft=k 1=6 1=6 1=5 误差自由度dfe=dfT dft=29 5=24 或 dfe=n(k 1)=6(5 1)=24 1=23矫正数,总平方和 SST=x2C=22.92+22.32+23.72-C=45.763处理平方和 误差平方和 SSe=SSTSSt=45.76344.463=1.300,2、F 检验和列方差分析表统计假设HO:1=2=6;HA:i不“全相等”(即至少有一个不等号)将上述计算的各项自由度、平方和、均方结果,按变异来源列出方差分析表(表8.5)。表8.3 种子包衣剂对棉花苗高影响的方差

5、分析表,FF0.01,故P0.01;表明种子包衣剂处理间差异极显著,即6种棉花种子包衣剂对棉花苗高的影响有极显著差异。3、处理平均数的多重比较当各处理平均数与对照相比较时,一般采用最小显著差数法(LSD法)。当处理间相互比较时,常采用新复极差法(SSR法)。,最小显著差数法(LSD法)首先计算平均数差异标准误:再计算最小显著差数,然后,计算处理平均数于与对照平均数的差数,检验各种子包衣剂与对照的差异显著性结果列于表8.6。表8.4 种子包衣剂处理的棉花苗高与对照相比的差异显著性,新复极差法(SSR法)计算平均数标准误。根据显著水平、误差自由度=24和两极差间所包含的平均数的个数p(秩次距),p

6、=2,3,4,5,6查SSR表,查得临界SSR0.05(24,p)和SSR0.01(24,p)值;,再计算最小显著极差 表8.5 种子包衣剂对棉花苗高影响的LSR值,用标记字母法表示新复极差法多重比较的结果。表8.6 6种子包衣剂对棉花苗高的影响新复极差检验结果,4、试验结论试验结论1 由LSD法显著性比较结果(表8.4)表明,种子包衣剂TW5、TW2、TW6和TW3均比对照TW1极显著的促进了棉花的生长,TW4比对照TW1极显著的抑制了棉花的生长 试验结论2 由新复极差检验结果(表8.6)表明,种子包衣剂TW5促进棉花生长的效果极显著的高于TW2、TW6、TW3、TW1和TW4;种子包衣剂T

7、W2和TW6促进棉花生长的效果极显著高于TW3、TW1和TW4,TW2和TW6间无显著差异;TW3促进棉花生长的效果极显著高于TW1和TW4;TW1促进棉花生长的效果极显著高于TW4。,二、组内观察值数目不等的完全随机试验的统计分析 在单因素完全随机试验中,若k 组处理的重复观察值数目不相等,分别用n1,n2,n3,nk表示,试验观测值总数为ni;则称为组内观察值数目不等的单因素完全随机试验。与组内观察值数目相等的方差分析步骤基本相同;计算公式上略有差异。,自由度及平方和分解的差异总变异自由度 dfT=ni 1 误差自由度 矫正值 C=T2/ni总平方和,处理平方和 误差平方和 平均数多重比较

8、的计算差异平均数标准误,上式的nA和nB系两个相比较的平均数的样本容量。但亦可先算得各ni的平均数n0。则平均数标准误 平均数差数标准误,例8.4 选用5个棉花品种A、B、C、D和E进行营养钵育苗试验,采用完全随机设计。播种后40d测定株高(cm),测定结果如表8.7所示。试比较5个品种的平均株高有无显著差异。表8.7 5个棉花品种株高观测结果(cm),解:已知:品种数k=5,各品种重复次数n1=n2=6,n3=5,n4=n5=4。自由度与平方和的分解总自由度 dfT=ni 1=25-1=24品种间自由度 dft=k 1=5-1=4误差自由度 dfe=dfT dft=24 4=20,矫正数总平

9、方和 品种间平方和 误差平方和 SSe=SSTSSt=267.7576 150.0863=117.6713,列方差分析表进行F检验表8.8 5个棉花品种株高观测结果方差分析 品种间的F=6.376F0.01(4,20),P0.01,表明品种间有极显著差异,需作多重比较。,平均数间多重比较,比较各品种平均株高间有无显著差异,宜采用新复极差检验作多重比较。计算出平均重复次数 计算平均数标准误,查出=0.05与=0.01的临界SSR值,乘以,即得各最小显著极差,所得结果列入表8.9。表8.9 棉花品种株高新复极差检验的LSR值,结果用标记字母法列于表8.12。表8.10 5个棉花品种株高的新复极差检

10、验结果,试验结论表8.10试验结果表明,D品种的平均株高显著高于其他供试品种的平均株高,极显著高于B、E和C品种的平均株高;A品种的平均株高显著高于C品种,但A品种与B、E品种之间差异不显著。可以认为D品种生长速度最快,A品种生长速度居中,C品种生长较慢。,三、组内又可分为亚组的完全随机试验的统计分析,单因素完全随机试验,如果设若干个组,每组又分为若干个亚组,而每个亚组内又具有若干个观察值,称为组内又可分为亚组的完全随机试验,其测定结果简称为系统分组资料。这种试验设计也称为巢式设计(Nested design)。,地块 株,样点 枝条,数次分析 叶片,土样分析 果树病害,1、组内又可分为亚组的

11、完全随机试验的数据模式,2、线性可加模型和期望均方分解上述数据的线性数学模型为:xijk=m+ti+dij+eijkti=mi m为组效应(或处理效应)N(0,st2)dij=mij mi为亚组效应 N(0,sd2)eijk=xijk-mij 为随机误差N(0,s2)当由样本估计时,相应的数学模型为:分别是m、ti、dij 和eijk的估值,3、组内又可分为亚组的完全随机试验的方差分析方法,自由度及平方和的分解总自由度 dfT=lmn-1组间自由度 dft=l-1组内亚组间自由度 dfm(l)=l(m-1)误差自由度 dfe=lm(n-1)矫正数,F检验首先检验H0:sd2=0(即检验各亚组间

12、效应方差是否显著存在)F=sm(l)2/se2 具df1=l(m 1),df2=lm(n 1)然后检验H0:mi=m(固定模型时;检验各组间有无不同效应);或H0:st2=0(随机模型时;即检验各组间效应方差是否显著存在),i)当被H0:sd2=0被否定时 F=st2/sm(l)2 具df1=l 1,df2=l(m 1)ii)当被H0:sd2=0 被接受时 F=st2/se2 具df1=l 1,df2=l(mn 1)se2为sm(l)2与se2合并均方,多重比较若进行组内亚组间平均数的多重比较,自由度=dfe,则平均数标准误为:若进行组间平均数的多重比较,则平均数标准误和自由度分别为:,例8.

13、5 用A,B,C,D等4种油菜种子包衣剂处理油菜品种农杂62的种子,研究油菜种子包衣剂的对油菜生长的影响。各种子包衣剂处理播种3盒,采用完全随机设计。播种后20d测定苗高(cm),每盒测定5株,结果如表8.13所示。试比较不同种子包衣剂对油菜平均苗高的影响有无显著差异。,表8.13 种子包衣剂对油菜苗高的影响结果,解:本例属于单因素组内又可分为亚组的完全随机试验资料,处理数 l=4,每处理重复盒数m=3,每盒重复观测次数n=5,共有lmn=435=60个观测值。计算各项自由度与平方和总自由度 dfT=lmn-1=435 1=59种子包衣剂间自由度 dft=l-1=4 1=3种子包衣剂内盒间自由

14、度 dfm(l)=l(m-1)=4(3 1)=8,误差(个体间)自由度dfe=lm(n 1)=43(5 1)=48矫正数 C=T2/lmn=366.32/60=2236.2515总平方和SST=x2 C=(6.52+7.32+4.52+5.82)-2236.2615=2277.25 2236.2615=40.9885,种子包衣剂间平方和 种子包衣剂内盒间的平方和,误差(个体间)平方和F检验首先检验H0:sd2=0(即检验各亚组间效应方差是否显著存在)说明同一种子包衣剂内各盒间平均苗高无显著差异。,再检验种子包衣剂间效应差异显著性:要将sm(l)2、se2合并用 se2作分母,即:FF0.01(

15、3,56)=4.15,推断:不同种子包衣剂平均苗高间有极显著差异。检验结果见方差分析表(表8.14)。,因此要检验各种子包衣剂平均苗高间的差异显著性,表8.14 油菜种子包衣剂对苗高影响的方差分析,各种子包衣剂平均数间的多重比较(SSR法)平均数标准误为:以dfe=l(mn 1)=4(35 1)=5660,查SSR表,查得p=2,3,4时SSR0.05和SSR0.01的值,求出相应的各LSR值列于表8.15,表8.16 种子包衣剂的油菜苗高(cm)新复极差检验结果,试验结论 由表8.16试验结果表明,4种油菜种子包衣剂间有极显著差异;包衣剂C的苗高极显著高于A、B和D的苗高;A的苗高极显著高于

16、种子包衣剂B和D的苗高;B的苗高极显著高于D的苗高。,第三节 单因素随机区组试验的统计分析,一、统计分析方法单因素随机区组试验设计根据随机、重复和局部控制三大原则,将试验地按土壤肥力梯度划分成等于重复次数的几个区组,区组内各小区完全随机排列。要求区组方向与土壤肥力梯度垂直,小区的长边与土壤肥力梯度平行。处理数目一般不要超过20个,最好10个左右。这种试验设计适用于品种比较试验和栽培试验等各种试验。,如:k=5,n=3的随机区组排列示意图,A E C B D,一般用于田间试验或环境条件有差异的试验,肥力梯度,B D E A C,E C A D B,设有k个处理,n个区组,试验共有kn个观测值。表

17、8.17 单因素随机区组试验观察值的数据结构(i=1,2,k;j=1,2,n),表8.18 单因素随机区组试验结果的方差分析表,处理平均数的多重比较方法与完全随机设计的相同,即:新复极差法(SSR法)式中:最小显著差数法(LSD法)式中:,例8.2有一水稻品比试验,有A1、A2、A3、A4、A5、A6、A7、A8,8个品种(k=8)。其中A2为对照品种,采用随机区组设计,重复3次(n=3),小区计产面积40m2,其产量结果列于表8.19,试分析各品种产量是否有显著差异?,表8.19 水稻品比试验产量结果(kg),返回SST,返回SSt,解:已知:品种数 k=8,区组数与重复次数相同 n=3,A

18、2为CK,随机区组设计,小区计产面积=40m2;。1、计算各平方和与自由度总自由度 dfT=kn-1=83-1=23 品种间自由度 dft=k-1=8-1=7 区组自由度 dfr=n-1=3-1=2误差自由度 dfe=(k-1)(n-1)=(8-1)(3-1)=14,矫正数 总平方和 区组平方和,数 据,处理平方和 误差平方和 SSe=SSTSStSSr=121.01830 84.66500 8.82333=27.52997,数 据,2、F检验,表8.20 水稻品种比较试验产量结果方差分析,对区组间均方作F检验,假设H0:1=2=3;HA:1、2、3不“全相等”(1、2、3分别代表区组、的总体

19、平均数),F=4.41165/1.96643=2.244F0.05,推断:接受H0,说明3个区组的非处理因素比较一致,试验地的土壤肥力较均匀(一般可以不作区组间的F检验,因为试验的目的不是研究区组效应)。,对品种间均方作F检验,假设H0:A1=A2=A3.=A8 HA:A1、A2、A3.、A8不全相等(A1、A2、A3.、A8分别代表品种A1、A2、A3.、A8的总体平均数)F=12.09500/1.96643=6.151F0.01,故在=0.01的水平上否定H0,接受HA。说明8个供试品种的总体平均数间有极显著差异。但并不清楚哪两个品种平均数间差异显著,哪两个品种平均数间差异不显著。因而,进

20、行两品种平均数间的多重比较,3、多重比较 最小显著差数法(LSD法)本试验的目的要检验各供试品种产量是否与对照品种的有显著差异,采用LSD法较为适宜。首先计算品种产量平均数的差异标准误。,依dfe=14,查t值表得t0.05(14)=2.145,t0.01(14)=2.977,LSD0.05=1.1450 2.145=2.4560(kg)LSD0.01=1.1450 2.977=3.4087(kg),表8.21 水稻品比试验各品种产量与对照品种相比的差异显著性,新复极差检验法(SSR法),若认为有必要检验品种产量间的差异显著性,则选用SSR法。首先,计算平均数标准误。根据dfe=14,查SSR

21、表计算LSR值,结果列入表8.22,表8.22 水稻品种比较试验产量新复极差检验的LSR值,表8.23 水稻品种比较试验平均产量(kg)新复极差检验结果(标记字母法),4、试验结论试验结论1 表8.21检验结果表明,仅有A5品种的平均产量极显著高于对照A2,其他品种的平均产量与对照无显著差异。试验结论2 表8.23检试验结果表明,A5品种的平均产量显著高于其他品种,极显著高于对照A2和A1、A8、A4、A6、A7;A3品种的平均产量显著高于A7;而其它品种小区平均产量间均无显著差异。,二、单因素随机区组试验的线性模型和期望均方,1、单因素随机区组试验的线性模型单因素随机区组试验结果,具有k个处

22、理水平和n个区组。若以i代表横行(处理),则i=1,2,k;以j代表纵行(区组),则j=1,2,n,整个资料共有k行n列。所以,在第i行j列的观察值可以用xij表示,其线性模型为:xij=+i+j+ij,上式中,为总体平均数,i为处理效应,可为固定模型或随机模型。在固定模型中,i=0,假定在随机模型中,假定。j为区组效应,一般为随机模型,假定,若为固定模型则假定 j=0;而ij则为相互独立的随机误差,是从N(0,2)的总体中抽得的。样本观察值的线性模型为:,2、单因素随机区组试验的期望均方,单因素随机区组试验的各种效应一般有3种模型(参见第7章),即固定模型(也称模型I),随机模型(也称模型)

23、和混合模型。这3种模型的期望均方(EMS)列于表8.26。,表8.24 随机区组设计的期望均方,第四节 拉丁方试验的统计分析,将k个处理排成一个kk拉丁方,使得每一个处理在每一行或每一列中都只出现一次。每一行及每一列都成为区组(重复),行称为横行区组,列称为纵行区组。因此拉丁方设计有几个处理就必须设置几次重复,拉丁方设计的处理数重复数横行区组数纵行区组数。,III,DCEAB,CEABD,1、选择标准方,2、按数字1,4,5,3,2调整列的顺序,3、按数字5,1,2,4,3调整行的顺序,ABCDE,EDBCA,BADEC,IV,V,II,I,V,E B A D C,A D E C B,I,II

24、,B C D E A,IV,D A C B E,III,C E B A D,4、按2=A,5=B,4=C,1=D,3=E排列品种;并将区组顺序标记,优点:是从纵横两个方向同时进行局部控制,且各处理均衡分布在整个试验区,可以控制任意方向上的土壤肥力差异,因此试验的精确度高,是各种常用的试验设计中精确度最高的一种。缺点:由于其重复次数等于处理数,因此不适用于处理数很少或很多的试验。,一、拉丁方试验结果的统计分析,表8.25 拉丁方试验方差分析表,例8.3有一小麦品种比较试验,设有A1、A2、A3、A4、A5 等5个小麦品种,其中A5为对照品种(CK),采用55拉丁方设计,小区计产面积为20m2,其

25、田间排列和产量结果列于表8.26,试分析各供试品种的产量与对照品种的差异显著性。,表8.26小麦品比55拉丁方试验产量结果(kg),解:1、首先,计算横行区组产量总和Tr、纵行区组产量总和Tc 及总和数T.列入表8.16;然后列出各品种产量结果,计算品种产量总和数Tt和品种产量平均数 分别列入表8.27。,表8.27 小麦品比试验各品种产量结果表,2、自由度与平方和的分解横行区组自由度 dfc=k-1=5-1=4 纵行区组自由度 dfr=k-1=5-1=4品种自由度 dft=k-1=5-1=4误差自由度 dfe=(k-1)(k-2)=43=12 矫正数 总平方和,3、F检验,表8.28 水稻品

26、比试验结果的方差分析,品种间F F0.05,表明各供试品种的产量有显著差异,需要进行多重比较。4、多重比较各品种产量平均数与对照的差异显著性比较(LSD法):小区平均产量的平均数差异标准误,查t值表dfe=12时,t0.05(12)=2.179,t0.01(12)=3.055,各品种平均数间的多重比较(新复极差检验法)小区平均产量的平均数标准误根据dfe=12,查SSR表,计算新复极差检验的LSR值列入表8.20。,表8.31 小麦品种产量的新复极差检验结果,5、试验结论表8.29试验结果表明,A2品种的产量极显著高于对照A5,其余品种皆与对照无显著差异。表8.31试验结果表明,A2品种产量显著高于其他品种的产量,极显著地高于A3、A4、A5品种的产量;A1、A3、A4、A5品种产量间无显著差异。,二、拉丁方的线性模型与期望均方,i表示横行效应;j表示纵行效应,(t)表示处理效应。ij(t)是独立的随机误差、并作正态分布。如果处理与纵行或横行区组有交互作用存在,则交互作用与误差相混杂,不能得到确切的误差估计,难以进行确切的检验。不过,只要土壤差异不太大,一般可假定不存在互作。,表8.32 拉丁方设计的期望均方,本章学习要点,1、掌握单因素随机区组设计的统计分析方法,了解拉丁方设计的统计分析方法2、比较单因素完全随机和单因素随机区组在设计和分析上的异同,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号