《第十章协方差分析.ppt》由会员分享,可在线阅读,更多相关《第十章协方差分析.ppt(54页珍藏版)》请在三一办公上搜索。
1、第十章 协方差分析,第一节 协方差分析的意义,下一张,主 页,退 出,上一张,协方差分析有二个意义,一是对试验进行统计控制,二是对协方差组分进行估计,现分述如下。一、对试验进行统计控制 为了提高试验的精确性和准确性,对处理以外的一切条件都需要采取有效措施严加控制,使它们在各处理间尽量一致,这叫试验控制。但在有些情况下,即使作出很大努力也难以使试验控制达到预期目的。例如:研究几种配合饲料对猪的增重效果,希望试验仔猪的初始重相同,因为仔猪的初始重不同,将影响到猪的增重。经研,下一张,主 页,退 出,上一张,发现:增重与初始重之间存在线性回归关系。但是,在实际试验中很难满足试验仔猪初始重相同这一要求
2、。这时可利用仔猪的初始重(记为x)与其增重(记为y)的回归关系,将仔猪增重都矫正为初始重相同时的增重,于是初始重不同对仔猪增重的影响就消除了。由于矫正后的增重是应用统计方法将初始重控制一致而得到的,故叫统计控制。统计控制是试验控制的一种辅助手段。经过这种矫正,试验误差将减小,对试验处理效应,下一张,主 页,退 出,上一张,估计更为准确。若 y 的变异主要由x的不同造成(处理没有显著效应),则各矫正后的 间将没有显著差异(但原y间的差异可能是显著的)。若 y的变异除掉x不同的影响外,尚存在不同处理的显著效应,则可期望各 间将有显著差异(但原y间差异可能是不显著的)。此外,矫正后的 和原y的大小次
3、序也常不一致。所以,处理平均数的回归矫正和矫正平均数的显著性检验,能够提高试验的准确性和精确性,从而更真实地反映试验实际。这种将回归分析与方差分析结合在一起,对试验数据进行分析的方法,叫做协方差分析(analysis of covariance)。,二、估计协方差组分 在第八章曾介绍过表示两个相关变量线性相关性质与程度的相关系数的计算公式:若将公式右端的分子分母同除以自由度(n-1),得(10-1),下一张,主 页,退 出,上一张,其中 是x的均方MSx,它是x的 方差 的无偏估计量;是y的均方MSy,它是y的 方差 的无偏估计量;,称为x与y的平均的离均差的乘积和,简称均积,记为MPxy,即
4、,(10-2),与 均 积 相 应 的 总 体参 数 叫 协 方 差(covariance),记为COV(x,y)或。统计学证明了,均积MPxy是总体协方差COV(x,y)的无偏估计量,即 EMPxy=COV(x,y)。于是,样本相关系数r可用均方MSx、MSy,均积MPxy表示为:(10-3),下一张,主 页,退 出,上一张,相应的总体相关系数可用x与y的总体标准差、,总体协方差COV(x,y)或 表示如下:(10-4),均积与均方具有相似的形式,也有相似的性质。在方差分析中,一个变量的总平方和与自由度可按变异来源进行剖分,从而求得相应的均方。统计学已证明:两个变量的总乘积和与自由度也可按变
5、异来源进行剖分而获得相应的均积。这种把两个变量的总乘积和与自由度按变异来源进行剖分并获得获得相应均积的方法亦称为协方差分析。,下一张,主 页,退 出,上一张,在随机模型的方差分析中,根据均方MS 和期望均方 EMS的关系,可以得到不同变异来源的方差组分的估计值。同样,在随机模型的协方差分析中,根据均积 MP 和期望均积 EMP 的关系,可 得 到 不同变异来源的协方差组分的估计值。有了这些估计值,就可进行相应的总体相关分析。这些分析在遗传、育种和生态、环保的研究上是很有用处的。由于篇幅限制,本章只介绍对试验进行统控制的协方差分析。,第二节 单因素试验资料的协方差分析,设有k个处理、n次重复的双
6、变量试验资料,每处理组内皆有n对观测值x、y,则该资料为具kn对x、y观测值的单向分组资料,其数据一般模式如表101所示。,下一张,主 页,退 出,上一张,表101 kn对观测值x、y的单向分组资料的 一般形式,表101的x和y变量的自由度和平方和的剖分参见单因素试验资料的方差分析方法一节。其乘积和的剖分则为:总变异的乘积和SPT是xji与 和yji与 的离均差乘积之和,即:(10-5)=kn-1,下一张,主 页,退 出,上一张,其中,,处理间的乘积和SPt是 与 和 与 的离均差乘积之和乘以n,即:(10-6)处理内的乘积和SPe是 与 和 与 的离均差乘积之和,即:(10-7),=k(n-
7、1)以上是各处理重复数n相等时的计算公式,若各处理重复数n不相等,分别为n1、n2、nk,其和为,则各项乘积和与自由度的计算公式为:(10-8),下一张,主 页,退 出,上一张,=SPT-SPt=-k=dfT-dft(10-9),有了上述SP和df,再加上x和y的相应SS,就可进行协方差分析。【例10.1】为了寻找一种较好的哺乳仔猪食欲增进剂,以增进食欲,提高断奶重,对哺乳仔猪做了以下试验:试验设对照、配方1、配方2、配方3共四个处理,重复12 次,选择初始条件尽量相近的长白种母猪的哺乳仔猪48头,完全随机分为4组进行试验,结果见表102,试作分析。,下一张,主 页,退 出,上一张,表102
8、不同食欲增进剂仔猪生长情况表(单位:kg),下一张,主 页,退 出,上一张,此例,=18.25+15.40+15.65+13.85=63.15=141.80+130.10+144.80+133.80=550.50 k=4,n=12,kn=412=48,协方差分析的计算步骤如下:(一)求x变量的各项平方和与自由度 1、总平方和与自由度 dfT(x)=kn-1=412-1=47,2、处理间平方和与自由度,=k-1=4-1=3,3、处理内平方和与自由度(二)求y变量各项平方和与自由度 1、总平方和与自由度,下一张,主 页,退 出,上一张,2、处理间平方和与自由度 3、处理内平方和与自由度(三)求x和
9、y两变量的各项离均差乘积和与自由度 1、总乘积和与自由度,=kn-1=412-1=47 2、处理间乘积和与自由度=1.64,下一张,主 页,退 出,上一张,=k-1=4-1=3 3、处理内乘积和与自由度 平方和、乘积和与自由度的计算结果列于表103。表103 x与y的平方和与乘积和表,(四)对x和y各作方差分析(表104)表104 初生重与50日龄重的方差分析表,下一张,主 页,退 出,上一张,分析结果表明,4种处理的供试仔猪平均初生重间存在着极显著的差异,其50 日龄平均重差异不显著。须进行协方差分析,以消除初生重不同对试验结果的影响,减小试验误差,揭示出可能被掩盖的处理间差异的显著性。(五
10、)协方差分析,下一张,主 页,退 出,上一张,1、误差项回归关系的分析 误差项回归关系分析的意义是要从剔除处理间差异的影响的误差变异中找出50日龄重(y)与初生重(x)之间是否存在线性回归关系。计算出误差项的回归系数并对线性回归关系进行显著性检验,若显著则说明两者间存在回归关系。这时就可应用线性回归关系来校正y值(50日龄重)以消去仔猪初生重(x)不同对它的影响。然后根据校正后的y值(校正50日龄重)来进行方差分析。如线性回归关系不显著,则无需继续进行分析。,回归分析的步骤如下:(1)计算误差项回归系数,回归平方和,离回归平方和与相应的自由度 从误差项的平方和与乘积和求误差项回归系数:(10-
11、10)误差项回归平方和与自由度(10-11)dfR(e)=1,下一张,主 页,退 出,上一张,误差项离回归平方和与自由度=85.08-47.49=37.59(10-12)(2)检验回归关系的显著性(表105)表105 哺乳仔猪50日龄重与初生重的 回归关系显著性检验表,F检验表明,误差项回归关系极显著,表明哺乳仔猪50 日龄重与初生重间存在极显著的线性回归关系。因此,可以利用线性回归关系来校正y,并对校正后的y进行方差分析。2、对校正后的50日龄重作方差分析(1)求校正后的50日龄重的各项平方和及自由度 利用线性回归关系对50日龄重作校正,并由校正后的50日龄重计算各项平方和是相当 麻烦的,统
12、计学已证明,校正后的总平方和、误差平方和及自由度等于其相应变异项的离回归平方和及自由度,因此,其各项平方和及自由度可直接由下述公式计算。,下一张,主 页,退 出,上一张,校正50日龄重的总平方和与自由度,即总离回归平方和与自由度(10-13)=-=47-1=46 校正50日龄重的误差项平方和与自由度,即误差离回归平方和与自由度(10-14)=-=44-1=43 上述回归自由度均为1,因仅有一个自变量x。,校正50日龄重的处理间平方和与自由度=57.87-37.59=20.28(10-15)=k-1=4-1=3(2)列出协方差分析表,对校正后的50日龄重进行方差分析(表106)查F值:=4.27
13、5(由线性内插法计算),由于F=7.63,P0.01,表明对于校正后的50日龄重不同食欲添加剂配方间存在极显著的差异。故须进一步检验不同处理间的差异显著性,即进行多重比较。,下一张,主 页,退 出,上一张,表106 表10-2资料的协方差分析表,3、根据线性回归关系计算各处理的校正50日龄平均重 误差项的回归系数 表示初生重对50日龄重影响的性质和程度,且不包含处理间差异的影响,于是可用 根据平均初生重的不同来校正每一处理的50日龄平均重。校正50日龄平均重计算公式如下:(10-16),下一张,主 页,退 出,上一张,公式中:为第i处理校正50日龄平均重;为第i处理实际50日龄平均重(见表10
14、2);为第i处理实际平均初生重(见表102);为全试验的平均数,为误差回归系数,=7.1848 将所需要的各数值代入(1016)式中,即可计算出各处理的校正50日龄平均重(见表 107)。,表107 各处理的校正50日龄平均重计算表,下一张,主 页,退 出,上一张,4、各处理校正50日龄平均重间的多重比较 各处理校正50日龄平均重间的多重比较,即各种食欲添加剂的效果比较。(1)t检验 检验两个处理校正平均数间的差异显著性,可应用t检验法:(10-17)(10-18),下一张,主 页,退 出,上一张,式中,为两个处理校正平均数间的差异;为两个处理校正平均数差数标准误;为误差离回归均方;n为各处理
15、的重复数;为处理i的x变量的平均数;为处理j的x变量的平均数;SSe(x)为x变量的误差平方和 例如,检验食欲添加剂配方1与对照校正50日龄平均重间的差异显著性:,=10.3514-12.0758=-1.7244=37.59/43=0.8742 n=12=1.52,=1.28,SSe(x)=0.92将上面各数值代入(1018)式得:于是,下一张,主 页,退 出,上一张,查t值表,当自由度为43时(见表106误差自由度),t0.01(43)=2.70(利用线性内插法计算),|t|t0.01(43),P0.01,表明对照与食欲添加剂1号配方校正50日龄平均重间存在着极显著的差异,这里表现为1号配方
16、的校正50日龄平均重极显著高于对照。其余的每两处理间的比较都须另行算出,再进行t检验。,(2)最小显著差数法 利用t检验法进行多重比较,每一次比较都要算出各自的,比较麻烦。当误差项自由度在 20以上,x变量的变异不甚大(即x变量各处理平均数间差异不显著),为简便起见,可计算一个平均的 采用最小显著差数法进行多重比较。的计算公式如下:,下一张,主 页,退 出,上一张,(10-19)公式中SSt(x)为x变量的处理间平方和。然后按误差自由度查临界t值,计算出最小显著差数:(10-20),本例x变量处理平均数间差异极显著,不满足“x变量的变异不甚大”这一条件,不应采用此处所介绍的最小显著差数法进行多
17、重比较。为了便于读者熟悉该方法,仍以本例的数据说明之。此时 由=43,查临界t值得:t0.05(43)=2.017,t0.01(43)=2.70于是 LSD0.05=2.0170.4353=0.878 LSD0.01=2.700.4353=1.175,下一张,主 页,退 出,上一张,不同食欲添加剂配方与对照校正50日龄平均重比较结果见表108。表108 不同食欲添加剂配方与对照间的 效果比较表,多重比较结果表明:食欲添加剂配方1、2、3号与对照比较,其校正50 日龄平均重间均存在极 显 著的差异,这 里 表 现 为 配 方1、2、3号的校正50日龄平均重均极显著高于对照。,(3)最小显著极差法
18、 当误差自由度在20以上,x变量的变异不甚大,还可以计算出平均的平均数校正标准误,利用LSR 法进行多重比较。的计算公式如下:(10-21),下一张,主 页,退 出,上一张,然后由误差自由度 和秩次距k查SSR表(或q表),计算最小显著极差:(10-22)对于【例10.1】资料,由于不满足“x变量的变异不甚大”这一条件,不应采用此处所介绍的LSR法进行多重比较。为了便于读者熟悉该方法,仍以【例10.1】的数据说明之。,下一张,主 页,退 出,上一张,=0.8742,n=12,SSt(x)=0.83,SSe(x)=0.92,k=4,代入(1021)式可计算得:SSR值与LSR值见表109。,下一张,主 页,退 出,上一张,此时,表109 SSR值与LSR值表,下一张,主 页,退 出,上一张,各处理校正50日龄平均重多重比较结果见表1010。表1010 各处理校正50日龄平均重 多重比较表(SSR法),下一张,主 页,退 出,上一张,多重比较结果表明:食欲添加剂配方3、2、1号的哺乳仔猪校正 5 0 日龄平均重极显著高于对照,不同食欲添加剂配方间哺乳仔猪校正50日龄平均重差异不显著。,下一张,主 页,退 出,上一张,