《一元方差分析.ppt》由会员分享,可在线阅读,更多相关《一元方差分析.ppt(50页珍藏版)》请在三一办公上搜索。
1、二、二元方差分析,一、一元方差分析,第六章,方差分析,二、统计分析,一、总平方和的分解,第一节,单因素试验的方差分析,例1 假定某型号的电子管的使用寿命服从正态分布,并且原料差异只影响平均寿命,不影响方差。现用三种不同来源的材料各试生产了一批电子管。从每批中各抽取若干只做寿命实验,得数据如下表。,试问测试结果是否说明这批电子管的寿命有明显差异?,1.引例,三个水平,因素,试验指标,例2 设对四种玉米品种进行对比实验,每个品种都在同一块田的五个小区各做一次实验,实验结果如下表所示。试问不同品种对玉米的平均产量是否有显著影响?,水平,因素,试验指标,设在试验中,因素A有m个不同水平,在水平下的试验
2、结果,其中 和 是未知参数。在水平 下作 次独立实验,其结果如表1所示。,2.数学模型,表1,是来自总体 的容量为 的 一个 样本,其观察值为,(1),由于 相互独立,且,若记,则,且相互独立,要判断因素的各水平间是否有显著差异,也就是要 判断各正态总体的均值是否相等,即检验假设,(2),其中 与 均为未知参数。式(2)称为单因素方差分析的数学模型。,(3),再令,(5),则是各水平下总体均值的加权平均,称为总平均值;,代表了第i水平下的总体均值与平均值的差异,这个差异称为 的效应,,(4),由式(2),(3)可以得到单因素方差分析的等价数学模型,它满足,式(5)表明:样本由总平均值 因素的水
3、平效应 随机误差三部分叠加而成。因而式(5)也称为线性可加模型。,(5),由于当 为真时,,=各水平的效应,=统计假设模型(1)等价于,(6),基本任务:根据样本提供的信息,对假设(6)进行检验,并估计未知参数,检验此假设的方法就是方差分析,3.总离差平方和的分解:,样本总平均,通过分解,构造统计量,组内平均,(7),(8),两者间的关系,称为总离差平方和。,引入记号,(10),总离差平方和分解,全部数据与总平均之间的差异,又叫总变差,其中,为各水平下的样本与该水平下样本均值的离差平方和,反映了各水平下样本值的随机波动情况,称为组内平方和。它是由试验的随机误差引起的,故又称误差平方和。,为各水
4、平下的样本均值与样本总均值的(加权)离差平方和,反映了各水平间的样本值的差异,称为组间平方和。形成它的主要原因是因素A的各水平下的不同效应,故又称为效应平方和。,常见统计量,1、样本均值,2、样本方差,设,是来自总体X的一个样本,,常用来估计EX.,复习,结论:设为来自总体 的一个样本,,4.SE,SA的统计特性,故,(12),(13),记,(14),(15),的均方,的均方,4.SE,SA的统计特性,(14),(15),(14)及(15)两式表明:,是 的无偏估计,,仅当,成立时才是 的无偏估计,,否则它的期望值要大于,在 成立时应接近于1,,而当 H1成立时总有偏大的倾向。,如果比值,比1
5、大得多,就应拒绝假设,为此,我们采用,(16),作为检验统计量。,当 成立时,,与,相互独立,且分别服从自由度,(n-m),(m-1)的 分布,故,复习:F 分布的分位点,对于给定的正数,称满足条件,的点,为,分位点,分布的上,对给定的显著性水平,由,得检验问题(1.1)或(1.6)的拒绝域为,(17),上述分析的结果可排列成表2的形式称为方差分析表,在实际计算时,通常使用下列公式,其中,例1,设对四种玉米品种进行对比实验,每个品种都在同一块田的五个小区各做一次实验,实验结果如下表所示。试问不同品种对玉米的平均产量是否有显著影响?(=0.01),解,分别以 表示不同品种玉米平均产量总体的均值,
6、按题意需检验假设,品种,地块,产量,1 32.3 33.3 30.8 29.3,172.1 173.9 168.5 141.9 656.4,5 36.5 34.5 35.8 28.8,4 35.0 36.8 32.3 28.0,3 34.3 36.3 35.3 29.8,2 34.0 33.0 34.3 26.0,5923.682 6048.242 5678.45 4027.122 21677.50,29618.41 30241.21 28392.25 20135.61,5933.03 6060.07 5696.15 4035.97 21725.22,注意到,可得方差分析表,方差分析表,方差来
7、源,误差E,因素A,总和,均 方,自由度,平方和,显著性,F 比,当 时,,由F分布表可查得,由于,故拒绝,即认为,这四个品种对玉米平均产量的影响高度显著。,3,19,16,若检验结果为原假设H0不成立,,有时需要对,则 的置信度为1 的置信区间为,由上面讨论,可得未知参数,的估计,是 的无偏估计。,5.未知参数的估计,如果检验结果为拒绝,,即,不全相等。,有时需要对第i个水平及第k个水平均值差 作出区间估计。,为此,我们可以取,作为 的点估计,,注意到,又,是 的无偏估计,,而,可以证明 与 相互独立。,的置信度为 的置信区间为,求例2中未知参数 的点估计及均值差的置信度为0.95的区间估计
8、。,解,的点估计为,及 的无偏估计分别为,例2,当,时,,的置信度为0.95的置信,区间分别为,因素A分3个水平,对每个水平进行4次试验,结果如下表:,假定样本都是从同方差的正态总体中抽取的。,(1)在显著性水平 下,检验假设,组均值相等。,(2)求未知参数,及,的点估计以及均值差的置信区间(置信度为95%),例3,解,(1)用下表进行计算,方差分析表,查表得,拒绝,即在显著性水平下,可以认为组平,均值在整体上是有显著差异的。,(2),查表,的置信度为95%的置信区间分别为,一共进行了13次试验,假设样本都是从同方差的正态总体中抽取的,试验结果如下表:,(1)在显著性水平 下检验假设,(2)求 及 的点估计及均值,差的95%置信区间。,例4,解,用下表进行计算,得,方差分析表,(1)查表得,拒绝,在显著性水平下,,可以认为3个水平下的期望有显著差异。,(2),又,由,得,的置信区间为,即(67.1,7.1)。,由,可得,的置信区间为,即(78.6,7.4)。,由,可得,的置信区间为,即(38.9,26.9)。,