《概率论与数理统计课件第8章.ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计课件第8章.ppt(81页珍藏版)》请在三一办公上搜索。
1、单因素试验的方差分析,在工农业生产和科研活动中,我们经常遇到这样的问题:影响产品产量、质量的因素很多,例如影响农作物的单位面积产量有品种、施肥种类、施肥量等许多因素。我们要了解这些因素中哪些因素对产量有显著影响,就要先做试验,然后对测试结果进行分析,作出判断。方差分析就是分析测试结果的一种方法。,引 言,基 本 概 念,试验指标试验结果。,可控因素在影响试验结果的众多因素中,可人为 控制的因素。,水平可控因素所处的各种各种不同的状态。每个 水平又称为试验的一个处理。,单因素试验如果在一项试验中只有一个因素改变,其它的可控因素不变,则该类试验称为 单因素试验。,引例,例1(灯丝的配料方案优选)某
2、灯泡厂用四种配料方案制成的灯丝生产了四批灯泡,在每批灯泡中作随机抽样,测量其使用寿命(单位:小时),数据如下:,灯泡的使用寿命试验指标,灯丝的配料方案试验因素(唯一的一个),四种配料方案(甲乙丙丁)四个水平,因此,本例是一个四水平的单因素试验。,引 例,用X1,X2,X3,X4分别表示四种灯泡的使用寿命,即为四个总体。假设X1,X2,X3,X4相互独立,且服从方差相同的正态分布,即XiN(i,2)(i=1,2,3,4),本例问题归结为检验假设 H0:1=2=3=4 是否成立,我们的目的是通过试验数据来判断因素 A 的不同水平对试验指标是否有影响。,设 A 表示欲考察的因素,它的 个不同水平,对
3、应的指标视作 个总体 每个水平下,我们作若干次重复试验:(可等重复也可不等重复),同一水平的 个结果,就是这个总体 的一个样本:,单因素试验的方差分析,单因素试验资料表,纵向个体间的差异称为随机误差(组内差异),由试验造成;横向个体间的差异称为系统误差(组间差异),由因素的不同水平造成。,由于同一水平下重复试验的个体差异是随机误差,所以设:,其中 为试验误差,相互独立且服从正态分布,线性统计模型,单因素试验的方差分析的数学模型,具有方差齐性。,相互独立,从而各子样也相互独立。,首先,我们作如下假设:,即,令(其中)称为一般平均值。,称为因素A的第 个水平 的效应。,则线性统计模型变成,于是检验
4、假设:,等价于检验假设:,显然有:,整个试验的均值,考察统计量,经恒等变形,可分解为:,其中,反映的是各水平平均值偏离总平均值的偏离程度。,如果H0 成立,则SSA 较小。,若H0成立,则,总离差平方和,见书P168,其中,这里,反映的是重复试验种随机误差的大小。,表示水平Ai的随机误差;表示整个试验的随机误差,若假设 成立,则,由P106定理5.1可推得:,将 的自由度分别记作,则,(记,称作均方和),(各子样同分布),则,(记,称作均方和),对给定的检验水平,由,得H0 的拒绝域为:,F 单侧检验,结论:方差分析实质上是假设检验,从分析离差平方和入手,找到F统计量,对同方差的多个正态总体的
5、均值是否相等进行假设检验。单因素试验中两个水平的均值检验可用第七章的T检验法。,思考:为什么此处只做单侧检验?,(1)若,则称因素的差异极显著(极有统计意义),或称因素A的影响高度显著,这时作标记;,约 定,(2)若,则称因素的差异显著(差异有统计意义),或称因素A的影响显著,作标记;,(3)若,则称因素A有一定影响,作标记();,(4)若,则称因素A无显著影响(差异无统计意义)。,注意:在方差分析表中,习惯于作如下规定:,简便计算公式:,其中,同一水平下观测值之和,所以观测值之和,例2 P195 2 以 A、B、C 三种饲料喂猪,得一个月后每猪所增体重(单位:500g)于下表,试作方差分析。
6、,解:,解:,不同的饲料对猪的体重的影响极有统计意义。,列方差分析表,例2的上机实现步骤,1、输入原始数据列,并存到A,B,C列;,2、选择StatANOVAone-way(unstacked),不同的饲料对猪的体重的影响极有统计意义。,定理 在单因素方差分析模型中,有,如果H0不成立,则,所以,,即H0不成立时,,有大于1的趋势。,所以H0为真时的小概率事件应取在F值较大的一侧。,双因素试验方差分析,双因素试验的方差分析,在实际应用中,一个试验结果(试验指标)往往受多个因素的影响。不仅这些因素会影响试验结果,而且这些因素的不同水平的搭配也会影响试验结果。,例如:某些合金,当单独加入元素A或元
7、素B时,性能变化不大,但当同时加入元素A和B时,合金性能的变化就特别显著。,统计学上把多因素不同水平搭配对试验指标的影响称为交互作用。交互作用在多因素的方差分析中,把它当成一个新因素来处理。,我们只学习两个因素的方差分析,更多因素的问题,用正交试验法比较方便。,无交互作用的双因素试验的方差分析,数学模型,假设某个试验中,有两个可控因素在变化,因素A有a个水平,记作A1,A2,Aa;因素B有b个水平,记作B1,B2,.Bb;则A与B的不同水平组合AiBj(i=1,2,a;j=1,2,b)共有ab个,每个水平组合称为一个处理,每个处理只作一次试验,得ab个观测值Xij,得双因素无重复实验表,双因素
8、无重复(无交互作用)试验资料表,无交互作用的双因素试验的方差分析,线性统计模型,基本假设(1)相互独立;(2),(方差齐性)。,其中,所有期望值的总平均,水平Ai对试验结果的效应,水平Bj对试验结果的效应,试验误差,特性:,水平Ai对试验结果的效应,水平Bj对试验结果的效应,试验误差,要分析因素A,B的差异对试验结果是否有显著影响,即为检验如下假设是否成立:,总离差平方和的分解定理,仿单因素方差分析的方法,考察总离差平方和,可分解为:,称为因素A的离差平方和,反映因素 A 对试验指标的影响。,称为因素B的离差平方和,反映因素 B 对试验指标的影响。,称为误差平方和,反映试验误差对试验指标的影响
9、。,可推得:,将 的自由度分别记作,,则,若假设 成立,则:,对给定的检验水平,,拒绝H01,即A 因素的影响有统计意义。,拒绝H02,即B 因素的影响有统计意义。,双因素(无交互作用)试验的方差分析表,注意,各因素离差平方和的自由度为水平数减一,总平方和的自由度为试验总次数减一。,双因素(无交互作用)试验的方差分析表,简便计算式:,其中:,例1 设甲、乙、丙、丁四个工人操作机器、各一天,其产品产量如下表,问工人和机器对产品产量是否有显著 影响?,解 基本计算如原表,结论:工人对产品的产量有显著影响,机器对产品的产量有极显著影响。,例1的上机操作,对应例1 的数据输入方式,原始数据,行因素水平
10、,列因素水平,(A),(B),工人对产品产量有显著影响,而机器对产品产量的影响极显著。,有交互作用的双因素试验的方差分析,线性统计模型,基本假设(1)相互独立;(2),(方差齐性)。,有检验交互作用的效应,则两因素A,B的不同水平的搭配必须作重复试验。,处理方法:把交互作用当成一个新因素来处理,即把每种搭配AiBj看作一个总体Xij。,观测值,总平均,因素A的效应,因素B的效应,交互作用的效应,试验误差,有交互作用的双因素试验的方差分析,线性统计模型,其中,所有期望值的总平均,水平Ai对试验结果的效应,水平Bj对试验结果的效应,试验误差,交互效应,特性:,要判断因素A,B及交互作用AB对试验结
11、果是否有显著影响,即为检验如下假设是否成立:,总离差平方和的分解定理,仿单因素方差分析的方法,考察总离差平方和,可分解为:,SSA称为因素A的离差平方和,反映因素 A 对试验指标的影响。SSB称为因素B的离差平方和,反映因素 B 对试验指标的影响。SSAB称为交互作用的离差平方和,反映交互作用AB对试验指标的影响。SSE称为误差平方和,反映试验误差对试验指标的影响。,若“各因素、各水平及其交互作用的影响无统计意义”的假设 成立,则,则,可推得:,由 作右侧假设检验来考察各因素及因素间的交互作用对试验指标的影响力.,双因素有重复(有交互作用)试验资料表,因素 A,因素 B,双因素(有重复)试验方
12、差分析表,各离差平方和的计算公式参看出P180_181,这里,例3 P183 例题2,因素A(能量),因素 B(蛋白质),输入数据时,C2表示行因素水平,C3表示列因素水平。第几次重复不必列明,软件自会识别。,结果显示如P185,均0.01,饲料中能量的高低、蛋白质含量的不同及两者的交互作用对鱼的体重的影响极有统计意义。,各因素,各水平,各交互作用下的均值。,作业 P195 3 4(借助软件完成)预习第三节 正交试验设计 及其统计分析,正交试验设计及其统计分析,引言,试验设计是数理统计中的一个较大的分支,它的内容十分丰富。我们简介正交试验设计。,正交试验设计是利用“正交表”进行科学地安排与分析
13、多因素试验的方法。其主要优点是能在很多试验方案中挑选出代表性强的少数几个试验方案,并且通过这少数试验方案的试验结果的分析,推断出最优方案,同时还可以作进一步的分析,得到比试验结果本身给出的还要多的有关各因素的信息。,正交表是一种特别的表格,是正交设计的基本工具。我们只介绍它的记号、特点和使用方法。,正交表的记号及含义,记号及含义,如,表示,?,表示各因素的水平数为2,做8次试验,最多考虑7个因素(含交互作用)的正交表。,正交表的特点,1、正交表中任意一列中,不同的数字出现的次数相等;,表示:在试验安排中,所挑选出来的水平组合是均匀 分布的(每个因素的各水平出现的次数相同)均衡分散性,2、正交表
14、中任意两列,把同行的两个数字看成有序数 对时,所有可能的数对出现的次数相同。,表示:任意两因素的各种水平的搭配在所选试验中出现 的次数相等 整齐可比性,这是设计正交试验表的基本准则,正交试验设计的基本步骤,确定目标、选定因素(包括交互作用)、确定水平;,2.选用合适的正交表;,3.按选定的正交表设计表头,确定试验方案;,4.组织实施试验;,5.试验结果分析。,例1 为了解决花菜留种问题,以进一步提高花菜种子的产量和质量,科技人员考察了浇水、施肥、病害防治和移入温室时间对花菜留种的影响,进行了四个因素各两个水平的正交试验,各因素及其水平如下表:,解 第一步:选择适当的正交表,所以选用正交表,注:
15、也可由试验次数应满足的条件来选择正交表。,若考虑A与B、A与C的交互作用,则,所以还可选用正交表,其中:,由 确定。,是可求出的,而 是未知的,,当不考虑交互作用时:可取,故 N 不是唯一的。,试验次数N的确定原则,如三因素四水平 43 的正交试验至少应安排,次以上的试验。,如三因素四水平 43 并包括第一、二个因素的交互作用的正交试验至少应安排的试验次数为,若再加上包括第一、五个因素的交互作用的正交试验则至少应安排的试验次数为,次以上的试验。,又如安排 的混合水平的正交试验至少应安排,所以一般地,有,第二步 表头设计查交互作用表,表示位于第二、第四列的两因素的交互作用要放于第六列。,注意:主
16、效应因素尽量不放交互列。如A、B因素已放C1、C2列,则C 因素就不放C3列。,花菜留种的表头设计,考虑交互作用AB和AC,则例1的表头可设计为,注:第6列为空白列,当随机误差列;也可把第7列作空白列。一般要求至少有一个空白列。,按正交表 得试验方案:,只需将各列中的数字“1”、“2”分别理解为所填因素在试验中的水平数,每一行就是一个试验方案。,第三步 按所选定的正交试验方案组织试验,记录试验 结果;,见P192 表8-22,第四步 分析正交试验结果,方法1 直观分析(极差分析),(1)计算极差,确定因素的主次顺序,第j列的极差,或,极差越大,说明这个因素的水平改变对试验结果的影响越大,极差最
17、大的那个因素,就是最主要的因素。,对例1来说,各因素的主次顺序为,(2)确定最优方案,如果不考虑交互作用,则根据各因素在各水平下的总产量或平均产量的高低确定最优方案;如果考虑交互作用,则取各种搭配下产量的平均数,按优化标准确定最优方案。,本例中,不考虑交互作用,在方案A1B2C2D2最优,但交互作用AC是第三重要因素,所以需考虑A、C的搭配对实验指标的影响,取AiBj的各种搭配的平均数,结果是A1与C1 搭配最好,故本问题的最优方案为A1B2C1D2。,方法2 方差分析法,基本思想与双因素方差分析方法一致:将总的离差平方和分解成各因素及各交互作用的离差平方和,构造F统计量,对各因素是否对试验指
18、标具有显著影响,作F检验。,要求:能利用MINITAB完成正交试验的方差分析。,例1的上机操作,按正交表及试验结果输入数据。,不写C3 不写C5 要表明是交互作用,F1 表示该因子的影响力比试验误差更小,不必理会,(严重无统计意义)去掉这些因子,将它们造成的微小差异归到试验误差中(软件会自动处理),则可突显其它因子的影响。,去掉C1*C2,C6后再作方差分析。,由 P 值知,因素A(C1)的影响力最大,B(C2)次之,再次之是交互作用A*C(C1*C4)。按此顺序,再根据各相关因子各水平的均值确定最优组合。,选A1,选B2,在选A1的前题下选C1,最后,C6(D)无统计意义,选那一个水平都可以,故得两最优组合:A1B2C1D1和A1B2C1D2,作业,P198 6(利用软件MINITAB完成方差分析法)预习:第九章 第一节,