《方差分析法》PPT课件.ppt

上传人:小飞机 文档编号:6500766 上传时间:2023-11-07 格式:PPT 页数:78 大小:1.15MB
返回 下载 相关 举报
《方差分析法》PPT课件.ppt_第1页
第1页 / 共78页
《方差分析法》PPT课件.ppt_第2页
第2页 / 共78页
《方差分析法》PPT课件.ppt_第3页
第3页 / 共78页
《方差分析法》PPT课件.ppt_第4页
第4页 / 共78页
《方差分析法》PPT课件.ppt_第5页
第5页 / 共78页
点击查看更多>>
资源描述

《《方差分析法》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《方差分析法》PPT课件.ppt(78页珍藏版)》请在三一办公上搜索。

1、方差分析解决的主要问题是什么?单因素方差分析与双因素方差分析 原理的相同点与不同点?,第六章 方差分析法 ANOVA,ANOVA由英国统计学家首创,为纪念Fisher,以F命名,故方差分析又称 F 检验(F test)。用于推断多个总体均值有无差异,方差分析的来源,例题 某公司计划引进一条生产线,为了选择一条质量优良的生产线以减少日后的维修问题,他们对6种型号的生产线作了初步调查,得到每个型号的生产线上个月维修的小时数,每种型号调查4条,结果列于表6-1。试问由此结果能否判定由于生产线型号不同而造成它们在维修时间方面有显著差异?,引言:方差分析的基本概念和原理,表 61 对6种型号生产线维修时

2、数的调查结果,研究的指标:维修时间记作Y,控制因素是生产线的型号,分为6个水平即A,B,C,D,E,F,每个水平对应一个总体Yi(i=1,2,6)。,引言:方差分析的基本概念和原理,现在的试验就是进行调查,每种型号调查4台,相当于每个总体中抽取一个容量为4的样本,得到的数据记作yij(i=1,2,6;j=1,2,3,4),即为下表数据。计算各样本平均数 如下:,表 62,引言:方差分析的基本概念和原理,两个总体平均值比较的检验法把样本平均数两两组成对:与,与,与,与,与,共有(15)对。,引言 方差分析的基本概念和原理,即使每对都进行了比较,并且都以0.95的置信度得出每对均值都相等的结论,但

3、是由此要得出这6个型号的维修时间的均值都相等。这一结论的置信度仅是,上述方法存在的问题,工作量大,置信度低,将这15对平均数一一进行比较检验,引言 方差分析的基本概念和原理,对试验进行多次测量所得到的一组数据x1,x2,xn,由于受到各种因素的影响,各个测量值通常都是参差不齐的,它们之间的差异称为误差。,由于试验条件的改变,试验误差,反映了测试结果的精密度,随机因素引起,系统误差,反映测试条件对测试结果的影响,方差分析的基本原理:(1)将数据总的偏差平方和按照产生的原因分解成:(总的偏差平方和)=(由因素水平引起的偏差平方和)+(随机误差平方和)(2)上式右边两个平方和的相对大小可以说明因素的

4、不同水平是否使得各型号的平均维修时间产生显著性差异,为此需要进行适当的统计假设检验.如何从数据中分离出两者的大小?-方差分析,引言:方差分析的基本概念和原理,方差分析的几个名词,什么是方差?离均差离均差平方和SS方差(2 S2)=均方(MS)标准差:S自由度:f关系:MS=SS/f,方差分析的含义,方差是描述变异的一种指标,方差分析是一种假设检验的方法。方差分析也就是对变异的分析。是对总变异进行分析,看总变异是由哪些部分组成的,以及这些部分间的关系如何。,结合单因素实验介绍方差分析的有关原理。在单因素试验中,为了考察因素A的k个水平A1,A2,Ak对Y的影响,设想在固定的条件Ai下作试验.所有

5、可能的试验结果组成一个总体Yi,它是一个随机变量.可以把它分解为两部分(6-1)i=1,,k,因素的水平数。,6.1单因素方差分析的数学模型和数据结构,其中:纯属Ai作用的结果,称为在Ai水平条件下 Yi 的真值(也称为在Ai条件下Yi的理论平均).是实验误差(也称为随机误差)。(6-2)其中,和 都是未知参数(i=1,2,k).,假定在水平Ai下重复做m次试验,得到观测值,表 63,6.1 数学模型和数据结构,表中:(i=1,2,k)(6-3)Yij表示在Ai条件下第j次试验的结果,用式子表示就是(i=1,2,k j=1,2,m)(6-4)注意:每次试验结果只能得到Yij,而(6-4)式中的

6、 和 都不能直接观测到。,6.1 数学模型和数据结构,为了便于比较和分析因素A的水平Ai对指标影响的大小,通常把 再分解为(i=1,2,k)(6-5)其中,称为一般平均(Grand Mean),它是比较作用大小的一个基点(总体的平均值);,6.1 数学模型和数据结构,并且称 为第i个水平Ai的效应.它表示水平的真值比一般中等水平差多少。满足约束条件(6-6)可得,i=1,2,k;j=1,2,m,6.1 数学模型和数据结构,要解决的问题,找出参数和 的估计量,分析观测值的偏差,检验各水平效应有无显著差异,6.1 数学模型和数据结构,用最小二乘法求参数 的估计量,然后寻求 的无偏估计量.须使参数

7、的估计值能使在水平Ai下求得的观测值Yij与真值 之间的偏差尽可能小。为满足此要求,一般考虑用最小偏差平方和原则,也就是使观测值与真值的偏差平方和达到最小.,参数点估计,由(6-4)可知,上述偏差平方和令下列各偏导数为零,(i=1,2,k),参数点估计,由 解得(6-7)由 解得(6-8),参数点估计,并由此得 的估计量至此,求得参数 的估计量(6-9),参数点估计,按照上述原则求参数估计量的方法称为最小二乘法,称为最小二乘估计量.我们还可以证明 分别是参数 的无偏估计量。将 和 分别用它们的估计量代替,可以得到试验误差 的估计量,(6-10),参数点估计,为了由观测值的偏差中分析出各水平的效

8、应,我们研究三种偏差:,和.根据前面参数估计的讨论,它们分别表示,分解定理(教材中“加法定理”)(6-11),的估计.,和,6.2 分解定理 自由度,证明:,6.2 分解定理 自由度,组间变差,组内变差,总偏差,误差公理,令则分解定理(6-11)可写成(6-12),6.2 分解定理 自由度,总差平方和变差平方和残差平方和,上式中,称为总偏差平方和.称为误差平方和(或组内平方和);称为因素A的效应平方和(或组间平方和),ST的自由度fT=km-1 SA的自由度fA=k-1 SE的自由度fE=k(m-1)容易看出,自由度之间也有类似于分解定理(加法定理)的关系(6-13),6.2 分解定理 自由度

9、,参数假设检验的假设条件,观测值(i=1,2,.,k;j=1,2,.,m)相互独立,在水平Ai条件下,Yij(j=1,2,.,m)服从正态分布N,6.3 显著性检验,要判断在因素A的k个水平条件下真值之间是否有显著性差异,即检验假设 H0:,H1:不全相等相当于检验假设 H0:(i=1,2,k),H1:i不全为零,可以证明当H0为真时,(6-16)并且 与 相互独立.得(6-17)其中 和 称为均方(Mean Square).,6.3 显著性检验,变差平方和/变差自由度,残差平方和/残差自由度,利用(6-17)式来检验原假设H0是否成立.对于给定的显著水平,可以从F分布表查出临界值 再根据样本

10、观测值算出FA的值.当 时,拒绝H0,当 时,接受H0。即:如果H0成立,F应等于1;相反应大于1,而且因素的影响越大,F值也越大,6.3 显著性检验,FF0.01,影响特别显著,“*”F0.01FF0.05,影响显著,“*”F0.05FF0.1,一定影响,“*”F0.1F,影响不大或没影响,“”,表 64 方差分析表,方差分析表,下面继续讨论前面6种型号的生产线的例子。根据调查结果,在a=0.05的显著水平时,检验这6种型号的生产线在平均维修时间方面有无显著差异?根据实践经验,认为各种型号生产线的维修时间是近似服从正态分布的。作统计假设:6种型号的生产线平均维修时数无显著差异,即 H0:ai

11、=0(i=1,2,6),H1:ai不全为零,计算SA及SE,6.3 显著性检验,表 85 计算列表,6.3 显著性检验,再将计算结果分别代入SA与SE两式中,得到第一自由度 第二自由度,6.3 显著性检验,查F分布表得由于,故拒绝H0。该结论说明,至少有一种生产线型号的效应不为零,这等价于至少有两种型号的生产线的平均维修时数是有显著差异的。,表 66 方差分析表,6.3 显著性检验,双因素方差分析的类型数据结构离差平方和的分解应用实例,6.4 双因素方差分析,在实际问题的研究中,有时需要考虑两个因素对实验结果的影响。例如饮料销售,除了关心饮料颜色之外,我们还想了解销售地区是否影响销售量,如果在

12、不同的地区,销售量存在显著的差异,就需要分析原因。采用不同的销售策略,使该饮料品牌在市场占有率高的地区继续深入人心,保持领先地位;在市场占有率低的地区,进一步扩大宣传,让更多的消费者了解、接受该生产线。,6.4.1 双因素方差分析的类型,若把饮料的颜色看作影响销售量的因素A,饮料的销售地区则是影响因素B。对因素A和因素B同时进行分析,就属于双因素方差分析。双因素方差分析的内容,是对影响因素进行检验,究竟是一个因素在起作用,还是两个因素都起作用,或是两个因素的影响都不显著。,6.4.1 双因素方差分析的类型,双因素方差分析的类型,无交互作用的双因素方差分析,有交互作用的双因素方差分析,假定因素A

13、和因素B的效应之间是相互独立的,不存在相互关系,假定因素A和因素B的结合会产生出一种新的效应,6.4.1 双因素方差分析的类型,例如,若假定不同地区的消费者对某种颜色有与其他地区消费者不同的特殊偏爱,这就是两个因素结合后产生的新效应,属于有交互作用的背景;否则,就是无交互作用的背景。有交互作用的双因素方差分析不讲授,有兴趣的同学可自查资料自学。,6.4.1 双因素方差分析的类型,双因素方差分析的数据结构如表所示:双因素方差分析数据结构,表 67,6.4.2 数据结构,表中,因素A位于列的位置,共有r个水平,代表第j种水平的样本平均数;因素B位于行的位置,共有k个水平,代表第i种水平的样本平均数

14、。为样本总平均数,样本容量n=rk。每一个观察值Xij看作由A因素的r个水平和B因素的k个水平所组合成的rk个总体中抽取样本容量为1的独立随机样本。这rk个总体的每一个总体均服从正态分布,且有相同的方差。这是进行双因素方差分析的假定条件。,6.4.2 数据结构,6.4.3 离差平方和的分解,各离差平方和对应的自由度:总离差平方和SST的自由度为rk-1=n-1;因素A的离差平方和SSA的自由度为r-1;因素B的离差平方和的自由度为k-1;随机误差SSE的自由度为(r-1)(k-1),6.4.3 离差平方和的分解,由离差平方和与自由度可以计算均方差:对因素A而言:对因素B而言:对随机变量而言:,

15、6.4.3 离差平方和的分解,表 68 双因素方差分析表,6.4.3 离差平方和的分解,贡献率分析,某商品有五种不同的包装方式(因素A),在五个不同地区销售(因素B),现从每个地区随机抽取一个规模相同的超级市场,得到该商品不同包装的销售资料如下表.表 69现欲检验包装方式和销售地区对该商品销售是否有显著性影响。(a=0.05),6.4.4 应用实例,解:若五种包装方式的销售的均值相等,则表明不同的包装方式在销售上没有差别。建立假设对因素A:H0:,包装方式之间无差别H1:不全相等,包装方式之间有差别对因素B:H0:地区之间无差别H1:不全相等 地区之间有差别,6.4.4 应用实例,计算F值 因

16、素A的列均值分别为:因素B的行均值分别为:总均值=15.04故:SST=(20-15.04)2+(10-15.04)2=880.96 SSA=5(21.6-15.04)2+5(11.6-15.04)2=335.36 SSB=5(15.2-15.04)2+5(18.8-15.04)2=199.36 SSE=880.96-335.36-199.36=346.24,6.4.4 应用实例,接下来:因此,6.4.4 应用实例,统计决策 对于因素A,因为 FA=3.87Fcrit=F0.05(4,16)=3.01 故拒绝H0,接受H1,说明不同的包装方式对该商品的销售产生影响。对于因素B,因为 FB=2.

17、30Fcrit=3.01 故接受H0,说明不同地区该商品的销售没有显著差异。,6.4.4 应用实例,6.5 效应分析-最佳工况,在试验设计方法中,采用比较显著因素水平效应的方法来确定最佳工况,最佳工况除了考虑显著性因素水平效应之外,还需综合考虑其他因素:如经济性、安全,等。,方差分析是在数理统计的基础上建立起来的,只有满足其基本假设才能采用。(1)误差具有随机性、独立性,且正态分布(2)各样本的方差满足齐性(3)各样本的方差与其样本平均值不相关(4)效应满足线性可加性,6.6 方差分析的基本假设,6.6.1 正态性,纯属Ai作用的结果,称为在Ai水平条件下 Yi 的真值(也称为在Ai条件下Yi

18、的理论平均).是实验误差(也称为随机误差)。(6-2)方差分析中的平方和计算、F检验等都在正态基础上建立起来的,必须满足试验数据满足正态分布。独立性:误差项的大小与其属于哪个样本无关,具有随机性,它是数理统计理论的基础,必须满足。试验设计必须满足随机化原则。,方差齐性:各样本的总体方差相等,即各样本值都来自等方差的同一个正态总体。用实际样本值估计总体方差常不相等,但不会超出随机因素的影响范围。正是由于它们不相等才用各样本误差的加权平均来估计总体方差。如果两个样本,一个来自大方差的总体,另外来自小方差的总体,显著性检验常得到错误结论。大方差样本易被判断为显著。失去方差齐性时不能用方差分析法进行显

19、著性检验。,6.6.2 方差齐性,某些分布的样本平均值与其方差之间存在一定关系。一般样本平均值范围较大时可能出现平均值与方差成比例的情况。此时不能采用方差分析方法进行显著性检验。工程技术中,比例数据、百分数数据是常见的平均值与其方差相关的数据,需要进行变换才能使用方差分析法。,6.6.3 平均值与方差独立,在数据结构模型中,总平均、效应与误差项之间具有线性关系。方差分析方法是在该假设条件下完成的,必须保证满足。失去线性可加性的主要原因:各因素之间存在交互作用;倍增效应,线性可加性,总平均,效应,误差,对违反方差分析法四个基本假设的数据必须进行变换。(1)对数变换样本标准偏差与均值近似成比例倍增

20、效应的数据注意事项:1)不能对原始数据进行等差变换 2)数据中有负数,不能使用对数变换 3)数据中有0,不能使用对数变换,6.6.5 数据变换方法,(2)变换:用于百分数数据lg(100/x-1)为简化计算,给出如下单位-10lg(100/x-1)=1(dB,分贝),6.6.5 数据变换方法,(3)累计频数法:,6.6.5 数据变换方法,原始数据为优、良、中(定性),试验时对每一抽样进行评定,把试验结果转化为优、良、中出现的密度频数数据,进一步把密度频数数据转变为累积频数数据。,数据变换后的方差分析:进行数据变换后,如果满足方差分析法的四个基本假设,方可对变换后的数据进行方差分析法、显著性检验

21、和效应分析。特别是最佳工况的估计值要用变换后的数据给出。,6.6.5 数据变换方法,问题:研究某化学产品转化率的试验。因素选择:合成温度Ai,催化剂用量Bj目的:(1)合成温度、催化剂用量对转化率的影响(2)寻找最佳工况(3)确定最佳工况的转化率和误差限,6.7 方差分析方法的应用,因素水平的选择:根据化学原理和经验,选择因素水平的范围。由于水平的范围较大,因此选择较多的因素水平数量。,6.7 方差分析方法的应用,试验次序的随机化:根据随机数确定试验次序,6.7 方差分析方法的应用,1 方差分析,建立数据模型的结构(根据线性可加原理得到两因素模型),1 方差分析,过程计算的基本公式总偏差平方和样本间的变差平方和误差平方和自由度,1 方差分析,利用等差转换原理,去掉虚拟均值(水平及误差波动的直流分量),END,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号