实验二方差分析过程.ppt

上传人:牧羊曲112 文档编号:6270763 上传时间:2023-10-12 格式:PPT 页数:71 大小:2.34MB
返回 下载 相关 举报
实验二方差分析过程.ppt_第1页
第1页 / 共71页
实验二方差分析过程.ppt_第2页
第2页 / 共71页
实验二方差分析过程.ppt_第3页
第3页 / 共71页
实验二方差分析过程.ppt_第4页
第4页 / 共71页
实验二方差分析过程.ppt_第5页
第5页 / 共71页
点击查看更多>>
资源描述

《实验二方差分析过程.ppt》由会员分享,可在线阅读,更多相关《实验二方差分析过程.ppt(71页珍藏版)》请在三一办公上搜索。

1、实验二:方差分析过程,一、单因素方差分析二、无重复的双因素分析三、有重复的双因素分析,ONE WAY ANOVA单因变量单因素。广义线性模型:四个过程1.Univariate过程:单因变量多因素。2.Multivariate过程:多因变量多因素。3.Repeated过程:重复测量数据时。4.Variance Components过程:用于对层次数据拟合方差成分模型。,2015/11/5,统计分析综合实验史慧萍,2,为什么不用单样本t检验?,设每个检验的显著水平为,则检验c个独立的比较,则犯一类错误的概率为 1(1)k若组为三、五组,采用T检验(=0.05)就需进行3次、10次的两两比较,则犯一

2、类错误的概率为:1(10.05)3=0.141(10.05)10=0.40,2015/11/5,统计分析综合实验史慧萍,3,方差分析是比较多组的总体均值是否相等的一种数据分析方法。方差分析的目的是:判断分组是否有效。(检验均数(组间或变量间)差别是否具有统计意义)有效的分组应该是组间差距大,组内差距小,这是方差分析的判别依据,方差分析主要是将样本方差进行合理分解,比较数据的组间差异和组内差异,从而进行判断。,2015/11/5,统计分析综合实验史慧萍,4,基本概念,因素(Factor):因素是可能对应变量有影响的变量,一般,因素会有不止一个水平,而分析的目的就是考察或比较各个水平对应变量的影响

3、是否相同。例如影响农作物产量的因素有气温、降雨量、日照时间等。在方差分析中,因素的取值范围不能无限,只能有若干水平,即应当为分类变量。水平Level:因素的不同取值等级称作水平,例如性别有男、女两个水平。需要注意的是,有些时候水平是人为划分出来的,比如身高被分为高、中、低三个水平。单元(Cell):指各个因素之间的组合,我们所说的方差齐就是指的各个单元的方差齐。互交作用(Interaction):如果一个因素的效应大小在另一个因素不同水平下明显不同,则称为两因素间存在交互作用。,2015/11/5,统计分析综合实验史慧萍,5,方差分析(以H0假设成立的前提)条件,各样本的独立性正态性方差齐,2

4、015/11/5,统计分析综合实验史慧萍,6,单因素方差分析的模型,Xij=+i+ij(有些时候写成Xij=i+ij)Xij=表示第i组变量的第j个观测值其中:表示所有处理的总的平均数,为一常数i=i,为一参数,表示影响因素在第i个水平下对应变量的附加效果,并假设所有的i之和为零ij为第i组实验第j个处理单位的个别效应,也称个别差异或随机效应,ijN(0,2),表示随机误差项,且所有ij间相互独立。,2015/11/5,统计分析综合实验史慧萍,7,单因素方差分析的假设检验,H0:1=2=,=r=,即i=0,i=1,rH1:1、2、r 之间不完全相等(或者i不全等于零,或者至少有一个i不等于零。

5、),2015/11/5,统计分析综合实验史慧萍,8,双因素方差分析的模型(一),Xij=+i+j+ijk其中:1.表示所有处理的总的平均数,为一常数;2.i是A因素的第i个水平的效果,即A因素的主效应;3.j是B因素的第j个水平的效果,即B因素的主效应;4.ijk为误差项。ijk N(0,2),且所有ijk间相互独立。,为一参数,表示第i个处理的效果ij为独立正态(0,2)的随机变量,表示随机误差项,2015/11/5,统计分析综合实验史慧萍,9,双因素方差分析的模型(二),Xij=+i+j+()ij+ijk其中:1.表示所有处理的总的平均数,为一常数;2.i是A因素的第i个水平的效果,即A因

6、素的主效应;3.j是B因素的第j个水平的效果,即B因素的主效应;4.()ij是A因素的第i个水平和B因素的第j个水平之间的互交作用(附加效应);5.ijk为误差项。ijk N(0,2),且所有ijk间相互独立。,为一参数,表示第i个处理的效果ij为独立正态(0,2)的随机变量,表示随机误差项,2015/11/5,统计分析综合实验史慧萍,10,双因素方差分析有三个假设,A因素的主效应(说明A无影响)H0A:i*=,即i=0,i=1,r(或者因素A的主效应是否显著异于零)H1A:i不全等于零(或者1*、2*、r*之间不完全相等)B因素的主效应(说明B无影响)H0B:*j=,即j=0,j=1,s(或

7、者因素B的主效应是否显著异于零)H1B:j不全等于零(或者*1、*2、*s 之间不完全相等)A、B因素的互交作用(说明A与B无互交效应)H0C:Cij=ijij=0(或者因素A和因素B的互交作用是否显著异于零),2015/11/5,统计分析综合实验史慧萍,11,方差分析概述,(一)目的检验某一个控制因素的改变是否会给观察变量带来显著影响。例如:不同肥料某农作物亩产量不同学历工资收入推销策略推销额,2015/11/5,统计分析综合实验史慧萍,12,(二)基本思路(1)入手点:检验控制变量的不同水平下,各总体的分布是否存在显著差异,进而判断控制变量是否对观测变量产生了显著影响。(2)前提:不同水平

8、下各总体服从方差相等的正态分布。(3)H0:不同水平下,各总体均值无显著差异。即:不同水平下控制因素的影响不显著。(4)构造F统计量因为:总变差=组间差异+组内差异可证明:SST=SSA+SSE(设:k个水平)考察平均的组间差异与平均的组内差异的比值(或方案间的方差与与所有方案内的方差之比),于是(5)结论:F值较大,F值的相伴概率小于或等于用户给定的显著性水平,则拒绝H0,认为不同水平下各总体均值有显著差异;F值较小,F值的相伴概率大于用户给定的显著性水平,则不能拒绝H0,可以认为不同水平下各总体均值无显著差异。,2015/11/5,统计分析综合实验史慧萍,13,一、单因素方差分析,2015

9、/11/5,统计分析综合实验史慧萍,14,2015/11/5,统计分析综合实验史慧萍,15,(三)应用举例不同的施肥量是否对亩产量造成了显著影响观测变量的数据安排控制变量可以定义成定类或定序变量观察方差分析表不同推销方式是否对推销额有显著影响观察方差分析表(四)进一步的分析前提的检验:各水平下方差齐性检验实现方法:option中的statistics:Homogeneity-of-variance,检验各水平下各总体方差是否齐性。H0:各水平下各总体方差无显著差异。,2015/11/5,统计分析综合实验史慧萍,16,单因素方差分析中的多重比较,目的:如果总体均值存在差异,F检验不能说明哪个水平

10、造成了观察变量的显著差异。多重比较将对每个水平的均值逐对进行比较检验。多重比较方法1.LSD法:即最小显著性差异法,实际上就是t检验的变形,用t检验完成各组间的配对比较,检验的敏感性比较高,各水平间的均值存在微小差异也有可能被检验出来,但此方法对第一类弃真错误的概率不进行控制和调整。2.Bonferroni法:即修正最小显著性差异法,与LSD法基本相同,不同的是对第一类弃真错误的概率进行了控制。3.Tukey法:即Tukey显著差异,应用这种方法要求各水平观测个数相等,与LSD法相比,对第一类弃真错误的概率进行了有效的处理。4.Scheffe法:使用了F统计量为检验统计量,对可能的组合进行同步

11、进入的配对比较,可用于检验分组均值所有可能的线性组合。当各水平个案数不相等,或者想进行复杂的比较时,用此法较为稳妥,但灵敏度不是很高。5.S-N-K法:全称是Studend-Newman-Keuls法,是运用最广泛的一种两两比较方法。它采用Student Range 分布进行所有各组均值间的配对比较。该方法保证在H0真正成立时总的水准等于实际设定值,即控制了一类错误。单因素方差分析方法选择策略一般可以参照如下标准:如果存在明确的对照组,要进行的是验证性研究,即计划好的某两个或几个组间(和对照组)的比较,宜用Bonferroni(LSD)法;若需要进行的是多个均数间的两两比较(探索性研究),且各

12、组个案数相等,适宜用Tukey法;其它情况宜用Scheffe法。,2015/11/5,统计分析综合实验史慧萍,17,例:不同岗位的平均工资问题,是任何单位的人事管理都要考虑的根本问题。若某单位的工作岗位可以分为三类:一线工人、科级以上干部、一般干部。试比较这三类职工的当前的平均工资有无显著差异?数据见“CH4CH8茎叶箱方差工资性别岗位300余”。,2015/11/5,统计分析综合实验史慧萍,18,单因素方差分析实现,2015/11/5,统计分析综合实验史慧萍,19,2015/11/5,统计分析综合实验史慧萍,20,2015/11/5,统计分析综合实验史慧萍,21,比较,多重比较,选项,201

13、5/11/5,统计分析综合实验史慧萍,22,均数分布图,Equal Variances Assumed复选框,LDS:LDS法,实际上就是t检验的变形,只是在变异和自由度的计算上利用了整个样本信息,而不仅仅是所比较两组的信息,因此它的敏感度最高,在比较时仍然存在放大水准(一类错误)的问题,但换之言就是总的二类错误非常的小,要是LSD法都没检验出差错,那恐怕是真的没差别。S-N-K:即Student Newman Keuls法,是运用最广泛的一种两两比较法。他采用Student Range分布进行所有各组均值间的配对比较。该方法保证在H0真正成立时总的水准等于实际设定值即控制了第一类错误。Bon

14、feeroni:由LDS法修正而来,通过设置每个检验的水准来控制总的水准,该方法的敏感度介于LDS法和Scheffe法之间。,2015/11/5,统计分析综合实验史慧萍,23,Sidak:也是从t检验修正而来的,和Bonfeeroni法非常相似,但比Bonfeeroni法保守。TUKEY:即Tukeys honestly signficant difference法(Tukeys HSD),同样采用Student Range分布统计量进行所有组间均值的两两比较。但与S-N-K法不同的是,它控制的是所有比较中最大的一类错误概率值不超过水准。Scheffe:当各组人数不相等,或者想进行复杂的比较时

15、,用此法较为妥当。它检验的是各个均数的线性组合,而不是只检验某一对均数间的差异,并控制整体水准等于0.05。但正因如此,它相对比较保守,有时方差分析F值有显著性,用该法两两比较却找不出差异来。Dunnentt:将所有的处理组均数分别与指定的对照组均数比较,并控制所有比较中最大一类错误概率值不超过水准,请注意该方法并不适用于完全两两比较的情况。选定此方法会激活下面的Control Category框。用于设定对照组及单双侧检验。,2015/11/5,统计分析综合实验史慧萍,24,统计描述分析表,样本数、均值、标准差、标准误、95%置信区间、最小值、最大值。,2015/11/5,统计分析综合实验史

16、慧萍,25,三组当前工资的方差齐性检验表,P=0.0000.05,表示三个组的数据不具有方差齐性。,2015/11/5,统计分析综合实验史慧萍,26,单因素方差分析表,第一列:方差来源第二列:变差(Sum of Squares 与样本均值的离差平方和)。第三列:自由度:组间df=K-1=3-1=2,组内df=N-k=366-3=363,全体df=N-1=366-1=365第四列:方差第五列:统计量F的值f。第六列:f统计值的显著性概率,用于显著性检验。p=0.0000.01,即不同工作性质(三组)的工资有显著差异。不同组(不同工作性质)可解释的变差42070380885.006,抽样误差引起的

17、变差52166613580.788,它们的方差21035180443和143709679.286,相除的F统计量的观测值146.373,由于F大于1,说明组间方差大于组内方差,分组造成的,差异远远大于超过抽样造成的误差。对应的概率p值近似为0,如果显著水平为0.05,由于概率p值小于显著水平,则拒绝零假设,而接受备选假设,认为这三个总体的均值是有差异的。进一步分析,有三个按钮选项:Options(选项)、Post Hoc(探究差异来自哪?)、Contrasts,2015/11/5,统计分析综合实验史慧萍,27,组合比较的对照系数说明,给出了输入的所要比较的各组均值的系数。,2015/11/5,

18、统计分析综合实验史慧萍,28,组合对比检验结果,先前得出不具有方差齐的结论,所以这里应当读取“Does not assume equal variances”这行的结果。P=0.0000.05,表示其均值的组合与0有显著差异(即表示一线工人与科以上干部的平均工资有显著差异),2015/11/5,统计分析综合实验史慧萍,29,多重比较结果,2015/11/5,统计分析综合实验史慧萍,30,由浅表得知不具有方差齐的结论,所以这里应当读取TamhaneT2的t检验结果。表中第二列的星号的含义:在显著水平为0.05的情况下,相应两组的均值存在明显差异,与第三列的结果相对应(Sig.均小于0.05)。,

19、二、无重复的双因素分析,2015/11/5,统计分析综合实验史慧萍,31,问:因素A的不同水平(方案)的效果(均值),有无显著不同?问:因素B的不同水平(方案)的效果(均值),有无显著不同?,2015/11/5,统计分析综合实验史慧萍,32,例:某公司对产品设计了4个种类的包装(用A、B、C、D表示),又设计了3种销售方案,对4种包装的该产品试销一个月,销售业绩数据如下(见H8无重双因包装销售),现在想知道:不同包装、不同销售方案,对销售业绩是否有显著差异?,2015/11/5,统计分析综合实验史慧萍,33,无重复的双因素分析的SPSS实现,数据存放方式,2015/11/5,统计分析综合实验史

20、慧萍,34,2015/11/5,统计分析综合实验史慧萍,35,变量标签,2015/11/5,统计分析综合实验史慧萍,36,2015/11/5,统计分析综合实验史慧萍,37,注意:无重复实验问题不能直接点击“OK”,因为系统默认值是对主效应、交互效应做全分析。,2015/11/5,统计分析综合实验史慧萍,38,模型选择,2015/11/5,统计分析综合实验史慧萍,39,完全因素模型:包括所有因素和协方差分析的主要效果与所有因素间的交互作用,但不包括协变量之间的交互作用,Sum of squares列表框:用于选择方差分析模型进行变异分解的方法,2015/11/5,统计分析综合实验史慧萍,40,输

21、出结果,因素变量的取值和样本数,2015/11/5,统计分析综合实验史慧萍,41,双因素方差分析摘要表,第一列:变差来源Corrected Model:校正模型(的变差=包装类型的变差+销售方案的变差)Intercept:截距,相当于包装类型:包装类型的变差销售方案:销售方案的变差Error:误差项(残差项)的变差Total:总变差Corrected Total:校正的变差和(=校正模型+残差平方和)第二列:常规的变差(Type Sum of Squares)。第三列:自由度第四列:方差(变差与相应自由度之比)第五列:统计量F的值f第六列:f统计值的显著性概率,用于显著性检验,其p值均小于0.

22、05,所以在两因素的不同水平的不同组合中,至少有的效果之间,有显著差异。,2015/11/5,统计分析综合实验史慧萍,42,由于两因素的不同水平的不同组合中,至少有的效果之间,有显著差异。则应进一步确定有显著差异的水平。Contrasts:比较选项(用户自定义假设检验步骤:对均值进行比较的设置),2015/11/5,统计分析综合实验史慧萍,43,Options:估计边际均值(方差齐次性检验)post hoc:多重比较选项(方差齐与方差不齐检验方法的选项),2015/11/5,统计分析综合实验史慧萍,44,Univariate Analysis of Variance方差分析结果(p值均小于0.

23、05,所以在两因素的不同水平的不同组合中,至少有的效果之间,有显著差异。),2015/11/5,统计分析综合实验史慧萍,45,各个因素的样本数、方差齐性检验结果(分母不存在,F统计值无法显现)、方差分析结果,Estimated Marginal Means估计边际均值,2015/11/5,统计分析综合实验史慧萍,46,Post Hoc Tests:包装类型(多重比较),表中第二列的星号的含义:在显著水平为0.05的情况下,相应两组的均值存在明显差异,与第三列的结果相对应(Sig.均小于0.05)。,2015/11/5,统计分析综合实验史慧萍,47,Post Hoc Tests:销售方案(多重比

24、较),表中第二列的星号的含义:在显著水平为0.05的情况下,相应两组的均值存在明显差异,与第三列的结果相对应(Sig.均小于0.05)。,2015/11/5,统计分析综合实验史慧萍,48,用户定义的假设检验索引表,2015/11/5,统计分析综合实验史慧萍,49,自定义的假设检验:对照分析表(包装类型的均值效果比较)及包装类型的方差分析结果解释见P234(设置见课件),2015/11/5,统计分析综合实验史慧萍,50,试与方差分析结果表比较,试与包装类型(多重比较)结果表比较,p=0.0000.05,水平1(包装A)与水平4(包装D)的效果有显著差异,自定义的假设检验:对照分析表(销售方案的均

25、值效果比较)及销售方案的方差分析结果解释见P235(设置见课件),2015/11/5,统计分析综合实验史慧萍,51,试与方差分析结果表比较,试与销售方案(多重比较)结果表比较,p=0.0000.05,水平1(方案甲)与水平3(方案丙)的效果有显著差异,指标的边际均值图(测线图):横坐标为包装类型,分线因素为销售方案,纵坐标为销售业绩。在4种包装类型和3种销售方案组合的折线图之间,近似有平行关系,则说明互交作用不显著。,2015/11/5,统计分析综合实验史慧萍,52,三、有重复的双因素分析,2015/11/5,统计分析综合实验史慧萍,53,问:因素A的不同水平(方案)的效果(均值),有无显著不

26、同?问:因素B的不同水平(方案)的效果(均值),有无显著不同?问:因素A与B之间的交互作用如何?,2015/11/5,统计分析综合实验史慧萍,54,例:3种类型的科技企业(大型科技企业、中型科技企业、小型科技企业),每个类型个足够数量的企业,对某项政策的作用大小打分,共分为3个等级。已知这些企业的与该项政策密切相关(先验判断密切相关)的指标U。现在想知道:该政策(作用的不同等级)对不同类型的企业的指标U的作用(均值)有无显著差异?评价某政策作用大小的企业的业绩(指标U),2015/11/5,统计分析综合实验史慧萍,55,有重复的双因素分析的SPSS实现,2015/11/5,统计分析综合实验史慧

27、萍,56,2015/11/5,统计分析综合实验史慧萍,57,有重复的双因素分析的实现(要考虑交互作用),2015/11/5,统计分析综合实验史慧萍,58,默认系统对“模型”的选择(全分析,包括互交分析),2015/11/5,统计分析综合实验史慧萍,59,选项的选择,2015/11/5,统计分析综合实验史慧萍,60,多重比较的选择,选一个或两个变量到右框,下部分选项激活。选择最小显著性差异方法的t检验LSD,选择方差不等的、没有正态分布假设的TamhanesT2检验。,2015/11/5,统计分析综合实验史慧萍,61,输出结果,1.变量标签和样本个数,2015/11/5,统计分析综合实验史慧萍,

28、62,2.描述统计表,2015/11/5,统计分析综合实验史慧萍,63,3.方差齐性检验结果,概率p=0.1050.05,接受零检验,认为本问题具有方差齐性。,2015/11/5,统计分析综合实验史慧萍,64,4.含交叉项(交互作用)的双因素方差分析结果,2015/11/5,统计分析综合实验史慧萍,65,首先是所用方差分析模型的检验,F值为7.101,p=0.000,因此所用的模型有统计学意义,可以用它来继续判断模型中的系数有无统计学意义;第二行是截距,它在我们的分析中没有实际意义;第三行政策作用的F统计值是13.3793955658,相应的显著概率p=0.0000.05,说明交互作用与零没有

29、显著差异。,5.企业评价政策等级的两两T检验结果,2015/11/5,统计分析综合实验史慧萍,66,6.科技企业规模的两两t检验结果,2015/11/5,统计分析综合实验史慧萍,67,未选择“假定方差不齐”时的两两t检验结果,2015/11/5,统计分析综合实验史慧萍,68,未选择“假定方差不齐”时的两两t检验结果,2015/11/5,统计分析综合实验史慧萍,69,指标的边际均值图:,2015/11/5,统计分析综合实验史慧萍,70,注:用SPSS 统计软件进行方差分析是非常简便和快捷的,但是,要注意SPSS 进行方差分析时,对数据的输入的格式是有要求的,一般来说,定义的分组变量主要是用来表示因子的不同水平。如果输入的数据的格式不对,那么将得不到正确的结果。所以,在用SPSS 进行方差分析时要注意到这一点。,2015/11/5,统计分析综合实验史慧萍,71,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号