《第六章SPSS的方差分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《第六章SPSS的方差分析ppt课件.ppt(83页珍藏版)》请在三一办公上搜索。
1、第六章 SPSS的方差分析,方差分析概述单因素方差分析多因素方差分析协方差分析,第一节 方差分析概述,在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。通常是比较不同实验条件下总体均值间的差异举例医学界研究几种药物对某种疾病的疗效;农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响不同饲料对牲畜体重增长的效果等不同广告形式、地区规模等因素对广告效果的影响等 都可以使用方差分析方法去解决,方差分析是检验多个总体均值是否相等一种方法。本质上是研究分类型自变量对数值型因变量的影响。,方差分析概念,因素(控制变量):在方差分析中,所要检验的对象称为因素。其常为一个或多个离散型的分类变
2、量。水平:因素的不同类别或不同取值为因素的不同水平。因素的每一个水平可以看作一个整体。观测值(观测变量):在进行方差分析时,每个因素水平下得到的 样本数据。,几个基本概念,方差分析中判断总体均值是否相等一般是通过对数据误差来源的分析判断得到。误差来源有两种情况:随机误差和系统误差。随机误差:在同一因素下的观察值由于抽样的随机性造成的误差。系统误差:不同因素下的观察值由于系统因素造成的误差。,方差分析基本原理,数据误差用平方和表示。组内误差(随机误差)数据误差 随机误差 组间误差 系统误差,衡量同一水平下样本数据的误差,衡量不同下的样本数据误差,方差分析的核心是方差可分解。这里的方差是指通过计算
3、各观测值偏离均值的平方和再除以n-1得到。这样,在给定n的情况下,方差就是离差平方和,简称SST。观察量的总平方和SST分解为组间离差平方和SSA和组内误差平方和SSE,即:SST=SSA+SSE,由误差来源的分析得知,判断分类型自变量对数值型因变量受否有影响,就是检验数值型变量存在差异的原因。如果这种差异主要是系统误差,则分类型变量对该数值存在显著影响,否则差异不显著。根据统计学原理,组间均方和组内均方的比值构成F分布。给定显著性水平,通过和F分布统计量的概率P的比较,推出总体均值是否存在显著差异。,方差分析一般应满足3个基本假设,即要求:各个总体应服从正态分布各个总体的方差相同观测值是独立
4、的。,第二节 单因素方差分析,单因素方差分析的基本思想单因素方差分析的数学模型单因素方差分析的基本步骤单因素方差分析的基本操作单因素方差分析的应用举例单因素方差分析的进一步分析及应用,单因素方差分析的基本思想,单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响。例如:比较若干种牌子的胶合板的耐磨情况,变量BRAND为试样的牌子,变量WEAR为试样的磨损量,共有5种牌子的胶合板,每种试验了4个试样,我们希望知道这5种牌子的胶合板的磨损量有无显著差别,我们在选购时就不必考虑哪个更耐磨而只需考虑价格等因素,但如果结果有 差异,我们应考虑使用耐磨性好的牌子。,概念,明确观测变量和控制变量
5、eg:前面例子中观测量是胶合板的磨损量 控制变量是牌子种类剖析观测变量的方差比较观测变量总离差平方和各部分的比例如果组间离差平方和所占比例较大,则说明观测变量的变动主要是由控制变量引起的,否则,则不是。,基本思想,单因素方差分析的数学模型,在水平Ai下的第j次试验的样本值 可以定义为:,单因素方差分析的数学模型为,单因素方差分析的基本步骤,(1)建立原假设和备择假设。(2)构造统计量其中,n为总体数目,(3)计算统计量的观测值和概率P值(4)给定显著性水平,得出结论。当 拒绝原假设,即认为控制变量不同水平下观测变量各总体的均值存在显著差异;当 时,则不能拒绝原假设,即认为控制变量不同水平下观测
6、变量各总体的均值没有显著差异,单因素方差分析的基本操作及应用举例以广告城市与销售额.sav为例,分析,比较均值,单因素AVOVA,广告形式对销售额的单因素方差分析,方法一,因为F值对应的概率P值小于0.05,所以拒绝原假设,即认为不同广告形式对销售额有显著差异。,方法二,比较均值,分析,均值,单因素方差分析一定要选上,单因素方差分析的进一步分析,进一步分析,方差相等时的一些多重比较方法,即最小显著性差异法。用T检验完成组间成对均值的比较。检验的敏感度较高,即使是各个水平间的均值存在细微差别也有可能被检验出来,但此方法对第一类弃真错误不进行控制和调整,LSD方法,即修正最小显著性差异法。用T检验
7、完成组间成对均值的比较,但通过设置每个检验的误差率来控制整个误差率。因此采用此方法看到的显著值是多重比较完成后的调整值。用q检验完成各水平下观测值个数相等时组间成对均值的比较。一定程度可以保证犯一类错误的概率总体上不增大。,Bonferroni方法,Tukey方法,当各水平下观测值个数不相等,或者想进行复杂的比较时,或对所有可能的组合进行同步比较时,可选用此方法。这种检验被用来检验组间均值的所有可能的线性组合,而不只是成对组合,并控制整体显著性水平为0.05。这种方法相对比较保守,有时候方差分析F值有显著性,用该方法进行两两比较却找不出差异。,Scheffe方法,用于进行所有各组均值间的配对比
8、较,且用于水平观测值个数相等的情况。用逐步过程进行其次子集的均值配对比较。在该过程中各组均值按从小到大的顺序排列,最先比较最极端的差异。,S-N-K方法,方差不相等时的一些多重比较方法,Tamhane,sT2方法:表示用T检验进行配对比较检验Dunnett,sT3方法:表示用Student最大系数进行进行配对比较检验Games-Howell方法:表示方差不齐时的配对比较检验Dunnett,sC方法:表示用极差统计量进行配对比较检验,其他检验,趋势检验,先验对比检验,所有系数之和为0,单因素方差分析应用举例的进一步分析以广告城市与销售额.sav为例,不同广告形式下销售额总体方差齐性检验,因为P值
9、大于0.05,所以不能拒绝原假设,即认为方差齐性,多重比较检验(分析哪种广告形式作用明显),广告形式多重比较检验的相似性子集,此方法在相似性子集划分中用得最多,趋势检验(分析销售额是否会随着地区人口密度减少而呈现出某种趋势),因为F值对应的概率P值小于0.05,所以拒绝原假设,即认为地区和销售额之间不是零线性相关,先验对比检验,因为T值对应的概率P值大于0.05,所以不能拒绝原假设,即认为报纸广告的效果与广播、体验的总体效果没有显著差异,练习,对四个服务行业的服务质量进行评价,较高得分表示较高的服务质量。对航空公司、零售业、旅馆业和汽车制造业进行的评定数据见四种不同行业评价得分.sav。在显著
10、性水平=0.05下,检验四种行业质量等级的总体均值是否差异显著?你的结论如何?,第三节多因素方差分析,在上一节课,我们已经研究了不同广告形式对产品销售有显著影响,不同地区的产品销售额也存在显著差异,然而,不同广告形式和不同地区的搭配是否会对销售额产生影响呢?而哪种搭配方式又可以获得最理想的销售业绩呢?,问题引出,本节主要内容,多因素方差分析的基本思想多因素方差分析的数学模型多因素方差分析的基本步骤多因素方差分析的基本操作多因素方差分析的应用举例多因素方差分析的进一步分析及应用,多因素方差分析的基本思想,多因素方差分析用来研究两个及两个以上控制变量是否对观测变量产生显著影响。它不仅能分析多个因素
11、对观测变量的独立影响,更能够分析多个控制因素的交互作用能否对观测变量的分布产生显著影响,进而找到有利于观测变量的最优组合。,概念,确定观测变量和若干个控制变量剖析观测变量的方差比较观测变量总离差平方和和各部分所占的比例,基本思想,剖析观测变量的方差,第一,控制变量独立作用的影响第二,控制变量交互作用的影响第三,随机因素的影响,多因素方差分析的数学模型,设控制变量A有k个水平,B有r个水平,每个交叉水平下均有l个样本,则在控制变量A的水平Ai和控制变量B的水平Bj下的第k个样本值 定义为:,多因素方差分析的饱和模型,多因素方差分析的基本步骤,提出零假设选择检验统计量,固定效应模型,随机效应模型,
12、计算检验统计量观测值和概率P值给出显著性水平,并作出统计决策(1)若FA的概率p,则拒绝原假设,即认为控制变量A的不同水平对观测变量产生了显著影响。(2)FB的概率p,则拒绝原假设,即认为控制变量B的不同水平对观测变量产生了显著影响。(3)FAB的概率p,则拒绝原假设,即认为控制变量A、B的交互作用对观测变量产生了显著影响,然后再依此对A、B的效应进行检验,多因素方差分析的基本操作以广告城市与销售额.sav为例,分析一般线性模型单变量,因为概率P小于0.05,所以拒绝原假设,即认为线性模型对观测变量有一定的解释作用,后面的几个概率中,除了交互作用中概率大于0.05外,其余的全小于0.05,说明
13、除了交互作用差异不显著外,其它的都显著,多因素方差分析的进一步分析,两因素的非饱和模型:SST=SSA+SSB+SSE三因素的非饱和模型:SST=SSA+SSB+SSC+SSABC+SSE,多因素方差分析的非饱和模型,多因素方差分析的其他功能,均值检验模型分析,多因素方差分析的进一步分析的操作以广告城市与销售额.sav为例,建立非饱和模型,均值比较的操作,练习,某教学实验中,采用不同的教学方法和不同的教材进行教学实验,获得一系列数据,现在分析不同教学方法和不同教材对教改成绩的影响,数据附在文件夹教改成绩.sav。要求:进行均值的多重比较,方法选用LSD法,得出教改成绩多因素方差分析的饱和模型表
14、和非饱和模型表,并得出教学方法和教材的交互作用图。,第四节协方差分析,问题引出:在分析不同的饲料对生猪增重是否产生显著差异时,如果仅仅是分析饲料的作用,即用单因素方差分析来进行,而不考虑生猪自身各自不同的身体条件(比如猪最初时的体重)时,得出的结论很可能是片面的,不准确的。这时,如何才能准确地反映不同饲料对生猪体重的影响呢?,协方差分析的基本思路协方差分析的数学模型协方差分析的基本操作协方差分析的应用举例,本节主要内容,协方差分析的基本思路,基本概念,协方差分析是指将那些很难人为控制的控制因素作为协变量,并在排除协变量对观测变量影响的条件下,分析控制变量对观测变量的作用,从而更加准确地对控制变量进行评价。,基本同方差分析的基本思想,除此之外,考虑了协变量的影响,认为观察变量的变化受四个方面的影响:即控制变量的独立作用,控制变量的交互作用,协变量的作用和随机因素的作用,并在扣除协变量的影响后,再分析控制变量对观测变量的影响。,协方差分析的基本思想,方差分析中的零假设是:协变量对观测变量的线性影响不显著;在协变量影响扣除的条件下,控制变量各水平下观测变量的总体均值无显著差异,控制变量各水平对观测变量的效应同时为零。用F统计量进行检验。,协方差分析的数学模型,单因素协方差分析的数学模型是:,协方差分析的基本操作以生猪与饲料.sav为例,