《SPSS教程-多因素方差分析.doc》由会员分享,可在线阅读,更多相关《SPSS教程-多因素方差分析.doc(9页珍藏版)》请在三一办公上搜索。
1、多因素方差分析多因素方差分析是对一个独立变量是否受一个或多个因素或变量影响而进行的方差分析.SPSS调用Univariate过程,检验不同水平组合之间因变量均数,由于受不同因素影响是否有差异的问题.在这个过程中可以分析每一个因素的作用,也可以分析因素之间的交互作用,以与分析协方差,以与各因素变量与协变量之间的交互作用.该过程要求因变量是从多元正态总体随机采样得来,且总体中各单元的方差相同.但也可以通过方差齐次性检验选择均值比较结果.因变量和协变量必须是数值型变量,协变量与因变量不彼此独立.因素变量是分类变量,可以是数值型也可以是长度不超过8的字符型变量.固定因素变量是反应处理的因素;随机因素是
2、随机地从总体中抽取的因素.例子研究不同温度与不同湿度对粘虫发育历期的影响,得试验数据如表5-7.分析不同温度和湿度对粘虫发育历期的影响是否存在着显著性差异.表5-7 不同温度与不同湿度粘虫发育历期表相对湿度%温度重 复12341002591.295.093.893.02787.684.781.282.42979.267.075.770.63165.263.363.663.3802593.289.395.195.52785.881.681.084.42979.070.867.778.83170.786.566.964.94025100.2103.398.3103.82790.691.794.59
3、2.22977.285.881.779.73173.673.276.472.5数据保存在DATA5-2.SAV文件中,变量格式如图5-1.1准备分析数据在数据编辑窗口中输入数据.建立因变量历期历期变量,因素变量温度A,湿度为B变量,重复变量重复.然后输入对应的数值,如图5-6所示.或者打开已存在的数据文件DATA5-2.SAV.图5-6 数据输入格式2启动分析过程点击主菜单Analyze项,在下拉菜单中点击General Linear Model项,在右拉式菜单中点击Univariate项,系统打开单因变量多因素方差分析设置窗口如图5-7.图5-7 多因素方差分析窗口3设置分析变量设置因变量:
4、在左边变量列表中选历期,用向右拉按钮选入到Dependent Variable:框中.设置因素变量:在左边变量列表中选a和b变量,用向右拉按钮移到Fixed Factor:框中.可以选择多个因素变量.由于内存容量的限制,选择的因素水平组合数应该尽量少.设置随机因素变量:在左边变量列表中选重复变量,用向右拉按钮移到到Random Factor框中.可以选择多个随机变量.设置协变量:如果需要去除某个变量对因素变量的影响,可将这个变量移到Covariate框中.设置权重变量:如果需要分析权重变量的影响,将权重变量移到WLS Weight框中.4选择分析模型在主对话框中单击Model按钮,打开Univ
5、ariate Model对话框.见图5-8.图5-8 Univariate Model 定义分析模型对话框在Specify Model栏中,指定分析模型类型. Full Factorial选项此项为系统默认的模型类型.该项选择建立全模型.全模型包括所有因素变量的主效应和所有的交互效应.例如有三个因素变量,全模型包括三个因素变量的主效应、两两的交互效应和三个因素的交互效应.选择该项后无需进行进一步的操作,即可单击Continue按钮返回主对话框.此项是系统缺省项. Custom选项建立自定义的分析模型.选择了Custom后,原被屏蔽的Factors & Covariates、Model和Buil
6、d Term栏被激活.在Factors & Covariates框中自动列出可以作为因素变量的变量名,其变量名后面的括号中标有字母F;和可以作为协变量的变量名,其变量名后面的括号中标有字母C.这些变量都是由用户在主对话框中定义过的.根据表中列出的变量名建立模型,其方法如下:在Build Term栏右面的有一向下箭头按钮下拉按钮,单击该按钮可以展开一小菜单,在下拉菜单中用鼠标单击某一项,下拉菜单收回,选中的交互类型占据矩形框.有如下几项选择: Interaction 选中此项可以指定任意的交互效应; Main effects 选中此项可以指定主效应; All 2-way 指定所有2维交互效应;
7、All 3-way 指定所有3维交互效应; All 4-way 指定所有4维交互效应 All 5-way 指定所有5维交互效应.建立分析模型中的主效应:在Build Term栏用下拉按钮选中主效应Main effects.在变量列表栏用鼠标键单击某一个单个的因素变量名,该变量名背景将改变颜色,单击Build Term栏中的右拉箭头按钮,该变量出现在Model框中.一个变量名占一行称为主效应项.欲在模型中包括几个主效应项,就进行几次如上的操作.也可以在标有F变量名中标记多个变量同时送到Model框中.本例将a和b变量作为主效应,按上面的方法选送到Model框中.建立模型中的交互项要求在分析模型中
8、包括哪些变量的交互效应,可以通过如下的操作建立交互项.例如,因素变量有a和b,建立它们之间的相互效应. 连续在Factors &框的变量表中单击a和b变量使其选中. 单击Build Term栏内下拉按钮,选中交互效应Interaction项. 单击Build Term栏内的右拉按钮,a*b交互效应就出现在Model框中,模型增加了一个交互效应项:a*b Sum of squares 栏分解平方和的选择项 Type I项,分层处理平方和.仅对模型主效应之前的每项进行调整.一般适用于:平衡的AN0VA模型,在这个模型中一阶交互 效应前指定主效应,二阶交互效应前指定一阶交互效应,依次类推;多项式回归
9、模型.嵌套模型是指第一效应嵌套在第二 效应里,第二效应嵌套在第三效应里,嵌套的形式可使用语句指定. Type II项,对其他所有效应进行调整.一般适用于:平衡的AN0VA模型、主因子效应模型、回归模型、嵌套设计. Type III项,是系统默认的处理方法.对其他任何效应均进行调整.它的优势是把所估计剩余常量也考虑到单元频数中.对没 有缺失单元格的不平衡模型也适用,一般适用于:Type I、Type II所列的模型:没有空单元格的平衡和不平衡模型. Type IV顶,没有缺失单元的设计使用此方法对任何效应F计算平方和.如果F不包含在其他效应里,Type IV = Type IIIl = Type
10、II.如果F包含在其他效应里,Type IV只对F的较高水平效应参数作对比.一般适用于:Type I、Type lI所列模型; 没有空单元的平衡和不平衡模型. Include intercept in model栏选项系统默认选项.通常截距包括在模型中.如果能假设数据通过原点,可以不包括截距,即不选择此项.5选择比较方法在主对话框中单击Contrasts按钮,打开Contrasts比较设置对话框,如图5-9所示.如图5-9 Contrasts对比设置框在Factors框中显示出所有在主对话框中选中的因素变量.因素变量名后的括号中是当前的比较方法.选择因子在Factors框中选择想要改变比较方法
11、的因子,即鼠标单击选中的因子.这一操作使Change Contrast栏中的各项被激活.选择比较方法单击Contrast参数框中的向下箭头,展开比较方法表.用鼠标单击选中的对照方法.可供选择的对照方法有: None,不进行均数比较. Deviation,除被忽略的水平外,比较预测变量或因素变量的每个水平的效应.可以选择Last或 First作为忽略的水平. Simple,除了作为参考的水平外,对预测变量或因素变量的每一水平都与参考水平进行比较.选择Last或First作为 参考水平. Difference,对预测变量或因素每一水平的效应,除第一水平以外,都与其前面各水平的平均效应进行比较.与H
12、elmert对照 方法相反. Helmert,对预测变量或因素的效应,除最后一个以外,都与后续的各水平的平均效应相比较. Repeated,对相邻的水平进行比较.对预测变量或因素的效应,除第一水平以外,对每一水平都与它前面的水平进行比较. Polynomial,多项式比较.第一级自由度包括线性效应与预测变量或因素水平的交叉.第二级包括二次效应等.各水平彼此 的间隔被假设是均匀的.修改比较方法先按步骤选中因子变量,再选比较方法,然后单击Change按钮,选中的比较方法显示在步骤选中的因子变量后面的括号中.设置比较的参考类在Reference Category栏比较的参考类有两个,只有选择了Dev
13、iation或Simple方法时才需要选择参考水平.共有两种可能的选择,最后一个水平Last选项和第一水平First项.系统默认的参考水平是Last.6 选择均值图在主对话框中单击Plot按钮,打开Profile Plots对话框,如图5-10所示.在该对话框中设置均值轮廓图.如图5-10 Profile Plots对话框均值轮廓图用于比较边际均值.轮廓图是线图,图中每个点表明因变量在因素变量每个水平上的边际均值的估计值.如果指定了协变量,该均值则是经过协变量调整的均值.因变量做轮廓图的纵轴;一个因素变量做横轴.做单因素方差分析时,轮廓图表明该因素各水平的因变量均值.双因素方差分析时,指定一个
14、因素做横轴变量,另一个因素变量的每个水平产生不同的线.如果是三因素方差分析,可以指定第三个因素变量,该因素每个水平产生一个轮廓图.双因素或多因素轮廓图中的相互平行的线表明在因素间无交互效应;不平行的线表明有交互效应. Factors框中为因素变量列表. Horlzontal Axis横坐标框,选择选择Factors框中一个因素变量做横坐标变量.被选的变量名反向显示,单击向右拉箭头按钮,将变量名送入相应的横坐标轴框中. 如果只想看该因素变量各水平的,因变量均值分布,单击Add按钮,将所选因素变量移入下面的Plots框中.否 则,不点击Add按钮,接着做下步. Separate Lines分线框.
15、如果想看两个因素变量组合的各单元格中因变量均值分布,或想看两个因变量间是否存在交互效应, 选择Factors框中另一个因素变量,单击右拉按钮将变量名送入Separate Lines框中.单击Add按钮,将自动生成 的图形表达式送入到Plots栏中.分线框中的变量的每个水平将在图中是一条线.图形表达式是用*连接的两个因素变 量名. Separate Plots分图框.如果在Factors栏中还有因素变量,可以按上述方法,将其送入Separate Plot框中,单击 Add按钮,将自动生成的图形表达式送入到Plots栏中.图形表达式是用*连接的三个因素变量名.分图变量的每个 水平生成一张线图. 将
16、图形表达式送到Plots框后发现有错误,单击选错的变量,单击Remove按钮,将其取消,再重新输入正确内容.在检查无误后,按Continue按钮确认,返回到主对话框.如果取消做的设置单击Cancel按钮7 选择多重比较在主对话框中单击Post Hoc选项,打开Post Hoc Multiple Comparisons for Observed Means对话框,从Factor框选择变量,单击向右拉按钮,使被选变量进入Post Hoc test for框.本例子选择了a和b.然后选择多重比较方法.在对话框中选择多重比较方法.本例子选择了Duncan和Tamhanes T2.8选择保存运算值图5-
17、11 Save对话框在主对话框中,单击Save按钮,打开Save设置对话框,如图5-11所示.通过在对话框中的选择,可以将所计算的预测值、残差和检测值作为新的变量保存在编辑数据文件中.以便于在其他统计分析中使用这些值. Predicted Values 预测值1. Unstsndardized,非标准化预测值.2. Weighted,如果在主对话框中选择了WLS变量,选中该复选项,将保存加权非标准化预测值.3. Standard error,预测值标准误. Diagnostics 诊断值1. Cooks distance,Cook 距离.2. Leverage values,非中心化 Leve
18、rage 值. Residuals 残差1. Unstsndardized,非标准化残差值,观测值与预测值之差.2. Weighted,如果在主对话框中选择了WLS变量,选中该复选项,将保存加权非标准化残差.3. Standardized,标准化残差,又称Pearson残差.4. Studentized,学生化残差.5. Deleted,剔除残差,自变量值与校正预测值之差. Save to New File保存协方差矩阵选中Coefficient statistics项,将参数协方差矩阵保存到一个新文件中.单击File按钮,打开相应的对话框将文件保存.9选择输出项在主对话框中单击Options
19、按钮,打开Options输出设置对话框,见图5-12.图5-12 Options输出设置对话框 Estimated Marginal Means 估测边际均值设置 在Factor and Factor Interactions框中列出Model对话框中指定的效应项,在该框中选定因素变量的各种效应项, 单击右拉按钮就将其复制到Display Means for框中.选择主效应,则产生估计的边际均值表;选择二维交互效应产生的估计 边际均值表实际上是典型的单元格均值表.选择三维交互效应也是单元格均值表. 在Display Means for框中有主效应时激活此框下面的Compare main eff
20、ects复选项,对主效应的边际均值进行组间的配 对比较. Confidence interval adjustment参数框,进行多重组间比较.打开下拉菜单,共有三个选项: LSD、Bonferroni、Sidak.在Display栏中指定要求输出的统计量Descriptive statistics项,输出描述统计量:观测量的均值、标准差和每个单元格中的观测量数.Estimates of effect size项,效应量估计.选择此项,给出2值.它反应了每个效应与每个参数估计值可以归于 因素的总变异的大小.Observed power复选项,选中此项给出在假设是基于观测值时各种检验假设的功效.
21、计算功效的显著性水平,系统默认的临界值 是0.05.Parameter estimates项.选择此项给出了各因素变量的模型参数估计、标准误、t检验的t值、显著性概率和95的置信区间.Contrast coefficient matrix项,显示协方差矩阵.Homogeneity test项,方差齐次性检验.本例子选中该项.Spread vs.level plot项,绘制观测量均值对标准差和观测量均值对方差的图形.Residual plot项,绘制残差图.给出观测值、预测值散点图和观测量数目,观测量数目对标准化残差的散点图,加上正态和标准化 残差的正态概率图.Lack of fit项,检查独立
22、变量和非独立变量间的关系是否被充分描述.General estimable function项,可以根据一般估计函数自定义假设检验.对比系数矩阵的行与一般估计函数是线性组合的. Significance level 框设置改变Confidence intervals框内多重比较的显著性水平.10 提交执行设置完成后,在多因素方差分析窗口框中点击OK按钮,SPSS就会根据设置进行运算,并将结算结果输出到SPSS结果输出窗口中.11 结果与分析主要输出结果:结果分析:方差不齐次性检验显著 表5-8 方差齐次性检验表明:方差不齐次性显著,p0.05.方差分析:表5-9 主效应方差分析表:在表的左上方
23、标明研究的对象是粘虫历期.偏差来源和偏差平方和: Source列是偏差的来源.其次列是Type III Sum of Squares偏差平方和. Corrected Model校正模型,其偏差平方和等于两个主效应a、b平方和加上交互a*b的平方和之和. Intercept截距. a温度主效应,其偏差平方和反应的是不同温度造成对粘虫历期的差异.与b偏差平方相同均属于组间偏差平方和. b湿度主效应,其偏差平方和反应的是不同湿度计量造成的粘虫历期之差异. a*b温度和湿度交互效应,其偏差平方和反应的是不同温度和湿度共同造成的粘虫历期的差异. Error误差.其偏差平方和反应的是组内差异.也称组内偏差
24、平方和. Total是偏差平方和在数值上等于截距、主效应、次效应和误差偏差平方和之总和. Corrected Total校正总和.其偏差平方和等于校正模型与误差之偏差平方和之总和. df自由度 Mean Square均方,数值上等于偏差平方和除以相应的自由度. F值,是各效应项与误差项的均方之比值 Sig进行F检验的p值.p0.05,由此得出温度和湿度对因变量粘虫历期在0.05水平上是有显著性差异的.根据方差分析表明: 不同温度a对粘虫历期的偏差均方是1575.434,F值为90.882,显著性水平是0.000,即p0.05存在显著性差异; 不同湿度b对粘虫历期的偏差均方是322.000,F值为18.575,显著性水平是0.000,即p0.05存在不显著性 差异.多重比较由于方差不齐次性,应选择方差不具有齐次性时的Tamhanes T2t检验进行配对比较.表5-10 多重比较表就是温度各水平Tamhanes T2方法比较的结果.表中的各项说明参见表5-65.2.2节. 温度25与27、29和31之间都有显著性差异; 温度27与25、29和31之间都有显著性差异; 温度29与26和27之间都有显著性差异;与31无显著性差异; 温度31与25和27之间都有显著性差异;与29无显著性差异.不同湿度水平之间无显著性差异存在,这里没有列出多重比较表.