实验设计与方差分析.docx

上传人:小飞机 文档编号:5175520 上传时间:2023-06-11 格式:DOCX 页数:33 大小:1.05MB
返回 下载 相关 举报
实验设计与方差分析.docx_第1页
第1页 / 共33页
实验设计与方差分析.docx_第2页
第2页 / 共33页
实验设计与方差分析.docx_第3页
第3页 / 共33页
实验设计与方差分析.docx_第4页
第4页 / 共33页
实验设计与方差分析.docx_第5页
第5页 / 共33页
亲,该文档总共33页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《实验设计与方差分析.docx》由会员分享,可在线阅读,更多相关《实验设计与方差分析.docx(33页珍藏版)》请在三一办公上搜索。

1、试验设计与方差分析SPSS操作一、试验设计与方差分析的关系试验设计并不是一种统计方法,而是一组统计方法的统称,其主 要用途在于分析自变量X的值与因变量y值之间的关系。此外,还用 于降低背景变量对理解x值与y值之间关系时的影响。试验设计使用的最主要的统计工具是方差分析,因此,许多教材 将试验设计与方差分析设计为同一部分,使用共同的概念和术语。其实方差分析并不仅仅在试验设计领域使用,也可以用来分析观 察数据。二、基本术语例:影响某温室水果产量的主要因素有三个:施肥量、浇水量、 温度。如果想通过控制三个因素的量,找出一个最优组合来提高产量, 就是实验设计与方差分析问题。相关的术语有:自变量(因子、因

2、素、输入变量、过程变量):可以控制的、影 响因变量的变量。本例为施肥量、浇水量、温度。因变量(反应变量、输出变量):我们所关心的、承载试验结果 的变量。本例为产量。背景变量(噪声、噪声变量、潜伏变量):能观察但不可控的因 子或因素,影响较小、达不到自变量水平。本例可能有测量误差等。水平(设置):自变量的不同等级。水平数通常不多,连续型变 量需离散化取值。如本例:施肥设1000克、1100克、1200克三个量, 浇水量设200千克、220千克两个量,温度设18度、20度、22度三 个量。处理:各因子按设定水平的一个组合。如本例:施肥1000克、 浇水200千克、温度18度为一个处理。试验单元:试

3、验载体的最小单位。如本例的一个温室或由一个温 室分割形成的房间。主效应与交互效应:两因子及以上试验时,各因子可能对因变量 有影响,因子间的相互作用也可能对因变量有影响。于是就有了上述 概念。有时,交互效应比主效应更重要。如本例:施肥固定在1000 克,浇水固定在200千克,18度、20度、22度三个温度条件下产量 的差异,可以理解为温度的主效应;而同一温度条件下,不同的施肥 量、浇水量造成的产量差异,就是交互效应。三、试验设计的三个基本原则第一,随机化。即采取机会均等的措施,将各种条件完全随机地 配置在试验单元上。目的是要尽量消除试验因素之外的其他因素的干 扰(平衡处理,不是减少误差,而是避免

4、某种未知因素与系统因素相 混淆)。极其重要。第二,重复(复制)。即基本试验的重复,将一个处理施于两个 或两个以上试验单元。重复的目的主要在于估计误差。没有对误差的 估计就无法做出试验结论。同时,重复也有助于更准确地估计因子的 效应。第三,区组化。一组同质齐性的试验单元称为区组。即对试验单 元分组,每组施加全部试验条件。区组化是单因子试验所采取的一种 设计方法,目的与随机化原则相同,防止区组因素对试验结果产生影 响。合理的区组化应当保证区组内差别小,区组间差别较大。能分区 组者分区组,不能分区组的要随机化,区组设计也要随机化。四、方差分析原理方差分析其本质是关于K个总体均值是否相等的参数假设检验

5、 (注意:不是检验总体方差是否相同)。方差分析最基本的原理:不同处理组的均值差异基本来源于两个 方面,一是随机误差,其造成组内差异;二是试验条件造成的误差, 即不同的处理造成不同结果,其形成组间差异。如果处理有作用,则组间差异会大于组内差异;如果处理没有作 用,则组间差异与组内差异相关差较小。于是就有了检验统计量F, 它是组间差异与组内差异的比值。F值越大,处理越可能有作用,反 之,处理越可能没作用。五、SPSS方差分析过程SPSS提供的方差分析操作涉及两个菜单:一个是One-Way ANOVA,单因变量单因素方差分析,在比较均 值菜单下,适用于分析一个因子的完全随机化设计数据。另一个是Gen

6、eral Linear Model,简称GLM过程。其下有四个子菜单,功能不同。Univariate :提供单因变量单因素或多因素方差分析方法。Multivariate :提供多因变量多因素方差分析方法。Repeated Measures :提供重复测量方差分析方法。Variance Components:提供方差成分分析方法。1. 单因变量单因素方差分析对数据的基本要求:完全随机化设计,正态分布。主要的操作:第一,方差分析。选择了因变量和因子变量之后就可以做,输出方差 分析表,回答K个总体均值是否都相等。ANOVA产量Sum of SquaresdfMean SquareFSig.Betwe

7、en Groups516.0002258.0009.000.003Within Groups430.0001528.667Total946.00017第二,对照比较。选择Contrasts按钮。第三,均值的多重比较。选择Post Hoc按钮,输出多重比较表。该操 作应在方差分析之后做,解决到底是哪两个总体均值不等的问题。注 意方法选择(两大类;有的控制第一类错误概率、有的不控制;有的仅做均值是否相等的检验,有的同时做子集一致性检验)。Multiple Comparisons产量Tukey HSD设备(J)设备Mean Difference(I-J)Std. ErrorSig.95% Confi

8、dence IntervalLower BoundUpper Bound125.0003.091.269-3.0313.03313.000*3.091.0024.9721.0321-5.0003.091.269-13.033.0338.0003.091.051-.0316.0331-13.000*3.091.002-21.03-4.972-8.0003.091.051-16.03.03*. The mean difference is significant at the 0.05 level.Tukey HSD设备NSubset for alpha = 0.05123666.002674.0

9、074.001679.00Sig.051.269Means for groups in homogeneous subsets are displayed旦 量,第三,输出统计量的选择。选择Options按钮,分别输出描述统计 固定效应模型的统计量,方差齐性检验结果,Robust检验结果。Test of Homogeneity of Variances产量Levene Statisticdf1df2Sig.824215.458Robust Tests of Equality of Means产量Statisticadf1df2Sig.Welch7.41629.843.011Brown-Fors

10、ythe9.000214.333.003a. Asymptotically F distributed.此外,还可以做均值图。2. 单因变量单因素方差分析(随机化区组设计区组设计的基本出发点:隔离或消除误差对试验结果的影响。实际工作中,试验者、试验材料、原材料、试验设备、时间、地点、环境等都可能成为区组因素。合理的区组设计结果,是区组间差异较大而区组内差异较小。区组因素也被称为“无关变量”,即通常不被作为一个因子处理但在SPSS方差分析操作中,区组化结果是区组成为一个“因素”, 因此要使用单因变量多因素方差分析方法,即调用GLM过程的 Univariate 菜单。 一个例子:8名操作者分为8个

11、区组,每人按随机顺序分别使用3 种操作方法生产产品,检验操作效率是否相同。数据如下:操作者操作法单位时间产出var11110621211E3131354211225221386231457311108321119331331041112 注意:不:能将这个例子看作是真正的两因素的设计,因为每个水平组合只有一个观测值,没有重复,无法做交互效应分析选择方法:GLM过程的Univariate选项(注意“固定因素变量”、“随机因素变量”、“协变量”、“权重”选项)选择模型:不能做全模型,需要自定义模型,仅做主效应分析选择多重比较方法:方差分析表:Tests of Between-Subjects Ef

12、fectsSourceType III Sum of SquaresdfMean SquareFSig.Corrected Model3180.875a9353.43111.043.000Intercept341532.0421341532.0421.067E4.000操作法1660.5832830.29225.942.000操作者1520.2927217.1856.786.001Error448.0831432.006Total345161.00024Corrected Total3628.95823a. R Squared = .877 (Adjusted R Squared = .797

13、)均值多重比较表:Multiple Comparisons(I)操作(J)操作法法Mean Difference (I-J)Std. ErrorSig.95% Confidence IntervalLower BoundUpper BoundTukey HSD方法A方法B方法C-10.12*-20.37*2.8292.829.008.000-17.53-27.78-2.72-12.97方法B方法A方法C10.12*-10.25*2.8292.829.008.0072.72-17.6517.53-2.85方法C方法A方法B20.37*10.25*2.8292.829.000.00712.972.

14、8527.7817.65Tamhane方法A方法B方法C-10.12-20.37*4.8484.134.172.001-23.78-31.773.53-8.98方法B方法A方法C10.12 -10.254.8485.450.172.226-3.53-25.1123.784.61方法C方法A方法B20.37*10.254.1345.450.001.2268.98-4.6131.7725.11Based on observed means.The error term is Mean Square(Error) = 32.006.*. The mean difference is signific

15、ant at the .05 level.子集一致性检验表单位时间产出操作法NSubset123Tukey HSDa方法A8109.12方法B8119.25方法C8129.50Sig.1.0001.0001.000Means for groups in homogeneous subsets are displayed.Based on observed means.The error term is Mean Square(Error) = 32.006.a. Uses Harmonic Mean Sample Size = 8.000.3. 单因变量多因素方差分析(析因试验设计)析因试验是

16、指将各因素和不同水平交叉组合形成处理,从而找出 主要因素的试验方法。析因试验的基本要求:夫2个或2个以上因子;夫每个因子有2个或2个以上水平;夫2个或2个以上重复;夫每次试验涉及全部因子,即因子同时施加。因为是全因子、全水平的试验,因此通常只做2因子的析因试验, 因子水平也不宜多。析因试验是真正的多因子试验,因此在分析数据时需要选择GLM 过程的Univariate菜单。例:选用4种燃料、3种推进器进行导弹射程试验,每个处理进 行2次重复。SPSS数据形式为:选择方法:GLM过程的Univariate选项选择模型:因为是多因子分析,需要考虑交互效应,所以按默认选 项做全模型即可。做边际均值图:

17、观察各因子不同水平是否有差异,以及因子间是否 有交互效应。选择多重比较方法:a Univariate: Post Hoc Multiple Comparisons for Observed MeansFactor(s):椎进爵rEqual Variances Assumed lsd S-N-K0 BonferroniTukey SidakTukeys-bScheffeDuncan R-E-G-W-FHochbergs GT2 R-E-G-W-QGabrielDunnettControl Category:rTestWaller-DuncanType IJype II Error Ratio:

18、100Last 2-sided O 匚 Control Q ControlrEqual Variances Not Assumed回 Tamhanes T2 Dunnetts T3 Games-Howell Dunnetts CContinueCancelHelp做边际均值估计方差分析表:Tests of Between-Subjects EffectsDependent Variable:射程SourceType III Sum of SquaresdfMean SquareFSig.Corrected Model2401.348a11218.30411.056.000Intercept72

19、578.002172578.0023.676E3.000燃料261.675387.2254.417.026推进器370.9812185.4909.394.004燃料*推进器1768.6926294.78214.929.000Error236.9501219.746Total75216.30024Corrected Total2638.29823a. R Squared = .910 (Adjusted R Squared = .828)边际均值表(对样本的描述)1.燃料Dependent Variable:射程燃料MeanStd. Error95% Confidence IntervalLow

20、er BoundUpper Bound155.7171.81451.76459.669249.4171.81445.46453.369357.0671.81453.11461.019457.7671.81453.81461.7192.推进器Dependent Variable:射程推进器MeanStd. Error95% Confidence IntervalLower BoundUpper Bound158.5501.57155.12761.973256.9121.57153.48960.336349.5131.57146.08952.9363.燃料*推进器燃料推进器MeanStd. Err

21、or95% Confidence IntervalLower BoundUpper Bound1155.4003.14248.55462.246248.7003.14241.85455.546363.0503.14256.20469.8962145.9503.14239.10452.796252.3003.14245.45459.146350.0003.14243.15456.8463159.2003.14252.35466.046272.0503.14265.20478.896339.9503.14233.10446.7964173.6503.14266.80480.496254.6003.

22、14247.75461.446345.0503.14238.20451.896燃料均值多重比较表(对总体的检验)Multiple Comparisons(J)燃 (I)燃料料Mean Difference (I-J)Std. ErrorSig.95% Confidence IntervalLower BoundUpper Bound126.3002.5655.119-1.31713.9173-1.3502.5655.951-8.9676.2674-2.0502.5655.854-9.6675.56721-6.3002.5655.119-13.9171.3173-7.650*2.5655.049

23、-15.267-.0334-8.350*2.5655.030-15.967-.733311.3502.5655.951-6.2678.96727.650*2.5655.049.03315.2674-.7002.5655.993-8.3176.917412.0502.5655.854-5.5679.66728.350*2.5655.030.73315.9673.7002.5655.993-6.9178.317Based on observed means.The error term is Mean Square(Error) = 19.746.*. The mean difference is

24、 significant at the .05 level.射程TikeyiS1 1 111 1 1 4 SiMeans forgraHII6 6 6 6155I7B7571067 571767js subsetsare displayed.Based on observed means.The error term is Mean Square(Error)= 19.746.推进器均值多重比较表(对总体的检验):Multiple Comparisons射程Tukey HSD(I)推进(J)推Mean Difference (I-J)Std. ErrorSig.95% Confidence I

25、ntervalLower BoundUpper Bound器进器121.6382.2218.747-4.2907.56539.037*2.2218.0043.11014.96521-1.6382.2218.747-7.5654.29037.400*2.2218.0151.47313.32731-9.037*2.2218.004-14.965-3.1102-7.400*2.2218.015-13.327-1.473Based on observed means.The error term is Mean Square(Error) = 19.746.*. The mean difference

26、 is significant at the .05 level.射程Tukey HSD推进器NSubset123849.5122856.9121858.550Sig.1.000.747Means for groups in homogeneous subsets are displayed.Based on observed means.The error term is Mean Square(Error)= 19.746.边际均值图(对样本的描述):Estimated Marginal Means of 射程58.0-56.0-54.0=52.0-50.0-48.0=II1234燃料60

27、.0-58.056.054.0-52.0-50.0-48.0-Estimated Marginal Means of 射程推逃器Estimated Marginal Means of 射程70.0-60.0-50.0-40.0-IIII1234推进器123燃料注意:在0.01的显著性水平下,燃料的主效应差异不显著,推进器的主效应差异显著,燃料与推进器交互效应的差异异常显著,这时, 燃料因子就显得很重要,不能舍弃。4. 单因变量多因素方差分析(拉丁方设计)案例:某电机产品输出电压受三个因素影响:线圈数、芯片数、表面涂层。每个因素设置5个水平:线圈数145150155160165芯片数230240

28、250260270表面涂层1级2级3级4级5级如果将线圈数作为因子,芯片数和表面涂层作为区组变量,想观察不同线圈数量对输出电压是否有显著影响,就要使用拉丁方设计。拉丁方:由拉丁字母组成的方阵,每行每列的字母都不相同。例:一个5阶标准拉丁方(第一行、第一列按字母顺序排列)A B C D E B A E C DC D A E B D E B A C E C D B A实际工作中,要做随机化处理,即将标准拉丁方的行、歹iJ、字母 顺序做随机变换。例:可将上述标准拉丁方转化为下列形式:C B A D E E C B A D D A C E B A E D B C B D E C A如果将因子变量线圈数

29、的5个水平设为A、B、C、D、E,则有下列试验安排:1级2级3级4级5级230155150145160165240165155150145160250160145155165150260145165160150155270150160165155145试验数据(输出电压)如下:1级2级3级4级5级230201210602405241090250712252326017-646182708932314使用SPSS软件对上述实验设计结果进行数据分析,也需要调用多因 素方差分析方法,即GLM过程的Univariate选项。SPSS数据形式:序号芯片数表面涂层线圈数输出电压11132021221231

30、3110414465155062155722324823210924191025401131471232112做方差分析Univariate: Model方差分析表Tests of Between-Subjects EffectsDependent Variable:输出电压SourceType III Sum of SquaresdfMean SquareFSig.Corrected Model1396.480a12116.3739.111.000Intercept2323.24012323.240181.882.000芯片数32.56048.140.637.646表面涂层55.760413

31、.9401.091.404线圈数1308.1604327.04025.603.000Error153.2801212.773Total3873.00025Corrected Total1549.76024a. R Squared = .901 (Adjusted R Squared = .802)方差分析结论:因子的不同水平对实验结果的影响是显著的做方差齐性检验Test of Homogeneity of VarianceLevene Statisticdf1df2Sig.输出电压 Based on Mean.091420.984Based on Median.050420.995Based

32、on Median and with.050416.517.995adjusted dfBased on trimmed mean.083420.987做均值的多重比较DUNCAN致性子集检验结果:输出电压Duncan线圈数NSubset1234165圈5.80160圈55.205.20150圈57.807.80145圈512.40155圈522.00Sig.075.272.0651.000Means for groups in homogeneous subsets are displayed.Based on observed means.The error term is Mean Sq

33、uare(Error) = 12.773.做边际均值表:线圈数Dependent Variable:输出电压线圈数MeanStd. Error95% Confidence IntervalLower BoundUpper Bound145圈12.4001.5988.91815.882150圈7.8001.5984.31811.282155圈22.0001.59818.51825.482160圈5.2001.5981.7188.682165圈.8001.598-2.6824.2825. 使用SPSS做正交试验设计以上例为例:如果线圈数、芯片数、表面涂层均为因子,每个因 子均为5个水平,则做全因子

34、试验至少要试验125次,而且这125 次试验的每种处理只能做一次,没有重复。如何使用较少的试验次数达到最好的结果?正交设计是实际工作中使用的方法。 SPSS提供了正交设计功能。当我们提供了因子信息之后,系统可 以为我们提供一个试验方案。 SPSS提供的正交设计方案与通常的正交表有所区别。打开一个新数据文件,进入相应功能File Edit View Data Transform Analyze Graphs Utilities Add-onsDefine Variable Properties.Copy Data Properties.New Custom Attribute.Define Da

35、tes.Define Multiple Response Sets.Orthogonal Design电 Sort Cases. Sort Variables.SE Transpose.Restructure.Mere FilesH Aggregate.Validation器 Identify Duplicate Cases.Identify Unusual Cases.123456789101112131415161F5 Copy Datasetvarvar尚 Generate.+ Display.Weight Cases.曲 Generate Orthogonal Design定义因素变量

36、定义各因子水平值及标签通 Generate Design: Define ValuesMMValues and Labels for aValueLabelrAuto-Fill11:|14S圈Froml to2: RIlSCi 圈:F3:何|1SS 圈4: |16 调5: b馅圈6:7:8:9:ContinueCancelHelp选择将设计好的表格保存在当前工作文件中。输入随机数设计方案a口cBIHIU3_L-AKU3145圈23CI 片WDesignr41由圈230 n5级Design45155圈250 g5级Design56155圈260 g3级Design671曲圈230 n3级Desi

37、gn78145圈240 g擦Design891印圈260 g德Design910倡5圈240 n1级Design10111即圈270 g1级Design1112155圈240 g4级Design12131印圈250 n1级Design13141即圈230 n擦Design1415145圈250 g3级Design15161印圈270 n3级Design1617145圈260 n4级Design171815口圈260 n弦Design10191印圈230 n4级Design1920倡弓圈270 g4级Design2021145圈洌片弦Design2122佰口圈240 n3级Design22231曲圈270 n2级Design23241由圈250 g擦Design2425155圈260 n1级Design25

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号