《多因子方差分析》PPT课件.ppt

上传人:小飞机 文档编号:5581701 上传时间:2023-07-30 格式:PPT 页数:59 大小:208KB
返回 下载 相关 举报
《多因子方差分析》PPT课件.ppt_第1页
第1页 / 共59页
《多因子方差分析》PPT课件.ppt_第2页
第2页 / 共59页
《多因子方差分析》PPT课件.ppt_第3页
第3页 / 共59页
《多因子方差分析》PPT课件.ppt_第4页
第4页 / 共59页
《多因子方差分析》PPT课件.ppt_第5页
第5页 / 共59页
点击查看更多>>
资源描述

《《多因子方差分析》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《多因子方差分析》PPT课件.ppt(59页珍藏版)》请在三一办公上搜索。

1、多元统计分析方法,The Methods of Multivariate Statistical Analysis,第三章,多因子方差分析,无交互效应的二因子方差分析 有交互效应的二因子方差分析 三因子方差分析 其他多因子方差分析,方差分析的分类,单反应变量(y),多反应变量(y1,y2yk),单效应因子(A),双效应因子(A,B),多效应因子(A,B,C),无交互效应有交互效应,2)根据效应因子的随机性:固定模型(fixed model):效应因子是专门指定的。随机模型(random model):效应因子是从很多因子中随机抽取出来的。混合模型(mixed model):效应因子包含两种类型

2、因子。,1)根据变量的个数:,第一节 无交互效应的二因子方差分析,数据:每个交叉点上一个观测值,SST=SSA+SSB+SSE,总变异=因子A+因子B+随机误差,方差分析原理-变异分解:,无交互效应的双因子方差分析表:,统计假设:,【例3-1】用四种不同方法治疗8名患者,其血浆凝固时间的资料列在表3-2中。试分析治疗方法对血浆凝固时间的影响。表3-2 治疗方法与浆凝固时间的资料,【SAS 程序】data eg3_1;do b=1 to 8;do a=1 to 4;input x;output;end;end;cards;8.4 9.4 9.8 12.2 7.9 8.1 8.2 10.0run;

3、proc anova;class a b;model x=a b;means a/snk;run;,模型包含b因子-校正个体差异的影响,【SAS 输出结果】Analysis of Variance ProcedureDependent Variable:X Sum of MeanSource DF Squares Square F Value Pr FModel 10 92.00500000 9.20050000 14.03 0.0001Error 21 13.77375000 0.65589286Corrected Total 31 105.77875000 R-Square C.V.Roo

4、t MSE X Mean 0.869787 8.103786 0.8098721 9.9937500Source DF Anova SS Mean Square F Value Pr FA 3 13.01625000 4.33875000 6.62 0.0025B 7 78.98875000 11.28410714 17.20 0.0001,Student-Newman-Keuls test for variable:XNOTE:This test controls the type I experimentwise error rate under the complete null hyp

5、othesis but not under partial null hypotheses.Alpha=0.05 df=21 MSE=0.655893Number of Means 2 3 4Critical Range 0.8421113 1.0206699 1.1286903Means with the same letter are not significantly different.SNK Grouping Mean N A A 11.0250 8 4 B 9.9375 8 3 B 9.7125 8 2 B 9.3000 8 1,Source DF Anova SS Mean Sq

6、uare F Value Pr FA 3 13.01625000 4.33875000 6.62 0.0025B 7 78.98875000 11.28410714 17.20 0.0001Model 10 92.00500000 9.20050000 14.03 0.0001Error 21 13.77375000 0.65589286Corrected Total 31 105.77875000,无交互效应的双因子方差分析表:,【SAS 程序】data eg3_1;do b=1 to 8;do a=1 to 4;input x;output;end;end;cards;8.4 9.4 9.

7、8 12.2 7.9 8.1 8.2 10.0run;proc anova;class a;model x=a;means a/snk;run;,模型不包含b因子-不校正个体差异的影响,Analysis of Variance ProcedureDependent Variable:XSource DF Sum of Squares F Value Pr FModel 3 13.01625000 1.31 0.2909Error 28 92.76250000Corrected Total 31 105.77875000 R-Square C.V.X Mean 0.123052 18.21288

8、 9.99375000Source DF Anova SS F Value Pr FA 3 13.01625000 1.31 0.2909,Source DF Sum of Squares Mean Square F Value Pr FA 3 13.01625000 4.33875000 1.31 0.2909Error 28 92.76250000 3.31294643Corrected Total 31 105.77875000,完全随机设计的单因素方差分析结果:,Source DF Anova SS Mean Square F Value Pr FA 3 13.01625000 4.3

9、3875000 6.62 0.0025B 7 78.98875000 11.28410714 17.20 0.0001Error 21 13.77375000 0.65589286Corrected Total 31 105.77875000,随机区组设计的双因素方差分析结果:,第二节 有交互效应的二因子方差分析,数据:每个交叉点上有r(1)个重复观测值,SST=SSA+SSB+SSAB+SSE,总变异=因子A+因子B+交互效应AB+随机误差,方差分析原理-变异分解:,(1)H0:1=a H1:i j(A效应)(2)H0:1=b H1:i j(B效应)H0:所有ij 都相同 H1:所有ij 不

10、完全相同(交互效应),统计假设:,有交互效应的双因子方差分析表:,什么是交互效应?,例如:Y=舒张压 A=药物:A=1(对照药),A=2(试验药)B=性别:B=1(男性),B=2(女性),无交互效应模型:Y=A+B有交互效应模型:Y=A+B+AB,交互效应的阶数,二因子:A,B,A*B 主效应:A,B 一阶交互效应:A*B 三因子:A,B,C,A*B,A*C,B*C,A*B*C 主效应:A,B,C 一阶交互效应:A*B,A*C,B*C 二阶交互效应:A*B*C:,【例3-2】某药物研究所作抗哮喘病药物实验,目的是比较两种剂量的抗哮喘病药物和一个对照药物在三个临床研究地点的效能差异。研究设计是在

11、每一个地点用每一种处理方法处理8个病人,因变量采用的是哮喘病人体能测试得分的增加量。测试结果列在表3-4中。表3-4 哮喘病人体能测试得分增加量数据,【SAS程序】data eg3_2;do place=1 to 3;do treat=1 to 3;do id=1 to 8;input x;output;end;end;end;cards;4.0 2.3 6.3 10.22.4 5.4 6.4 9.01.0 1.3 6.8 5.2run;proc glm;class place treat;model x=place|treat;lsmeans place|treat/pdiff adjust

12、=bon;run;,【SAS输出结果】General Linear Models ProcedureClass Level InformationClass Levels ValuesPLACE 3 1 2 3TREAT 3 1 2 3Number of observations in data set=72 Dependent Variable:X Sum of MeanSource DF Squares Square F Value Pr FModel 8 297.97000000 37.24625000 11.62 0.0001Error 63 201.98500000 3.206111

13、11Corrected Total 71 499.95500000 R-Square C.V.Root MSE X Mean 0.595994 34.71202 1.7905617 5.1583333,模型总体检验结果:p=0.0001,R2=0.596。说明模型有统计意义。,Source DF Type I SS Mean Square F Value Pr FPLACE 2 21.31750000 10.65875000 3.32 0.0424TREAT 2 185.85583333 92.92791667 28.98 0.0001PLACE*TREAT 4 90.79666667 22.

14、69916667 7.08 0.0001Source DF Type III SS Mean Square F Value Pr FPLACE 2 21.31750000 10.65875000 3.32 0.0424TREAT 2 185.85583333 92.92791667 28.98 0.0001PLACE*TREAT 4 90.79666667 22.69916667 7.08 0.0001,因子的主效应和交互效应检验结果:地点p=0.0424,处理方法p=0.0001,交互效应p=0.0001。说明所有因子效应以及交互效应都具有显著性意义。,Least Squares Means

15、Adjustment for multiple comparisons:BonferroniPLACE X Pr|T|H0:LSMEAN(i)=LSMEAN(j)LSMEAN i/j 1 2 31 4.53750000 1.0.0383 0.90712 5.86250000 2 0.0383.0.39793 5.07500000 3 0.9071 0.3979.TREAT X Pr|T|H0:LSMEAN(i)=LSMEAN(j)LSMEAN i/j 1 2 31 2.90000000 1.0.0001 0.00012 6.50416667 2 0.0001.1.00003 6.0708333

16、3 3 0.0001 1.0000.,三个地点上因变量均值差异的检验结果:仅地点I和II有显著性差异(p=0.0383),均值分别为4.54和5.86。,三种处理方法的因变量均值差异的检验结果:低剂量药物与其它两种药物均有显著性差异(p=0.0001),高剂量药物与对照药物没有显著性差异(p=1.0000),三种药物的均值分别为2.90、6.50和6.07。,PLACE TREAT X LSMEAN LSMEAN Number1 1 3.47500000 11 2 3.67500000 21 3 6.46250000 32 1 3.12500000 42 2 7.97500000 52 3 6

17、.48750000 63 1 2.10000000 73 2 7.86250000 83 3 5.26250000 9,交叉处理组上均值的成对比较结果。读这部分结果,首先搞清楚排列序号1-9的意义,它表示33=9个不同的处理方式。例如,序号1表示place=1,treat=1;序号2表示place=1,treat=2;序号4表示place=2,treat=1;序号5表示place=2,treat=2。,Pr|T|H0:LSMEAN(i)=LSMEAN(j)i/j 1 2 3 4 5 6 7 8 9 1.1.0000 0.0513 1.0000 0.0002 0.0471 1.0000 0.00

18、03 1.0000 2 1.0000.0.1001 1.0000 0.0004 0.0922 1.0000 0.0006 1.0000 3 0.0513 0.1001.0.0150 1.0000 1.0000 0.0003 1.0000 1.0000 4 1.0000 1.0000 0.0150.0.0001 0.0137 1.0000 0.0001 0.7191 5 0.0002 0.0004 1.0000 0.0001.1.0000 0.0001 1.0000 0.1277 6 0.0471 0.0922 1.0000 0.0137 1.0000.0.0003 1.0000 1.0000

19、7 1.0000 1.0000 0.0003 1.0000 0.0001 0.0003.0.0001 0.0280 8 0.0003 0.0006 1.0000 0.0001 1.0000 1.0000 0.0001.0.1826 9 1.0000 1.0000 1.0000 0.7191 0.1277 1.0000 0.0280 0.1826.,序号1和序号2的比较结果是p=1.0000,表示在第一个地点上,低剂量药物与高剂量药物没有显著性差异,它们的差异是d1=3.475-3.675=-0.2。序号4和序号5的比较结果是p=0.0001,表示在第二个地点上,低剂量药物与高剂量药物有非常显著

20、的差异,它们的差异是d2=3.125-7.975=-4.85。,结果说明:在I 和II两个不同的地点上,低剂量药物与高剂量药物对因变量影响的效果是完全不同的:一个无显著性差异,一个有显著性差异。该问题如果不分析交互效应,得到的结论是,低剂量药物与高剂量药物有显著性差异。显然这个结论是不十分准确的。,第三节 三因子方差分析,SST=SSA+SSB+SSC+SSAB+SSAC+SSBC+SSABC+SSE,方差分析原理-变异分解:,三因子方差分析表:,多因子方差分析=析因分析,【例3-3】某研究组用小鼠做实验,研究性别,种类和体重对皮下移植SRS瘤细胞生长特性影响的结果。共选用了28只小鼠,实验设

21、计采用的是有重复的三因子析因设计。接种后第8天测得肿瘤体积列在表3-7中。试对该实验作出统计分析结论。表3-7 皮下移植SRS瘤细胞肿瘤体积观测数据,【SAS程序】data eg3_3;do a=1;do id=1 to 3;do b=1 to 2;do c=1 to 2;input x;output;end;end;end;end;do a=2;do id=1 to 4;do b=1 to 2;do c=1 to 2;input x;output;end;end;end;end;cards;0.7069 1.0838 0.0628 0.4712 0.2503 0.8514 0.0125 0.

22、1327run;proc glm;class a b c;model x=a b c a*b a*c b*c a*b*c;run;,【SAS输出结果】General Linear Models ProcedureClass Level InformationClass Levels ValuesA 2 1 2B 2 1 2C 2 1 2Number of observations in data set=28Dependent Variable:X Sum of MeanSource DF Squares Square F Value Pr FModel 7 2.46341682 0.3519

23、1669 10.09 0.0001Error 20 0.69723090 0.03486155Corrected Total 27 3.16064772 R-Square C.V.Root MSE X Mean 0.779403 50.95467 0.1867125 0.3664286,Source DF Type III SS Mean Square F Value Pr FA 1 0.08232839 0.08232839 2.36 0.1400B 1 1.47768123 1.47768123 42.39 0.0001C 1 0.58870397 0.58870397 16.89 0.0

24、005A*B 1 0.04510319 0.04510319 1.29 0.2688A*C 1 0.09834212 0.09834212 2.82 0.1086B*C 1 0.05372962 0.05372962 1.54 0.2288A*B*C 1 0.05799944 0.05799944 1.66 0.2118,General Linear Models ProcedureDependent Variable:X Sum of MeanSource DF Squares Square F Value Pr FModel 3 2.18963285 0.72987762 18.04 0.

25、0001Error 24 0.97101487 0.04045895Corrected Total 27 3.16064772 R-Square C.V.Root MSE X Mean 0.692780 54.89313 0.2011441 0.3664286Source DF Type III SS Mean Square F Value Pr FA 1 0.08232839 0.08232839 2.03 0.1666B 1 1.43410837 1.43410837 35.45 0.0001C 1 0.67319609 0.67319609 16.64 0.0004,可以有效控制或消除其

26、它混杂因素对反应变量的干扰,使得分析结果更准确;可以同时研究几个因素之间的交互作用,使得分析结果更可靠和稳定。,析因分析的优点:,它需要的样本较多,或者需要实验的次数较多,特别是因子的水平较多时更是如此。,析因分析的缺点:,拉丁方设计(Latin square design):是一种特殊的三因子设计。它要求:1)三个因子的水平数 r 相同;2)三个因子的一阶交互效应不存在。对于rr 拉丁方,仅需要n=r r 个样本。,一、拉丁方设计的概念,数据:,将n=33=9个样本随机地分配到每一个格子里,进行相应的试验。例如第一行第一列的样本对应的试验条件是A=1,B=1,C=b。,统计假设:,(1)H0

27、:1=2 H1:1 2(A效应)(2)H0:1=2 H1:1 2(B效应)H0:1=2 H1:1 2(C效应),方差分析表:,【例3-4】为了了解喂养时间、地区温度和食物配方对某种动物体重的影响,某研究所设计了一个33拉丁设计,其中,因子A表示喂养时间,水平记为1、2、3;因子B表示地区温度,水平记为1、2、3;因子C表示食品配方,水平记为a、b、c。经过一段时间喂养后,体重的增加量记录在下表中。试用拉丁方分析法作出结论。,data eg3_4;input a b c$x;cards;1 1 b 20 1 2 c 30 1 3 a 60 2 1 c 25 2 2 a 70 2 3 b 25 3

28、 1 a 55 3 2 b 30 3 3 c 25run;proc anova;class a b c;model x=a b c;means a b c/lsd;run;,SAS 程序,Analysis of Variance ProcedureDependent Variable:XSource DF Sum of Squares F Value Pr FModel 6 2750.00000000 165.00 0.0060Error 2 5.55555556Corrected Total 8 2755.55555556 R-Square C.V.X Mean 0.997984 4.411

29、765 37.7777778Source DF Anova SS F Value Pr FA 2 22.22222222 4.00 0.2000B 2 155.55555556 28.00 0.0345C 2 2572.22222222 463.00 0.0022,T tests(LSD)for variable:XNOTE:This test controls the type I comparisonwise error rate not the experimentwise error rate.Means with the same letter are not significant

30、ly different.T Grouping Mean N A A 40.000 3 2 A 36.667 3 1 A 36.667 3 3 T Grouping Mean N B A 43.333 3 2 B 36.667 3 3 B 33.333 3 1 T Grouping Mean N C A 61.667 3 a B 26.667 3 c B 25.000 3 b,统计结果:因子A的三个水平间没有显著性差异;因子B的三个水平中,第二个水平与其它两个水平有显著性差异;因子C的三个水平中,水平a与其它两个有显著性差异。专业结论:地区温度和食物配方对动物体重有显著性影响;喂养时间对动物体

31、重无显著性影响。尤其第一种食物配方使得体重增加最快。,二、嵌套设计资料的方差分析,例如,如果因素B的水平在因素A的每一个水平之内,则称因素B嵌套在因素A之内,记为B(A)。并称A为主因子,B为A的嵌套因子。这种设计称为嵌套设计(nested design)。,特点:1)效应因子可以是随机因子;2)主因子的变异大于嵌套因子的变异;3)嵌套因子在主因子各水平下可以取不同水平 值或不同个数的水平。使用方法:1)实验因素对反应变量的影响有主次之分 时,将主要因素作为主因子;2)不能分析因素之间的交互作用。,嵌套设计的应用实例1,为研究不同品种的萝卜叶子中钙的含量,从四种萝卜中各随机抽取了一个萝卜(因素

32、A),每个萝卜上随机抽取了3片叶子(因素B),每个叶子上取2个样本(重100mg),进行测定,结果列在下表中。特点:1)萝卜和叶子都是随机抽取的;2)萝卜(因子A)的变异大于叶子(因子B)的变异;3)嵌套因子在主因子各水平下可以取不同个数的水平。,萝卜叶子中钙含量测定结果,data turnip;do sample=1 to 2;do plant=1 to 4;do leaf=1 to 3;input calcium;output;end;end;end;cards;3.28 3.52 2.88 2.46 1.87 2.19 2.77 3.74 2.55 3.78 4.07 3.313.09

33、3.48 2.80 2.44 1.92 2.19 2.66 3.44 2.55 3.87 4.12 3.31run;proc sort;by plant leaf sample;run;proc nested;class plant leaf;var calcium;run;,SAS程序,Nested Random Effects Analysis of Variance for Variable CALCIUM DegreesVariance of Sum of ErrorSource Freedom Squares F Value Pr F TermTOTAL 23 10.270396PL

34、ANT 3 7.560346 7.665 0.0097 LEAFLEAF 8 2.630200 49.409 0.0000 ERRORERROR 12 0.079850Variance Variance PercentSource Mean Square Component of TotalTOTAL 0.446539 0.532938 100.0000PLANT 2.520115 0.365223 68.5302LEAF 0.328775 0.161060 30.2212ERROR 0.006654 0.006654 1.2486Mean 3.01208333Standard error o

35、f mean 0.32404445,在某项化合物转化率的实验研究中,涉及到催化剂的种类(因素A)和温度(因素B)。根据专业知识,催化剂对该化合物转化率的影响作用大于温度,而且在不同催化剂条件下所用的温度不完全相同。实验批次为2。转化率观测结果列在下表中。试分析催化剂和温度对该化合物转化率的作用。特点:1)催化剂(因子A)的变异大于温度(因子B)的变异;2)嵌套因子B在主因子A各水平下取值不同。,不同催化剂在不同温度下对某化合物转化率的观测结果,嵌套设计的应用实例2,data act;do sample=1 to 2;do act=1 to 3;do temp=1 to 3;input pct;

36、y=arsin(sqrt(pct/100);output;end;end;end;cards;82 91 85 65 62 56 71 75 8584 88 83 61 59 60 67 78 89run;proc sort;by act temp sample;run;proc nested;class act temp;var y;run;,Nested Random Effects Analysis of Variance for Variable Y DegreesVariance of Sum of ErrorSource Freedom Squares F Value Pr F T

37、ermTOTAL 17 0.333622ACT 2 0.262434 12.347 0.0075 TEMPTEMP 6 0.063767 12.889 0.0006 ERRORERROR 9 0.007421Variance Variance PercentSource Mean Square Component of TotalTOTAL 0.019625 0.025824 100.0000ACT 0.131217 0.020098 77.8263TEMP 0.010628 0.004902 18.9806ERROR 0.000825 0.000825 3.1931Mean 1.052151

38、46Standard error of mean 0.08538045,三、裂区设计资料的方差分析,例如,二级裂区设计资料是:,裂区设计(split plot design):是一个多级的随机区组设计。,特点:1)效应因子是固定因子,区组配置是随机的;2)效应因子分先后顺序,如AB C。使用方法:1)先将实验对象分成区组,再将每个区 组里的实验对象按第一因子分组,再 按第二因子分组。2)可以分析因素之间的交互作用(除区 组与最后一个因子)。,裂区设计的应用实例,例3,为研究不同瘤株的生瘤效果和不同浓度蛇毒的抑瘤作用,先将48只小鼠按条件分成3个区组,再将每个区组的16只小鼠随机地分成4组,分别

39、接受4种不同的瘤株(因子A)。一天后再对接受同一种瘤株的4只小鼠分别腹腔注射4种不同浓度的蛇毒(0.00,0.03,0.05,0.075),连续用蛇毒抑瘤10天。停药1天后解剖测瘤重。结果列于下表。分析:1)因素A和B都是固定效应因子;2)效应因子有先后顺序,AB。,data split;do block=1 to 3;do A=1 to 4;do B=1 to 4;input wt;output;end;end;end;cards;0.80 0.36 0.17 0.28 0.74 0.50 0.42 0.36.0.32 0.20 0.26 0.14 0.33 0.29 0.27 0.37ru

40、n;proc mixed;class a b block;model wt=a b a*b/ddfm=satterth;random block a*block;lsmeans a b/pdiff;run;,Tests of Fixed Effects Source NDF DDF Type III F Pr F A 3 6 3.48 0.0903 B 3 24 18.47 0.0001 A*B 9 24 1.76 0.1295 Differences of Least Squares Means Effect B _B Difference Std Error DF t Pr|t|B 1 2

41、 0.22416667 0.04142010 24 5.41 0.0001 B 1 3 0.24916667 0.04142010 24 6.02 0.0001 B 1 4 0.27250000 0.04142010 24 6.58 0.0001 B 2 3 0.02500000 0.04142010 24 0.60 0.5518 B 2 4 0.04833333 0.04142010 24 1.17 0.2547 B 3 4 0.02333333 0.04142010 24 0.56 0.5784,Least Squares MeansEffect B LSMEAN Std Error DF t Pr|t|B 1 0.51833333 0.03788861 6.23 13.68 0.0001 B 2 0.29416667 0.03788861 6.23 7.76 0.0002 B 3 0.26916667 0.03788861 6.23 7.10 0.0003 B 4 0.24583333 0.03788861 6.23 6.49 0.0005,结论:1)蛇毒浓度不同,瘤重不同。2)浓度为0组的瘤重与其它三种浓度组有显著性差异。而其它三组的瘤重无显著性差异。3)不同瘤株的生瘤效果无显著性差异。,Thanks!,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号