《多因素设计的方差分析.ppt》由会员分享,可在线阅读,更多相关《多因素设计的方差分析.ppt(59页珍藏版)》请在三一办公上搜索。
1、多因素设计的方差分析,放射医学与公共卫生学院统计学教研室,基本概念,完全随机设计(单因素)随机区组设计(两因素,无重复)拉丁方设计(三因素,无重复)析因设计(两因素以上,至少重复2次以上),基本设计类型 SS总的分解,析因设计的概念,在评价药物疗效时,除需知道A药和B药各剂量的疗效外(主效应),还需知道两种药同时使用的协同疗效。析因设计及相应的方差分析能分析药物的单独效应、主效应和交互效应。,第一节 析因设计的方差分析,析因试验设计将两个或多个因素的各个水平进行排列组合,交叉分组进行试验。主要用于分析各因素间的交互作用,比较各因素不同水平的平均效应和因素间不同水平组合下的平均效应,寻找最佳组合
2、。,析因设计,A因素食物中蛋白含量,B因素食物中脂肪含量,表1 不同种类饲料喂养后小白鼠的体重,表2 不同种类饲料喂养后小白鼠的平均体重,单独效应(simple effect)是指其他因素的水平固定时,同一因素不同水平间的差别。在每个B水平,A的效应。或在每个A水平,B的效应。,主效应(main effect)是指某一因素各水平间的平均差别。,交互效应(interaction)是指当某因素的各单独效应随另一因素水平的变化而变化时,则称这两个因素间存在交互效应。,则a、b间存在交互效应,如果,如果,则a、b间存在协同作用,如果,则a、b间存在拮抗作用,如果不存在交互效应,则只需考虑各因素的主效应
3、。在方差分析中,如果存在交互效应,解释结果时,要逐一分析各因素的单独效应,找出最优搭配。在两因素析因设计时,只需考虑一阶交互效应。三因素以上时,除一阶交互效应外,还需考虑二阶、三阶等高阶交互效应,解释将更复杂。,析因设计的优点:用相对较小样本,获取更多的信息,特别是交互效应分析。析因设计的缺点:当因素增加时,实验组数呈几何倍数增加。实际工作中部分交互效应,特别是高阶交互效应可以根据专业知识排除,这时可选用正交设计。,【例1】将20家兔随机等分4组,每组5只,进行神经损伤后的缝合试验。处理由两个因素组合而成,A因素为缝合方法,有两水平,一水平为外膜缝合,记作a1,另一水平为束膜缝合,记作a2,B
4、因素为缝合后的时间,有两水平,一水平为缝合后1月,记作b1,另一水平为缝合后2月,记作b2。试验结果为家兔神经缝合后的轴突通过率(%)(注:测量指标,视为计量资料),见表3。各处理的均数及差别见表4。,表3 家兔神经缝合后的轴突通过率(%),变异分解,表 两因素a b析因设计方差分析计算表,基本步骤,1.建立检验假设,确定检验水准,对于因素AH0:A因素各水平的总体均数相等H1:A因素各水平的总体均数不等对于因素BH0:B因素各水平的总体均数相等H1:B因素各水平的总体均数不等对于交互作用ABH0:A、B两方法无交互效应H1:A、B两方法有交互效应,2.计算检验检验统计量 列表计算各组均数,表
5、5 2因素2水平析因试验的均数(%)差别,表方差分析表,3.确定P值,做出统计推断,A、B的交互作用:,P0.05,按=0.05,不拒绝H0,差异无统计学意义。,A、B的单独效应:,B固定1水平时,A的单独效应为A2A1=4%,B固定2水平时,A的单独效应为 A2A1=8%,A固定1水平时,B的单独效应为20%,A固定2水平时,B的单独效应为24%,AB=|(A1B1A2B1)(A1B2A2B2)|/2=(-4%+8%)/2=2%,交叉设计的基本结构如下图:,第二节 交叉设计的方差分析,实验对象随机分配,A组接受常规药间歇期接受新药,B组接受新药间歇期接受常规药,广义地说,如果比较G种处理,相
6、应将试验时间分成G个阶段,每个受试者在不同试验阶段分别接受这G种处理;不同试验组受试者接受G种处理的顺序不同。,1.基本概念,交叉试验除处理因素外,还需考虑处理顺序和试验阶段的效应,因此分析时要分解出三种效应。一般假定因素间无交互作用。,优点:由于是自身前后比较,不受个体变异影响。每种处理在每种顺序都有,可比性好。缺点:限于慢性病的对症治疗,有时停药的间歇期不能为病人接受。,(2)设计方法,两种处理时,随机分两组,每组顺序不同。,G2时,可借用拉丁方安排处理顺序。,【例2】某研究者为研究用A、B两种方案治疗高血压的疗效,随机地让3、5、6、7、8、12号病人用先用A法治疗,后用B法治疗;1、2
7、、4、9、10、11号病人先用B法,后用A法。记录治疗后血压的下降值(kPa),结果见下表。,表 A、B两种方案治疗高血压的血压下降值(kPa),变异分解,【检验步骤】,1.建立检验假设,确定检验水准,2.计算检验统计量F值,表8 A、B两种方案治疗高血压的血压下降值(kPa),误差 总 处理 阶段 受试者=23-1-1-11=10,表9 交叉设计方差分析表,第三节 拉丁方设计方差分析(latin square design ANOVA),欲比较一个因素中K个水平的各均数,同时要控制另二个因素作用,并且每个因素的水平数相等,可用拉丁方设计。用K个拉丁字母排列成K行K列的方阵,使每行、每列中每个
8、字母仅出现1次,这样的方阵称为拉丁方。,例如:22拉丁方 33拉丁方 A B A B C B A C A B B C A 44拉丁方 55拉丁方 A B C D A B C D E B C D A B E D A C D A B C C A E B D C D A E D C A E B E D B C A 拉丁方的行和行,或列和列交换,仍为拉丁方。,拉丁方设计实际上是一种特殊类型的三因素试验设计,三个因素的水平数必须相同。(1)首先根据水平数选定拉丁方。(2)再随机交换拉丁方的行或列。(3)然后将两个控制因素分别放置于拉丁方的行、列,主要考察因素放置于字母上。(4)根据设计进行试验,把试验结
9、果记入相应位置。(5)进行方差分析,得出结论。,例3 5种防护服,由5个人在不同的5天中穿着测定其脉搏数(试验是以脉搏数作为人对高温反应的指标),试比较5种防护服在不同天气,对人脉搏的影响是否不同?,5个不同日期,5个受试者,穿5种不同防护服的脉搏数受 试 者 日期 甲 乙 丙 丁 戊 1 A B C D E 2 B C D E A 3 C D E A B 4 D E A B C 5 E A B C D,表10不同日期5个受试者穿着5种不同防护服时脉搏次数(次数/分),字母间(处理间)总变异 行间 列间 误差 由于总变异分解更细,误差更小,效率也更高。,可作三个方差分析:(1)H0:各种防护服
10、的平均脉搏数相同;H1:各种防护服的平均脉搏数不全相同;F1=MS防护服间/MS误差(2)H0:各个受试者的平均脉搏数相同;H1:各个受试者的平均脉搏数不全相同;F2=MS受试者间/MS误差(3)H0:不同日期的平均脉搏数相同;H1:不同日期的平均脉搏数不全相同。F3=MS日期间/MS误差,表11 例3的方差分析表变异来源 SS DF MS F P 总变异 4105.91 24 日期间 508.07 4 127.01 2.89 0.05受试者间 2853.67 4 713.41 16.27 0.05 误差 526.14 12 43.84 F0.05(4,12)=3.26,F0.01(4,12)
11、=5.41,例4下面的表是家兔在不同部位注射某种药物后所生疱疹的大小。家兔共有六只,其编号为、。注射部位有六处,其代号为A、B、C、D、E、F,其中A、B、C在脊椎附近,D、E、F在两侧,注射次序(日期)用1、2、3、4、5、6来表示。,表12 家兔注射某种药物后不同部位所生疱疹大小(cm2),表13 家兔疱疹资料的方差分析,第四节 章重复测量设计的方差分析,重复测量设计的概念,重复测量设计(repeated measurement design)是指同一观察对象在给予一种或多种处理后,在多个时间点上重复测量同一受试对象某一观察指标的值。重复测量研究的目的是探讨同一研究对象在不同时点上某指标的
12、变化情况。,一、重复测量资料的类型,1.单因素重复测量设计资料,例5 从6名健康人抽血后制成血滤液。每个受试者的血滤液分成4份,把4份血滤液随机分别放置0、45、90、135分钟,测定其血糖浓度如表14。此研究对同一受试者的血滤液在不同时点上重复测量了4次血糖浓度,目的是为了分析放置时间这一因素对血糖浓度的影响,故称之为单因素重复测量设计资料。,表14 血滤液放置不同时间的血糖浓度(mmol/L),重复测量设计与随机区组设计的区别主要:,(1)重复测量设计中受试对象内(看成区组)的各时间点是固定的,不能随机分配,随机区组设计资料中每个区组内的受试对象彼此独立,处理只在区组内随机分配,同一区组内
13、的受试对象接受的处理各不相同。,(2)重复测量设计中同一受试对象的数据彼此不独立,即重复测量数据间存在某种程度的相关性。而随机区组设计中,各区组内各处理水平相互独立,各区组内各观察对象所得数据相互独立,重复测量设计方差分析的前提条件,进行重复测量设计的方差分析,除需满足一般方差分析的条件,即要求资料满足正态性和方差齐性外,还应满足协方差阵(covariance matrix)的球形性(sphericity)或复合对称性(compound symmetry)。球对称性通常采用Mauchly检验(Mauchlys test)来判断。如果不满足球形检验,则采用校正后的P值进行统计推断。,观察对象数为
14、n,重复测量数为m,数据总个数为N,自由度的计算公式如下:,分析步骤:,分析见SAS程序,2.两因素重复测量设计资料,例6 为比较两种同类药物A、B在体内的代谢速度,将10名受试对象随机分为两组,一组给予A药,另一组给予B药。分别在服药后1、2、4、6小时测定血中的药物浓度,结果见表15。此研究对同一受试者在服药后不同时点上重复测量了4次血中的药物浓度,目的是为了分析药物及时间两个因素对药物浓度的影响,故称之为两因素重复测量设计资料。,表15 两种同类药物在血中的浓度(g/ml),观察对象数为n,重复测量数为m,处理因素有g水平,数据总个数为N,总平方和、对象间、对象内、测量间自由度的计算公式
15、与单因素重复测量设计资料时相同,其它自由度的计算公式如下:,变异分解,分析见SAS程序,data xiyin;do a=1 to 2;do b=1 to 2;do i=1 to 3;input x;output;end;end;end;cards;2.1 2.2 2.0 1.3 1.2 1.1 0.8 1.2 1.0 0.8 0.9 0.7;proc anova;class a b;model x=a b a*b;run;,data jiaochaanova;do id=1 to 12;do s=1 to 2;input treat$x;output;end;end;cards;b 3.07
16、a 2.80 b 1.33 a 1.47a 4.40 b 3.73 b 1.87 a 3.60a 3.20 b 2.67 a 3.73 b 1.60a 4.13 b 2.67 a 1.07 b 1.73b 1.07 a 1.47 b 2.27 a 1.87b 3.47 a 3.47 a 2.40 b 1.73;proc anova;class id s treat;model x=id s treat;run;,data ladingfang1;do date=1 to 5;do id=1 to 5;input treat$x;output;end;end;cards;A 129.8B 116
17、.2C 114.8D 104.0E 100.6B 144.4C 119.2D 113.2E 132.8A 115.2C 143.0D 118.0E 115.8A 123.0B 103.8D 133.4E 110.8A 114.0 B 98.0C 110.6E 142.8A 110.6B 105.8C 120.0D 109.8;proc anova;class date id treat;model x=date id treat;run;,data ladingfang2;do id=1 to 6;do date=1 to 6;input treat$x;output;end;end;card
18、s;B 7.5C 6.7A 7.9D 6.1F 7.3E 6.9E 8.5D 8.2B 8.1C 9.9A 8.7F 8.3C 7.3F 7.3E 6.8A 7.4B 6.0D 7.7A 7.4E 7.7C 6.4F 5.8D 7.1B 6.4F 6.4B 6.2D 8.1E 8.5C 6.4A 7.1D 5.9A 8.2F 7.7B 7.5E 8.5C 7.3;proc anova;class date id treat;model x=date id treat;means date id treat;run;,data chongfu1;input g time1-time4;cards
19、;1 5.27 5.27 4.94 4.611 5.31 5.26 4.93 4.701 5.88 5.83 5.38 5.011 5.49 5.43 5.32 5.041 5.66 5.44 5.38 4.881 6.22 5.72 5.61 5.22;proc glm;class g;model time1-time4=g/nouni;repeated time 4/printe;run;,data chongfu2;input g time1 time2 time3 time4;cards;19.1253.1654.8945.8815.148.7877.3961.2913.3720.6571.2275.0816.5130.0774.2675.6911.995.8480.2669.82213.5527.146.8853.2121.0225.1254.0344.1522.1514.2368.7464.6526.1825.8345.754.2521.6840.2932.3471;proc glm;class g;model time1 time2 time3 time4=g/nouni;repeated time 4/printe;run;,