流行病与卫生统计学-方差分析.ppt

上传人:牧羊曲112 文档编号:6172134 上传时间:2023-10-02 格式:PPT 页数:176 大小:1.92MB
返回 下载 相关 举报
流行病与卫生统计学-方差分析.ppt_第1页
第1页 / 共176页
流行病与卫生统计学-方差分析.ppt_第2页
第2页 / 共176页
流行病与卫生统计学-方差分析.ppt_第3页
第3页 / 共176页
流行病与卫生统计学-方差分析.ppt_第4页
第4页 / 共176页
流行病与卫生统计学-方差分析.ppt_第5页
第5页 / 共176页
点击查看更多>>
资源描述

《流行病与卫生统计学-方差分析.ppt》由会员分享,可在线阅读,更多相关《流行病与卫生统计学-方差分析.ppt(176页珍藏版)》请在三一办公上搜索。

1、方差分析(一)单向方差分析(one-way ANOVA),方差分析(analysis of variance,ANOVA)又称变异数分析或 F检验,适用于对多个平均值进行总体的假设检验,以检验实验所得的多个平均值是否来自相同总体。,实验三要素:,统计模型:,效应值=总平均效应+处理效应+随机误差效应,效应值-总平均效应=处理效应+随机误差效应,第一节 方差分析的基本思想,方差分析的基本思想是将出现在所有测量值上的总变异按照其变异的来源分解为多个部分,然后进行比较,评价由某种因素所引起的变异是否具有统计学意义。单向方差分析(one way analysis of variance)是指处理因素只

2、有一个。这个处理因素包含有多个离散的水平,分析在不同处理水平上应变量的平均值是否来自相同总体。,例8-1 有3种解毒药:A、B及C,同时设一个空白对照D,共有4个组。即解毒药这个处理因素包含有4个水平,或4个处理组,用i表示处理组号,i1,2,3,4分别代表A、B、C、D4个组。受试大白鼠共24只,故动物总数或样本含量N=24。按完全随机化方法将它们分成等数的4个组,每组有6只动物。用ni表示第i组受试动物数(当每组受试动物数相等时用n代替 ni)。用j(j=1,2,6)表示每组受试动物号。应变量用Yij表示第 i组第j号大白鼠的血中胆碱酯酶含量(/ml)。实验结果见表8l。,表8-1 应用不

3、同解毒药的大白鼠血中胆碱酯酶含量(Yij)(ml),各组平均值为。各组测定值的总和为=111+89480。样本总平均值为 4802420.0。在单向方差分析中,变异来源于两个方面,一方面是受试对象个体间的变异(称组内变异),另一方面是实验因素各水平间的变异(称组间变异)。因此,总变异可按其变异来源进行分解。,总变异=处理间变异(组间)+误差(组内),观察值效应=总平均效应+处理效应+随机误差效应,总平均,单因素方差分析的基本思想(图示),一、离均差平方和的分解,个体测定值与总平均值之差可写为 上式等号右边第一项称为组内离均差,第二项是组平均值与总平均值之差,称为组间离均差。将等式两边平方后求和

4、得到,上式第二行中间的一项又可以写成下列等式:这是因为有之故。最后得到公式(8-1)就是单向方差分析的总离均差平方和分解公式。用文字表达为:总离均差平方和组间离均差平方和十组内离均差平方和SS总SS组间+SS组内,二、F值与F分布,t检验是用t值进行假设检验的,方差分析则用F值进行假设检验。每种来源的离均差平方和用相应的自由度去除,可得到平均的离均差平方和,简称均方(mean square,MS)。各种均方表示为:组间均方:MS组间SS组间v组间SS组间(al)组内均方:MS组内SS组内v组内SS组内(Na)组内均方表示各组内均方的平均值,它是随机误差项的方差的综合估计值。其代表性优于每个组的

5、组内均方。它的分子和分母分别是各组内离均差平方和之和及各组内自由度之和。,关系式为:由于组间均方包含由随机误差及处理因素引起的误差,故其值比组内均方大。理论上的组间均方的期望值可表示为:式中为组内均方的期望值 E(MS组内),i及为分别对应于及 的期望值。,F值的计算公式为F值的实际意义表现为如下的比值:,H0:T=0 H1:T0,F统计量不可能是负值,因为分子及分母都是平方项。分子中的SS组间是各组平均值与总平均值之差的加权平方和。如果各处理组所代表的总体平均值彼此相等,则各组样本平均值也就彼此接近。其结果是各组样本平均值很接近总平均值。反之,如果各处理组所代表的总体平均值差别很大,则相应的

6、各组样本平均值也就彼此差别很大;某些组平均值就明显不同于总平均值。因此一个大的组间均方MS组间可使F值变大,它提供足够的把握来拒绝无效假设。若MS组间很小,则缺乏证据来拒绝无效假设。,由于分析数据都是来自样本,故必须考虑资料的变异性。组内均方MS组内是随机误差方差的估计值,它是衡量样本资料随机变异性大小的指标。如果资料的随机变异性很大,则MS组内也大。若资料的随机变异性很小,则MS组内也小。当MS组间大,而MS组内小时,F值就大。当MS组间大,MS组内也大时,则F值就不一定大。那么F值要多大才能有把握拒绝无效假设呢?这就要由F统计量的分布来决定了。当F统计量达到一个小的P值水平时,就可以拒绝无

7、效假设。,t分布只有一个自由度。因为两组比较时,组间自由度恒为l。F分布有两个自由度,即组间自由度v组间=a-l及组内自由度v组内=Na,又分别称为分子自由度v1和分母自由度v2。F分布是一种偏态分布。它的分布曲线由这两个自由度来决定。分子自由度v1 4及分母自由度v2 10的F分布曲线见图8l。,F分布的随机变量没有负值。依据不同 水准下的F界值表。例如当v1=10,v2=30时,0.05的临界F值F0.05(10,30)2.16,当计算出的统计量 F值等于或大于临界 值时,就在水准上拒绝无效假设,否则就不拒绝无效假设。根据计算出的F统计量与临界F值 之间的关系有如下的统计学推断规则:,第二

8、节 方差分析的步骤,方差分析的步骤为:一、整理和描述资料。在第一节中已经介绍了方差分析所用的资料表格式(见表8-l)。按格式整理后,计算出每组的测定值之和、组平均值,测定值平方和以及总平均值等。二、提出检验假设及规定类错误概率水准的大小。H0:1=2=a,各组所代表的总体平均值相等;H1:i h,至少有一个不等式成立。i,hl,2,a。i h。0.05。,离均差平方和的简化计算公式:,式中C为校正数,三、计算各种离均差平方和、自由度及均方。例一资料用式(8-l)、式(8-2)与式(8-3)计算出的结果如下:l总离均差平方和 SS总10616(480)2241016.0。总自由度v总24l23。

9、2组间离均差平方和组间自由度v14-l3,组间均方 MS组间568.33/3=189.443组内离均差平方和SS组内1016.0568.33447.67。组内自由度v2=4(6l)20,组内均方MS组内447.67/20=22.38,四、计算F值。应用式(8-4)计算得 F189.44/22.38=8.46将以上计算结果列于方差分析表中(见表8-2)。五、确定P值并作出统计学推断。查附表5:F界值表,得F0.05(3,20)3.10。由于FF0.05(3,20),故有概率P0.05,根据式(8-5)的推断规则拒绝无效假设,接受备择假设。处理因素的 4个水平中至少有一个组的总体平均值不同于其他各

10、组。从表8-l所示的各 值可见,不同解毒药物的效果是不同的。解毒药物 A和 C与空白对照组 D相近。B组血中胆碱酯酶含量较其他组为高。,表8-2大白鼠血中胆碱酯酶含量方差分析表,第三节 平均值之间的多重比较,方差分析是对各观察组的平均值是否来自相同总体进行总的检验,不能对各组间的差别作深人分析。这一点却往往是研究者最关心的。对于一个实验,如果经方差分析后不拒绝无效假设,则表示各组平均值所代表的总体是相等的。分析工作即可终止。但若结果拒绝了无效假设,则需进行平均值之间的多重比较以进一步确定哪些组的平均值之间的差别,具有统计学意义。这时就涉及到累积类错误概率的问题。,当有a个平均值需作两两比较时,

11、比较的次数共有c=a!/2!(a-2)!。例如当a3时c3,a4时c6。当比较的次数越多,在无效假设为真时,拒绝无效假设时的累积类错误概率也越大。设每次检验所用类错误的概率水准为,累积类错误的概率为,则在对同一实验资料进行c次检验时,在样本彼此独立的条件下,根据概率乘法原理,其累积类错误概率与c有下列关系:例如,设=0.05,c=6,其累积类错误的概率为l-(1-0.05)6=1-(0.95)6=0.26。目前有多种有效控制累积类错误概率的多重比较方法,下面介绍常用的Bonferroni法、SNK法和Tukey法。,均数间多重(两两)比较的三种形式及比较的方法:1.各均数间全部比较(探索性研究

12、)方法:SNK法(q检验)、Bonferroni法、Tukey法等。2.多个实验(处理)组与一个对照组比较 例:A B C三组分别与对照组比较 方法:Dunnett检验3.比较具有专业意义的组(确定性研究)例:A、B、C、D四组,从专业意义认为只需比较 A与C和B与D,其余各组不需比较。方法:LSD法(最小显著差法 least significant difference),一、Bonferroni法,Bonferroni提出,如果在水准上进行c次假设检验,当无效假设为真时,至少有一次拒绝无效假设的累积类错误概率不超过ca,即有不等式 ca。例如设0.05,c=3时运用概率乘法原理计算出的 0

13、.143(30.05)。因此可以重新选择类错误概率水准,以便使累积类错误概率0.05。根据 Bonferroni不等式可得到要重新选择的水准为(/c)。例如设定0.05,进行 3次比较(c=3)时,重新选定的水准为=(0.05/3)0.016。只有当t检验的类错误概率等于或小于0.016时才能拒绝无效假设。这样当无效假设为真时,其累积类错误概率不超过0.05。,用Bonferroni法进行多个平均值之间的两两比较时所用的t检验公式为:式(8-7)的分母Se,为两平均值之差的标准误,计算公式为:、及ni、nh分别是两个比较组的平均值及观察例数。例如对例8-1的四个平均值进行两两比较时,c6。设累

14、积 I类错误概率0.10。对用于每次检验的类错误概率水准进行调整得(0.10/6)0.0167。故采用t(=0.0167/2,v)作为临界值。但在通用的t分布表中查不到这一概率水准下的t值,须通过下列公式换算:,式(89)中的v为组内均方的自由度。Z是标准正态分布面积下的横轴距离取值。本例为/20.0083,Z=2.395,v20,代入上式即得到临界值为:利用式(8-8)计算t检验所需的标准误Se:利用式(8-7)计算各组平均值之间两两比较的t值为:,用相同的方法计算出t(A:C)0.072.607,t(A:D)1.352.607;t(B:C)3.402.607;t(B:D)4.832.97;

15、t(C:D)1.432.607。从以上的两两比较中可知,只有B组与其他各组间的差别具有统计学意义,而其他各组间的差别无统计学意义。这一结果的累积类错误的概率不超过0.10。当比较次数不多时,Bonferroni法的效果较好。但当比较次数较多(例如在10次以上)时,则由于其检验水准选择得过低,结论偏于保守。,二、SNK法,SNK(student-Newman-Keuls)法又称q检验,是根据q值的抽样分布作出统计推论。仍以例8l为例介绍其检验过程。1.将各组的平均值按由小到大的顺序排列:排列顺序(1)(2)(3)(4)平均值 28.0 18.7 18.5 14.8 原组号 B C A D 2.计

16、算两个平均值之间的差值及组间跨度k,见表8-3第(2)、(3)两列。,表8-3SNK法两两比较的计算用表,3.计算两对比组之差的标准误S。计算公式为:由于本例中各组例数相等都为n6,故有对任意两对比组之差公用的标准误Se1.9313。4.按下列公式计算统计量q值:按式(8-11)计算的平均值之间两两比较的q值见表8-3第(4)列。,5.计算 P值并作出统计推断。按 v20,0.05及0.01两个检验水准,根据不同组间跨度k查附表6:q界值表得的q0.05(20,k)及q0.01(20,k)列于表8-3第(5)、(6)两列。表8-3最后一列列出了概率P。可见 与其他各组比较,都在0.01水准上具

17、有统计学意义。而 之间的差异均无统计学意义。结论为解毒药B的效果显著优于其他各组。,三、Tukey法,Tukey法用称为真正显著差(honestly significant difference,HSD)的单一值作为判断标准。该法的计算步骤为:1.计算各组平均值两两之间的绝对差值。计算结果见表8-4第2列。2.根据检验水准,观察总例数N及比较组数k,从附表6:q界值表中查出q(k,N-k)的值。本例有k4,N24,N-k20。选取0.05,从附表6得q0.05(4,20)3.96。,3.用下列公式计算HSD值:式(8-12)中的n是比较组的观察例数。当两组的观察例数相等时用n;当两组的观察例数

18、不相等时用例数较少的ni代替n。本例的HSD=7.65。4.将差值d(i,h)与HSD值进行比较。凡d(i:h)HSD者则拒绝无效假设;否则不拒绝无效假设。本例的比较结果见表8-4最后一列。检验结果表明,B组与A、C、D组之间的差别具有统计学意义,而A、C、D三组之间的差别无统计学意义。,表8-4HSD法计算用表,SAS软件中的方差分析过程:Data anova;do group=1 to 4;do n=1 to 6;input y;output;end;end;Cards;23 12 18 16 28 14 28 31 23 24 28 3414 24 17 19 16 22 8 12 21

19、 19 14 15;Proc anova;class group;model y=group;Means group/snk bon tukey dunnett lsd;Means group/hovtest;Run;Quit;,SPSS软件中单因素方差分析过程:DATA LIST FRE/x groupBegin data23 1 12 1 18 1 16 1 28 1 14 128 2 31 2 23 2 24 2 28 2 34 214 3 24 3 17 3 19 3 16 3 22 3 8 4 12 4 21 4 19 4 14 4 15 4End data.Oneway x by

20、group/STATISTICS DESCRIPTIVES HOMOGENEITY/POSTHOC=SNK TUKEY ALPHA(.05).,第四节 方差分析的假定条件和数据变换,一、方差分析的假定条件 l.观察值Yij独立来自正态分布的总体 如果样本含量较大,虽然总体分布偏离正态,由于有中心极限定理的保证,方差分析也是适用的。但是如果总体极度地偏离正态时,则须作数据转换,以改善其正态性。2.方差齐性(homogeneity)只有当各组内方差在总体上相等时,才能有效地分析各对比组平均值之间的差异。当最大方差与最小方差之比值()超过3时,由于增大了类错误的概率,就可能影响对方差分析结果的判断。

21、如果各对比组的观察例数不相等,则其影响程度会更大。,二、方差齐性检验,第五章第五节介绍了检验两个总体方差齐性的方法。这里介绍检验多个总体方差齐性的方法,并用例81的资料解释其计算步骤。1.提出检验假设。2.计算每一组的中位观察值mdi中位观察值mdi是指在第i组内所有观察值按由大到小的顺序排列后位置居中的观察值。如果组内观察例数是偶数,则mdi取正中间两个观察值的平均值。例8-l的各组中位观察值为:md1(l816)/217,md2(2828)228,md3(17+19)218,md4(l415)214.5。,3.计算各组内个体观察值与中位观察值之差的绝对值dij dij=|Yij-mdi|(

22、8-13)例如,d11=|2317|=6,d12|1217|5,余类推。用dij作单向方差分析。本例得 F0.37,v13和v2=20。查附表 6:F界值表得F0.05(3,20)=3.10F,故不拒绝H0,认为这些组内均方都来自具有相同理论均方的总体。本例用原始测定值Yij计算的各组内方差为 最大方差与最小方差之比,表明方差基本齐性。,测得的三组大白鼠营养试验中每组12只大鼠尿中氨氮的排出量X(mg/6天),A组:30 27 35 35 29 33 32 36 26 41 33 31B组:43 45 53 44 51 53 54 37 47 57 48 42C组:82 66 66 86 56

23、 52 76 83 72 73 59 53,方差不齐性,Levenes检验 F=9.44 P0.01,三、数据变换,对于一些明显偏离正态性和方差齐性条件的资料,可以通过数据变换的方法以改善其假定条件,使方差分析的结果趋于稳健。常用的数据变换方法有:1.平方根反正弦变换(arcsine square root transformation)当观察值为服从二项分布的比例资料时,由于当样本平均值靠近0或1时方差小,而在0.5时方差最大,这时宜采用平方根反正弦变换,将比例数据转换为新数据后再进行方差分析。设原观察值为Y(用小数表示),变换后的新值为X。变换公式有两种:,(1)用角度表示的变换公式为:(

24、2)用弧度表示的变换公式为:上面两个公式中的sin-1为反正弦函数,为圆周率。例如 Y0.53(即53),用式(8-14)变换为用式(8-15)变换为,2.平方根变换(squae root transformation)平方根变换法适用于观察值为服从泊松分布的计数资料。由于这类资料的方差等于平均值,当平均值大时方差也大。平方根变换公式为:3.对数变换(logarithm transformation)对数变换适用于某些服从对数正态分布的资变换公式为:(当cv接近于一个常数时)Xlog10(Y)(8-17)由于0和负值无对数,这时可改用,Xlog10(Y+a),a为任意常数。数据变换的缺点是对分

25、析结果作解释欠直观。,对上例数据用对数转换:令 y=log10(x),得:,转换后:方差齐性,Levenes检验 F=1.53 P=0.23,方差分析(二)Analysis of Variance(ANOVA),学习要点,两因素方差分析的定义;两因素方差分析设计基本思想;多因素方差分析;重复测量方差分析,方差分析,单因素:完全随机设计两因素:随机区组设计多因素:析因、拉丁方、正交设计,重复测量设计,单组多组,方差分析(二)两因素、多因素方差分析,第一节 两因素方差分析(随机区组设计)第二节 多因素方差分析(析因设计)第三节 重复测量设计方差分析,第一节随机区组设计资料(配伍组)双因素,资料类型

26、:随机区组设计(randomized block design)是将受试对象按自然属性(如实验动物的窝别、体重,病人的性别、年龄及病情等)相同或相近者组成区组,然后把每个区组中的受试对象随机地分配给不同处理。设计中有两个因素,一个是处理因素,另一个是按自然属性形成的区组。区组的选择原则是“区组间差别越大越好,区组内差别越小越好”。,它是比完全随机设计更精细的一种设计方法,这样设计的资料作方差分析的检验效能较高,因为在此种设计的方差分析表中多了一个分析内容区组间的变异,致使误差均方有一定程度的缩小。,两因素方差分析定义:既分析各处理组间有无差别,又同时分析各配伍组间有无差别,以说明研究因素和配伍

27、因素有无影响均数间比较的检验方法。,两因素方差分析基本思想:将所有测量值上的总变异按照其变异的来源分解为三个部分:1)处理组间变异(处理因素的影响)用MS处理表示2)区组间的变异(配伍因素的影响)用MS区组表示3)误差变异(个体因素的影响)用MS误差表示 F处理=MS处理/MS误差;F区组=MS区组/MS误差如果:处理因素(或配伍因素)确无效的话,F 1;处理组因素(或配伍因素)确有效的话,F 1 F越大,P值越小,就越有理由认为组间有差别。,随机区组设计的方差分析表,表8 随机区组设计的方差分析表,例2:利用随机区组设计研究不同温度对家兔血糖浓度的影响,某研究者进行了如下实验:将24只家兔按

28、窝别配成6个区组,每组4只,分别随机分配到温度15、20、25、30的4个处理组中,测量家兔的血糖浓度值(mmol/L),结果如下表9.4所示,分析4种温度下测量家兔的血糖浓度值是否不同?,表9 四种温度下测量家兔的血糖浓度值(mmol/L),离均差平方和与自由度的分解,总变异 4种温度的影响、6个窝别的影响和随机误差处理组变异(variation between treatment)区组变异(variation between block)误差变异,建立假设检验,确定检验水准,处理组:4个总体均数全相等,即4种温度下家兔血糖 浓度值相同:4个总体均数不全相等,即4种温度下家兔血 糖浓度值不全

29、相同区组:6个总体均数全相等,即不同窝别家兔血糖浓 度相同:6个总体均数不全相等,即不同窝别家兔血糖 浓度不全相同,表10 例2资料的方差分析表,确定P值并作出统计推断,在随机区组设计的方差分析时,研究者感兴趣的是研究因素。但是区组效应是否有统计学意义也是相当重要。,当设计方案配对设计时,随机区组设计方差分析所算得处理因素统计量F与配对t检验所得统计量t 有如下关系:F=t2,N-g(n1-1+n2-1+n3-1+.ng-1),第二节 析因设计方差分析(析因设计是一种多因素的交叉分组设计),回顾:什么是析因设计,例:在评价药物疗效时,除需知道A药和B药各剂量的疗效外(主效应),还需知道两种药同

30、时使用的交互效应。析因设计及相应的方差分析能分析药物的单独效应、主效应和交互效应。,析因设计 factorial design是一种多因素的交叉分组设计。它不仅可检验每个因素各水平间的差异,而且可检验各因素间的交互作用。两个或多个因素如存在交互作用,表示各因素不是各自独立的,而是一个因素的水平有改变时,另一个或几个因素的效应也相应有所改变;反之,如不存在交互作用,表示各因素具有独立性,一个因素的水平有所改变时不影响其他因素的效应。,22析因设计,22=4种处理,2因素2水平全面组合,23=6种处理,23析因设计,222=8种处理,222析因设计,33析因试验举例,考察不同剂量考的松和党参对AT

31、P酶活力的作用。A因素(考的松)不用 低剂量 高剂量 不用 O A1 A2B因素 低剂量 B1 A1 B1 A2 B1 高剂量 B2 A1 B2 A2 B2,析因设计的方差分析,是一种多因素设计。例如,两个因素时,第1个因素有3个水平,第2个因素有2个水平,全部因素组合共有326种组合。每种组合都作试验时就是析因试验设计。此试验设计也可称为32析因试验设计。342析因试验设计,有 因素,个水平。,3个,3,4和2,卫生统计学教研室,二、析因设计的有关术语,单独效应(simple effects):主效应(main effects):交互作用(Interaction):,(一)单独效应,其它因素

32、水平固定时,同一因素不同水平间效应的差别,B因素固定在1水平时,A因素的单独效应为?,4,(二)主效应,某一因素各水平单独效应的平均差别,Am=(a2b2-a1b2)+(a2b1-a1b1)/2=16+4/2=10,Bm=(a1b2-a1b1)+(a2b2-a2b1)/2=10+22/2=16,(三)交互效应,若一个因素的单独效应随另一个因素水平的变化而变化,且变化的幅度超出随机波动的范围时,称该两因素间存在交互效应。,AB=(a2b2-a1b2)-(a2b1-a1b1)/2=(16-4)/2=6,AB=(a2b2-a2b1)-(a1b2-a1b1)/2=(22-10)/2=6,正交互效应(协

33、同作用):,负交互作用(拮抗作用):,存在交互效应,表示4个处理组A1B1,A2B1,A1B2,A2B2对应的总体均值,两因素联合(共同)作用大于其单独作用之和,两因素联合作用小于其单独作用之和,协同作用,未用a药,用a药,未用b药,用b药,拮抗作用,析因设计的方差分析,析因试验设计能够检验每个因素的各水平间主要变量的平均值的统计差异,也能检验因素间的交互影响。当存在交互影响时,表示一个因素各水平间的差异随着另一个因素的水平改变而不同;当不存在交互作用时,则各因素独立,即一个因素各水平改变时,不影响另另一个因素的各水平之效应。,析因设计的方差分析,某研究所对甲、乙两药的降胆固醇作用进行研究,将

34、甲药视作因素1,下有两个水平,水平1为不加甲药,水平2为加甲药。乙药为因素2,水平1为不加乙药,水平2为加乙药。构成了2 2=4个水平组合。试验中将12个高胆固醇病人随机分为四组进行治疗,观察胆固醇的下降值(mmol/L)。因素2 因素1 水平1 水平2 小计 水平1 0.416 0.728 0.650 0.806 0.468 0.598 3.666 水平2 1.456 1.664 1.144 2.028 1.092 2.080 9.464 小计 5.226 7.904 13.130,假 设 检 验,1.H0:因素1各水平的胆固醇的平均降低值相同;H1:因素1各水平的胆固醇的平均降低值不相同;

35、2.H0:因素2各水平的胆固醇的平均降低值相同;H1:因素2各水平的胆固醇的平均降低值不相同;3.H0:因素1各水平的胆固醇的平均下降值的差异,独立于因素2,或者因素2各水平的胆固醇的平均下降值的差异,独立于因素1;H1:两者不独立;(即检验两个因素的交互作用),SAS程序,Data dat4;Do a=1 to 2;Do b=1 to 2;proc glm data=dat4;Do i=1 to 3;class a b;Input x;model x=a b a*b;Output;means a b a*b;End;run;End;End;Cards;,优点:研究多因素的效应分析因素的交互作

36、用节约样本含量缺点统计分析较复杂临床科研中不宜得到适宜交互作用分析的资料因素和水平数均不宜过多,否则实验量太大,例3:,为研究某降血糖药物对糖尿病及正常大鼠心肌磺脲类药物受体SUR1的mRNA的影响,某研究者进行了如下实验:将24只大鼠随机等分成4组:两组正常大鼠,另两组制成糖尿病模型,糖尿病模型的两组分别进行给药物和不给药物处理,剩余两组正常大鼠也分别进行给药物和不给药物处理,表12 4种不同处理情况下吸光度的值(%),单独效应(simple effect)主效应(main effect)交互效应,表13 例3资料吸光度均数的差别,A因素的主效应,B因素的单独效应,B因素的单独效应,交互效应

37、,指两个或多个因素间的效应互不独立的情形 AB两因素的交互效应的计算公式为:,AB交互效应 BA交互效应,图 22析因设计交互作用示意图,吸光度均数(),正常大鼠,离均差平方和与自由度的分解,建立检验假设并确定检验水准,因素A H0:糖尿病和正常大鼠吸光度值的总体均数相等 H1:糖尿病和正常大鼠吸光度值的总体均数不相等 因素B H0:使用药物和不使用药物治疗吸光度值的总体均 数相等 H1:使用药物和不使用药物治疗吸光度值的总体均 数不相等 AB交互作用H0:使用和不使用药物治疗对糖尿病和正常大鼠吸 光度值无影响 H1:使用和不使用药物治疗对糖尿病和正常大鼠吸光 度值有影响,计算检验统计量,总=

38、-1=24-1=2 3处理=(A的水平数B的水平数)-1=(2 2)-1=3A=A的水平数-1=2-1=1B=B的水平数-1=2-1=1AB=(2-1)(2-1)=1e=(2 2)(6-1)=20,总-处理=23-3,表14 例3资料方差分析表,确定p值并作出推断结论,如要分析A因素或B因素的单独效应,应固定在A因素的基线水平来分析B因素的作用,或者固定在B因素的基线水平来分析A因素的作用。,若交互作用无统计学意义 SS总=SSA+SSB+SS误差 其中SS误差为交互作用的离均差平方与误差离均差平方相加而得。它们的自由度是由两者的自由度相加而得。,SAS程序两因素方差分析(two-way an

39、ova),例4:为探索丹参对肢体缺血再灌注损伤的影响,将30只纯种新西兰实验用大白兔,按窝别相同、体重相近划分为10个区组。每个区组3只大白兔随机采用A、B、C三种处理方案,即在松止血带前分别给予丹参2ml/kg、丹参1ml/kg、生理盐水2ml/kg,在松止血带前及松后1小时分别测定血中白蛋白含量(g/L),算出白蛋白减少量如下表9-6所示,问A、B两方案分别与C方案的处理效果是否不同?,data aa2;do treat=1 to 3;do block=1 to 10;input x;output;end;end;cards;2.21 2.32 3.15 1.86 2.56 1.98 2.

40、37 2.88 3.05 3.422.91 2.64 3.67 3.29 2.45 2.74 3.15 3.44 2.61 2.864.25 4.56 4.33 3.89 3.78 4.62 4.71 3.56 3.77 4.23;,proc glm;class treat block;model x=treat block/SS1;/*treat处理组,block为区组*/means treat/dunnett(3);/*指定第三组为对照组*/run;,第三节 重复测量设计方差分析,方差分析,单因素:完全随机设计两因素:随机区组设计多因素:析因、拉丁方、正交设计,重复测量设计,单组多组,一、

41、重复测量资料的数据特征,当对同一受试对象在不同时间重复测量次数p3时,称为重复测量设计或重复测量数据。,重复测量资料,同一受试对象的同一观察指标在不同时间点上进行多次测量所得的资料,常用来分析该观察指标在不同时间点上的变化。有时是从同一个体的不同部位(或组织)上重复测量获得的指标的观测值。,目的:就是比较不同时间点动态变化趋势的特征,想一想?,同一观察单位具有多个观察值,而这些观察值来自同一受试对象的不同时点(部位等),这类数据间往往有相关性存在,违背了方差分析要求数据满足独立性基本条件。,在这种情况下:,若使用一般的方差分析,就不能充分揭示出内在的特点,有时甚至会得出错误结论。,所以重复测量

42、资料需要采用专门的统计分析方法,该方法是近代统计学研究的热点之一。,实际中:重复测量资料比独立资料更多见,临床研究中,需要观察病人在不同时间的某些生理、生化或病理指标的变化趋势,研究不同时间或疗程的治疗效果。流行病学研究中,观察队列人群在不同时间上的发病情况。研究不同职业、性别人群实施某种控制后,不同时间的多次效果考察。卫生学研究中,纵向观察儿童生长发育规律等,不同地区和环境营养状况。,重复测量数据在医学研究中十分常见,而且统计表达和分析误用情况严重。,主要优点,减少样本含量控制个体变异非实验因素(干扰因素),主要缺点,滞留效应(carry-over effect)潜隐效应(latent ef

43、fect)学习效应(learning effect),120,重复测量设计与配对设计的区别?,1.随机区组设计要求每个区组内实验单位彼此独立,区组号 A营养素 B营养素 C营养素 1 50.10 58.20 64.50 2 47.80 48.50 62.40 3 53.10 53.80 58.60 4 63.50 64.20 72.50 5 71.20 68.40 79.30 6 41.40 45.70 38.40 7 61.90 53.00 51.20 8 42.20 39.80 46.20,表 A、B、C 3种营养素喂养 小白鼠所增体重(克),处理因素只能在区组内随机分配每个实验单位接受处

44、理是不同的见右表:,重复测量设计与随机区组设计的区别?,2.重复测量设计区组内实验单位彼此不独立,同一受试的血样重复测量结果是高度相关,提示:分析存在一定的复杂性。,小结 重复测量资料的特点,重复测量数据:是对同一受试对象的某个观察指标进行连续观测所得到的数据至少有两个因素:处理因素、时间因素 重复测量的试验结果是按时间顺序固定排列的,不能像随机区组设计的处理那样经过随机排列同一个体不同时间测量值之间高度相关,重复测量资料,多变量重复测量方差分析,单变量重复测量方差分析,二、重复测量资料分类repeated measurement data,多变量重复测量方差分析,单变量重复测量方差分析,二、

45、重复测量资料分类repeated measurement data,两组,单组,重复测量资料,单变量重复测量方差分析,1.单组重复测量 指同一组内(或接受同一种处理)的多个受试者,在多个时间点上的反应变量所作的测量,又称为单变量重复测量。,2.多组重复测量(多组并不等于多因素)指将受试者按处理的不同水平分为几个组,对这些组内的每一受试者,都在不同时间点对他们的反应变量进行测量。,重复测量资料方差分析的条件:1.正态性 处理因素的各处理水平的样本个体之间是相互独立的随机样本,其总体均数服从正态分布;2.方差齐性 相互比较的各处理水平的总体方差相等,即具有方差齐同 3.各时间点组成的协方差阵(co

46、variance matrix)具有球形性(sphericity)特征。,Box(1954)指出,若球形性质得不到满足,则方差分析的F值是有偏的,这会造成过多的拒绝本来是真的无效假设(增加型错误)。,三、重复测量资料分析的前提条件,概念:,协方差阵的球对称性是指该对角线元素(方差)相等、非主对角线元素(协方差)为零,球形性,协方差阵的球形性质是指该矩阵主对角线元素(方差)相等、非主对角线元素(协方差)为零。常用Mauchly氏法检验协方差阵的球形性质。Mauchly氏检验的P值若大于研究者所选择的显著性水准时,说明协方差阵的球形性质得到满足。否则,必须对与时间有关的F统计量的分子、分母自由度进

47、行调整,以便减少犯I类错误的概率。调整系数为(读作epsilon)。,球形对称的实际意义举例,s1-22=10+20-2(5)=20s1-32=10+30-2(10)=20s1-42=10+40-2(15)=20s2-32=20+30-2(15)=20s2-42=20+40-2(20)=20s3-42=30+40-2(25)=20,本例差值对应的方差精确相等,说明球形对称。,球形对称的检验,用Mauchly法检验协方差阵是否为球形 H0:资料符合球形要求,H1:资料不满足球形要求检验的P值若大于研究者所选择的显著性水准时,说明协方差阵的球形性质得到满足。,球形条件不满足怎么办,常有两种方法可供

48、选择:采用MANOVA(多变量方差分析方法)2.对重复测量ANOVA检验结果中与时间有关的F值的自由度进行调整(调小),(1)Geenhouse-Geisser调整系数(G-G)(2)Huynh-Feldt调整系数(H-F),分子自由度,分母自由度,自由度调整方法1,自由度调整方法2,调整规则,对具有重复测定性质的时间效应和处理*时间的交互作用的F值的自由度进行调整。调整后的F临界值较原先大,提高了拒绝H0的门槛。减少了犯I类错误的概率。,四举例:单组重复测量数据的方差分析,观察10名慢性乙型肝炎患者治疗前、治疗12周、24周、36周四个时间点上谷丙转氨酶(ALT)水平的变化趋势,结果见下表,

49、试进行统计推断。,分析:数据结构上与完全区组设计相似但实质不同,各观测点时间顺序是固定的,不能随机分配;不同观测点数据彼此不独立或不完全独立,存在一定的相关性。,SAS结果中包括偏相关阵,例题 1.建立假设,确定检验水准0.01,2.进行球对称性检验,球对称性通常采用Mauchlys test检验标准来判断,3.调整时间点F值的自由度,当资料满足“球对称”(Sphericity)条件时(P),不作调整。当资料不满足“球对称”条件时(P),时间点间F值的自由度需要调整。,4.计算F值,球对称性通常采用Mauchlys test检验来判断,其结果按0.1水准检验,不满足球对称性,对系数进行校正,其

50、结果如下:,结果显示:治疗前与治疗后不同时间转氨酶平均水平不同。,5.单组重复测量方差分析数据结构,6.基本程序格式,Nouni 不打印输出单变量分析结果Printe 产生Mauchly 球性检验的统计量2、P值,分析:单组重复测量数据分析的缺陷只能分析观察对象的观测值在不同时间点的差别。,专业认为:不同时间点上的观测值变化可能是“处理”的作用,也可能是患者病情的自然变化,与“处理”无关,如果要分析“处理”效应,必须设立一个平行对照组,通过组间差别的大小说明“处理”组效应的大小。两独立样本重复测量设计是将N个受试对象随机地等分两组,一组作为实验组,另一组作为对照组。,为研究国产某药品与同类型进

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号