《多元方差分析.ppt》由会员分享,可在线阅读,更多相关《多元方差分析.ppt(43页珍藏版)》请在三一办公上搜索。
1、多元统计量与多元方差分析,例 用益寿宁治疗五名高血脂患者,治疗结果列于下表,试计算多元统计量。,1、样本均数向量,反应变量样本均数也可用一个 维列向量表示为,2、样本协方差矩阵,如果有p个反应变量,则样本协方差矩阵是一个pp矩阵,记为,对角线上是各变量的方差 对角线的两侧是变量与变量之间的协方差 由于,S是对称矩阵。,3、离差矩阵(SSCP),矩阵L与矩阵S有如下的关系:L=(n-1)S,4、样本相关矩阵,如果有个反应变量,将所有的相关系数合起来写成矩阵形式,便得一个 样本相关矩阵,多元描述统计量:,描述指标的平均水平,S 描述指标的变异程度R 描述指标的相关性,n个观察向量 均服从 维正态分
2、布。维正态分布的密度函数为,多元正态分布(multivariate normal distribution),两个均数向量的比较Hotelling 检验,例 用益寿宁治疗五名高血脂患者,治疗结果列于下表,,例 用益寿宁治疗五名高血脂患者,治疗结果列于下表,试推论益寿宁药物是否有降血脂的作用。,当有多个反应变量时,公式中 的改为样本均数向量,0改为假定的总体均数向量,方差 改为样本协方差矩阵S,t2即推广为Hotelling,即,1、检验均数向量,当反应变量只有1个,即p1时,在 成立的条件下,检验统计量F t2。当 p1时,在 成立条件下,F与Hotelling 有如下关系 1p,2np 根据
3、一个样本均数向量 检验总体均数向量是否为 可采用F值作为检验统计量。在 成立条件下,该统计量服从F分布,当n较大时,近似地服从自由度为p的 分布。,H0:H1:,n5,p2,,12,23,SAS程序:data aa;input x1 x2;x11=x1-0;x22=x2-0;cards;proc glm;model x11 x22=;manova h=intercept;proc corr cov outp=a;var x1 x2;proc print;run;run;,2、检验两个均数向量,例 调查西安市某中学16岁男女生若干名,测量其身高、体重和胸 围,结果见表20.2。试检验该中学全体1
4、6岁男女生身体发育状 况的差别有无统计学意义。,在H0:12成立的条件下,公式中 与F值有如下关系 1p,2n1n2p1 当n1n2较大时,F值近似地服从自由度为 的 分布。,H0:12,H1:12n112,n210,p3,=31.03,13,218,多元分析是单变量分析的扩展,对单变量(一元)资料配对 t 检验是配对 T 检验的特例;t 检验是 T 检验的特例。,SAS程序:DATA GROWTH;INPUT SEX$H W B;CARDS;M 171 58.5 81.0 M 175 65 87 M 159 38 71 M 155.3 45 74 M 152 35 63 M 158.3 44
5、.5 75 M 154.8 44.5 74 M 164 51 72 M 165.2 55 79 M 164.5 46 71 M 159.1 48 72.5 M 164.2 46.5 73 F 152 44.8 74 F 153 46.5 80 F 158 48.5 73.5 F 150 50.5 87 F 144 36.3 68 F 160.5 54.7 86F 158 49 84 F 154 50.8 76 F 153 40 70 F 159.6 52 76;,PROC GLM;CLASS SEX;/*按照性别分组*/MODEL H W B=SEX/NOUNI;MANOVA H=SEX/PR
6、INTE PRINTH;LSMEANS SEX/STDERR PDIFF;PROC SORT;BY SEX;PROC CORR COV OUTP=A;VAR H W B;BY SEX;PROC PRINT;RUN;,data aa;do group=1 to 2;input n;do i=1 to n;input w h x;output;end;end;cards;12171 58.5 81175 65 87 10152 44.8 74;,proc glm;class group;model w h x=group;manova h=group/printe printh;proc corr
7、 cov outp=a;var w h x;by group;run;,一元方差分析:分析一个或多个定性影响因素对一个定量指标的影响情况多元方差分析:分析一个或多个定性影响因素对两个或两个以上在专业上有 一定联系的定量指标的影响;条件:1 多元正态分布 2 比较组间的多元协方差矩阵相等。,多个均数向量的比较 多元方差分析,例 3组两反应变量与反映某药治疗效果的得分见表,比较三个处理组的疗效。,方差分析的基本思想:总离均差平方和矩阵(SSCP)的分解:组间离差阵H 组内离差阵E,多元方差分析的方差分解表,n13,n22,n33;,资料多元方差分析表,1.统计量 表示Wilks提出的Lambda统
8、计量。是一个广义方差比 反映组内变异在总变异中的比例。当 很小时,说明组间差异H大于随机效应E,应怀疑零假设H0:12G是否正确。其中,分子、分母都是行列式。的检验界值可根据表将 转变为F 分布后确定。,Wilks统计量的精确分布,相应的 0.0061,P0.01,拒绝:,认为三组患者的治疗效果评分有差别。,data aa;do group=1 to 3;input n;do i=1 to n;input t1 t2 t3;output;end;end;cards;3 63.2 35.3 27.9453.4 22.5 2546.5 20.0 14.6572.4 42.5 29.975 49.5
9、 29.3;,proc glm;class group;model t1 t2 t3=group;manova h=group/printe printh;lsmeans group/stderr pdiff;run;,现测得10名乳腺癌患者大剂量顺铂化疗前后血液中两项指标的数值,x1(血液尿素氮BUN,mg%),X2(血清肌澉Cr,mg%),请分析化疗对它们的影响是否有统计学意义?,data aa;input x1 x2 y1 y2;d1=x1-x2;d2=y1-y2;cards;11.7 9.6 1.3 0.99.7 10.7 0.6 0.914 12 0.9 0.614.6 14.7 0.8 0.9;,proc glm;model d1 d2=;manova h=intercept;proc corr cov outp=a;var d1 d2;proc print;run;,多变量分析与单变量分析1.没有全面利用多个反映变量的信息2.反映变量趋势不一致时,得不出一个概括 性的结论3.单变量假设检验只说明某一变量在数轴分布上的组间差别,不能反映多个变量在平面或空间上的差别。,两组新生儿出生时的体重与身长数据,单变量t检验:体重t=1.62,P=0.13身长t=0.04,P=0.97Hotelling T2检验:F=4.58,P=0.03,