《广义线性回归分析》PPT课件.ppt

上传人:小飞机 文档编号:5505107 上传时间:2023-07-14 格式:PPT 页数:50 大小:264.49KB
返回 下载 相关 举报
《广义线性回归分析》PPT课件.ppt_第1页
第1页 / 共50页
《广义线性回归分析》PPT课件.ppt_第2页
第2页 / 共50页
《广义线性回归分析》PPT课件.ppt_第3页
第3页 / 共50页
《广义线性回归分析》PPT课件.ppt_第4页
第4页 / 共50页
《广义线性回归分析》PPT课件.ppt_第5页
第5页 / 共50页
点击查看更多>>
资源描述

《《广义线性回归分析》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《广义线性回归分析》PPT课件.ppt(50页珍藏版)》请在三一办公上搜索。

1、多元统计分析方法,The Methods of Multivariate Statistical Analysis,主要的统计分析方法,卡方分析,分类型,数值型,回忆,方差分析回归分析,比较率,比较均值,依存关系,反应变量,异同点?,方差分析,分析效应因子A对反应变量Y的影响,即,分析效应因子A的不同水平对反应变量Y的作用差异。,。男性和女性之间收缩压的差异。试验药和对照药之间的作用差异。大学生和运动员之间肺活量的差异,方差分析的原理,分解总体变异:,SST=SSA+SSE,舒张压,性别,回归分析,分析自变量X对因变量Y的依存关系,即,分析自变量X改变一个单位时,因变量Y的改变量大小。,。收缩

2、压和胆固醇的依存关系。肺活量和体重的关系。污染物浓度和污染源距离之间的关系,回归分析的原理,分解总体变异:,SST=SSX+SSE,舒张压,胆固醇,方差分析和回归分析的相同点,模型:因变量=自变量+残差,方法原理:分解总体变异 SST=SSA+SSE SST=SSX+SSE 因变量:连续型数值变量,方差分析和回归分析的不同点,自变量:方差分析:自变量-分类型 回归分析:自变量-连续型,结合?,广义线性模型分析,General Linear Model Analysis,什么是广义线性模型分析?协方差分析 广义线性回归分析,主要内容,第一节 广义线性模型分析的概念,广义线性模型分析是将方差分析和

3、回归分析的基本原理结合起来,用来分析连续型因变量与任意型自变量之间各种关系的一种统计分析方法。其意义是使得方差分析和回归分析的实用性和准确性得到进一步提高。,两个典型的广义线性模型分析方法,协方差分析,广义线性回归分析,含有数值型自变量的方差分析,含有分类型自变量的回归分析,第二节 协方差分析,协方差分析是将方差分析原理和线性回归分析原理结合起来的一种方差分析方法。它消除了混杂变量(协变量)对因变量的影响,使得方差分析结果更加准确。,。男性和女性之间收缩压的差异。试验药和对照药之间的作用差异。大学生和运动员之间肺活量的差异,方差分析存在的问题:结果不够准确,用方差分析结果来对下面问题作结论,合

4、适吗?,方差分析不够准确的原因:,年龄身高,SST=SSA+SSE,肺活量,职业,解决的办法,处理效应Y,一、协方差分析的原理,分解总体变异:,SST=SSA+SSX+SSE,舒张压,性别,年龄,二、方差分析和协方差分析的区别区别(1):数据,方差分析协方差分析AYA Y X1y111y11 x111y121y12 x12 1 y1.n11y1,n1 x1,n12y212y21 x212y222y22 x22 2 y2,n22y2,n2 x2,n2,区别(2):模型,方差分析模型 协方差分析模型,i 是组均值 i 是校正的组均值(group mean)(adjusted group mean)

5、i j 是随机误差 i j 是随机误差 是协变量x对因变量y的影响,在效应因子的每一个水平上,因变量y服从正态分布;方差相等。,区别(3):假设条件,在效应因子的每一个水平上,因变量y服从正态分布;方差相等;在效应因子的每一个水平上,因变量y和协变量x呈线性关系;斜率相同。,方差分析 协方差分析,三、协方差分析的方法步骤,检验数据是否满足假设条件:正态分布性 方差齐性 线性相关性 平行性 检验效应因子的显著性 估计校正的组均值 检验校正的组均值之间的差异,【例6_1】为了研究两种药物对癫疯病菌的治疗效果,将30名病人随机分成3组,一组使用抗生素A,一组使用抗生素D,另一组作为对照组使用安慰剂。

6、治疗前和治疗后分别对病人身体的癫疯病菌数量进行了检测,病菌的数量是由每一个病人身体上六个部位病菌感染的程度而定的,数据列在下表中。试对该试验研究进行统计分析。,四、协方差分析的应用举例,数据:,解:这是一个完全随机设计资料。令 x 表示治疗前病人身体的癫疯病菌数量,y 表示治疗后病人身体的癫疯病菌数量,drug 表示用药方式,取值为A、D和F,分别 表示使用抗生素A、抗生素D和安慰剂。,首先建立SAS数据集data eg6_1;do id=1 to 10;do drug=A,D,F;input x y;output;end;end;cards;11 6 6 0 16 13 3 0 15 9 1

7、2 20run;,(一)检验协方差分析的4个假设条件是否满足(1)检验正态性:proc sort data=eg6_1;by drug;run;proc univariate data=eg6_1 normal;var y;by drug;run;(2)检验方差齐性:proc discrim data=eg6_1 pool=test;class drug;var y;run;(3)检验线性相关性:proc reg data=eg6_1;model y=x;by drug;run;(4)检验平行性:proc glm data=eg6_1;model y=drug x drug*x;run;,【S

8、AS 部分输出结果】(1)检验正态分布的结果:(H0:y 服从正态分布)A组:W=0.928405,P=0.4166D组:W=0.871798,P=0.1002F组:W=0.972136,P=0.9023-说明三个组的y 值均近似服从正态分布。检验方差齐性的结果:(H0:方差相等)Chi-Square=1.551005,DF=2,P=0.4605,-说明三个组的方差在统计意义上是相等的。,注意,以上检验过程应逐条进行,若发现有不满足假设条件的,应当选取适当的变量变换,使之尽可能接近假设条件。,检验线性相关性的结果:(H0:线性无关,H1:线性相关)A组:F=11.23,df=(1,8),p=0

9、.0101 D组:F=39.24,df=(1,8),p=0.0002F组:F=6.21,df=(1,8),p=0.0374-说明三个组上 y 与 x 均近似呈线性关系。检验平行性的结果:(H0:斜率相等)F=0.59,df=(2,24),p=0.560,-说明三条直线近似平行。,(二)假设条件满足后,再进行协方差分析:【SAS 程序】proc glm;class drug;model y=drug x;lsmeans drug/pdiff;run;【SAS 输出结果】General Linear Models ProcedureClass Level InformationClass Leve

10、ls ValuesDRUG 3 A D FNumber of observations in data set=30,Dependent Variable:Y Sum of MeanSource DF Squares Square F Value Pr FModel 3 871.49740304 290.49913435 18.10 0.0001Error 26 417.20259696 16.04625373Corrected Total 29 1288.70000000 R-Square C.V.Root MSE Y Mean 0.676261 50.70604 4.0057775 7.9

11、000000Source DF Type I SS Mean Square F Value Pr FDRUG 2 293.60000000 146.80000000 9.15 0.0010X 1 577.89740304 577.89740304 36.01 0.0001Source DF Type III SS Mean Square F Value Pr FDRUG 2 68.55371060 34.27685530 2.14 0.1384X 1 577.89740304 577.89740304 36.01 0.0001,T for H0:Pr|T|Std Error ofParamet

12、er Estimate Parameter=0 EstimateINTERCEPT-0.434671164 B-0.18 0.8617 2.47135356DRUG A-3.446138280 B-1.83 0.0793 1.88678065 D-3.337166948 B-1.80 0.0835 1.85386642 F 0.000000000 B.X 0.987183811 6.00 0.0001 0.16449757,Least Squares MeansDRUG Y Pr|T|H0:LSMEAN(i)=LSMEAN(j)LSMEAN i/j 1 2 3A 6.7149635 1.0.9

13、521 0.0793D 6.8239348 2 0.9521.0.0835F 10.1611017 3 0.0793 0.0835.,The means and adjusted means means adjusted meansDrug A 5.20 6.72Drug D 6.10 6.82Drug F 13.10 10.16,均值和校正均值,【结果解释】模型的总体检验结果:p=0.0001,R2=0.676,说明模型有统计意义,即drug和x 对y 的联合作用是显著的。TyepI SS 对参数的检验结果:因为drug排在协变量x之前,根据第一类SS定义,检 验drug 对y 的影响效应时

14、,没有对x 进行校正。此结果 说明,不考虑治疗前的病情状况,这三种治疗方法是有 显著性区别的(p=0.0010)。,TyepIII SS 对参数的检验结果。根据第三类SS定义,检验 模型中每一个自变量时,都校正模型中的其它变量对y 的 影响。此结果说明,校正了治疗前的病情状况后,这三种 治疗方法是没有显著性区别的(p=0.1384)。给出了三个处理组的校正均值,即,校正了治疗前的病情 状况后三个组的均值,以及每一对均值的差异比较。因为 上面结果已经说明三种治疗方法没有显著性差别,因此不 需要解释这一部分的结果。因为数据满足协方差分析的 假设条件,因此,上述协方差分析结果是可靠的。,协方差分析的

15、意义,可以消除多个混杂因素对处理效应的影响,得到校正均值;提高方差分析结果的准确性和真实性;医学研究中应用广泛,解决了很多条件不易控制的实验问题。,协方差分析和随机区组设计的区别:,随机区组设计资料的方差分析仅可以消除一个混杂因素(分类型变量)对因变量的影响;协方差分析可以消除多个混杂因素对因变量的影响。,协方差分析在医学中的应用,1)借助协方差分析来排除非处理因素的干扰,从而准确地估计处理因素的试验效应。2)协方差分析和方差分析一样,包括各种类型的模型,因此可以用来处理医学研究中各种不同设计资料的分析,例如,完全随机设计资料,随机区组设计资料等等。,第三节 广义线性回归分析,广义线性回归分析

16、是将线性回归分析原理和方差分析原理相结合起来的一种线性回归分析方法,它和线性回归分析的区别是模型的自变量可以是任意类型的变量。其主要目的是扩大线性回归分析的应用范围,使得它的应用价值得到进一步提高。,广义线性回归分析的假设条件:,因变量是连续随机变量;自变量相互独立;每一个数值型自变量与因变量呈线性关系;每一个数值型自变量与随机误差相互独立;观察个体的随机误差之间相互独立;随机误差eiN(0,)。,广义线性回归分析的应用举例,【例6-2】为了解大学生中抑郁症的发病率极其原因,某医科大学临床系学生进行预防战略实习时,随机抽取了该市481名大学生进行调查。调查的内容包括测试抑郁症表现的34个问题(

17、0=无,1=有时,2=经常,3=持续有)以及关于个人、家庭和学校的若干问题。如性别、年龄、身高、体重、父母文化程度、家庭月收入、父母是否离异、个人学习成绩、家庭气氛、对学校是否满意、对父母要求是否有压力、睡眠质量、有否经济压力、平时和同学关系、平时性格、社交能力、是否有知心朋友、有否恋爱困扰等问题。,,其中,年龄、身高和体重是连续变量,其余都是顺序变量。数据经过整理,计算出34个问题的和,令其为因变量y,y值越大说明患抑郁症的可能性越大。其它问题作为自变量。经过初步分析,筛选出和y有显著线性关系的自变量以及年龄和性别两个重要变量,进行广义线性回归分析。进入模型的自变量是:年龄(x1:连续变量)

18、、性别(x2:1=男,2=女)、家庭气氛(x3:1=和谐,2=一般,3=很差)、对所在学校和专业是否满意(x4:1=很满意,2=基本满意,3=不满意)、对父母的要求有压力吗(x5:1=无,2=有一点,3=很大)、平时睡眠质量如何(x6:1=很好,2=一般,3=很差)、平时性格如何(x7:1=开朗,2=稍微少语,3=内向)、有社交或人际交流的困难吗(x8:1=无,2=有一点,3=很多)、有否知心朋友(x9:1=有,2=无)。,【SAS程序】proc glm data=eg6_2;class x2-x9;model y=x1-x9/ss3 solution;run;,【SAS 输出结果】Gener

19、al Linear Models ProcedureClass Level InformationClass Levels ValuesX2 2 1 2X3 3 1 2 3X4 3 1 2 3X5 3 1 2 3X6 3 1 2 3X7 3 1 2 3X8 3 1 2 3X9 2 1 2Number of observations in data set=481NOTE:Due to missing values,only 453 observations can be used in this analysis.,Dependent Variable:Y Sum of MeanSource

20、DF Squares Square F Value Pr FModel 15 44160.764050 2944.050937 15.46 0.0001Error 437 83230.127782 190.457958Corrected Total 452 127390.891832 R-Square C.V.Root MSE Y Mean 0.346656 49.90975 13.800651 27.651214,Source DF Type III SS Mean Square F Value Pr FX1 1 28.879716 28.879716 0.15 0.6972X2 1 83.

21、191091 83.191091 0.44 0.5090X3 2 3550.202560 1775.101280 9.32 0.0001X4 2 1395.001753 697.500876 3.66 0.0265X5 2 2181.647192 1090.823596 5.73 0.0035X6 2 11579.310765 5789.655382 30.40 0.0001X7 2 1680.552471 840.276236 4.41 0.0127X8 2 2976.181048 1488.090524 7.81 0.0005X9 1 1885.687051 1885.687051 9.9

22、0 0.0018,T for H0:Pr|T|Std Error ofParameter Estimate Parameter=0 EstimateINTERCEPT 72.51496951 6.91 0.0001 10.49333179X1 0.17806694 0.39 0.6972 0.45728442X2 1-0.91539699-0.66 0.5090 1.38506653 2 0.00000000.X3 1-10.68527474-2.84 0.0047 3.75746504 2-5.30141860-1.38 0.1689 3.84753002 3 0.00000000.X4 1

23、-5.18319904-2.52 0.0121 2.05798800 2-3.43902105-2.19 0.0291 1.57051830 3 0.00000000.X5 1-7.67022601-3.02 0.0027 2.54367456 2-7.77699716-3.34 0.0009 2.32903272 3 0.00000000.,X6 1-19.13918032-7.60 0.0001 2.51956030 2-13.06747122-5.40 0.0001 2.42059805 3 0.00000000.X7 1-6.78021193-2.35 0.0192 2.8856031

24、0 2-3.13863602-1.13 0.2607 2.78675475 3 0.00000000.X8 1-8.36233209-2.60 0.0098 3.22234050 2-3.10011372-1.01 0.3129 3.06845035 3 0.00000000.X9 1-6.09035051-3.15 0.0018 1.93556179 2 0.00000000.,拟合的广义线性回归模型如下:y=72.515+0.178*x1-0.915(if x2=1)+0(if x2=2)-10.685(if x3=1)-5.301(if x3=2)+0(if x3=3)-5.183(if

25、 x4=1)-3.439(if x4=2)+0(if x4=3)-7.670(if x5=1)-7.777(if x5=2)+0(if x5=3)-19.139(if x6=1)-13.067(if x6=2)+0(if x6=3)-6.780(if x7=1)-3.139(if x7=2)+0(if x7=3)-8.362(if x8=1)-3.100(if x8=2)+0(if x8=3)-6.090(if x9=1)+0(if x9=2),广义线性回归分析的优点:,和线性回归分析相比,广义线性回归分析的优点有:1、自变量可以是任意类型的变量;2、利用SAS的glm过程可以分析每一个分类型变量对因变 量y的影响的显著性。,方差分析和回归分析的异同点?什么是协方差分析?协方差分析与方差分析的区别?协方差分析的假设条件?什么是广义线性回归分析?广义线性回归分析与线性回归分析的区别?广义线性回归分析的假设条件是什么?,总 结,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号