《研究生医学统计学Logisticregressionppt课件.ppt》由会员分享,可在线阅读,更多相关《研究生医学统计学Logisticregressionppt课件.ppt(50页珍藏版)》请在三一办公上搜索。
1、研究生医学统计学,Logistic regression,Logistic回归,流行病与卫生统计学系,第一节.非条件logistic回归第二节.条件logistic回归第三节.应用及其注意事项,流行病与卫生统计学系,医学研究中常碰到应变量的可能取值仅有两个(即二分类变量),如发病与未发病、阳性与阴性、死亡与生存、治愈与未治愈、暴露与未暴露等,显然这类资料不满足多元(重)回归的条件,什么情况下采用Logistic回归,流行病与卫生统计学系,Brown(1980)在术前检查了53例前列腺癌患者,拟用年龄(AGE)、酸性磷酸酯酶(ACID)两个连续型的变量,X射线(X_RAY)、术前探针活检病理分级
2、(GRADE)、直肠指检肿瘤的大小与位置(STAGE)三个分类变量与手术探查结果变量NODES(1、0分别表示癌症淋巴结转移与未转移)建立淋巴结转移的预报模型。,实例,流行病与卫生统计学系,(一)53例接受手术的前列腺癌患者情况,流行病与卫生统计学系,(二)26例冠心病病人和28例对照进行病例对照研究,流行病与卫生统计学系,26例冠心病病人和28例对照者进行病例对照研究,流行病与卫生统计学系,一、logistic回归模型,流行病与卫生统计学系,概率预报模型,流行病与卫生统计学系,二、模型的参数估计,Logistic回归参数的估计通常采用最大似然法(maximum likelihood,ML)。
3、最大似然法的基本思想是先建立似然函数与对数似然函数,再通过使对数似然函数最大求解相应的参数值,所得到的估计值称为参数的最大似然估计值。,流行病与卫生统计学系,参数估计的公式,流行病与卫生统计学系,三、回归参数的假设检验,流行病与卫生统计学系,优势比及其可信区间,流行病与卫生统计学系,标准化回归参数,用于评价各自变量对模型的贡献大小,流行病与卫生统计学系,SAS程序,流行病与卫生统计学系,The LOGISTIC ProcedureAnalysis of Maximum Likelihood Estimates,流行病与卫生统计学系,预报模型,流行病与卫生统计学系,The LOGISTIC Pr
4、ocedureAnalysis of Maximum Likelihood Estimates,流行病与卫生统计学系,预报模型,流行病与卫生统计学系,四、回归参数的意义,当只有一个自变量时,以相应的预报概率 为纵轴,自变量 为横轴,可绘制出一条S形曲线。回归参数的正负符号与绝对值大小,分别决定了S形曲线的方向与形状,流行病与卫生统计学系,流行病与卫生统计学系,优势比改变exp(bj)个单位,流行病与卫生统计学系,流行病与卫生统计学系,流行病与卫生统计学系,五、整个回归模型的假设检验,流行病与卫生统计学系,似然比检验(likelihood ratio test),流行病与卫生统计学系,ROC曲线
5、模型评价,流行病与卫生统计学系,ROC曲线模型评价,图16-2 Logistic回归预报能力的ROC曲线,流行病与卫生统计学系,六、logistic逐步回归(变量筛选),MODEL语句加入选项“SELECTION=STEPWISE SLE=0.10 SLS=0.10;”常采用似然比检验:决定自变量是否引入或剔除。,流行病与卫生统计学系,模型中有X5、X6、X8,看是否引入X1,模型含X5、X6、X8的模型的负二倍对数似然为:50.402模型含X1、X5、X6、X8的模型的负二倍对数似然为:46.224,流行病与卫生统计学系,第二节.条件logistic回归,流行病与卫生统计学系,条件似然函数,
6、流行病与卫生统计学系,1:3配对的例子,流行病与卫生统计学系,1:2配对的例子,流行病与卫生统计学系,表16-7条件logistic回归的SAS程序,流行病与卫生统计学系,结果,流行病与卫生统计学系,第三节 应用及其注意事项,应变量为(二项)分类的资料(预测、判别、危险因素分析等等),流行病与卫生统计学系,注意事项,分类自变量的哑变量编码 为了便于解释,对二项分类变量一般按0、1编码,一般以0表示阴性或较轻情况,而1表示阳性或较严重情况。如果对二项分类变量按+1与-1编码,那么所得的,容易造成错误的解释。,流行病与卫生统计学系,西、中西、中三种疗法哑变量化,原资料,哑变量化,流行病与卫生统计学
7、系,注意事项,2.自变量的筛选 不同的筛选方法有时会产生不同的模型。实际工作中可同时采用这些方法,然后根据专业的可解释性、模型的节约性和资料采集的方便性等,决定采用何种方法的计算结果。,流行病与卫生统计学系,注意事项,3.交互作用 交互作用的分析十分复杂,应根据临床意义与实际情况酌情使用。,流行病与卫生统计学系,注意事项,4.多分类logistic回归 心理疾病分为精神分裂症、抑郁症、神经官能症等(名义变量nominal variables);疗效评价分为无效、好转、显效、痊愈(有序变量ordinal variables)。参见第17章,应变量,SPSS软件计算,Analyze Regress
8、ion Binary LogisticDependent:yCovariates:x1 x8 Method:Forward WardSave Predicted Values Probabilities Group membershipOption CI for exp 95%Probability for Stepwise Entry:0.1 Removal 0.15,DATA samp16_1;INPUT x_ray grade stage age acid nodes;CARDS;.;PROC LOGISTIC DESCENDING;MODEL nodes=x_ray grade sta
9、ge age acid/RISKLIMITS;OUTPUT OUT=pred PROB=pred;PROC PRINT DATA=pred;RUN;,The SAS System 22:07 Monday,November 29,2005 1 The LOGISTIC Procedure Model Information Data Set WORK.SAMP16_1 Response Variable nodes Number of Response Levels 2 Number of Observations 53 Model binary logit Optimization Tech
10、nique Fishers scoring Response Profile Ordered Total Value nodes Frequency 1 1 20 2 0 33 Probability modeled is nodes=1.,Model Convergence Status Convergence criterion(GCONV=1E-8)satisfied.Model Fit Statistics Intercept Intercept and Criterion Only Covariates AIC 72.252 60.126 SC 74.222 71.948-2 Log
11、 L 70.252 48.126 Testing Global Null Hypothesis:BETA=0 Test Chi-Square DF Pr ChiSq Likelihood Ratio 22.1264 5 0.0005 Score 19.4514 5 0.0016 Wald 13.1406 5 0.0221,The SAS System 22:07 Monday,November 29,2005 2 The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF
12、Estimate Error Chi-Square Pr ChiSq Intercept 1 0.0618 3.4599 0.0003 0.9857 x_ray 1 2.0453 0.8072 6.4208 0.0113 grade 1 0.7614 0.7708 0.9759 0.3232 stage 1 1.5641 0.7740 4.0835 0.0433 age 1-0.0693 0.0579 1.4320 0.2314 acid 1 0.0243 0.0132 3.4230 0.0643,The SAS System 22:07 Monday,November 29,2005 2 T
13、he LOGISTIC Procedure Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr ChiSq Intercept 1 0.0618 3.4599 0.0003 0.9857 x_ray 1 2.0453 0.8072 6.4208 0.0113 grade 1 0.7614 0.7708 0.9759 0.3232 stage 1 1.5641 0.7740 4.0835 0.0433 age 1-0.0693 0.0579 1.4320
14、0.2314 acid 1 0.0243 0.0132 3.4230 0.0643 Odds Ratio Estimates Point 95%Wald Effect Estimate Confidence Limits x_ray 7.732 1.589 37.614 grade 2.141 0.473 9.700 stage 4.778 1.048 21.783 age 0.933 0.833 1.045 acid 1.025 0.999 1.051,Association of Predicted Probabilities and Observed Responses Percent
15、Concordant 84.5 Somers D 0.694 Percent Discordant 15.2 Gamma 0.696 Percent Tied 0.3 Tau-a 0.332 Pairs 660 c 0.847 Wald Confidence Interval for Adjusted Odds Ratios Effect Unit Estimate 95%Confidence Limits x_ray 1.0000 7.732 1.589 37.614 grade 1.0000 2.141 0.473 9.700 stage 1.0000 4.778 1.048 21.783
16、 age 1.0000 0.933 0.833 1.045 acid 1.0000 1.025 0.999 1.051,Obs no x_ray grade stage age acid nodes _LEVEL_ pred 1 1 0 1 1 64 40 0 1 0.25511 2 2 0 0 1 63 40 0 1 0.14633 3 3 1 0 0 65 46 0 1 0.21842 4 4 0 1 0 67 47 0 1 0.06459。50 50 1 0 1 64 89 1 1 0.80302 51 51 0 1 0 59 99 1 1 0.29880 52 52 1 1 1 68 126 1 1 0.94215 53 53 1 0 0 61 136 1 1 0.76730,