医用SAS统计分析五.ppt_三一办公31ppt.com

资源描述

《医用SAS统计分析五.ppt》由会员分享，可在线阅读，更多相关《医用SAS统计分析五.ppt（74页珍藏版）》请在三一办公上搜索。

1、2023/5/22,1,医用SAS统计分析,第五讲,2023/5/22,2,一、多元线性回归基本概念多元线性回归简称多元回归，是研究一个应变量与多个自变量间线性依存关系数量变化规律的一种方法。多元线性回归方程,式中：b0为回归方程常数项，bj(j=1,2,，m)为偏回归系数，即在其他自变量固定的条件下，Xj改变一个单位时应变量的改变量。,2023/5/22,3,多元线性回归方程的应用预测应变量的估计值探索影响应变量y的主要因素当X为某一定值时，估计应变量y的容许区间当X为某一定值时，估计其应变量的总体均数的置信区间,2023/5/22,4,语句格式同单变量线性回归基本相同。pro

2、c reg 选项；model 应变量=自变量名列/选项；必选语句，定义回归分析模型 proc reg 语句的选项 data=数据集指明回归分析所用的数据集。outset=数据集指定一个输出数据集，用以存储回归分析所得的参数估计。simple 输出每个变量的简单统计结果。,2023/5/22,5,model语句的选项 selection=method 规定变量筛选方法，method可以是以下几种选项：forward（或 f）前进法，按照sle规定的P值从无到有依次选一个变量进入模型 backward（或 b）后退法，按照sls规定的P值从含有全部变量的模型开始，以次剔除一个变量。stepwi

3、se 逐步法，按照sle的标准依次选入变量，同时对模型中现有的变量按sls的标准剔除不显著的变量。注：选项中没有selection语句时，模型中含有全部自变量的回归模型。sle=概率值入选标准，规定变量入选模型的显著性水平，前进法默认为0.5，逐步法默认为0.15。sls=概率值剔除标准，指定变量保留在模型的显著性水平，后退法默认为0.1，逐步法默认为0.15。,2023/5/22,6,stb 输出各自变量的标准偏回归系数。cli 输出个体y值的95%容许区间上下限 clm 输出预测值均值的95%可信区间上下限。P 输出实际值Yi，预测值、残差及其标准误。tol 输出各自变量的容许值。0

4、tol值1，越接近于0，共线性越严重。vif 输出各自变量的方差膨胀因子。当vif10时，可认为多元共线性严重存在。collin 要求详细分析自变量之间的共线性，给出信息矩阵的特征根、条件指数和方差比，当条件指数10，方差比0.5时，可认为存在多元共线性。collinoint 与选择项collin作用相同，但不包括回归常数。R 进行预测值的残差分析（即异常值识别与强影响分析），输出学生化残差值和Cooks距离D值。当学生化残差值2时，所对应的点可能是异常点，当D值0.5时，可认为对应的变量值对回归函数是强影响点。,2023/5/22,7,完全多元线性回归例7-7 10名女中学生的体重（X1,

5、kg），胸围（X2,cm），胸围的呼吸差（X3,cm）及肺活量（Y,ml）的资料如下表所示。现作应变量Y对自变量X1，X2，X3的三元线性回归方程。,data mreg1;input x1 x2 x3 y;cards;35 69 0.7 160040 74 2.5 260040 64 2.0 210042 74 3.0 265037 72 1.1 240045 68 1.5 2200,43 78 4.3 275037 66 2.0 160044 70 3.2 275042 65 3.0 2500;proc reg;model y=x1 x2 x3/stb;run;,2023/5/22,8,Mo

6、del:MODEL1Dependent Variable:Y Analysis of Variance Sum of MeanSource DF Squares Square F Value ProbFModel 3 1250109.0678 416703.02259 5.617 0.0355Error 6 445140.93222 74190.15537C Total 9 1695250 Root MSE 272.37870 R-square 0.7374 Dep Mean 2315.00000 Adj R-sq 0.6061 C.V.11.76582,2023/5/22,9,Paramet

7、er Estimates Parameter Standard T for H0:Variable DF Estimate Error Parameter=0 Prob|T|INTERCEP 1-3035.536354 2168.6738473-1.400 0.2111 X1 1 60.931823 36.29713798 1.679 0.1442 X2 1 37.808334 22.98080891 1.645 0.1510 X3 1 101.379460 121.97470310 0.831 0.4377 StandardizedVariable EstimateINTERCEP 0.00

8、000000X1 0.46445689X2 0.39174762X3 0.25399450,2023/5/22,10,逐步回归简介逐步回归是筛选自变量的常用的方法之一。筛选自变量的方法还有前进法，后退法和最优回归子集法。逐步回归法是依据事先给定的两个显著性水平SLE和SLS，将自变量逐个引入方程，同时每引入一个新变量后，对已选入的变量要进行逐个检验，将不显著的变量剔除，这样保证最后所得的变量都有显著性。自变量间的多重共线性(multicollinearity)整个回归方程的统计检验P 的矛盾现象。偏回归系数的估计值明显与实际情况不符，或者是偏回归系数的符号与专业知识的情况相反。,2023/

9、5/22,11,据专业知识，该自变量与应变量间关系密切，而偏回归系数检验结果P。增加（或删除）一个变量，或者改变（或去除）一个观察值，引起回归系数估计值发生大的变化。多重共线性是引起上述问题的重要原因。解决多重共线性的办法用主成分估计等有偏估计替代最小二乘估计。用逐步回归等方法筛选自变量。如上例7-7，整个回归模型P=0.0355，而b0,b1,b2,b3P值均大于0.05。估计变量之间存在共线性问题。,2023/5/22,12,程序7-13,data stepreg1;input x1 x2 x3 y;cards;35 69 0.7 160040 74 2.5 260040 64 2.0

10、210042 74 3.0 265037 72 1.1 240045 68 1.5 220043 78 4.3 275037 66 2.0 160044 70 3.2 275042 65 3.0 2500;,proc reg;model y=x1-x3/stb tol vif collin collinoint R;model y=x1-x3/selection=stepwise sle=0.25 sls=0.25 stb;run;,2023/5/22,13,例（医学统计学王洁贞主编，例15.1）某科研协作组调查某煤矿期高血压病患者40例，X1为工作面污染程度等级，X2为井下工龄（年），X3为

11、体重（kg），X4为吸烟年限(年)，X5为饮酒年限（年），Y为收缩压(kPa)，试作多元线性回归分析。data stepreg2;infile d:sassas5wang15_1.txt;input id x1 x2 x3 x4 x5 y;proc reg;model y=x1-x5/stb tol vif collin collinoint r;model y=x1-x5/selection=stepwise sle=0.05 sls=0.05 stb;run;,2023/5/22,14,二、多元线性相关研究多个变量间线性关系的一种统计分析方法。变量间相关系数有以下三类：简单相关系数它是

12、说明两个变量相关程度和方向（不考虑其他变量的影响）的统计指标（ri,j)。偏相关系数它是当其他变量固定时，说明某两个变量间相关程度和方向的统计指标（如r12,3）。复相关系数R 亦称为全相关系数。说明应变量与各自变量的线性关系的密切程度。决定系数 R2 复相关系数的平方。它说明应变量的变异中由各自变量的改变而引起的占多少。如R2=0.8，则说明应变量的变异中有80%由自变量的改变而引起的。,2023/5/22,15,程序7-12data mcorr1;infile d:sassas5mcorr1.txt;input x1 x2 x3 y;proc corr nosimple;/*禁止一些简单

13、统计量的输出*/var x1 x2 x3 y;/*包括了所有变量，实际可以省略*/proc corr nosimple;var x1 x2;partial x3;/*partial语句的作用是固定x3*/proc corr nosimple;var x1 x2;partial x3 y;/*partial语句的作用是固定x3和y*/run;,2023/5/22,16,三、Logistic回归分析简介 Logistic回归模型是适用于应变量（因变量）为分类变量的回归分析。当应变量为分类变量时，如应变量结果为二分类变量的发病、不发病，生存、死亡等，是不能用多元线性回归模型（Y=0+i xi)来分

14、析各种危险因素与应变量之间的关系的。因为应变量Y只能取值为1和0。不符合线性回归模型中应变量Y应具有正态分布和方差齐性的要求，同时线性回归模型得到的Y值会出现大于1或小于0的不合理结果，显然不能用线性回归建立预测模型。以发病为例，发病的概率为P，不发病的概率为1-P，0P1。,公式等号左边简称为logit（P），即logit(P)=0+i xi,可证明，无论Y得何值，均0P1。上式可推导为：,2023/5/22,17,Logistic回归的应用 logistic回归在流行病学和临床流行病学等方面应用广泛，既可用于前瞻性的队列研究，又可用于回顾性的病例对照研究。常用于：,病因学分析；,预后分析；

15、,鉴别诊断；,评价治疗措施；,毒物的半数效量和联合作用,2023/5/22,18,Logistic回归的分类按应变量的类型分类为：两分类的Logistic回归非条件logistic回归即研究对象未经过配对。（在SAS中调用logistic模块进行统计）。条件logistic回归即在配对病例对照研究中的1:1和1:M及N:M配对。（在SAS中调用Phreg模块进行统计）。多分类有序反应变量的Logistic回归（在SAS中调用logistic模块进行统计）。多分类无序反应变量的Logistic回归（在SAS中调用Catmod模块进行统计）。本讲主要介绍两分类Logistic回归,2023

16、/5/22,19,两分类非条件Logistic回归语法格式 Proc logistic data=数据集选项；model 应变量名=自变量名列/选项；freq；可选项，指明频数变量。output;output语句创建一个新的SAS数据集，其含有每个个体的原始数据，pred|p=变量名为在out=数据集中含有每个个体预测概率。【Proc语句的选项】order=data 规定按照数据集中反应变量水平出现的先后顺序进行运算。descending(或des)规定按照反应变量降序水平进行运算。,2023/5/22,20,注意：以上两个选项非常重要，如死亡为1，存活为0，为了得到死亡对存活的概率（或者

17、说是死亡的危险），应选择此两个选项之一，否则得到的是存活对死亡的概率，因为logistic回归模型是自动按反应变量值为小的来拟合方程的。反之，如果死亡为0，存活为1，可不选此两项之一，【model语句的选项】selection=forward(或f)|backward(或b)|stepwise(或s)|score 规定变量的筛选方法，分别为向前、向后、逐步和最优子集法。缺省时为none,拟合全回归模型。sle=概率值指定变量进人模型的显著水平，缺省为0.05。sls=概率值指定变量剔除模型的显著水平，缺省为0.05。CL 计算输出所有回归参数的可信区间。,2023/5/22,21,clod

18、ds=pl 计算输出OR的可信区间。scale=none aggregate 要求对模型进行拟合优度检验。例9-4 40例病人的治愈情况Y（Y=0表示未愈，Y=1表示治愈，病情严重程度X1(X1=0 表示不严重，X1=1表示严重），年龄X2为连续变量，治疗方法X3(X3=0表示新方法，X3=1表示一般疗法），数据如表9.6，试作logistic回归分析。程序9-4data c;infile d:sassas5cx9_4.txt;input y x1-x3;proc logistic des;/*按降序水平进行运算*/model y=x1-x3/scale=none aggregate;/*对模

19、型进行拟合优度检验*/Output out=b p=pr;/*在数据集b中含有每个个体的预测概率值*/run;,2023/5/22,22,The LOGISTIC Procedure Data Set:WORK.C 数据集名 Response Variable:Y 反应变量Y Response Levels:2 反应变量水平数2 Number of Observations:40 观察值40 Link Function:Logit 联系函数logit Response Profile 反应变量的描述 Ordered 顺序值 Value Y Count 计数值 1 1 17 2 0 23,202

20、3/5/22,23,Deviance and Pearson Goodness-of-Fit Statistics 模型的拟合优度检验 Pr Criterion DF Value Value/DF Chi-SquareDeviance 31 36.3231 1.1717 0.2344Pearson 31 29.5583 0.9535 0.5402 Model Fitting Information and Testing Global Null Hypothesis BETA=0 模型拟合信息和整体偏回归系数为0 的假设检验 Intercept Intercept andCriterion O

21、nly Covariates Chi-Square for Covariates判断的准则仅有截距所有变量协变量的卡方AIC 56.548 55.413.SC 58.237 62.169.-2 LOG L 54.548 47.413 7.135 with 3 DF(p=0.0677)Score.6.630 with 3 DF(p=0.0847),2023/5/22,24,Analysis of Maximum Likelihood Estimates 最大似然法估计值分析 Parameter Standard Wald Pr Standardized OddsVariable DF Es

22、timate Error Chi-Square Chi-Square Estimate RatioINTERCPT 1 3.7025 2.1442 2.9817 0.0842.X1 1-0.6157 0.7135 0.7446 0.3882-0.171877 0.540X2 1-0.0939 0.0636 2.1812 0.1397-0.309336 0.910X3 1-1.5236 0.7396 4.2430 0.0394-0.424813 0.218 Association of Predicted Probabilities and Observed Responses 模型回代判别分析

23、 Concordant=71.9%(一致率）Somers D=0.448 Discordant=27.1%(非一致率）Gamma=0.452 Tied=1.0%(结点率)Tau-a=0.224(391 pairs)c=0.724,2023/5/22,25,治愈的概率模型为：,例2 为了探讨冠心病发生的有关危险因素，对26例冠心病病人和28例对照者进行病例对照研究，各因素的说明见下表。试用logistic逐步回归分析方法筛选危险因素。,2023/5/22,26,表冠心病8个可能的危险因素与赋值因素变量名赋值说明年龄(岁)X1 45=1,4554=2,5564=3,65=4高血压史 X2 无

24、=0,有=1高血压家族史 X3 无=0,有=1吸烟 X4 不吸=0,吸=1高血脂史 X5 无=0,有=1动物脂肪摄入 X6 低=0,高=1体重指数(BMI)X7 24=1,2426=2,26=3A型性格 X8 否=0,是=1冠心病 Y 对照=0，病例=1,2023/5/22,27,程序data ex16_2;infile d:sassas5log2.txt;input x1-x8 y;proc logistic des;model y=x1-x8/selection=stepwise sle=0.1 sls=0.1clodds=pl;run;,2023/5/22,28,条件Logistic 回

25、归条件Logistic回归分析是用phreg(proportional hazard regression，比例风险回归）模块完成的。Phreg模块主要用于Cox回归的计算）语法格式在data步先建立一个时间哑变量，一般为time=1-case；（如病例case=1，对照case=0，则病例哑变量time=0，对照哑变量time=1，要求病例的time要小，对照的time要大）。如果病例case=0，对照case=1，时间哑变量为time=case。Proc phreg 选项；model=/选项；,2023/5/22,29,Strata；Freq；【Proc phreg 选项】；nosum

26、mary 不打印输出事件和截尾数值。simple 输出模型中变量的简单统计描述【model 过程选项】ties=discrete 用离散的logistic模型替代比例风险模型。此句必选！selection=forward(或f)|backward(或b)|stepwise(或s)|score 规定变量的筛选方法，分别为向前、向后、逐步和最优子集法。缺省时为none,拟合全回归模型。,2023/5/22,30,sle=概率值指定变量进人模型的显著水平，缺省为0.05。sls=概率值指定变量剔除模型的显著水平，缺省为0.05。risklimits 计算输出RR的可信区间。alpha=概率值指

27、定RR的（1-）可信区间，缺省时为0.05。1:1配对条件Logistic回归例9-8 为研究胃癌的危险因素，某医学院用103对1：1配对资料，这里选用其中10对三个因素，即X1（蛋白质摄入量0，1，2，3），X2（不良饮食习惯0，1，2，3）及X3（精神因素0，1，2）。数据如表9.11。试作条件Logistic回归分析。,2023/5/22,31,表9.11 10对胃癌的1：1配对数据,2023/5/22,32,程序data log1_2;do id=1 to 10;do case=0 to 1;input x1-x3;time=case;output;end;end;cards;1 3

28、 0 1 0 1 0 3 2 1 3 0 0 1 2 0 2 0 1 2 0 1 0 0 1 1 1 1 2 1,0 2 2 2 0 01 1 1 0 0 01 1 2 0 0 03 3 2 2 2 02 2 2 0 0 0;proc phreg;model time*case(1)=x1-x3/ties=discrete selection=stepwise sle=0.25 sls=0.25;strata id;run;,2023/5/22,33,The PHREG Procedure Data Set:WORK.LOG1_2 Dependent Variable:TIME 反应变量tim

29、e Censoring Variable:CASE 截尾变量case Censoring Value(s):1 截尾值为1 Ties Handling:DISCRETE 结点处理方法为 discrete Summary of the Number of Event and Censored Values PercentStratum ID Total Event Censored Censored 1 1 2 1 1 50.00 2 2 2 1 1 50.0010 10 2 1 1 50.00-Total 20 10 10 50.00,2023/5/22,34,Step 1:Variable

30、X3 is entered.The model contains the following explanatory variables.X3 Testing Global Null Hypothesis:BETA=0 Without With Criterion Covariates Covariates Model Chi-Square-2 LOG L 13.863 7.158 6.705 with 1 DF(p=0.0096)Score.5.538 with 1 DF(p=0.0186)Wald.3.139 with 1 DF(p=0.0764),2023/5/22,35,Step 2:

31、Variable X2 is entered.The model contains the following explanatory variables.X2 X3 Testing Global Null Hypothesis:BETA=0 Without With Criterion Covariates Covariates Model Chi-Square-2 LOG L 13.863 3.724 10.139 with 2 DF(p=0.0063)Score.7.229 with 2 DF(p=0.0269)Walt.2.467 with 2 DF(p=0.2913)NOTE:No(

32、additional)variables met the 0.25 level for entry into the model.,2023/5/22,36,Analysis of Maximum Likelihood Estimates Parameter Standard Wald Pr RiskVariable DF Estimate Error Chi-Square Chi-Square Ratio 变量自由度参数估计值标准误 wald卡方值 P值 RR值X2 1 1.165351 0.81080 2.06579 0.1506 3.207X3 1 2.067157 1.63944

33、 1.58985 0.2073 7.902 Summary of Stepwise Procedure Variable Number Score Wald Pr Step Entered Removed In Chi-Square Chi-Square Chi-Square 1 X3 1 5.5385.0.0186 2 X2 2 3.4594.0.0629,胃癌患病的概率模型为：,2023/5/22,37,1:M或N:M的条件Logistic回归 1:M配比是一个病例配M个对照，N:M配比是N个病例配M个对照。使用的SAS语句和1:1配对基本是一致的。例题某北方城市研究喉癌发病的危险因素，

34、用1:2配对的病例-对照研究方法进行了调查。先选取了6个可能的危险因素并节录25对数据，各因素的赋值说明见下表1，资料列于表2。试作条件Logistic逐步回归。,2023/5/22,38,表1 喉癌的危险因素与赋值说明,2023/5/22,39,表2 喉癌1:2配对病例-对照调查资料整理表,2023/5/22,40,程序data log1_4;infile d:sassas5log1_4.txt;do i=1 to 25;do j=1 to 3;input y x1-x6;time=1-y;output;end;end;proc phreg nosummary;model time*y(0)

35、=x1-x6/ties=discrete selection=stepwise sle=0.1 sls=0.1 risklimits;strata i;run;,2023/5/22,41,四、生存分析简介概念生存分析是将事件的结果和出现此结果所经历的时间结合起来分析的统计分析方法。生存分析的数据完全数据即掌握研究事件的起点，又掌握终点的生存时间资料为完全数据，一般用t来表示。不完全数据因迁移原因失去联系；死于其他原因；在总结分析时仍然生存。生存分析中称这种不完全数据为截尾数据、删失数据、终检数据(censored data)。生存率(survival rate)又称累积生存概率，即

36、个体活过时点t的概率,用S(t)表示。,2023/5/22,42,生存分析的三种变量1.目标变量即生存时间，常记为t。2.协变量可以是研究因素，也可以是排除其影响的因素，常记为x1，x2，xp。3.截尾变量常记为censor或d等。生存分析的任务估计生存率；比较生存率；寻找影响因素。生存分析的方法参数法已知生存时间T 服从某特定的分布类型，对分布的参数作统计描述与推断。常见的有：Weibull分布，指数分布，正态分布等。相应的SAS过程为lifereg。非参数法不知生存时间T的分布类型或不符合特定的分布类型，对整个分布或某个特征作统计描述与推断。常用乘积极限,2023/5/22,

37、43,法(product limit method)和寿命表法(life table method)估计生存率和中位生存时间等；用时序检验(log-rank test)，Wilcoxon检验和似然比检验等作分组比较。相应的SAS过程为：lifetest 半参数法不知生存时间分布确切类型，用模型的方法对模型的部分参数作统计描述与推断。常用的是Cox模型。相应的SAS过程为：phreg。注：半参数法与参数法可用来研究多个因素对生存时间的影响，非参数法难以实施多因素生存分析。非参数法的lifetest过程语法格式：PROC LIFETEST 选项；TIME；,2023/5/22,44,STRAT

38、A；（指定比较的分组变量，按分组变量名列分别进行分析和比较。）TEST；（指定协变量名列，检验生存时间与该变量是否有关）Freq；（指定频数变量名）PROC过程选项 1.method=方法指定估计生存率所用的方法：PL 要求用乘积极限法（即Kaplan-Meier 法）估计生存率并计算中位生存时间等，为缺省方法。LT 要求用寿命表法估计生存率等。2.intervals=(初值 to 终值 by 步长）或 width=数值只能在指定方法为寿命表法时使用。用寿命表法分析时，程序会自动,2023/5/22,45,给定生存时间的区间。如果人为规定生存时间的分组区间，则需用该选项指定。3.Plot

39、s=绘图类型要求输出生存分析图。可供输出的图形有：S 对生存函数S(t)作图。横、纵坐标分别为t，S(t)。H 对风险函数作图。横、纵坐标分别为t，H(t)。小样本资料的乘积极限法(Kaplan-Meier法）例15-1 25例某种癌症的患者在不同的日期随机分配至两治疗组，分别以A、B两种治疗方法进行治疗。治疗后继续对这些病人进行随访至到2003年5月31日结束。资料如表15.1所示，数字后又+号者为删失值。试进行生存率分析。,2023/5/22,46,data life1;do group=1 to 2;input n;do i=1 to n;input t;if t0 then cens

40、or=1;else censor=0;t=abs(t);output;end;end;cards;128 52 58 63 63 220 365 452 496-528-560-6761313 18 23 70 76 180 195 210 232 300 396-490-540;,proc lifetest plots=(s)formchar(1,2,7)=|-+;time t*censor(1);strata group;run;,2023/5/22,47,The LIFETEST Procedure Product-Limit Survival Estimates GROUP=1 Sur

41、vival Standard Number Number T Survival Failure Error Failed Left 生存时间生存率死亡概率生存率标准误死亡例数生存例数 0.000 1.0000 0 0 0 12 8.000 0.9167 0.0833 0.0798 1 11 52.000 0.8333 0.1667 0.1076 2 10 58.000 0.7500 0.2500 0.1250 3 9 63.000.4 8 63.000 0.5833 0.4167 0.1423 5 7 220.000 0.5000 0.5000 0.1443 6 6 365.000

42、0.4167 0.5833 0.1423 7 5 452.000 0.3333 0.6667 0.1361 8 4 496.000 0.2500 0.7500 0.1250 9 3 528.000*.9 2 560.000*.9 1 676.000*.9 0*Censored Observation,2023/5/22,48,Summary Statistics for Time Variable T Point 95%Confidence Interval Quantile Estimate Lower,Upper)四分位数点估计 95%可信区间 75%.220.000.50%292.50

43、0 63.000 496.000 25%60.500 52.000 365.000 Mean 272.083 Standard Error 62.231 生存时间均数均数的标准误NOTE:The last observation was censored so the estimate of the mean is biased.,2023/5/22,49,The LIFETEST Procedure Product-Limit Survival Estimates GROUP=2 Survival Standard Number Number T Survival Failure Erro

44、r Failed Left 0.000 1.0000 0 0 0 13 13.000 0.9231 0.0769 0.0739 1 12 18.000 0.8462 0.1538 0.1001 2 11 23.000 0.7692 0.2308 0.1169 3 10 70.000 0.6923 0.3077 0.1280 4 9 76.000 0.6154 0.3846 0.1349 5 8180.000 0.5385 0.4615 0.1383 6 7195.000 0.4615 0.5385 0.1383 7 6210.000 0.3846 0.6154 0.1349 8 5232.00

45、0 0.3077 0.6923 0.1280 9 4300.000 0.2308 0.7692 0.1169 10 3396.000 0.1538 0.8462 0.1001 11 2490.000*.11 1540.000*.11 0*Censored Observation,2023/5/22,50,Summary Statistics for Time Variable T Point 95%Confidence Interval Quantile Estimate Lower,Upper)75%300.000 195.000.50%195.000 70.000 300.000 25%7

46、0.000 18.000 195.000 Mean 192.692 Standard Error 40.963 Summary of the Number of Censored and Uncensored Values GROUP Total Failed Censored%Censored 1 12 9 3 25.0000 2 13 11 2 15.3846 Total 25 20 5 20.0000,2023/5/22,51,SDF|1.0+*AB|S|u|A*-Ar|v|BB|i|AAv 0.8+|a|B-|Bl|AA|D|*Bi|s|B-Bt 0.6+|r|A-Ai|BB|b|A-

47、Au|t|B-B|i|A-Ao 0.4+|n|B-B|A-AF|B-B|u|n|Ac|B-Bt 0.2+|i|o|Bn|0.0+|+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-0 50 100 150 200 250 300 350 400 450 500 550 600 650 700 T,2023/5/22,52,Test of Equality over Strata Pr Test Chi-Square DF Chi-Square Log-Rank 时序检验 0.6640 1 0.4152 Wilcoxon 秩和检验 0.3272 1 0.5673-2Log(LR)似然比

48、检验 1.0362 1 0.3087,2023/5/22,53,例王洁贞主编医学统计学例14.1 P202手术疗法组：52 78 92 96 105 123 145 136*157*182*209*224*手术+化疗组：79 95 117 175 203 102*157*199*216*246*269,2023/5/22,54,data life2;do group=1 to 2;input n;do i=1 to n;input t;if t0 then censor=1;else censor=0;t=abs(t);output;end;end;cards;1252 78 92 96 1

49、05 123 145-136-157-182-209-2241179 95 117 175 203-102-157-199-216-246 269;,proc lifetest plots=(s)formchar(1,2,7)=|-+;time t*censor(1);strata group;run;,2023/5/22,55,大样本资料的寿命表法例2 王洁贞主编医学统计学例14.2 P206,2023/5/22,56,data life3;input t censor f g;/*t:月数的下限；censor:1=死亡，0=失访；f:人数；g:分组变量*/cards;0 1 8 1 0

50、0 0 1 7 1 5 1 7 0 1 113 1 4 1 13 0 0 119 1 2 1 19 0 0 1 7 1 4 2 7 0 4 213 1 2 2 13 0 2 219 1 2 2 19 0 3 225 1 3 2 25 0 2 231 1 1 2 31 0 4 237 1 0 2 37 0 1 2;,proc lifetest method=Lt width=6 plots=(s)formchar(1,2,7)=|-+;time t*censor(0);strata g;freq f;run;,2023/5/22,57,The LIFETEST Procedure Life Ta

展开阅读全文