《SAS统计分析软件应用.ppt》由会员分享,可在线阅读,更多相关《SAS统计分析软件应用.ppt(128页珍藏版)》请在三一办公上搜索。
1、1,SAS 统计分析系统Statistical Analysis System,宁夏医科大学公共卫生学院流行病与卫生统计学系李吴萍 2011.5,2,第一节 SAS软件简介,1966年美国North Carolina州立大学的两位生物统计学研究生开始研制SAS系统,直至1976年成立了SAS软件研究所,正式推出了SAS软件,1985年推出微机版SAS。SAS是用于决策支持的大型集成信息系统,软件系统最早的功能限于统计分析,逐渐成为一个用来管理、分析数据和编写报告的大型集成应用软件系统,具有完备的数据访问、管理、分析、呈现及应用开发等功能,完全超出了单纯统计应用的功能。属于世界领先,使用最为广泛
2、的统计软件之一。,3,由于SAS系统是从大型机上的系统发展而来,在设计上也是完全针对专业用户进行设计,因此操作以SAS语言编程为主,另外也有非编程方式的菜单系统,但人机对话的界面不太友好。学习SAS软件时,需要用户有基本的统计学知识,对所选用的统计方法有较清楚的了解,没有统计学基础知识要掌握SAS软件较为困难。,4,SAS系统是一个模块化的组合软件系统,它提供了约20多个模块,各个模块之间既相互独立又相互交融补充。本课程用得最多的是Base SAS模块和SAS/STAT模块。Base SAS是SAS系统的基础。它既可以单独使用,也可以与其他模块组成一个用户化的SAS系统,但是其他模块必须与之结
3、合起来才能使用。Base SAS主要承担着数据及用户使用环境的管理、SAS语言程序的处理,并具有基本的数据分析和报告等统计功能。,5,SAS/STAT提供了当今流行的主要统计分析方法,是国际上统计分析领域的标准权威软件。它具有回归分析、方差分析、属性数据分析、多元分析、聚类分析、判别分析、非参数分析、生存分析和心理测量分析等统计功能。,6,第二节 SAS软件的使用基础,一、SAS的启动和退出 启动SAS双击桌面SAS图标开始菜单 程序 The Sas System The Sas System for Windows V*.*直接双击SAS应用程序退出SAS标题栏关闭按钮菜单栏 File Ex
4、it,7,标题栏、菜单栏、工具栏Editor 程序编辑器窗口LOG 运行过程日志窗口Output 结果输出窗口Explorer 资源管理器窗口Results 结果索引窗口,二、SAS的工作窗口,SAS常用功能键,8,第二节 SAS软件的使用基础,9,Editor窗口 主要用于打开SAS程序文件(*.sas)、编辑和修改SAS程序、并提交全部或部分SAS程序。LOG窗口显示有关的SAS会话和提交SAS程序的信息,包括程序的出错信息等(*.log)Output窗口 主要显示提交SAS程序后的运行结果(*.lst)Explorer窗口 主要用于查看和管理所有SAS文件,而且可以对非SAS文件创建快捷
5、方式。Results 窗口 主要用于操作和管理提交SAS程序后的输出结果。他的内容与Output窗口的内容一一对应,可以看成是Output窗口内容的名称。,二、SAS的工作窗口,10,第三节 SAS语言的语句和程序,一、SAS 语句 一个SAS语句就是要求SAS系统执行某种操作或给SAS系统提供一些信息的命令。SAS语句通常由SAS关键字、SAS名称、运算符及特殊字符组成。规则:(1)以;结尾(2)以SAS关键字开始。如:data,proc,input,cards,model,class,if,keep,set,run,11,第三节 SAS语言的语句和程序,一、SAS 语句(3)注释语句可以用
6、*开始,或者用/*/表示中间内容是注释语句。例1.1Data sas1_1;/*sas1_1是数据集名*/Input id name$height weight;Bmi=weight/height*2;Cards;/*数据流开始*/1 judy 1.56 45 2 lucy 1.67 53 3 lili 1.58 50;/*数据流结束*/Proc print data=sas1_1;Run;,12,第三节 SAS语言的语句和程序,一、SAS 语句 1.SAS关键字 几乎所有的SAS语句都是由SAS关键字开始的,说明SAS语句的类型。data语句,input语句,proc语句,run语句2.SA
7、S数据集名和变量名(1)32个字符之内,(2)第一个字母必须为字母或_;第二个以后可以为字母或数字。(3)字母不区分大小写。(4)不能使用空格和%¥#$等特殊字符,13,第三节 SAS语言的语句和程序,一、SAS 语句 3.SAS运算符 包括比较运算、算术运算、逻辑运算(1)算数运算符+-*/*(2)比较运算符=2 and y3 or/|逻辑或 x2 or y3Not/逻辑非 最大 35;结果为55;结果为3|连接 A=my name is;B=SAS;C=A|B;那么C=“my name is SAS”,14,第三节 SAS语言的语句和程序,一、SAS 语句 4.SAS函数 函数的一般形式:
8、函数名(自变量,自变量,)(1)SAS常用的概率和密度函数标准正态分布密度函数:probnorm(x)如:y=probnorm(-1.96);结果为0.025t分布密度函数:probt(x,df)如:y1=probt(0.95,100);结果为0.82780F分布密度函数:probF(x,df1,df2)2分布密度函数:probCHI(x,df)二项分布概率函数:probBNML(p,n,m)泊松分布概率函数:poisson(m,n),15,第三节 SAS语言的语句和程序,正态分布分位数函数:probit(p)0p1 如:y=probit(0.025),结果为-1.96t分布分位数函数:TIN
9、V(p,df)F分布分位数函数:FINV(p,df1,df2)2分布分位数函数:CINV(p,df)其它常用函数ABS(x)-取X的绝对值SQRT(x)-计算X的平方根MOD(x,y)-求x/y的余数,16,第三节 SAS语言的语句和程序,EXP(x)-计算e的x次幂LOG(x)-对自变量x求以e为底的自然对数LOG10(x)-对自变量x求以10为底的对数CEIL(x)-取自变量x的最小整数。如CEIL(5.7)=6FLOOR(x)-取自变量x的最大整数。如CEIL(5.7)=5INT(x)-取X的整数部分ROUND(x,n)-X按n的精度取舍入值,17,第三节 SAS语言的语句和程序,dat
10、a sas1_2;y1=probnorm(-1.96);/*标准正态分布密度函数*/y2=probt(0.95,100);/*t分布密度函数*/y3=probit(0.025);/*正态分布分位数函数*/x1=log10(100);/*对自变量x求以10为底的对数*/x2=exp(2);/*计算e的x次幂*/x3=CEIL(5.7);/*取自变量x的最小整数*/x4=ABS(-8);/*取X的绝对值*/x5=SQRT(36);/*计算X的平方根*/x6=MOD(10,3);/*求x/y的余数*/x7=FLOOR(5.7);/*取自变量x的最大整数*/x8=INT(5.6874);/*取X的整数
11、部分*/x9=ROUND(5.4874,0.001);/*X按n的精度取舍入值*/A=my name is;B=SAS;C=A|B;proc print data=sas1_2;run;,18,第三节 SAS语言的语句和程序,二、SAS 程序 将一系列SAS语句按逻辑顺序排列起来,构成SAS程序。通常包括数据步和过程步两部分。数据步以data语句开头,以run语句结束。主要作用是建立数据集。过程步以proc开头,以run语句结束。主要作用是激活SAS过程对数据进行处理和分析。提交SAS程序:(1)工具栏提交图标,(2)run/submit,(3)使用F3功能键,19,第三节 SAS语言的语句和
12、程序,二、SAS 程序 程序的储存:(1)键入“file 路径+文件名.扩展名”如:file d:usersas1-1.sas;(2)“文件”菜单“保存”程序的调用:(1)键入infile路径+文件名+扩展名 如:infile d:usersas1-1.sas;(2)“文件”菜单“打开”,20,第三节 SAS语言的语句和程序,例1.3 SAS程序举例data sas1_3;/*创建名为sas1_3的SAS数据集*/Input id nam$height weight;bmi=weight/height*2;cards;1 Judy 1.56 45/*数据流中每个数据值之间最少有1各空格*/2
13、Lucy 1.67 53;run;/*数据步结束*/proc print data=sas1_3;/*显示输出sas1_3数据集到output窗口*/run;/*过程步结束*/,21,第二章 建立SAS数据集,第一节 SAS数据集概述一、SAS数据集基本格式,SAS数据集可以看做由若干行和若干列组成的表格,一个数据集等价于关系型数据库中的一个表。,变量,观测,变量有两种类型:数值型变量 字符型变量,22,第二章 建立SAS数据集,第一节 SAS数据集概述一、SAS数据集基本格式,例2_1 缺失值的例子,Data sas2_1;Input id name$height weight;If nam
14、e=999 then name=.;If weight=999 then weight=.;Cards;1 Judy 156 999 2 Lucy 167 58 3 999 165 55 4 Tomy 178 62;Proc print data=sas2_1;run;,23,第二章 建立SAS数据集,二、临时SAS数据集和永久SAS数据集,临时数据集只能在SAS会话过程中创建使用,一旦退出SAS,数据集就不存在了。在Explorer窗口中可以看到一个名为work的SAS数据库,主要存放SAS临时数据集。创建时可以用两水平命名方式:如work.数据集名,也可以用一水平的命名方式:如数据集名。,
15、24,二、临时SAS数据集和永久SAS数据集,永久性数据集储存在硬盘里,因此,在以后的每一次SAS会话中都可以在打开。在创建和使用SAS永久性数据集之前,需要先建立一个SAS数据库来制定永久数据集存放的路径。一个SAS数据库相当于硬盘上的一个文件夹,可以将SAS数据集写入或读出。命名永久性数据集时必须用两水平的命名方式,即数据库名.数据集名,数据库名实际是一个SAS数据库的逻辑名。,第二章 建立SAS数据集,25,例2_2 SAS程序举例libname tj d:user;/*创建名为tj的sas数据库*/data tj.sas2_2;/*创建永久性数据集sas2_2,保存在d:user下*/
16、Input id name$height weight;bmi=weight/height*2;cards;1 Judy 1.56 45 2 Lucy 1.67 53;run;proc print data=tj.sas2_2;/*将保存在d:user的数据集sas2_2显示输出到output窗口*/run;,第二章 建立SAS数据集,26,第二章 建立SAS数据集,第二节 SAS数据集的建立一、用数据步创建SAS数据集创建SAS数据集最主要的方式是使用Base SAS中的数据步。一个SAS数据步由data语句开始,后面接着其他程序语句,通过从原始数据文件中读入数据或对已存在的SAS数据集进行
17、操作来建立新的SAS数据集。在SAS程序中,用户可以使用不同的来源输入数据。常用的数据输入来源包括:(1)原始数据以数据流的方式;(2)原始数据以外部文件的方式;(3)已经存在的SAS数据集;(4)通过程序语句来建立数据集。,27,1、从数据流中读入数据在SAS程序中,用cards语句定义数据流的开始。Input语句用于从数据流中读入数据。,28,例2.3 从数据流读入数据建立数据集data sas2_3;/*创建名为sas2_3的SAS数据集*/Input id name$height weight;/*从数据流中读入数据*/cards;1 Judy 156 45 2 Lucy 167 53
18、 3 Susan 165 55 4 tony 178 70;run;/*数据步结束*/proc print data=sas2_3;/*显示输出sas2_3数据集到output窗口*/run;/*过程步结束*/,29,2、从外部文件中读入数据Infile语句用来指定外部文件,通常外部文件并不是SAS文件。用input语句将外部文件中的数据读入SAS中建立SAS数据集。外部文件中的记录可以按一个变量一列的方式排列,也可以没用格式,不安列方式排列。,30,例2.4 从外部文件读入数据外部文本文件k:userstudent.txt1 Judy 1.56 45 2 Lucy 1.67 53 3 Sus
19、an 1.65 55 4 tony 1.78 70SAS程序:Data sas2_4;Infile d:userstudent.txt;/*指定外部文件*/Input id name$height weight;/*从外部文件中读取记录*/Run;Proc print data=sas2_4;Run;,31,3、从SAS数据集中读入数据用set语句可以从已有的SAS数据集中创建新的数据集。运行set语句,SAS会从已有的SAS数据集中读入观测,包括原始数据集中的所有变量,还可以在原数据集变量基础上创建新的变量。,32,例2.5 从已有的SAS数据集中读入数据Data sas2_5;set sa
20、s2_4;/*从已有的数据集sas2_4中读入数据*/Bmi=weight/height*2;/*生成一个新变量*/Run;Proc print data=sas2_5;Run;,33,例2.6 利用程序语句建立SAS数据集Data sas2_6;Do i=1 to 10;/*do与end语句之间的语句被重复执行10次*/Y=rannor(2008);/*产生来自标准正态分布的随机数*/Output;End;Proc print data=sas2_6;Run;,4、利用程序语句建立SAS数据集,34,SAS中Import/Export向导可用于将其他类型的文件,如Excel、Access、d
21、Base、文本文件等转为SAS数据集。在file菜单下点击import/export,按向导指示操作即可。,二、Import/Export向导创建SAS数据集,35,第三节 SAS数据集的修改,例2.7 按观测连接SAS数据集,female,male,需要连接的SAS数据集,一、SAS数据集的合并1、按观测连接SAS数据集,36,第三节 SAS数据集的修改,例2.7 连接SAS数据集的例子Data sas2_7;Set tj.female tj.male;Run;Proc print data=sas2_7;Run;,使用set语句可以将两个或多个数据集按观测连成一个大的数据集,这也是将新变量
22、追加已有数据集上的一种方式。,37,第三节 SAS数据集的修改,例2.8 一对一匹配合并SAS数据集,student1,student2,需要连接的SAS数据集,语句merge可以合并两个或多个数据集中的变量,这些数据集中的观测是一一对应的。,2、按变量合并SAS数据集,38,第三节 SAS数据集的修改,例2.8 按变量合并SAS数据集Data sas2_8;Merge student1 student2;Run;Proc print data=sas2_8;Run;,39,第三节 SAS数据集的修改,例2.9 利用程序语句建立SAS数据集,student3,student4,需要连接的SAS
23、数据集,如果需要合并的数据集中的观测并不是一一对应的关系,则需要用by语句指定各数据集中用于匹配观测的变量。(使用by语句之前,需要先对关键字段进行排序。,40,第三节 SAS语言的语句和程序,例2.9 按变量合并SAS数据集Proc sort data student3;by id;Proc sort data student4;by id;Data sas2_9;Merge student3 student4;Run;Proc print data=sas2_9;Run;,41,第三节 SAS语言的语句和程序,如果只想保留数据集中的部分观测,有两种方式建立哑集。第一种可以用if 条件语句告
24、诉SAS需要保留符合条件的观测;另一种用ifthan delete语句告诉SAS将不符合条件的观测删除。,二、建立SAS数据集的哑集,1、删除观测,42,第三节 SAS语言的语句和程序,例2.10 删除观测的例子,student,43,第三节 SAS语言的语句和程序,例2.10 程序1Data sas2_10;Set student;If sex=female;Run;Proc print data=sas2_10;Run;,44,第三节 SAS语言的语句和程序,例2.10 程序2Data sas2_10;Set student;If sex=female then delete;Run;Pr
25、oc print data=sas2_10;Run;,45,第三节 SAS语言的语句和程序,有时并不需要数据集中的所有变量,可以用drop或keep语句来删除或保留数据集中的变量,注意同一个数据步中drop和keep语句不能同时出现。,2、删除变量,46,第三节 SAS语言的语句和程序,例2.11 程序1Data sas2_11;Set student;Keep id name sex age;Run;Proc print data=sas2_11;Run;,删除变量的例子,仅保留数据集student中的部分变量(id,name,sex,age)。可以用下面两个SAS程序。,47,第三节 SA
26、S语言的语句和程序,例2.11 程序2Data sas2_11;Set student;Drop height weight;Run;Proc print data=sas2_11;Run;,48,例3.1 抽样调查某地120名1835岁健康男性居民血清铁含量(mol/L),数据如下。试编制此血清铁资料的频数分布表并描述该资料。,第三章 常用统计描述,7.42 8.65 23.02 21.61 21.31 21.46 9.97 22.73 14.94 20.18 21.6223.07 20.38 8.40 17.32 29.64 19.69 21.69 23.90 17.45 19.08 20
27、.52 24.14 23.77 18.36 23.04 24.22 24.13 21.53 11.09 18.89 18.26 23.29 17.67 15.38 18.61 14.27 17.40 22.55 17.55 16.10 17.98 20.13 21.00 14.56 19.89 19.82 17.48 14.89 18.37 19.50 17.08 18.12 26.02 11.34 13.81 10.25 15.94 15.83 18.54 24.52 19.26 26.13 16.99 18.89 18.46 20.87 17.51 13.12 11.75 17.40 21
28、.36 17.14 13.77 12.50 20.40 20.30 19.38 23.11 12.67 23.02 24.36 25.61 19.53 14.77 14.37 24.75 12.73 17.25 19.09 16.79 17.19 19.32 19.59 19.12 15.31 21.75 19.47 15.51 10.86 27.81 21.65 16.32 20.75 22.11 13.17 17.55 19.26 12.65 18.48 19.83 23.12 19.22 19.22 16.72 27.90 11.74 24.66 14.18 16.52,49,第三章 常
29、用统计描述,一、定量资料的统计描述1、定量资料的频数表先用MEANS过程找出最大值和最小值 MIN=7.42 MAX=29.64 RANGE=22.22确定组距(I=2)和第一组段的下限(L=7)然后建立新变量(x0),将变量X转化为该数据所在组段的下限值 赋值新的变量:x0=INT(X-L)/I)*I+L 或:x0=x-mod(x-L,I)或:x0=I*INT(x/I)+I/2用FREQ过程作频数表:proc freq;tables x0;Run;,50,第三章 常用统计描述,2、简单描述:MEANS过程 输出样本含量、均数、标准差、最小值、最大值(N、Mean、Std Dev、Minimu
30、m、Maximum)3、详细描述:UNIVARIATE过程输出更多指标:样本含量、均数、标准差、最小值、最大值、方差、标准误、中位数、四分位数间距、常用百分位数、众数、平方和、离均差平方和等,可以作正态性检验另外还显示原数据中的部分极端值,51,第三章 常用统计描述,PROC MEANS;CLASS SEX;VAR HEIGHT WEIGHT;RUN;CLASS 指定分组变量(可以不写)VAR 指定需要分析的变量(不写即分析全部变量)MAXDEC=n 指定计算结果保留小数位数(默认2位)可加的选项有:标准误(StdErr)、方差(Var)、总和(Sum)、平方和(USS)、离均差平方和(CSS
31、)、全距(Range)、变异系数(CV)、偏度系数(Skewness)、峰度系数(Kurtosis)、可信区间(CLM)等还可以计算总体均数=0的 t 检验(T、Prt)不加任何选项时,自动输出5项结果:N、Mean、Std Dev、Minimum、Maximum,52,第三章 常用统计描述,Data sas3_1;Input x;Gr=2;x0=gr*int(x/gr)+gr/2;/*计算组中值X0*/Cards;7.42 8.65 23.02 21.6124.66 14.18 16.52;proc freq data=sas3_1;Tables x0/out=iron;/*out=iron
32、表示输出变量为X0的一维频数分布表*/Proc univariate data=sas3_1;Var x;Histogram x/midpoints=7 to 29 by 2;/*组中值的取值范围从729,组距为2*/Run;Proc means data=sas3_1;Var x;Run;,53,第三章 常用统计描述,例3.2随机抽取15名学生,记录他们的性别(sex)、年龄(age)、体重(w,kg)、和身高(h,cm),求:(1)按性别分组分别计算学生们身高和体重的均数、标准差、变异系数、中位数和P50。(2)计算学生身高95%可信区间。要求结果保留小数点后3位。F 15 46 156
33、f 14 41 149 f 18 65 165 m 15 50 160 m 13 48 155 m 18 70 180 m 14 38 150 m 16 55 165 m 17 68 176 m 16 60 170 f 17 50 160 f 17 58 160 f 16 60 165 m 17 65 175 f 18 61 162,54,Data sas3_2;Input sex$age w h;Cards;f 15 46 156 f 14 41 149 f 18 65 165 m 15 50 160 m 13 48 155 m 18 70 180 m 14 38 150 m 16 55 1
34、65 m 17 68 176 m 16 60 170 f 17 50 160 f 17 58 160 f 16 60 165 m 17 65 175 f 18 61 162;Proc means data=sas3_2 mean std cv median p50 clm maxdec=3;/*选项maxdec指小数点后保留的位数*/Var h w;Class sex;Run;,55,第三章 常用统计描述,例3.3 对40名麻疹易感儿童接种麻疹疫苗一个月后,测得其血凝抑制抗体滴度如下,求其平均滴度。,56,Data sas3_3;/*计算几何均数*/Input f x;Y=log10(x);C
35、ards;1 4 5 8 6 16 2 32 7 64 10 128 4 256 5 512;Proc means noprint;/*选项noprint表示不打印程序运行结果*/Var y;Freq f;Output out=b mean=my;/*选项out=b和mean=my表示把该过程步运行所得均数叫my,并放入数据集b中*/Data c;Set b;mx=10*my;Proc print data=c;Var mx;Run;,57,二、定性资料统计描述,FREQ 过程 可以产生频数表和 n 维列联表PROC FREQ;TABLES A;RUN;TABLES 指定要分析的定性变量TAB
36、LES A 产生一维频数表TABLES A*B 产生二维列联表(A是行B是列)TABLES A*B*C 产生三维列联表(A是分层,B是行,C是列)TABLES A*(B C)产生A*B、A*C两个二维表TABLES X1-X3 产生X1、X2、X3三个一维表TABLES(X1-X4)*Y 产生X1*Y X2*Y X3*Y X4*Y四个二维表,第三章 常用统计描述,58,如描述以下三个定性变量(258人)A文化程度(1=文盲2=初中以下3=高中4=大学)B工作强度(1=轻 2=中 3=重)C月收入(1=300 2=300-3=500-4=1000-)DATA SAS3_4;INPUT A B C
37、;CARDS;3 2 3 4 1 4 4 1 3;PROC FREQ;TABLES A B C;PROC FREQ;TABLES A*B;PROC FREQ;TABLES A*B*C;PROC FREQ;TABLES A*(B C);RUN;,59,一维频数表 Cumulative Cumulative A Frequency Percent Frequency Percent 频数 构成比 累计频数 累计构成比 2 78 30.2 78 30.2 3 85 32.9 163 63.2 4 95 36.8 258 100.0,60,二维频数表 A=4Frequency|Percent|C Ro
38、w Pct|Col Pct|1|2|3|4|Total-+-+-+-+-+-+1|0|6|37|26|69B|0.00|6.32|38.95|27.37|72.63|0.00|8.70|53.62|37.68|.|75.00|67.27|81.25|-+-+-+-+-+-+2|0|2|18|6|26|0.00|2.11|18.95|6.32|27.37|0.00|7.69|69.23|23.08|.|25.00|32.73|18.75|-+-+-+-+-+-+Total 0 8 55 32 95 0.00 8.42 57.89 33.68 100.00,频数 构成比行构成比列构成比,61,一、
39、单样本的t检验,第四章 t 检验,例4-1 以往新生儿出生体重平均为3000g,某医院对产妇开展孕期保健指导后,测得15名新生儿出生体重如下,问开展孕期保健指导后对新生儿体重是否有影响?2800 3400 2900 2750 3000 3100 4600 3900 2350 3500 2600 3700 3800 2950 3200,62,一、单样本资料的t检验,第四章 t 检验,SAS常用于t检验的过程有:PROC UNIVARIATE过程PROC MEANS过程PROC TTEST过程(本章重点讲述),63,一、单样本资料的t检验,第四章 t 检验,DATA SAS4_1;INPUT X;
40、cards;2800 3400 2900 2750 3000 3100 4600 3900 2350 3500 2600 3700 3800 2950 3200;RUN;PROC univariate normal;VAR X;RUN;Proc ttest h0=3000;VAR X;RUN;,64,第四章 t 检验,例4-2 本例是有关儿童阅读能力测试的比较,数据来自Moore(1995,)的研究。数据包含了44名三年级儿童的阅读能力评分(DRP),具体见表。请问这些儿童阅读能力评分是否高于一般儿童的评分(30分)?,44名儿童阅读能力评分,65,第四章 t 检验,/*对频数分布资料的分析*
41、/Data sas4_2;Input x f;Cards;40 2 47 2 52 2 26 1 19 2 25 2 35 4 39 1 26 1 48 1 14 2 22 1 42 1 34 2 33 2 18 1 15 1 29 1 41 2 44 1 51 1 43 1 27 2 46 2 28 1 49 1 31 1 28 1 54 1 45 1;Run;PROC univariate normal;VAR X;Freq f;RUN;Proc ttest h0=30;VAR X;Freq f;RUN;,66,二、配对设计 t 检验,例4-3 为了比较新旧两个测声计的测定效果,随机选定1
42、0个场地,在每地同时用新旧两个测声计测量数据如下,问新旧两个测声计的测量结果是否不同?场地 1 2 3 4 5 6 7 8 9 10旧:87 65 74 95 65 55 63 88 61 54新:86 66 77 95 60 53 62 85 59 55,67,第四章 t 检验,Data sas4_3;Input x1 x2;D=x1-x2;Cards;87 86 65 66 74 77 95 95 65 60 55 53 63 62 88 85 61 59 54 55;Run;PROC univariate normal;VAR d;RUN;Proc ttest;Paired x1*x2;
43、RUN;Proc ttest h0=0;VAR d;RUN;,68,三、两独立样本资料的t检验,例4-4 试比较克山病人与健康人的血磷值(mmol/L)是否不同?克山病人 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11健康人 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87,69,两样本均数比较用TTEST过程(方式一),DATA sas4_4;INPUT X;IF _N_11 THEN G=2;ELSE G=1;CARDS;0.84 1.05 1.20
44、 1.20 1.39 1.53 1.67 1.80 1.87 2.072.11 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.341.35 1.48 1.56 1.87;PROC TTEST;CLASS G;VAR X;RUN;,70,两样本均数比较用TTEST过程(方式二),DATA sas4_4;INPUT X g;CARDS;0.84 1 1.05 1 1.20 1 1.20 1 1.39 1 1.53 1 1.67 1 1.80 1 1.87 1 2.07 1 2.11 1 0.54 2 0.64 2 0.64 2 0.75 2 0.76 2 0.
45、81 2 1.16 2 1.20 2 1.34 2 1.35 2 1.48 2 1.56 2 1.87 2;PROC TTEST;CLASS g;VAR X;RUN;,71,结果:,Statistics Lower CL Upper CL Lower CL Upper CLVariable G N Mean Mean Mean Std Dev Std Dev Std Dev Std ErrX 13 0.8295 1.0846 1.3397 0.3027 0.4221 0.6969 0.1171 1X 11 1.2375 1.5209 1.8043 0.2947 0.4218 0.7402 0.
46、1272 2X Diff(1-2)-0.795-0.436-0.078 0.3264 0.422 0.5973 0.1729 T-Tests Variable Method Variances DF t Value Pr|t|X Pooled Equal 22-2.52 0.0193 X Satterthwaite Unequal 21.4-2.52 0.0196 Equality of Variances Variable Method Num DF Den DF F Value Pr F X Folded F 12 10 1.00 1.0000,72,两大样本均数比较时,如只有均数标准差,
47、而无原始数据时,无法直接调用SAS软件中的某个过程进行分析,只能在数据步中按照计算公式编写程序完成。调查健康人群红细胞数(1012/L)资料如下:男性360人,均数466.02,标准差57.46;女性255人,均数417.80,标准差29.10。试比较男女红细胞数有无差别?,(方式三),73,DATA BB;INPUT N1 X1 S1 N2 X2 S2;SE=SQRT(S1*S1/N1+S2*S2/N2);U=ABS(X1-X2)/SE;P1=1-PROBNORM(U);P=2*P1;U=ROUND(U,0.001);P=ROUND(P,0.00001);IF P0.0001 THEN P=
48、0.0001;CARDS;360 466.02 57.46 255 417.80 29.10;RUN;proc print;var x1 x2 u p;run;,(方式三),74,SAS中常用PORC ANOVA过程和PORC GLM过程来完成方差分析。其中,ANOVA过程只能用于平衡设计资料的方差分析;对样本容量不等(非均衡)的数据资料做方差分析时,应采用GLM过程。应当说明的是,对样本容量相等的数据资料,用ANOVA过程作方差分析的效率和可靠性等方面,都优于GLM过程。对平衡数据用GLM过程处理和用ANOVA过程处理的结论是一致的。,第五章 方差分析,75,GLM是数据分析过程中功能最丰富
49、的一个过程她包括:简单回归(一元回归)加权回归多重回归及多元回归 多项式回归方差分析 偏相关分析协方差分析 多元方差分析反应面模型分析 重复测量方差分析,第五章 方差分析,76,例5-1 某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名高血脂患者,采用完全随机设计方法将患者等分为4组,进行双盲试验。6周后测得低密度脂蛋白作为实验结果,问4个处理组患者的低密度脂蛋白含量总体均数有无差别?,第五章 方差分析,一、完全随机设计资料的方差分析,(一)各组例数相等的完全随机设计资料的方差分析,77,data sas5_1;/*研究生二版ex4-2例题*/input x c;cards;
50、3.53 1 2.42 2 2.86 3 0.89 44.59 1 3.36 2 2.28 3 1.06 4;Proc univariate normal;var x;class c;proc glm;class c;model x=c;means c/snk;means c/hovtest;run;,第五章 方差分析,78,data sas5_1;/*研究生二版ex4-2例题*/do c=1 to 4;do j=1 to 30;input x;output;end;end;cards;3.53 2.42 2.86 0.894.59 3.36 2.28 1.06;Proc univariate