统计分析系统sa.ppt

上传人:牧羊曲112 文档编号:6332740 上传时间:2023-10-17 格式:PPT 页数:53 大小:784KB
返回 下载 相关 举报
统计分析系统sa.ppt_第1页
第1页 / 共53页
统计分析系统sa.ppt_第2页
第2页 / 共53页
统计分析系统sa.ppt_第3页
第3页 / 共53页
统计分析系统sa.ppt_第4页
第4页 / 共53页
统计分析系统sa.ppt_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《统计分析系统sa.ppt》由会员分享,可在线阅读,更多相关《统计分析系统sa.ppt(53页珍藏版)》请在三一办公上搜索。

1、第2讲数据集的建立,计算中心,计算中心,SAS数据集,已有的SAS数据集,数据直接输入,其他文件格式,SAS数据分析模块,流行的数据库,SAS应用程序,数据集,计算中心,逻辑库和SAS文件,SAS对数据的分析是面对SAS数据集进行的;SAS数据集是一种SAS文件SAS文件:SAS系统创建和管理的有特殊结构的文件SAS数据集(类型为Table),SAS数据窗口(类型为View)SAS目录(类型为Catalog)等.SAS文件存储在SAS逻辑库中,计算中心,SAS逻辑库的文件用两级命名方式逻辑库名.文件名SAS每次启动时会自动指定5个逻辑库Work,Sasuser,Sashelp,gismaps,

2、mapsSasuser库保存与用户个人设置有关的文件Sashelp库保存与SAS帮助系统、例子有关的文件。SAS逻辑库临时库:名为WORK,系统自动指定永久库:可由用户定义,逻辑库和SAS文件,计算中心,用户自定义SAS逻辑库交互方式命令方式Libname 逻辑库名 SAS文件的存储目录;,逻辑库和SAS文件,逻辑库和SAS文件,Libname aa“e:sasdata”;Data aa.class;.,计算中心,Sas中数据集aa.Class,Windows下文件Class.sas7bdat,定义一逻辑库aa新建一数据集class.,计算中心,逻辑库和SAS文件,用资源管理(浏览)器查看逻辑

3、库进入浏览器窗口即可查看SAS文件库的属性和内容库名处点鼠标右键选属性可显示该库属性,计算中心,SAS的名字 SAS的名字(数据集名、变量名、逻辑库名等等)有以下命名规则:1)由英文字母、数字、下划线组成;2)第一个字符必须是字母或下划线;3)不区分大、小写字母。另外,SAS逻辑库名最多用8个字符;数据集和变量的名字最多用32个字符。,逻辑库和SAS文件,计算中心,SAS数据集(1)描述部分 包含该数据集的一般信息,包括:数据集的名字及其成员类型、数据集建立的日期和时间、观测的数目、变量的数目以及数据集中每一个变量的特征信息,包括:Name(变量名)、Type(类型)、Length(长度)、F

4、ormat(输出格式)、Informat(输入格式)、Label(标签)。(2)数据部分,逻辑库和SAS文件,计算中心,SAS数据集的建立数据来源及相应方法,数据存于纸上需直接键入,数据存于文本文件,数据存于流行数据库文件中,计算中心,用VIEWTABLE窗口建立数据集,(1)创建数据集单击“工具/表编辑器”单击表头顶端单元格,输入变量名在变量名下方单元格中输入数据变量类型的定义:右击变量名/column attributes,计算中心,用VIEWTABLE窗口建立数据集,数据集中变量的属性变量名(Name):字母或下划线开始且不超过32个(V6为8)个字符、数字或下划线构成类型(Type):

5、数值型、字符型($)长度(Length):缺省8字节(32767)标签(Label):256字节输入格式(Informat):输入格式名w.d输出格式(Format):输出格式名w.d,计算中心,用VIEWTABLE窗口建立数据集,输入输出格式,7.2comma9.2dollar10.2,输入数据,输入格式,实际存储 数据值12234.12,输出格式,8.2comma9.2dollar10.2,输出数据,12234.1212,234.12$12,234.12,122341212,234.1234$12,234.1234,计算中心,(2)保存数据集单击文件/保存或另存为选一个库名定义数据集名(3

6、)打开已有数据集工具/表编辑器文件/打开,计算中心,用SAS INSIGHT创建数据集,SAS/INSIGHT是一个交互式的数据探索和分析工具,它提供了所有的常用统计分析方法。用这一软件可以通过多窗口连动的图象和分析结果对数据进行探索,分析单变量分布,用相关和主成分研究多变量间的关系,用方差分析和回归分析说明、拟合变量间关系的模型。SAS/INSIGHT也可以创建和编辑数据集,计算中心,用SAS INSIGHT创建数据集,单击菜单“解答/分析/交互数据分析”启动SAS INSIGHT模块 在弹出的“SAS INSIGHT:Open”对话框的Library列表框中选定库逻辑名 单击New按钮 首

7、先在行列交汇处的数据区输入数据值(如下所示),数据的变量名在缺省情况下分别用A,B,C等命名。变量的类型(数值型(Interval)和字符型(Nominal)也显示在数据表的变量上方。,计算中心,用SAS INSIGHT创建数据集,用鼠标单击在数据表左上角的三角形按钮 系统弹出对数据表进行编辑 的快捷菜单 Find Next:翻卷数据窗口到下一个被选择观测。若没有被选中的观测值,则翻卷一个观测值。Move to First:将选中的观测或变量分别移至数据窗口的第一行或第一列。Sort:根据一个或几个变量对观测排序。New Observations:插入空行,以便输入新观测值。New Varia

8、bles:加入空间,以便输入新变量。,计算中心,用SAS INSIGHT创建数据集,Define Variable:重新定义变量 File Values:修改该数据窗口的数据值,可生成常数或以常数为增量的变量值。Extract:从已存在的数据窗口抽取数据子集来生成新的数据窗口。Data Options:设置控制数据窗口外观和操纵的选项。单击菜单“File/Save/Data”,在弹出的对话框中选定库名并定义数据集名,计算中心,将文本格式的数据导入文件/导入数据/Select a data source from the list/Tab delimited file(数据间以制表符分隔)/ne

9、xtWhere is the file/Browse/打开文本格式的文件/Options/选择数据所在的行/OK/next选择一个库名定义一个数据集名,用导入菜单,计算中心,将EXCEL格式的数据导入工具/表编辑器文件/导入数据/Select a data source from the list/Microsoft Excel 2000/nextWhere is the file/Browse/打开Excel格式的文件/Options/选择数据所在的工作表/OK/next选择一个库名定义一个数据集名,用SAS/ACCESS,计算中心,将SAS格式的数据导出到Excel工具/表编辑器文件/导出

10、数据/选择一个库名选择一个要导出的SAS数据集选择导出数据的格式Where do you want to save the file/Browse/保存Excel格式的文件/Next/Finish,用SAS/ACCESS,计算中心,SAS语言,数据步DATA步,过程步PROC步,原始数据,SAS表,SAS表,报告,数据步常用于创建数据集,过程步常用于处理数据集(生成报表、图形和实现数据分析功能),如proc print,计算中心,数据步与过程步SAS程序包括多个步骤和一些控制语句,一般情况下由两种类型的程序步(steps)组成:数据步(DATA steps)和过程步(PROC steps)数据

11、步通常用于创建SAS数据集,但也可以用于产生特别设计的报表。过程步通常用于分析和处理SAS数据集中的数据,但有时候也可用于创建数据集。,SAS程序概述,计算中心,用SAS程序建立数据集,程序的基本结构DATA 数据集名;INPUT 变量名表;其他数据步语句;CARDS;若干数据行RUN;,武汉大学计算中心,LOGO,1.临时数据集的建立,例1创建一临时数据集class1DATA CLASS1;INPUT NAME$AGE gender$H W B;CARDS;刘明 3 男 0.94 13.59 50.4 蔡行 3 男 0.91 14.20 50.0 李敏 4 女 1.39 16.15 51.6

12、 李涛 4 男 1.02 15.44 51.9 夏天 4 男 1.06 15.30 51.0 郭红 5 女 1.01 15.04 51.9 胡月 5 女 1.02 15.07 52.7 程彬 6 女 1.07 17.04 53.7 杨兵 6 男 1.12 18.09 54.1 刘进 6 男 1.14 18.80 53.5 王苗苗 7 女 1.16 19.93 55.5 张思凡 7 女 1.15 18.20 51.4RUN;PROC PRINT;RUN;,武汉大学计算中心,LOGO,2.永久数据集的建立,例2创建一永久数据集classbLIBNAME aa“e:sasdata;DATA aa.C

13、LASSB;INPUT NAME$AGE gender$H W B;CARDS;刘明 3 男 0.94 13.59 50.4 蔡行 3 男 0.91 14.20 50.0 李涛 4 男 1.02 15.44 51.9 夏天 4 男 1.06 15.30 51.0 杨兵 6 男 1.12 18.09 54.1 刘进 6 男 1.14 18.80 53.5RUN;PROC PRINT;RUN;,武汉大学计算中心,LOGO,2.永久数据集的建立,例3退出SAS后,再次进入并读取永久数据集classbLIBNAME BB D:aaa;PROC PRINT DATA=BB.CLASSB;RUN;,计算中

14、心,数据步的工作流程,数据步开始,有未读入的观测值吗?,用数据读入语句读入一个观测值,用其它语句对观测值进行运算或处理,把当前的观测值写入数据集,数据集建立完毕,开始下一个数据步或过程步,Y,N,LIBNAME aa e:sasdata;DATA aaCLASS1;INPUT NAME$AGE gender$H W B;CARDS;刘明 3 男 0.94 13.59 50.4 蔡行 3 男 0.91 14.20 50.0 李敏 4 女 1.39 16.15 51.6 李涛 4 男 1.02 15.44 51.9 夏天 4 男 1.06 15.30 51.0 郭红 5 女 1.01 15.04

15、51.9 胡月 5 女 1.02 15.07 52.7 程彬 6 女 1.07 17.04 53.7 杨兵 6 男 1.12 18.09 54.1 刘进 6 男 1.14 18.80 53.5 王苗苗 7 女 1.16 19.93 55.5 张思凡 7 女 1.15 18.20 51.4RUN;,计算中心,数据步语句,SAS语言构成数据步 data 过程步 procSAS语句关键字开始,分号结束SAS表达式常量数字型 12,3.14159,1.5E-8字符型“Lin ming”日期型 15jul2007d日期时间型 15JUL200714:13:20DT缺失值数字型缺失值用句点表示,计算中心,

16、数据步语句,SAS表达式变量数字型字符型运算符算术运算符:+,-,*,/,*比较运算符号:=,=,=,=5 and sex=“女”,计算中心,数据步语句,DATA语句DATA 数据集名(选择项);表明数据步的开始,定义新数据集名常用选项:DROP=变量名表 KEEP=变量名表 RENAME=(老变量名=新变量名),计算中心,数据步语句,INPUT语句INPUT 变量$起始列-末列;INPUT 变量$SAS输入格式;读数据指针的使用行保持符或的使用,计算中心,数据步语句,注释语句/*sklfjsdkfjsdk slkdjfsldk*/赋值语句变量名=表达式;,武汉大学计算中心,LOGO,数据步语

17、句,IF语句IF 表达式;仅对符合条件的观测值处理或IF 表达式 THEN 语句1;ELSE 语句2;如果THEN后有多句 THEN DO;语句序列1 END;,武汉大学计算中心,LOGO,数据步语句,简单DO语句DO;若干SAS语句END;,武汉大学计算中心,LOGO,数据步语句,循环DO语句DO 变量=初值 TO 终值 BY 增量 while|untill(表达式);END;例DO I=1 TO 8 BY 2;DO I=2 TO 16 BY 2 UNTIL(X/2)Y);DO I=1 TO 10 WHILE(XY);,武汉大学计算中心,LOGO,数据步语句,DO WHILE 语句DO wh

18、ile(表达式);END;例N=0;DO WHUILE(N5);X=N;N=N+1;END;,武汉大学计算中心,LOGO,数据步语句,DO UNTIL 语句DO UNTIL(表达式);END;例N=0;DO UNTIL(N=5);X=N;N=N+1;END;,武汉大学计算中心,LOGO,数据步语句,OUTPUT语句OUTPUT 数据集名;把当前的观测值写入正在建立的数据集中例Libname aa e:sasdata;Data aa.classb aa.classg;Set aa.class1;If gender=男 then output aa.classb;Else output aa.cl

19、assg;Run;,计算中心,数据步语句,Infile语句指明存放数据的文本文件,Input语句将从这个文件中读数据,程序中不再出现Cards语句和原始数据。该文件中只保存一行行的原始数据(不包括Cards;语句和数据最后的分号)。语句格式:Infile“”;说明:Infile语句要放在Input语句前,数据文件路径要与文件实际存储路径一致。,计算中心,数据步语句,例将一外部数据文件(e:sasdatadata1.txt)转换为SAS数据集(数据之间空格分隔,且无变量行)Libname AA e:sasdata;Data aa.data2;Infile e:sasdatadata1.txt;I

20、nput name$age gender$;File print;Put name$age sex$;Run;,计算中心,数据步语句,Set语句作用:纵向复制或连接数据集。语句格式:Set;说明Set语句从一个已存在的数据集中依次读取每一个观测,可进行相应处理,然后依次写入新建的数据集。,计算中心,数据步语句,例:DATA SCORE1;INPUT NUM S1-S3;CARDS;1001 78 89 92 1002 87 92 97 1003 64 74 88;DATA TOT;SET SCORE1;TOTAL=SUM(OF S1-S3);PROC PRINT;RUN;,计算中心,数据步语句

21、,Merge语句作用:横向复制或连接数据集。语句格式:Merge;,计算中心,数据步语句,删除和保留变量语句语句格式:Drop;删除变量Keep;保留变量说明虽然Drop语句指明的变量不写入建立的数据集中,但是这些变量可在该数据步的所有编程语句中使用。在 Data步中,Drop语句位于任何地方所产生的效果都相同(必须位于Data语句之后与Cards语句之前)。Drop和Keep作用相反,不能在数据步中同时使用,计算中心,数据步语句,例:DATA PARTS;INPUT NAME$S1 S2;TOTAL=S1+S2;DROP S1 S2;CARDS;zhanglin 78 89 wangqian

22、g 95 87;Proc print;Run;,计算中心,数据步语句,Length语句指明字符变量长度。语句格式Length;例:DATA A;LENGTH NAME$13;INPUT NAME SEX$H W;CARDS;ZhangZhihui F 1.70 52 ZhaoChangtai M 1.73 55;注意由于NAME变量已在LENGTH语句中定义为字符型量,故INPUT语句中可以不再用$号作定义。,计算中心,数据步语句,Label 语句当数据集输出(打印)时,用标号字符代替变量名,使对变量名称的描述更加详细。语句格式Label=;注意为使标号有效输出,需在Print过程语句中加La

23、bel选项。例:Data a;Input num$gender$h w;Label h=身高 w=体重;Cards;101 M 1.72 61;Proc print Label;Run;,计算中心,数据步语句,FILE语句FILE 文件说明;定义一个外部文件作为当前的输出文件,以供PUT语句将数据输出到该文件中去File 全路径文件名;将PUT语句的输出写入指定文件File log;指定把put语句的输出送到日志窗口File print;把put语句的输出送到输出结果窗口,计算中心,数据步语句,PUT语句PUT 指定列 变量$起始列-末列;将数据输出到FILE指定处或LOG窗口其中,指定列 将

24、指针移到指定列;指针保持在当前行例读一数据集并将其转换为外部文件Libname AA“e:sasdata”;Data abc;Set aa.class1;File“e:sasdataclass.txt”;Put name$age gender$h w b;Run;,计算中心,作业,1、下列数据为两个不同地区居民家庭收入和支出情况的抽样调查(单位:元),试分别统计收入和支出情况。将表中数据通过Excel导入到SAS数据集MyDATA中,4个变量名分别为:ID、R_ID、Income和Outgo,相应的标签名为家庭编号、地区编号、家庭总收入和家庭总支出。上传EXCEL格式的数据文件和数据集MYDATA到你的网络磁盘。,计算中心,家庭收支情况,计算中心,谢谢!,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号