SAS过程及常用统计分析.ppt

上传人:牧羊曲112 文档编号:5576147 上传时间:2023-07-29 格式:PPT 页数:34 大小:1.06MB
返回 下载 相关 举报
SAS过程及常用统计分析.ppt_第1页
第1页 / 共34页
SAS过程及常用统计分析.ppt_第2页
第2页 / 共34页
SAS过程及常用统计分析.ppt_第3页
第3页 / 共34页
SAS过程及常用统计分析.ppt_第4页
第4页 / 共34页
SAS过程及常用统计分析.ppt_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《SAS过程及常用统计分析.ppt》由会员分享,可在线阅读,更多相关《SAS过程及常用统计分析.ppt(34页珍藏版)》请在三一办公上搜索。

1、3.3 简单描述统计分析,简单描述统计量的基本概念总体(Population):一个统计问题所研究对象的全体。样体(Sample):从总体中抽取一定数量的个体进行研究,这部分个体称做样本。随机抽样(Random Sample):从总体中随机抽取样本,使每个个体都有同等的机会进入样本的抽样方法称为随机抽样。(样本推断总体),N:样本数量。统计学中,N30称为大样本。均值(MEAN)中位数(Median)众数(Mode)分位数(Quantiles):是对分布的详细研究,包括百分位数、四分位数及中值。Max&Min,定位测量,全距(Range):样本中最大值和最小值之差标准差(std dev):测量

2、值对于均值的离散程度方差(var)均值标准误(STDERR)变异系数(CV)自由度(df),离散程度测量,偏度(SKewness):描述测量量是否对称地分布在中心的两侧。正(右)偏态,SK0;负(左)偏态SK0峰度(kurtosis):反映单峰分布,K作为偏离正态分布的尺度;K=0正态分布.注意:一般用于大样本。置信区间(LCL,UCL)相关系数(correlation):r,形状测量,3.3.2 MEANS 过程,输出结果中统计量的命名方法:MEAN=X1-X3;MEAN=MEANX1 MEANX2 MEANX3;MEAN(X2)=MEANX2;说明:关键词后的变量名在输出文件中代表VAR变

3、量的统计量值,所以他们与变量的顺序是一一对应的。,MEANS过程应用,Data new;*建立数据集 Input y;*输入变量,变量名为yCards;*数据块开始数据块;*数据块结束Proc means n mean std var cv;*调用means过程并计算相应的统计数Var y;*对变量y进行分析Run;*程序运行,3.3.3 UNIVARIATE 过程,1.UNIVARIATE过程简介 UNIVARIATE过程除了可以完成与MEANS过程相同的基本统计量外,还可以计算变量的极端值、分位数,生成频率表,并支持对数据进行正态性检验。UNIVARIATE与MEANS过程不同的功能包括:

4、描述变量极端值的情况。计算分位数,如中位数,1/4和3/4分位数。生成若干个描述变量分布的图。生成频率表。对数据进行正态性检验。,UNIVARIATE过程,UNIVARIATE过程常用的选项,Proc univariate语句的选项NOPRINT 禁止统计报告在OUTPUT视窗中输出 PLOT 绘出茎叶图、箱式图和正态概率图 FREQ 产生频数和累积频数分布表 NORMAL 对变量进行正态性检验,UNIVARIATE过程,SAS中用关键字来指定所需要的统计量,事实上结果输出中用的就是各种关键字,常用的关键字有:基本统计量 N MEAN STD(标准误)CV SUM VAR(方差)RANGE 百

5、分位数描述 MIN P1 P5 P10 Q1 MEDIAN Q3 P90 P95 P99 MAX 与假设检验有关的统计量 STDERR(标准误)T(实例讲解),例 已知患者中钙、磷和葡萄糖含量,存于blood.txt中,试用UNIVERIATE过程对其中血磷进行统计描述。程序:Libname chap3 d:mysaschap3;data chap3.blood;infile:sasdtblood.txt;input number calcium phosphrs glucose;PROC UNIVARIATE DATA=chap3.BLOOD PLOT NORMAL FREQ;VAR PHO

6、SPHRS;RUN;,结果:,结果:,结果:,3.3.4 FREQ 过程(频数过程),例 下数据为进行两因素两水平试验所得,每次测得活细胞数目为number。试生成列联表。程序:data freq3_2;input x y number;cards;1 1 12 1 2 15 2 1 9 2 2 12;proc freq data=freq3_2;weight number;tables x*y;run;,5.WEIGHT语句统计计算中我们统称假设每条观测记录对频数计算的贡献为 1,使用WEIGHT语句可以定义每个观测值出现的频数为这个观测对应的权重(权重不能为负)。6.BY语句对由BY变量定

7、义的几组观测分别进行分析。但要求先按BY变量排序。,频数表的编制(习题),FREQ过程步例 某地随机抽取正常成年男子120名,其红细胞数如下,试作该批样本的频数表。5.12 5.13 4.58 4.31 4.09 4.41 4.33 4.58 4.24 5.45 4.32 4.844.91 5.14 5.25 4.89 4.79 4.90 5.09 4.04 5.14 5.46 4.66 4.204.21 3.73 5.17 5.79 5.46 4.49 4.85 5.28 4.78 4.32 4.94 5.214.68 5.09 4.68 4.91 5.13 5.26 3.84 4.17 4

8、.56 3.52 6.00 4.054.92 4.87 4.28 4.46 5.03 5.69 5.25 4.56 5.53 4.58 4.86 4.974.70 4.28 4.37 5.33 4.78 4.75 5.39 5.27 4.89 6.18 4.13 5.224.44 4.13 4.43 4.02 5.86 5.12 5.36 3.86 4.68 5.48 5.31 4.534.83 4.11 3.29 4.18 4.13 4.06 3.42 4.68 4.52 5.19 3.70 5.514.64 4.92 4.93 4.90 3.92 5.04 4.70 4.54 3.95 4

9、.40 4.31 3.774.16 4.58 5.35 3.71 5.27 4.52 5.21 4.37 4.80 4.75 3.86 5.69,已知均值比较的t检验例1 药厂制剂车间用自动装瓶机封装药液,在装瓶机正常工作时,每瓶药液净重500克。某日随机抽取了10瓶成品,称重为:504,498,487,496,509,476,482,510,469,472.问此时装瓶机工作是否正常?,MEANS过程执行t检验,配对比较的t检验例2 研究食物中维生素E与肝脏中维生素A含量的关系。将大白鼠按性别、体重配对。每对随机分配,一个正常饲料,一个用缺乏维生素E的饲料。经过一个时期饲养,杀死动物测定肝中维

10、生素A的含量,结果下表。试分析,MEANS过程执行t检验,使用带有下列语句的proc chart过程来绘制各种图表(1)垂直条形图(Vbar语句);(2)水平条形图(Hbar语句);(3)立体直方图(Block语句);(4)饼图(pie语句);(5)星图(star语句),补:CHART过程,例:职工基本情况表姓名 性别 职称 年龄 姓名 性别 职称 年龄Zhouli M P 50 Liping F AP 47 Wangfang F L 8 Yuhong F AP 40 Liulijun M L 30 Leiming M AP 32 Liuming M AP 36Yuke F AP 48Liul

11、ing M L 37Zhulin M P 44Liqing F AP 42 Wangfang F L 25Fangjin M L 26试绘制上表按照性别的图表,程序:DATA employee;INPUT name$sex$title$age;DATALINES;Zhouli M P 50 Yuke F AP 48 Liping F AP 47 Liuling M L 37 Wangfang F L 28 Zhulin M P 44Yuhong F AP 40 Liqing F AP 42 Liulijun M L 30Wangfang F L 25 Leiming M AP 32 Fangjin M L 26Liuming M AP 36;options ps=30 ls=80;PROC CHART DATA=employee;VBAR sex;HBAR sex;VBAR sex/group title;RUN;,结果:,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号