SAS数据分析范例.doc

上传人:laozhun 文档编号:2396006 上传时间:2023-02-17 格式:DOC 页数:257 大小:4.98MB
返回 下载 相关 举报
SAS数据分析范例.doc_第1页
第1页 / 共257页
SAS数据分析范例.doc_第2页
第2页 / 共257页
SAS数据分析范例.doc_第3页
第3页 / 共257页
SAS数据分析范例.doc_第4页
第4页 / 共257页
SAS数据分析范例.doc_第5页
第5页 / 共257页
点击查看更多>>
资源描述

《SAS数据分析范例.doc》由会员分享,可在线阅读,更多相关《SAS数据分析范例.doc(257页珍藏版)》请在三一办公上搜索。

1、SAS数据分析范例范金城 目录第1章 图形分析2范例1.1 国内生产总值及构成图形分析2范例1.2 国内生产总值图形分析7范例1.3 国家和地区人口资料图形分析(一)10范例1.4 国家和地区人口资料图形分析(二)13范例1.5 历年居民消费指数图形分析18第2章 描述性分析23范例2.1 盘碟、金属线数据描述性分析23范例2.2 血清总蛋白含量数据描述性分析27范例2.3 金属线数据描述性分析29范例2.4 皮带数据描述性分析33范例2.5 股票数据描述性分析39第3章 回归分析45范例3.1 历年国内生产总值回归分析45范例3.2 历年主要农产品产量回归分析50范例3.3 历年畜产品产量回

2、归分析57范例3.4 农、林、牧、渔业总产值二次响应面回归分析63范例3.5 历年国内生产总值二次响应面回归分析71第4章 方差分析与一般线性模型80范例4.1 Fisher的Iris数据方差分析80范例4.2 城市、城镇居民家庭基本情况方差分析88范例4.3 学生考试成绩二因素方差分析97范例4.4 修理工修理时间二因素方差分析102范例4.5 地区人口的一般线性模型108第5章 多变量过程115范例5.1 地区平均每人全年家庭收入主成分分析115范例5.2 地区人口主成分分析120范例5.3 历年主要农产品产量因子分析126范例5.4 盐泉水化学特征系数因子分析137范例5.5 Fishe

3、r的Iris数据的典型相关分析141第6章 聚类分析145范例6.1 人口按国家和地区聚类分析145范例6.2 主要农产品产量聚类分析148范例6.3 地区农、林、牧、渔总产值及指数聚类分析151范例6.4 各地区教育经费情况聚类分析156范例6.5 地区工业增加值和增长速度聚类分析158第7章 判别分析160范例7.1 人口按国家和地区判别分析160范例7.2 Fisher的Iris数据判别分析162范例7.3 国民经济生产总值判别分析167范例7.4 历年居民消费水平判别分析173范例7.5 地区农、林、牧、渔业总产值判别分析177第8章 时间序列预测182范例8.1 国内生产总值构成预测

4、182范例8.2 国际航班旅客数预测190范例8.3 加拿大山猫数据预测193范例8.4美国事故死亡数据预测197范例8.5 城乡居民储蓄存款年增加额数据预测206第9章 时间序列Arima模型213范例9.1 国内生产总值构成Arima模型213范例9.2 加拿大山猫数据Arima模型218范例9.3 美国月事故死亡数据Arima模型221范例9.4 城乡居民家庭人均收入Arima模型225范例9.5 历年国内生产总值Arima模型229第10章 自回归过程233范例10.1 历年国内生产总值自回归分析233范例10.2 商品零售额月数据自回归分析237范例10.3 教育经费情况自回归分析2

5、41范例10.4 居民消费水平自回归分析245范例10.5 人均主要农产品产量自回归分析248第1章 图形分析范例1.1 国内生产总值及构成图形分析SAS数据集d1是国内生产总值(单位:亿元)。x1是第一产业,x2是第二产业,x3是第三产业。SAS数据集d2是国内生产总值构成(单位: %)。x1是第一产业,x2是第二产业,x3是第三产业。对变量x1、x2、 x3,用Gchart过程分别画出水平条形图(Hbar)、垂直条形图(Vbar)、三维水平条形图(Hbar3d)、三维垂直条形图(Vbar3d)、饼形图(Pie)、三维饼形图(Pie3d)。%let d1=fjc.sczz;%let d2=f

6、jc.sczzgc;%macro gchart;%do i=1 %to 2;proc gchart data=&d&i;hbar x1 x2 x3;vbar x1 x2 x3;hbar3d x1 x2 x3;vbar3d x1 x2 x3;pie x1 x2 x3;pie3d x1 x2 x3;title c=blue h=7pct gchart &d&i;%end;%mend;%gchart;图1.1.1 d1变量x1的水平条形图图1.1.2 d1变量x2的水平条形图图1.1.3 d1变量x3的水平条形图图1.1.4 d1变量x1的垂直条形图图1.1.5 d1变量x1的三维水平条形图图1.1

7、.6 d1变量x2的垂直条形图图1.1.7 d1变量x3的饼形图图1.1.8 d1变量x2的三维饼形图范例1.2 国内生产总值图形分析SAS数据集d1是国内生产总值(单位:亿元) 。x1是第一产业,x2是第二产业,x3是第三产业。对变量x1、x2、x3,用Gchart过程画出三维垂直条形图(Vbar3d)。“vbar3d x1 x2 x3/type=freq inside=freq outside=cfreq;”表示三维垂直条形图类型为频数,内侧记频数,外侧记累积频数。 “vbar3d x1 x2 x3/type=percent inside=percent outside=cpercent;

8、”表示三维垂直条形图类型为百分比,内侧记百分比,外侧记累积百分比。“vbar3d x1/ sumvar=x1 type=sum inside=freq outside=cfreq;”表示三维垂直条形图类型为求和(对变量x1求和),内侧记频数,外侧记累积频数。%let d1=fjc.sczz;%macro gchart;%do i=1 %to 1;proc gchart data=&d&i;vbar3d x1 x2 x3/type=freq inside=freq outside=cfreq;vbar3d x1 x2 x3/type=percent inside=percent outside=

9、cpercent;vbar3d x1/ sumvar=x1 type=sum inside=freq outside=cfreq;vbar3d x2/ sumvar=x2 type=sum inside=freq outside=cfreq;vbar3d x3/ sumvar=x3 type=sum inside=freq outside=cfreq;title c=blue h=5pct &d&i;run;%end;%mend;%gchart;图1.2.1 d1变量x3的三维垂直条形图(频数类型)图1.2.2 d1变量x1的三维垂直条形图(百分比类型)图1.2.3 d1变量x2的三维垂直条形

10、图(求和类型)范例1.3 国家和地区人口资料图形分析(一)SAS数据集d1是74个国家和地区人口资料,Birth表示出生率,Death表示死亡率。SAS数据集d2程序分析97个国家和地区人口资料,Birth表示出生率,Death表示死亡率,Infantdeath表示婴儿死亡率。用Gchart过程进行图形分析。“vbar3d &c&i/type=freq inside=freq outside=cfreq;”表示三维垂直条形图类型为频数,内侧记频数,外侧记累积频数。 “hbar3d &c&i/type=percent;”表示三维水平条形图类型为百分比。“hbar3d birth/ sumvar=

11、birth type=sum;”表示三维水平条形图类型为求和(对变量birth求和)。“vbar3d birth/ sumvar=birth type=sum inside=freq outside=cfreq;”表示三维垂直条形图类型为求和(对变量birth求和),内侧记频数,外侧记累积频数。“autoref”表示自动加入与坐标轴相交的参照线。%let d1=fjc.modeclu4;%let d2=fjc.poverty;%let c1=birth death;%let c2=birth death infantdeath;%macro gchart;%do i=1 %to 2;proc

12、gchart data=&d&i;vbar3d &c&i/type=freq inside=freq outside=cfreq;hbar3d &c&i/type=percent;hbar3d birth/ sumvar=birth type=sum;vbar3d birth/ sumvar=birth type=sum inside=freq outside=cfreq;hbar3d &c&i/freq percent autoref;vbar3d &c&i/freq percent autoref;title c=green h=5pct &d&i;run;%end;%mend;%gcha

13、rt;图1.3.1 d1变量Birth的三维垂直条形图(频数类型)图1.3.2 d1变量Birth的三维水平条形图(百分比类型)图1.3.3 d1变量Birth的三维垂直条形图(求和类型)图1.3.4 d1变量Birth的三维水平条形图(频数类型,加参照线)图1.3.5 d1变量Birth的三维垂直条形图(频数类型,加参照线)范例1.4 国家和地区人口资料图形分析(二)SAS数据集d1是74个国家和地区人口资料,分为3类;SAS数据集d2是74个国家和地区人口资料,分为4类。Birth表示出生率,Death表示死亡率。用Gchart过程进行图形分析。Pattern是图形设定语句,如:“patt

14、ern1 v=s c=blue;”表示图形是实心、蓝色。Group是分组变量。“vbar &c&i/group=y patternid=group;”“vbar3d &c&i/group=y patternid=group;”表示垂直条形图与三维垂直条形图按y分组画,并按y分组上色。“hbar &c&i/subgroup=y freq;”“hbar3d &c&i/subgroup=y freq;”表示水平条形图与三维水平条形图按子组变量Subgroup=y连接成条形图,并按y分组上色。%let d1=fjc.bd3;%let d2=fjc.bd4;%let c1=birth death;%le

15、t c2=birth death;%macro gchart;%do i=1 %to 2;goptions reset=all;proc gchart data=&d&i;vbar &c&i/group=y patternid=group;hbar &c&i/group=y patternid=group;vbar3d &c&i/group=y patternid=group;hbar3d &c&i/group=y patternid=group;vbar &c&i/subgroup=y freq;hbar &c&i/subgroup=y freq;vbar3d &c&i/subgroup=y

16、 freq;hbar3d &c&i/subgroup=y freq;pattern1 v=s c=blue;pattern2 v=s c=red;pattern3 v=s c=green;pattern4 v=s c=yellow;title c=blue h=5pct &d&i;run;%end;%mend;%gchart;图1.4.1 d1变量Birth的分组垂直条形图(频数类型)图1.4.2 d1变量Death的分组水平条形图(频数类型)图1.4.3 d1变量Death的三维分组垂直条形图(频数类型)图1.4.4 d1变量Birth的三维分组水平条形图(频数类型)图1.4.5 d1变量B

17、irth的分组连接垂直条形图(频数类型)图1.4.6 d1变量Death的分组连接水平条形图(频数类型)图1.4.7 d1变量Birth的分组连接三维垂直条形图(频数类型)图1.4.8 d1变量Death的分组连接三维水平条形图(频数类型)范例1.5 历年居民消费指数图形分析SAS数据集是历年居民消费指数,x是全体居民消费指数,x1是城镇居民消费指数,x2是农村居民消费指数。SAS数据集d1原分为2类,SAS数据集d2原分为3类。Subgroup是子组变量。“vbar &c&i/subgroup=&b&i freq inside=freq outside=cfreq;”“vbar3d &c&i

18、/subgroup=&b&i freq inside=freq outside=cfreq;”表示垂直条形图与三维垂直条形图按子组变量Subgroup=y连接成条形图,并按y分组上色;每条内侧记频数,外侧记累积频数。“hbar &c&i/subgroup=&b&i percent;”“hbar3d &c&i/subgroup=&b&i percent;”表示水平条形图与三维水平条形图按子组变量Subgroup=y连接成条形图,并按y分组上色;每条记频数与百分比。“pie &c&i/subgroup=&b&i;”“pie3d &c&i/subgroup=&b&i;”表示饼形图与三维饼形图按子组变

19、量Subgroup=y画图,并按y分组上色。%let d1=fjc.jmxfzss;%let d2=fjc.jmxfzst;%let c1=x x1 x2;%let c2=x x1 x2;%let b1=y;%let b2=y;%macro gchart;%do i=1 %to 2;proc gchart data=&d&i;vbar &c&i/subgroup=&b&i freq inside=freq outside=cfreq;hbar &c&i/subgroup=&b&i percent;pie &c&i/subgroup=&b&i;vbar3d &c&i/subgroup=&b&i

20、freq inside=freq outside=cfreq;hbar3d &c&i/subgroup=&b&i percent;pie3d &c&i/subgroup=&b&i;title c=blue h=5pct &d&i group=&b&i;run;%end;%mend;%gchart;图1.5.1 d1变量x1的分组连接垂直条形图(频数类型)图1.5.2 d1变量x2的分组连接垂直条形图(频数类型)图1.5.3 d1变量x的分组连接水平条形图图1.5.4 d1变量x1的分组饼形图图1.5.5 d1变量x的分组连接三维垂直条形图(频数类型)图1.5.6 d1变量x2的分组连接三维水平

21、条形图图1.5.7 d1变量x的分组三维饼形图图1.5.8 d1变量x2的分组三维饼形图第2章 描述性分析范例2.1 盘碟、金属线数据描述性分析SAS数据集是盘碟、金属线数据。SAS数据集d1是盘碟数据,Gap是裂缝长度;SAS数据集d2是金属线数据,Length是长度。用Capablity过程进行描述性分析。画出两张直方图。第一张标出容量N、标准差Std、偏度Skewness、峰度Kurtosis、中位数Median、极差Range、上四分位数Q3、下四分位数Q1。第二张标出统计量Chisq、p值Pchisq、Kolmogorov-Smirnov统计量Ksd、p值Ksdpval、Aderso

22、n-Daling统计量Ad、p值Adpval、Cramer-von Mises统计量Cvm、p值Cvmpval;分别配正态分布(Normal)与对数正态分布(Lognormal)曲线,给出分布拟合检验。%let d1=fjc.plates;%let d2=fjc.wire;%let c1=gap;%let c2=length;%macro driver(x);%do i=1 %to 2;proc capability data=&d&i;title data=&d&i x=&x; var &c&i; histogram / cframe=yellow cfill=red; inset n me

23、an std skewness kurtosis median range q3 q1 uss / Header = Summary Statistics cframe = white ctext = white cfill = magenta pos = rm font =Italic; histogram /&x cframe=pink cfill=blue; inset &x(mean std chisq pchisq ksd ksdpval ad adpval cvm cvmpval) / Header = Summary Statistics cframe = white ctext

24、 = white cfill = purple pos = lmfont =Italic;%end;%mend;%driver(normal);%driver(lognormal);图2.1.1 d2的直方图及描述性分析图2.1.2 d2的直方图及正态分布拟合检验图2.1.3 d1的直方图及描述性分析图2.1.4 d1的直方图及对数正态分布拟合检验范例2.2 血清总蛋白含量数据描述性分析SAS数据集d1是血清总蛋白含量数据,x是血清总蛋白含量(g/L)。用Capablity过程进行描述性分析。画出两张直方图。第一张标出容量N、标准差Std、偏度Skewness、峰度Kurtosis、中位数Me

25、dian、极差Range、上四分位数Q3、下四分位数Q1。第二张标出统计量Chisq、p值Pchisq、Kolmogorov-Smirnov统计量Ksd、p值Ksdpval、Aderson-Daling统计量Ad、p值Adpval、Cramer-von Mises统计量Cvm、p值Cvmpval;分别配正态分布(Normal)与对数正态分布(Lognormal)曲线,给出分布拟合检验。检验表明:x服从正态分布或对数正态分布。%let d1=fjc.c1d2;%let c1=x;%macro driver(x);%do i=1 %to 1;proc capability data=&d&i;ti

26、tle data=&d&i x=&x; var &c&i; histogram / cframe=yellow cfill=red; inset n mean std skewness kurtosis median range q3 q1 uss / Header = Summary Statistics cframe = white ctext = white cfill = magenta pos = rm font =Italic; histogram /&x cframe=pink cfill=blue; inset &x(mean std chisq pchisq ksd ksdp

27、val ad adpval cvm cvmpval) / Header = Summary Statistics cframe = white ctext = white cfill = purple pos = lmfont =Italic;%end;%mend;%driver(normal);%driver(lognormal);图2.2.1 d1的直方图及描述性分析图2.2.2 d1的直方图及正态分布拟合检验图2.2.3 d1的直方图及对数正态分布拟合检验范例2.3 金属线数据描述性分析SAS数据集d1是金属线数据,Length是长度。用Capablity过程进行描述性分析。画出两张直方

28、图。第一张标出容量N、标准差Std、偏度Skewness、峰度Kurtosis、中位数Median、众数Mode、极差Range、上四分位数Q3、下四分位数Q1、0.05分位数P5、0.10分位数P10、0.90分位数P90、0.95分位数P95。第二张标出统计量Chisq、p值Pchisq、Kolmogorov-Smirnov统计量Ksd、p值Ksdpval、Aderson-Daling统计量Ad、p值Adpval、Cramer-von Mises统计量Cvm、p值Cvmpval。分别配正态分布(Normal)曲线,给出分布拟合检验。画出QQ图,给出描述性分析。画出经验分布函数图,配正态分布

29、函数曲线,给出描述性分析。%let d1=fjc.wire;%let c1=length;%macro driver(type);%do i=1 %to 1;proc capability data=&d&i; var &c&i; title data=&d&i type=&type; histogram/ &type( color=red w=2) legend=legend1 cframe=yellow cfill=blue; inset n mean std skewness kurtosis median mode range q3 q1 uss p5 p10 p90 p95 / po

30、s=lm cfill = red ctext = white font=Italic; legend1 cframe=green cborder=black; histogram/ &type( color=red w=2) legend=legend1 cframe=yellow cfill=blue; inset &type(mean std chisq pchisq cvm cvmpval ad adpval)/ pos=lm cfill = red ctext = white font=Italic; legend1 cframe=green cborder=black; legend

31、1 cframe=yellow cborder=black; cdfplot/ &type(color=blue w=2) cframe=yellow; inset n mean std skewness kurtosis median mode range q3 q1 uss p5 p10 p90 p95 / pos=lm cfill = red ctext = white font=Italic; qqplot / cframe=blue legend=legend1 &type square; inset n mean std skewness kurtosis median mode

32、range q3 q1 uss p5 p10 p90 p95 / pos=lm cfill = red ctext = white font=Italic; legend1 cframe=gray cborder=black;run;%end;%mend;%driver(normal); 图2.3.1 d1的直方图及描述性分析图2.3.2 d1的直方图及正态分布拟合检验图2.3.3 d1的QQ图及描述性分析图2.3.4 d1的经验分布函数图(配正态分布函数曲线)范例2.4 皮带数据描述性分析SAS数据集d1是皮带数据,Strength是强度,Width是宽度。用Capablity过程进行描述性

33、分析。画出两张直方图。第一张标出容量N、标准差Std、偏度Skewness、峰度Kurtosis、中位数Median、极差Range、上四分位数Q3、下四分位数Q1。第二张标出统计量Chisq、p值Pchisq、Kolmogorov-Smirnov统计量Ksd、p值Ksdpval、Aderson-Daling统计量Ad、p值Adpval、Cramer-von Mises统计量Cvm、p值Cvmpval。配正态分布(Normal)曲线、配对数正态分布(Lognormal)曲线、配伽玛分布(Gamma)曲线、配威布尔分布(Weibull)曲线,给出分布拟合检验。“proc iml;”给出变量(St

34、rength Width)的二元正态分布检验,检验方法为偏度、峰度法,结论为服从二元正态分布。%let d1=fjc.belts;%let c1=strength width;%macro driver(x);%do i=1 %to 1;proc capability data=&d&i; var &c&i;title data=&d&i x=&x; histogram / cframe=yellow cfill=red; inset n mean std skewness kurtosis median range q3 q1 uss / Header = Summary Statistic

35、s cframe = white ctext = white cfill = magenta pos = rm font =Italic; histogram /&x cframe=pink cfill=blue; inset &x(mean std chisq pchisq ksd ksdpval ad adpval cvm cvmpval) / Header = Summary Statistics cframe = white ctext = white cfill = purple pos = lmfont =Italic;proc iml;use &d&i;read all into

36、 mymatrix;y=mymatrix;print y;n=nrow(y);p=ncol(y);dfchi=p*(p+1)*(p+2)/6;q=i(n)-(1/n)*j(n,n,1);s=(1/n)*y*q*y; s_inv=inv(s);g_matrix=q*y*s_inv*y*q;beta1hat=(sum(g_matrix#g_matrix#g_matrix)/(n*n);beta2hat=trace(g_matrix#g_matrix)/n;kappa1=n*beta1hat/6;kappa2=(beta2hat-p*(p+2)/sqrt(8*p*(p+2)/n);pvalskew=

37、1-probchi(kappa1,dfchi);pvalkurt=2*(1-probnorm(abs(kappa2);print s;print s_inv;print beta1hat kappa1 pvalskew;print beta2hat kappa2 pvalkurt;quit;%end;%mend;%driver(normal);%driver(lognormal);%driver(gamma);%driver(weibull);图2.4.1 d1变量Strength的直方图及描述性分析图2.4.2 d1变量Strength的直方图及正态分布拟合检验图2.4.3 d1变量Widt

38、h的直方图及描述性分析 图2.4.4 d1变量Width的直方图及正态分布拟合检验图2.4.5 d1变量Strength的直方图及伽玛分布拟合检验图2.4.6 d1变量Width的直方图及伽玛分布拟合检验表2.4.1 d1变量(Strength Width)的二元正态分布拟合检验Y1243.51 3.0361221.95 2.9951131.67 2.9831129.7 3.0191198.08 3.1061273.31 2.9471250.24 3.0181225.47 2.981126.78 2.9651174.62 3.0331250.79 2.9411216.75 3.0371285.

39、3 2.8931214.14 3.0351270.24 2.9571249.55 2.9581166.02 3.0671278.85 3.0371280.74 2.9841201.96 3.0021101.73 2.9611165.79 3.0751186.19 3.0581124.46 2.9291213.62 2.9841213.93 3.0291289.59 2.9561208.27 3.0291247.48 3.0271284.34 3.0731209.09 3.0041146.78 3.0611224.03 2.9151200.43 2.9741183.42 3.0331195.66 2.9951258.31 2.9581136.05 3.0221177.44 3.091246.13 3.0221183.67 3.0451206.5 3.0241195.69 3.0051223.49 2.9711147.47 2.9441171.76 3.0051207.28 3.0651131.33 2.9841215.92 3.0031202.17 3.058S2288.9743 -0.33537-0.33537 0.0021631S_INV0.000447 0.06930990.0693099 473.05536BETA1HAT KAPPA1 PVALSKEW0.6

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号