实验五回归分析SAS过程.docx

上传人:小飞机 文档编号:5175198 上传时间:2023-06-11 格式:DOCX 页数:33 大小:226.06KB
返回 下载 相关 举报
实验五回归分析SAS过程.docx_第1页
第1页 / 共33页
实验五回归分析SAS过程.docx_第2页
第2页 / 共33页
实验五回归分析SAS过程.docx_第3页
第3页 / 共33页
实验五回归分析SAS过程.docx_第4页
第4页 / 共33页
实验五回归分析SAS过程.docx_第5页
第5页 / 共33页
亲,该文档总共33页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《实验五回归分析SAS过程.docx》由会员分享,可在线阅读,更多相关《实验五回归分析SAS过程.docx(33页珍藏版)》请在三一办公上搜索。

1、学号:班级: 姓名:实验五回归分析SAS过程(2)实验目的:1. 会对实际问题建立有效的多元回归模型,能对回归模型进行残差分析;2. 掌握SAS输出结果用于判别回归方程优良性的不同统计量,能对回归模型进 行运用,对实际问题进行预测或控制.实验要求:编写程序,结果分析.实验内容:1. 误差的正态性检验有几种方法,何时认为误差项服从正态分布?答:1.学生化残差2.残差正态性的频率检验3.残差的正态QQ图检验判断若散点(q , r ) (i = 1,2,n)大致在一条直线上(i)(i)y,、/、4(r. r)(q q)相关系数:p =i=1 一1y (r(i)-r)2 y (q (i) - q) i

2、=1i=1认为r. (i = 1,2,n)来自正态分布,接受误差正态性检验.2. 回归方程的选取的穷举法中,评价回归方程优良性的准则有哪些?根据准则何 时方程最优?答:1)修正的复相关系数准则或均方残差准则(R2(p)或心,准则)2) *准则3) 预测平方和准则(PRESSp准则)拟合所有可能的2m-1 -1个回归方程,画出*图:(p,C,在*图中选取最接近参考 直线Cp = p的点所对应的回归方程为最优方程.3. 简述逐步回归方法的思想和步骤.基本思想:逐个引入自变量建立回归方程,每次引入对Y影响最显著的自变量,并对方程 中旧变量逐个进行检验,把变为不显著的变量逐个从方程中剔除掉,最终得到的

3、方程中,既不 漏掉对Y显著影响的变量,又不包含对Y影响不显著的变量.添加或删除某个自变量的准则 是用残差平方和的相对减少或增加来衡量.步骤:(1)修正的复相关系数准则、cp准则选择模型(2) 预测平方和准则选择PRESSp最优回归方程(3) 最优模型的拟合检验4.做 2.6 2.8 (选作)2.9注意:可以选课外综合题目。2.6程序:data examp2_6;input x1 x2 y;cards;8.3 70 10.38.6 65 10.38.8 63 10.210.5 72 16.410.7 81 18.810.8 83 19.711.0 66 15.611.0 75 18.211.1

4、80 22.611.2 75 19.911.3 79 24.211.4 76 21.011.4 76 21.411.7 69 21.312.0 75 19.112.9 74 22.212.9 85 33.813.3 86 27.413.7 71 25.713.8 64 24.914.0 78 34.514.2 80 31.714.5 74 36.316.0 72 38.316.3 77 42.617.3 81 55.417.5 82 55.717.9 80 58.318.0 80 51.518.0 80 51.020.6 87 77.0;run;proc reg data= examp2_6;

5、model y=x1-x2;output out=a p=predict r=resid h=h student=r;run;data b;set a;drop x1-x2;run;proc print data=b;run;proc capability graphics noprint data=a; /* 对数据集 a 调用 capability过程,高分辨图,不打印输出*/qqplot r/normal;/* 作 student 数据的正态 QQ 图*/run;goptions reset=all;/*将图形的设置恢复为默认状态*/proc gplot data=a; /*对数据集a作

6、出画高分辨的散点图或曲线图*/plot resid*predict; /*画纵坐标为残差、横坐标为yi散点图*/symbol v=dot i=none; /*散点表示符号圆点,不画连线 */ run;/*此处至Quit是计算学生化残差对应的标准正态分布的分位数*/ proc sort data=a;by r;/*按r排序*/proc iml;/*调用iml矩阵分析模块,计算数据*/use a;/*打开数据集a */read all varr into rr; /*读入集a中变量r (学生化残差)各观测值到矩阵rr中*/do i=1 to 31;/*此循环计算 */qi=probit(i-0.3

7、75)/54.25);q=q/qi; /* 矩阵 qi 上下连接而成,即得 54*1 阶矩 q=(q(1),q(2), ,q(30)T */ end;rq=rr|q;/* 表示矩阵 rq=(rr q)*/create correl varr q;/* 创建数据集 correl,变量为 r、q */append from rq; /*从矩阵rq读取数据()*/quit;/* iml过程结束*/proc corr data=correl; /*计算学生化残差与对应的标准正态分布的分位数的相关系数*/ run;TheSHS System01:20 Fr iday, OcObsVpred ictres

8、 idrh110.34.83775.462341.496490.1158310.34.55395.746151.602950.1472110.216.44.81705.383021.528460.1768615.87410.525880.139670.0591918.819.8690-1.06901-0.293680.1206619.715.621.0183-1.31833-0.369620.1557516.192719.2459-0.59269-0.162280.1148018.2-1.04595-0.276660.0514822.621.41301.186980.320900.092011

9、019.920.1876-0.28758-0.075930.0479724.222.01542.184600.584770.073831221 .021 .4685-0.4684G-0.123690.048091321 .421.4685-0.06846-0.018080.048091421 .320.50620.793850.212370.072761519.123.9541-4.85411-1.274690.037651622.227.8522-5.65220-1.482750.035671733.831.58402.216030.612500.131311827.433.8065-6.4

10、0648-1.783240.143461925.730.6010-4.90098-1.306850.066662024.928.6970-3.79704-1.101370.211242134.534.38820.111820.029330.035812231 .736.0083-4.30832-1.135960.045422336.335.38530.914740.241760.049952438.341.7690-3.46900-0.948030.111432542.644.8777-2.27770-0.G08210.0G9312655.450.94294.457131.202600.088

11、422755.752.22383.476250.941880.096032858.353.42854.871491.327570.106422951 .553.8993-2.39933-0.G55110.109833051 .053.8993-2.89933-0.791630.109833177.068.51538.484702.486140.22706(a)学生化残差的正态QQ图(b)拟合值y的残差图The CORR Procedure2 Uar tables: RVar iableMeanStd DevSunMax imun31310.01031-0.671721.03B800.62292

12、0.31962-20.82318-1 .78324 -2.272752.486140.16243Pearson Correlat ion Coeff ic ients, N HOProb ! r! underRho=01.0000010.94091.00010.94091 .00011.00000结果分析:1)由学生化残差的正态QQ图可知,其点明显不在一条直线上;2)求得有序学生化残差与相应正态分布的分位数的相关系数B=0.94091与1相差较大.因此,若拟合线性回归模型,则误差分布与正态分布有较大的偏离;3) Y拟合值的残差图也表明Y与气,X2不满足线性关系,且两个拟合值还为负 数.由此知,

13、直接假定体积与直径和树干高度之间的线性回归关系是不恰当的.(2)对因变量Y作Box-Cox变换第一步:确定变换参数人鉴于(1)中的残差分析结果,我们对Y作Box-Cox变换Y(x)= : FModelErrorCorrected Total7684.162513842.08126254.97.0001421.9213615.068628106.08387Root MSE3.88183R-Square0.9480Dependent Mean30.17097Adj R-Sq0.9442Coeff Uar12.86612Intercept xl x2-57.987664.708160.339258.

14、638230.264260.1301512 17 8 6 6 7 2.0001.0001 0.0145Est imatesParameterStandardUar iableDFEst imateErrort ValuePr对Z关于X1, X2拟合线性回归模型,求出残差,及学生化残差r (i = 1,2, ,31).做出学 生化残差的正态QQ图以及Z的拟合值的残差图如图所示.(a)学生化残差的正态QQ图(q, r)(b) Z的拟合值z的残差图由图知,线性回归关系高度显著且复相关系数的平方和为R2 = 0.9776 ,即线性部分描 述了Z的绝大部分变化量.由此得拟合的回归方程为Z = -2.84

15、830 + 0.41940X 1 + 0.04051X 2回归模型Z=P +P X +P X +残差的相关系数检验01122Pearson Correlat ion Coeff ic ients, N = 31Prob r under HO: Rho=0RRQQRR1.000000.96990.0001QQ0.969901.00000 |t|1 ntercept1162.8759025.775656.32 FModel34133.633221377.8777413.01 it!Intercept1162.8759025.775656.32.0001xl1-1 .210320.30145-4.0

16、10.0007x21-0.665910.82100-0.810.4274x31-8.6130312.24125-0.700.4902The SS System15:32 Thursday, Oc87609G646797717G980972045678345278645567864756pred ictres idrh48.5888-0.5888-0.0G1500.1341868.8628-11 .8628-1.283030.1925563.55102.44900.246820.0701268.44961.55040.172310.2352484.84964.15040.452040.20378

17、42.6336-6.6336-0.781140.3188359.7986-13.7986-1.383010.0597755.7768-1.7768-0.189980.1737533.6754-7.6754-0.917300.3387076.39400.60600.063410.1374075.141913.85811.549790.2447854.867912.13211.214370.0572861.3103-14.3103-1.584700.2297767.9539-16.9539-1.710280.0718543.821513.17851.545200.3129G69.4490-3.44

18、90-0.354040.1036264.112114.88791.626920.2090580.78037.21970.757820.1427272.2187-12.2187-1.236770.0780941.67597.32410.811590.2307873.33963.66040.387620.1577246.02165.97840.665550.2378757.72702.27300.227750.05918Norma 1 Quant i1es(a)学生化残差的正态QQ图(b)拟合值y的残差图Pearson Correlat ion Coeff ic ients, N = 23 Pro

19、b r under HO: Rho=0 RQR1.000000.96428.0001Q0.964281.00000.0001结果分析:1)由学生化残差的正态QQ图可知,其点基本在一条直线上;2)求得有序学生化残差与相应正态分布的分位数的相关系数B=0.96428与1相差较小.因此,若拟合线性回归模型,则误差分布与正态分布有较小的偏离;3) Y拟合值的残差图也表明r与X1,X2,X3满足线性关系,由此知,直接假定病 人的满意程度与病人的年龄和病情程度、忧虑程度之间的线性回归关系是恰当的.【1】1)修正的复相关系数准则、C p准则选择模型data examp2_9;input x1-x3 y;ca

20、rds;50 51 2.3 4836 46 2.3 5740 48 2.2 6641 44 1.8 7028 43 1.8 8949 54 2.9 3642 50 2.2 4645 48 2.4 5452 62 2.9 2629 50 2.1 7729 48 2.4 8943 53 2.4 6738 55 2.2 4734 51 2.3 5153 54 2.2 5736 49 2.0 6633 56 2.5 7929 46 1.9 8833 49 2.1 6055 51 2.4 4929 52 2.3 7744 58 2.9 5243 50 2.3 60;data a;set examp2_9

21、;z=(y*0.07-1)/0.07;/* 作Box-Cox变换Z=(Y0.07-1)/0.07 */run;proc reg data=a;/*对集合a调用回归分析的reg过程*/model z=x1-x3/selection=adjrsq; /* 建立回归模型Z= 0+ 1X2+ 3X3+ ,用修 正的准则选择模型*/run;proc reg data=a;/*对集a调用回归分析的reg过程*/model z=x1-x3/selection=cp;/*建立回归模型Z= 0+ 1X2+ 3X3 +,利用准则选择模型*/run;2)修正的R 2( p)准则选择模型结果aThe SHS Syst

22、em15:53 Thursday,The REG ProcedureModel: MODEL1Dependent Mar i ab1e: zdjusted R-Square Select ion MethodNumber of Observat i ons Read23Number of Observat i ons Used23Number inAdjustedModelR-SquareR-Square0.62370.65790.62080.65530.61990.671710.53770.558720.39400.449110.38350.411510.36470.3936Var iabl

23、es in Mode13X2 3 2 3 XXX X 11112 3 2 X X X X X X Xr2(p) =0.6237最大 x1 x2 为最优 a由R2(p)准则选择最优模型Z=P0+P1X1+P2X2+ e .3)利用*准则选择模型结果The REG ProcedureModel: MODEL1Dependent Mar iable: zC(p ) Select ion MethodNumber of Observat i ons Read Number of Observat i ons UsedNumberModein1C(p)R-SquareVar iables in Mode

24、12.79670.6579xl x22.95180.6553xl x34.00000.6717xl x2 x36.53750.5587xl14.88530.4491x2 x3115.05870.4115x3116.09640.3936x2C =2.37967湘x1 x2最优集由c准则选择最优模型Z=B +B X+B X + 8.p01 12 2【2】预测平方和准则选择PRESSp最优回归方程对集a调用回归分析的reg过程,用预测平方和准则(PRESS =况dp)选择回归方程)i=11)程序proc reg data=a;/*对集a调用回归分析的reg过程*/model z=x1/noprint

25、; /*建立回归模型不打印输出*/output out二aa1 press=press; /* 输出数据集aa1,以press为变量,值 */run;proc means uss data=aa1; /*对集aa1调用描述性means过程,列出平方和uss */var press;/* 计算变量press平方和即*/run;/*以下对集a调用reg过程,模型Z= 0+ 2X2+,输出及预测平方和uss*/ proc reg data=a;model z=x2/noprint;output out=aa2 press二press;run;proc means uss data二aa2;var p

26、ress;run;/*以下对集a调用reg过程,模型Z= 0+ 3X3+,输出预测及预测平方和PRESSp*/proc reg data=a;model z=x3/noprint;output out二aa3 press=press;run;proc means uss data二aa3;var press;run;/*以下调用reg过程,模型Z= 0+ 1X1+ 2X2+,输出预测及预测平方和PRESS*/proc reg data=a;model z=x1 x2/noprint;output out=aa4 press=press;run;proc means uss data二aa4;v

27、ar press;run;/*以下调用reg过程,模型Z= 0+ 1X1+ 3X3+,输出预测及预测平方和 PRESSp */proc reg data二a;model z=x1 x3/noprint;output out二aa5 press=press;run;proc means uss data二aa5;var press;run;/*以下调用reg过程,模型Z= 0+ 2X2+ 3X3+,输出预测及PRESSp */ proc reg data=a;model z=x2 x3/noprint;output out二aa6 press=press;run;proc means uss d

28、ata二aa6;var press;run;/*调用reg过程,模型Z= 0+ 1X1+ 2X2+ 3X3+,输出预测及预测平方和 PRESSp */proc reg data=a;model z=x1 x2 x3/noprint;output out=aa7 press=press;run;proc means uss data二aa7;var press;run;/*以上模型PRESSp准则选择结束,选出最优自变量集,下面建立最优回归模型 Z= 0+ 1X1+ 2X2+ 3X3+,给出方差分析表和参数估计表*/proc reg data=a;/* 调用回归模reg过程,模型Z= 0+ 1X

29、1+ 2X2+ */model z=x1-x2;run;2)PRESSp输出结果The ShS System15:53 Thursday, OcThe MEANS ProcedureIhnalys is Uar table : press Res idual w i thout Current Observat ionUSS慢慢慢慢慢慢1 .8820041慢慢慢慢慢慢The ShS System15:53 Thursday, 0(The ME计NS ProcedureIhna 1 ys is Uar iab 1 e : press Res idua 1 w i thout Current Ob

30、servat ionUSS2.4935484懊懊懊懊懊懊The SAS System15:53 Thursday, OcIThe MEANS Procedurehna1is Var iab1e : press Res idual w i thout Current Observat ionUSS1 .6531882The ShS System15:53 Thursday, OctIThe MEANS Procedurehna1ys is Mar table : press Res idual u i thout Current Observat ionUSS傻傻傻傻傻傻1.5990749傻傻傻傻傻傻Z=PO+P

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号