实验六SAS方差分析.docx

上传人:牧羊曲112 文档编号:5175210 上传时间:2023-06-11 格式:DOCX 页数:11 大小:189.92KB
返回 下载 相关 举报
实验六SAS方差分析.docx_第1页
第1页 / 共11页
实验六SAS方差分析.docx_第2页
第2页 / 共11页
实验六SAS方差分析.docx_第3页
第3页 / 共11页
实验六SAS方差分析.docx_第4页
第4页 / 共11页
实验六SAS方差分析.docx_第5页
第5页 / 共11页
亲,该文档总共11页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《实验六SAS方差分析.docx》由会员分享,可在线阅读,更多相关《实验六SAS方差分析.docx(11页珍藏版)》请在三一办公上搜索。

1、实验六方差分析方差分析(analysis of variance, ANOVA)是检验多个总体均值是否相等的一种统计方法, 单因素方差分析是对样本观察值的差异进行分解,将某种因素下各组样本观察值之间可能存 在的系统误差加以比较,据此推断总体之间是否存在显著性差异,若存在显著性差异,说明 该因素的影响是显著的。双因素方差分析是对样本观察值的差异进行分解,将两种因素下各组样本观察值之间可 能存在的系统误差加以比较,据此推断总体之间是否存在显著性差异,根据两因素是否相互 影响,双因素分析分为不存在交互作用的双因素方差分析和存在交互作用的双因素方差分 析。6.1实验目的掌握使用SAS进行单因素方差分析

2、和双(多)因素方差分析的方法。6.2实验内容一、用INSIGHT作方差分析二、用“分析家”作方差分析三、用ANOVA过程和GLM过程进行方差分析6.3实验指导一、用INSIGHT作单因素方差分析【实验6-1】某化肥生产商要检验三种新产品的效果,在同一地区选取3块同样大小的 农田进行试验。甲农田中使用甲化肥,在乙农田中使用乙化肥,在丙农田中使用丙化肥,得 到6次试验的结果如表6-1(sy6_1.xls)所示。试在0.05的显著性水平下分析甲乙丙三种化肥 的肥效是否存在差异。表6-1三块农田产量甲504649524848乙495047474649丙5150494650501. 建立数据集将表6-1

3、在Excel中整理后导入成如图6-1左所示结构的数据集,存放在Mylib.sy6_1 中,如图6-1左所示,其中变量nt和cl分别表示农田和产量。在INSIGHT模块中打开数据集Mylib.sy6_1。2. 图形表现(1)选择菜单Analyze (分析)” “Box Plot/Mosaic Plot (盒形图/马塞克图)”,在打 开的“Box Plot/Mosaic Plot (Y)”对话框中选择变量cl,单击Y”按钮,选择变量nt,单 击“X”按钮,分别将变量移到列表框中,如图6-1右所示。4649524848495047474649515049465050如图6-2右所示。图6-2图6-3

4、分析变量的选择3.方差分析图6-1数据集mylib.sy6_ 1与变量选择(2)单击“Output”按钮,在弹出的对话框中选中Mean(均值)”复选框(如图6-2左), 以便在盒形图中显示均值。(3)两次单击“OK”按钮,得到结果图形表现结果中显示了不同农田产量的盒形图。可以看出,甲和乙标准差的差异不显著(菱形的 高度差异不大),三者的均值间有一定的差异,但此差异是否显著则需进一步的方差分析。(1)选择菜单Analyze (分析)”一“Fit (拟 合)”,在打开的“Fit(X Y)”对话框中选择数值型 变量作因变量,分类型变量作自变量:选择变量 cl,单击Y”按钮,选择变量nt,单击X”按

5、钮,分别将变量移到列表框中,如图6-3所示。(2)单击“OK”按钮,得到结果。在显示的分析结果中包含类似于回归分析结果的若干张表:第一张表提供拟合模型的一般信息(略)。第二张表为列名型变量信息,即nt为列名型的,有3个水平,如图6-4左所示。第三张表提供参数信息,并且约定,P_2、P_3、P_4分别为农田丙、甲、乙的标识变量 (也称哑变量)。如图6-4右所示。1 Nominal Variable InformationLevelnt丙2甲3乙| Parameter InformationParameterVariablentIntercept丙2nt3甲4乙图6-4列名型变量信息表与参数信息表

6、第四张表给出响应变量均值关于自变量不同水平的模型方程,如图6-5所示。其中,标识变量取值:,1Ml?del EqiatlcnCl =QQQU 1-1.3333 P_2 十 0.3333 :P_3c C 1,nt =丙 一2 To,其他,图6-5模型方程11, nt =甲P3 = h其他,根据标识变量的取值,容易求出各农田的平均产量:48 + 0.8333 nt =甲以的均值= 48.0000 nt =乙48 +1.3333 nt =丙第五张表(图6-6)给出模型拟合的汇总信息,其中:(1) 响应变量cl的均值=48.7222;KTTTH.一.、一、,】-, ci: .叫-、.I(2) 根均方误

7、差=1.7920; e L(3) 判定系数R2 = 0.1016,较小。其值越大,说图6-6拟合的汇总信息明自变量的信息对说明因变量信息的贡献越大,即分类变量取不同的值对因变量的影响越显著。第六张为方差分析表,如图6-7所示。21Analysisof VarianceSource iDFSun of Squaresi Mean Square :F StatPr FModel25. 44442 72220. 85 :0. 4479Error1548. 16673. 2111 :C Total1753. 6111图6-7方差分析表从方差分析表可以看出,P值大于0.05 (显著水平),所以不能拒绝原

8、假设,即不同农 田的产量无显著差异,也即三种化肥的肥效无显著差异。第七张表提供III型检验,它是方差分析表的细化,给出了各因素的平方和及F统计量, 因为本例是单因素的,所以这一行与图6-7的“Model” 一行相同。如图6-8所示。Type. III TestsSource :DFSlutl of Squar已m : Mean Squar已:F StatPr Fnt25. 4444 :2. 7222 |0. 85 10. 4479图6-8 III型检验表第八张为参数估计表(图6-9),其中有关于不同农田产量差异的估计和检验:Parameter EstimatesVariablentDFEstI

9、mat已Std Errort StatPr |tToleranceVar InflationIntercept nt丙甲乙40. 00001.33330. 83330. 73161.03461.034665. 611. 290. 81.00010. 21700. 43310: 75000. 75001.33331.3333图6-9参数估计表(1) 根据标识变量规定的方法,Intercept后的估计48是对应农田乙的产量的样本均值, 其后的t检验是检验总体均值是否为0。这里p值0.0001 0.05,所以农田丙与农田乙的产量没有显著差异,即化肥 丙和化肥乙的肥效无显著差异。(3)农田甲后的估计0

10、.8333是农田甲与农田乙的产量均值之差的估计值,其后的t检验 也是检验这两个产量均值之差是否为0。由于p值的绝对值为0.4331 0.05,所以农田甲与农田乙的产量没有显著差异,即化肥 甲和化肥乙的肥效无显著差异。图6-10残差和预测值的 散点图4.检验模型假定在分析结果中,最后有一个残差(Residual,响应变量值减预测 值)和预测值的散点图(图6-10),这个图可以帮助校验模型的假定。 从图中看出,残差有大体相同的散布,它表明等方差的假设没有问 题。为了验证残差为正态分布的假定,回到数据窗口。可以看到 R_cl (残差)和P_cl (预测值)已加到数据集之中, 下面用 Distribu

11、fion(Y )来验证残差的正态性。(1)选择菜单“Analyze”一Distribution(Y)”;(2)在打开的“Distribution(Y)”对话框中选定分析变量:R_cl;(3) 单击“OK”按钮;(4) 选择菜单Curves” “Test for Distribution”;在打开的“Test for Distribution”对 话框中直接单击“OK”按钮。在检验结果的“Test for Distribution”表中看到,p值大于0.05,不能拒绝原假设,表明 可以认为残差是正态分布的(图6-11)。Tests for DistributionClitv 已Distribut

12、ionMean/ThetaSigiria : Kolniogorc DPr - DNormal7. 8949E-161. 68330. 1540.15图6-11残差的正态性检验如果检验结果拒绝原假设,即残差不具有正态性,则需改用非参数方差分析。二、用“分析家”作双因素方差分析【实验6-2】北京市房地产开发商想要了解本市商品房各类房型及户型在各地区的销售 情况,搜集了房屋的销售量数据,如表6-2 (sy6_2.xls)所示。试用有交互作用的双因子方 差分析检验地区与房型对房屋销售是否存在交互作用。表6-2各种房型的销售套数三室两厅两室两厅复式房型其他朝阳区1月份652521674862月份711

13、54859338海淀区1月份481521503912月份50942555348大兴区1月份397561281472月份31457024184通州区1月份1571388962月份164194557其他1月份21744951472月份14549281. 生成数据集将表6-2在Excel中整理后导入成如图6-12左所示结构的数据集,存放在Mylib.sy6_2 中,其中a、b和sl分别表示地区、户型和销售量。(也可用下面程序生成数据集data mylib.sy6_2;keep A B SL;do A=朝阳区,海淀区,大兴区,通州区,其他;do B=三室两厅,两室两厅,复式房型, 其他;do C=1,

14、2;input SL;output;end;end;end;cards;65271152154867594863384815095214255055391348397314561570282414718415716413819485965721714544949258147108;run;)在“分析家”中打开数据集Mylib.sy6_2。2. 方差分析(1)选择菜单 Statistics (统计)”一“ANOVA (方差分析)”一“Factorial ANOVA (因 素方差分析)”,打开“Factorial ANOVA”对话框。(2)选中变量A、B,单击Independent (自变量)”按

15、钮,将其移到“Independent”框 中;选中变量SL,单击按钮“Dependent (因变量)”,将其移到“Dependent”框中,如图6-12右所示。Projecti _ at Sy6_2 AnalysisL |- Sy6 2 |1 2 3 4 5 6 7 8 9101112131415161718192021222324三室两厅652三室两厅711两室两厅521两室两厅548复式房型67复式房型59其他486其他338三室两厅481三室两厅509两室两厅521两室两厅425复式房型50复式房型55其他391其他348三室两厅397三室两厅314两室两厅561两室两厅570复式房型2

16、8复式房型24其他147184图6-12数据集Mylib.sy6_2与变量选择(3)考虑因素间的交互作用:单击“Model”按钮,打开“Factorial ANOVA Model”对话框。单击 “Standard Models”按钮,在弹出的菜单中选择Effects up to 2-wav interactions项,表示交互作用的a*b加入了模型效应栏,如图6-13左所示,单击“OK”按钮返回。图6-13选择模型与图形(4)绘制各因素不同水平下均值差异的连线图:单击“Plots”按钮,在打开的“Factorial ANOVA: Plots” 对话框中,选中“Plot dependent me

17、ans for two-way effects (双因素效应的 因变量均值连线图)”复选框;并选择“Height of standard error (se) bars”中的“2 se”,附加 上以均值为中心的二倍标准差为长度的竖线图,如图6-13右所示,单击“OK”返回。再次单击“OK”按钮,系统按要求进行方差分析计算,方差分析的结果如图6-14所示。3.结果分析显示的结果包含方差分析表和汇总信息。输出的方差分析表显示双因素考虑交互作用的方差分析模型是显著的(F=62.36, p F”的三个 p值可以看出因素A、B及因素A与B的交互作用(A*B)对指标j的影响是高度显著的。图6-14方差分析

18、结果在分析家窗口的项目管理器中双击选项“Means Plot of y by a and b ”,得到双因素不同 水平下因变量均值的连线图如图10-15所示。图10-15双因素不同水平下因变量均值差异的连线 图在因素A的5个水平位置上(朝阳区、 大兴区、海淀区、其他、通州区)有5条竖 线,对应于因素B的四个水平(复式房型、 两室两厅、其他和三室两厅)有4条不同颜 色的连线。每条连线与竖线的交点纵坐标是 在两因素相应水平下因变量J的均值。每条 竖线上还标出因变量j的均值的二倍标准差 的位置。从因素B的四个水平对应的连线可以看 出:复式房型的销售量最低,且与所在地区 关系不大;两室两厅的销售量比较

19、均衡,需 求量较多;三室两厅与其它房型的销量则与 所在地区密切相关,在朝阳区、海淀区的销量较高,在大兴、通州及其他地区的销量则较低。从因素A(地区)来看,通州区各种房形的销量都较低。从两室两厅的连线与其他三条连线的交叉可直观地看出因素A与因素B有交互作用。 在市区销量最好的房型为三室两厅,在郊区销量最好的房型是两室两厅。三、用ANOVA和GLM过程进行方差分析【实验6-3】使用ANOVA过程对“实验6-1”中例子作方差分析。执行如下代码:/* One-way Analysis of Variance */;proc anova data=Mylib.sy6_1;class NT;model C

20、L = NT;means NT / LSD HOVTEST=LEVENE; /*均值多重比较、方差齐性检验*/ run; quit;结果同实验6-1。【实验6-4】编程对表6-2中数据进行有交互作用的双因子方差分析。执行如下代码:proc glm data=mylib.sy6_2;class a b;model sl = a b a*b;run;程序运行主要结果同实验6-2。6.4上机演练【练习6-1】某公司研制出了 A、B、C、D四种新型生产设备,让6个工人分别操作相 同的时间,统计他们生产的零件的数量如表6-3(lx6_1.xls)所示。试在0.01的显著水平下检验这四种设备在单位时间生产

21、的零件数量是否存在显著差异。表6-3四种新型生产设备生产的零件的数量A754650567348B475065724649C485052464965D684849635170【练习6-2】某学校对大一到大四的学生身高进行调查,分别在各系取男生和女生各8 人,调查结果如表6-4所示(lx6_2.xls)所示。年级和性别之间无交互作用,试在0.01的显著 水平下判断:(1) 不同年级的学生平均身高是否有显著差异;(2) 男生和女生的平均身高是否有显著差异.表6-4学生身高数据年级性别身高大一男生175169173182165172175176女生165164160167158172162165大二男

22、生168175179185169172174176女生163156162173180163168164大三男生172183172170169167173168女生162165158156163170162166大四男生182175168173175172168180女生156158165164168173167162【练习6-3】某家上市公司有若干下属子公司,公司主要经营三种业务。公司总裁为了 解下属公司的经营状况,从下属公司中随机抽出了四家公司,并调查了每家公司在这三种主 营业务上的连续两个季度的利润率,调查结果如表6-5(lx6_3.xls)所示。表6-5四家子公司的主营业务利润率(%)公司1公司2公司3公司4主营业务1季度110.35-2.89-5.045.29季度24.470.302.61-3.44主营业务2季度111.254.851.829.76季度27.925.120.561.93主营业务3季度1-6.55-9.06-9.67-2.81季度2-4.32-3.48-12.43-4.08试进行用双因素方差分析并回答以下问题:(1) 各子公司的利润率是否有显著的差异?(2) 各主营业务的利润率是否有显著的差异?(3) 不同子公司在各主营业务上的利润率是否有所差别?

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号