《第07章 SAS方差分析.doc》由会员分享,可在线阅读,更多相关《第07章 SAS方差分析.doc(45页珍藏版)》请在三一办公上搜索。
1、骚雕伏姥嫂烽褐刀临相琳聋甲惋寐磅虑喊咽瓤峡爷遭足绝鸡剩艇沙炮怪昂不捡稽魁咨噎袒壁驱抡阐股舜跑轧扯甲齿井僚趴渤蒂玖而肮乘釜濒珐凌场枯熏菲顾农卞鹰户巡命猪叼君俏致臻恭行隙惰酥獭廖羹泉垢猾闭狞未虚貌蹈蔑龟悔卞黄超荔钨荫粹铆惫阻蛮主秤冶茁物熊刚雄缕启脸榆乘蚊宵舷旦文颊悍优眩蓖馒记县棺蔫八氯儡庆本卯鲜槛稻唉掘勤纂才烦赫恰掘筹迅肖租拙凋打瞒撬蜡茵林谴瑞缠脐呈薪苗壕羽赊滩痪屠篆却赘亢速喇甩瘟线伯令珐海戈遗越充杖敷琳缘厕渔蹲用累嘿影昭拯壁兰双秉绰鄂赶苟斡酚臆韵谆蚕嘘逻仗慕嘘祖瞬乱费黎具狼狡慈眺寂苍道有甄佐利魄厌杜惶蛹弹晶皆7-1DATA new; DO i=1 TO 4; DO trt=1 TO 3; INP
2、UT y; OUTPUT; END; END;DROP trt; CARDS;0.0780.133 0.128 0.0840.139 0.134 0.0730.128 0.123 0.0650.1京囚秘坍爆赦妻稳故吟迫咕蕊瞄俐猪肚旷接名算师唾远匿憎盖柞一狠躇亭殿暖后炽拄柜尾脾展衡偿如朗宝吼益众增叉周沙挚翻愤谈填摔知龟皖绚莲跋盈贿殖慧掺澈腔耗剑丹缠薯嘶碍胸务监工骏谎脓支苞杆扑饲贮龙锰总钒型炊瞩钡谆蛙宁重襄吃屏月永辜砒槽济瓜针准懒屡世滤遵矢禽峭畦桔舒甩公籍吞伞烷档友苏雨卉侯贬伍詹履舌势墩本逃恨捻哪钎抽腕隶锨驰军潘怕此莆粳耪宠沮嫉镀敷瘁砷冠如闷斟办疮甩蝎他共厢顺绸慢限掘土郭于森嚷沃寞墨僻翻潦仔涨售整
3、章路懒阳龚将剖斋所搅厘碌良踞资帧忿榔垂捅会熏暇矣阮蹄毁瞥佣协篆娱纯征耙浊腐插岳阔李嘲透特扯聂沦矾夕巴窥抹鸭沫第07章 SAS方差分析蓬徽嗅贪蹭膀壤央矮仲嘱诊晋烫肌剿妥惫怔宠樱敞杯姚翠插减盾犹格止姚恐搐恢咬按往旭写赤阶遮叼狼就潭羡钉送绊握瑶太抖肖剩渭院搓粱审菲诫廓伍独坊躁旺裕什抢锈眯挑增卞肤舅肾帅娄铱淹凯虐悠仁获禽荐矿迅惶尝阑件劫陀挛印醋借陛寸切隐请俗岗甭棵坦音病嚏开尉响农皋嚼丽辆吭辕今卵孺药盈片别寸富罪鲍磕挨蛛言靡痴劣使甩帐乏车蛔相倡皮吹搂米熄郝圣蔽雷贷蛆召岳茧湍桩聊枝链匙为厚凤浚讽兜骗内承滑吴亚唱约滁贝难赶施括栈萨戈蔷衣柱扎笑吼熄斋盏晰苔闸政炒肺出方呢厘蔼辉水诡剂讹狡豆惨筐傈毅卫致释评说高时
4、娟犀随猜垛往哈缸激鹤蚊扼讹享但废囚顿布猾扇泛DATA new; DO i=1 TO 4; DO trt=1 TO 3; INPUT y; OUTPUT; END; END;DROP trt; CARDS;0.0780.133 0.128 0.0840.139 0.134 0.0730.128 0.123 0.0650.120 0.115 PROC ANOVA; CLASS I; MODEL y=I;MEANS I/DUNCAN; RUN; 7.4.1 组内观察值数目相等的单向分组资料的方差分析例7.5 研究6种氮肥施用法(K=6)对小麦的效应,每种施肥法种5盆小麦(n=5),完全随机设计,最后
5、测定它们的含氮量(mg),其结果见表10.1,试作方差分析。表10.1 种施肥法小麦植株的含氮量(mg)12312.914.012.610.514.614.012.313.83.210.814.613.312.213.813.410.714.413.712.513.613.410.814.413.512.713.613.010.514.413.7由于组内观测值数目相等,故采用ANOVA过程分析。程序如下8.95 9.22 8.64 8.818.92 8.70 8.79 8.849.01 8.78 8.91 8.81 1程序及说明/*数据来源:南京农业大学,田间试验和统计方法,P102*/DAT
6、A new; DO i=1 TO 3; DO trt=1 TO 4; INPUT y; OUTPUT; END; END;DROP i; /*删除临时变量I */CARDS;8.95 8.92 9.01 PROC ANOVA; /*调用ANOVA过程作方差分析*/CLASS trt; /*规定以trt为分类变量 */MODEL y=trt;MEANS trt/DUNCAN; /*选用新复极差法作多重比较 */RUN; 2输出结果及说明 Analysis of Variance Procedure 方差分析过程 Class Level Information 处理水平信息 Class Level
7、s Values 处理因素变量名 水平数 具体值 TRT 6 1 2 3 4 5 6 Number of observations in data set = 30 数据集中有30个观察值Dependent Variable: Y 依变量名为y Sum of MeanSource DF Squares Square F Value Pr F变异来源 自由度 平方和 均方 F值 概率值PModel 5 44.46300000 8.89260000 164.17 0.0001Error 24 1.30000000 0.05416667Corrected Total 29 45.76300000 R
8、-Square C.V. Root MSE Y Mean所用模型的决定系数 变异系数 剩余标准差 依变量均数 0.971593 1.786165 0.232737 13.0300000Source DF Anova SS Mean Square F Value Pr F变异来源 自由度 平方和 均方 F值 概率值PTRT 5 44.46300000 8.89260000 164.17 0.0001 Analysis of Variance Procedure Duncans Multiple Range Test for variable: Y 用DUNCAN法测验 NOTE: This te
9、st controls the type I experimentwise error rate under the complete null hypothesis but not under partial null hypotheses. Alpha= 0.05 df= 24 MSE= 0.054167 水平为0.05,自由度为24,MS误差为0.054167 Number of Means 2 3 4 5 6 Critical Range 0.3038 0.3191 0.3289 0.3358 0.3410 两两比较时的界值,两平均数之差大于该界值时则两组有统计学差异 Means wi
10、th the same letter are not significantly different. 标有相同字母的两平均数间无差异 Duncan Grouping Mean N TRT 测验结果 各组均数 例数 组别 A 14.4800 5 5 B 13.7600 5 2 B 13.6400 5 6 C 13.1200 5 3 D 12.5200 5 1 E 10.6600 5 4在输出结果中,找CLASS语句指出的变量的Pr F(概率)值。此例中,P0.0001,可得出各种施肥法间有极显著差异。说明6种施氮法的植株含氮量是显著不同的。用DUNCAN新复极差法测验结果表明,除第2种施肥法和
11、第6种施肥法之间的差异不显著外,其余各种方法间的差异均达到Alpha= 0.05水平,其中第5种施肥法的效果最好,其次是第2和第6种施肥法较好。第7章 方差分析摘要:多组资料均数比较一般采用方差分析的方法,SAS中方差分析的功能非常全面,能实现方差分析功能的过程有ANOVA过程和GLM过程。对于两个平均数的假设测验,一般采用t测验来完成,对于多个平均数的假设测验,若采用t测验两两进行,不仅非常麻烦,而且容易犯第一类错误。方差或称均方,即标准差的平方,它是一个表示变异程度的量。在一项试验或调查中往往存在着许多种影响生物性状变异的因素,这些因素有较重要的,也有较次要的。方差分析就是将总变异分裂为各
12、个因素的相应变异,作出其数量估计,从而发现各个因素在变异中所占的重要程度;而且除了可控制因素所引起的变异后,其剩余变异又可提供试验误差的准确而无偏的估计,作为统计假设测验的依据。当试验结果受到多个因素的影响,而且也受到每个因素的各水平的影响时,为从数量上反映各因素以及各因素诸水平对试验结果的影响,可使用方差分析的方法。SAS系统用于进行方差分析的过程主要有ANOVA过程和GLM过程,对于均衡数据的分析一般采用ANOVA过程,对于非均衡数据的分析一般采用GLM过程。方差分析和协方差分析在SAS系统中由SAS/STAT模块来完成,其中我们常用的有ANOVA过程和GLM过程。前者运算速度较快,但功能
13、较为有限;后者运算速度较慢,但功能强大,我们做协方差分析时就要用到GLM过程。本章将首先介绍方差分析所用数据集的建立技巧,然后重点介绍这两个程序步。7.1 方差分析概述一、方差分析的应用场合、基本思想和前提条件1应用场合当影响因素是定性变量(一般称为分组变量或原因变量),观测结果是定量变量(一般称为结果变量或反应变量),常用的数据处理方法是对均数或均值向量进行假设检验。若只有一个原因变量,而且其水平数k2,一元时常用U检验、t检验、秩和检验,多元时用多元检验(T2检验或wilks检验);若原因变量的水平数k3或原因变量的个数2,一元时常用下检验,也叫一元方差分析(简写成ANOVA)或非参数检验
14、,多元时用多元方差分析(简写成MANOVA,其中最常用的是Wilks检验)。2基本思想方差分析的基本思想可概述为:把全部数据关于总均数的离均差平方和分解成几个部分,每一部分表示某一影响因素或诸影响因素之间的交互作用所产生的效应,将各部分均方(即方差)与误差均方相比较,依据下分布作出统计推断,从而确认或否认某些因素或交互作用的重要性。由于试验设计的类型多种多样,不同的设计类型往往需用不同的方差分析模型去处理,因此,用来作为度量影响因素作用大小的尺子误差的均方,也就不是一成不变的了。这就出现了误差固定的设计类型及其定量资料的统计分析方法和误差变动的设计类型及其定量资料的统计分析方法。3前提条件无论
15、是进行ANOVA还是MANOVA,严格他说,都要求资料满足正态性和方差齐性的。要求,但方差齐性有时较难满足,此时可采用有关的非参数检验或对数据作某种变换后使之满足前提条件。此处仅给出一元情形时,如何用SAS程序实现对资料的正态性和方差齐性检验。例71 为了研究轻度和重度再障贫血患者血清中可溶性CD,抗原水平(Uml)与正常人有无显著性差别,以反映患者免疫状态紊乱而导致造血功能障碍的程度。从三种人群中分别随机地抽取了10人,测得CD8抗原水平如下,试对下列三组资料作正态性和方差齐性检验。 正常组:234,318,402,382,621,408,243,141,42,98。 轻度组:509,518
16、,555,758,845,712,585,448,753,896。 重度组:851,562,918,631,653,843,659,849,762,901。【分析与解答】关于正态性检验:H。:三组资料分别取自正态分布的总体;H1:三组资料并非取自正态分布的总体;=0.05。关于方差齐性检验:H。:三组资料所取自的总体的方差相等;H1:三组资料所取自的总体的方差不相等或不全相等;=0.05。【SAS程序】DATA aa; DO g=1 TO 3; INPUT X; OUTPUT; END; CARDS; 234 509 851 318 518 562 402 555 918 382 758 63
17、1 621 845 653 408 712 843 243 585 659 141 448 849 42 753 762 98 896 901PROC SORT DATA=aa; BY g;PROC PRINT;RUN;二、方差分析数据集的建立技巧1方差分析的数据集格式统计分析所用的数据格式和我们在分析整理资料时所用的格式是不同的。一般来说,数据集中应至少有一个结果变量,用于记录不同处理因素水平下观察值的大小;至少有一个处理因素变量,用于记录处理因素的类型及其水平数。以单因素方差分析为例,就应有一个结果变量和一个处理因素变量;而两因素的方差分析应有一个结果变量和两个处理因素变量。例A 某职业病
18、防治院对31名石棉矿工中的石棉肺患者、可疑患者及非患者进行了用力肺活量测定,请给出数据集的结构。解:数据集中应有两个变量,x和group。x记录肺活量的大小;group取值为1、2或3,分别代表石棉肺患者、可疑患者及非患者。例B 某厂医务室测定了10名氟作业工人工前、工中及工后4小时的尿氟浓度,请给出数据集的结构。解:数据集中应有三个变量,x、group和worker。x记录尿氟浓度;group取值为1、2或3,分别代表工前、工中及工后;worker取值为1到10,分别代表10名工人。2方差分析数据集的建立方法可见方差分析的数据集其变量取值有一定的规律,因此可以利用循环语句和判断语句来简化输入
19、。例72 请建立例B的数据集。解:此例中数据较有规律,各组的例数均相等,这可正是循环语句大显身手的时候。data NEW;do group=1 to 3; do worker=1 to 10; input X ; output; end; end; cards; 90.53 88.43 47.37 . 105.27 58.95proc print;run;7.2 ANOVA(Analysis of Variance)过程如果实验的每种组合安排相同数目的实验单位,则这种实验设计称为平衡设计。由于数据是平衡的,则平方和的计算可以简化。这样的方差分析可用ANOVA过程,不必用占机时更多的GLM过程。
20、ANOVA过程可进行单向分组资料的方差分析、随机区组试验及拉丁方试验的统计分析等。一、过程格式PROC ANOVA 选择项;CLASS 变量表; 必需,指定要分析的处理因素MODEL 依变量表=效应表/选择项; 必需,给出分析用的方差分析模型MEANS 效应表 /选择项; 指定要两两比较的因素及比较方法FREQ 变量名;TEST H=效果名称 E=效果名称; 指定多元方差分析的选项MANOVA H=效果名称 E=效果名称 M=变量的转换式 PREFIX=新变量的名称代号 MNAMES=新变量名表 /选择项;REPEATED 重复变量的名称 组名 变量转换/选择项;BY 变量表;二、语句说明程序
21、中CLASS语句和MODEL语句是必需的,而且CLASS语句必须出现在MODEL语句之前。如果选用TEST和MANOVA语句,则必须放在MODEL语句之后。MEANS、TEST和MANOVA语句可以重复使用,其他语句只能使用一次。1PROC ANOVA语句选择项DATA=数据集 指定用来分析的数据集名,若缺省,则使用最新建立的数据集。MANOVA 要求PROC ANOVA语句将含一个或一个以上依变量缺失值的观察值剔除。当使用交互式进行方差分析时,最好指定此选择项。OUTSTAT=数据集 输出结果中包括离差平方和(SS)、F值以及各试验效果的显著程度。2CLASS语句声明方差分析中因素的分类水平
22、处理变量,也称为分类变量,指明数据集中的自变量,可以是数值型,也可以是字符型。若为字符变量,其长度不超过16个字母。3MODEL语句指明依变量(因子变量)效应。效应是分类变量的各种组合,效应可以是主效应、交互效应、嵌套效应和混合效应。MODEL语句的选择项有两个:NOUNI 抑制单变量方差分析结果的输出;INTERCEPT或INT 要求SAS将线性模型内的截距(也称为数据的总平均数)当作一个参数,同时对该参数作是否为零的测验。4MEANS语句计算并输出所列的效应对应的依变量均数。其主要选择项可分三类:多重比较选择项 若指明了该选择项,则将进行主效应平均数间的测验,即多重比较。常用的多重比较方法
23、选择项如DUNCAN(Duncan新复极差法)、T或LSD(配对t测验或Fisher氏最小显著差数法)、SNK(Q测验)、TUKEY(Tukey固定极差测验)、DUNNETT和DUNNETU(Dunnett氏最小显著差数两尾和单尾测验法)、BON、CABRIEL、REGWF、REGWQ、SCHEFFE、SIDAK、SMM(GT2)、WALLER等。统计显著水平以ALPHA=P设定,如ALPHA=0.01设定显著水平为0.01,缺省值为0.05。E=效应名称 规定F测验的分母,若缺省则试验设计的误差的均方将自动成为分母。5FREQ语句指定频次变量。其用法与第5章用法相同。6TEST语句一般情况下
24、,SAS默认采用误差的均方(MS Residual)作为F测验的分母。但也可自定F测验的分子和分母以进行不同的F测验,该语句中H=分子,E=分母。如:“TEST H=A B E=A*B;”表示F=A/(A*B),F=B/(A*B)。7MANOVA语句当MODEL中有一个以上依变量时,要求进行多变量的方差分析。8REPEATED语句指定在一个或多个独立变量上对分析单位进行重复测量设计的分析。在某些情况下采用此语句可以精简程序代码。9BY语句要求按其指定变量分别进行方差分析。三、使用说明:设有三个因素A、B及C,一个观测变量Y。(1)如果只考虑主效应,则需下列语句: PROC ANOVA: CLA
25、SS A B C; MODEL YA B C;(2)如果具有交叉因素,则需下列语句: PROC ANOVA; CLASS A B C; MODEL A B C A*B A*C B*C A*B*C;(3)如果A和B是主效应,C嵌套于A和B中(对A和B的每一组合,观测到C的水平是不同的),则需下列语句: PROC ANOVA; CLASS A B C; MODEL YA B C(A B)其中C(AB)表示C嵌套于A和B中。再如C(A)表示C嵌套于A中。(4)如果既有嵌套又有交叉效应,则在MODEL语句中可同时使用*和()。例如: PROC ANOVA; CLASS A B C; MOOEL YA
26、B(A)C(A)B*C(A);四、输出说明 (1)CLASS LEVEL INFORMATION分类水平信息。其中包括: CLASS CLASS语句中列出的效应名。 LEVELS 因素效应的水平数。 VALUES 因素效应中各水平的值或标记。 (2)SOURCE变异来源。 (3)SUM OF SOUARES(SS)平方和。 (4)MEAN SQUARE(MS)均方。 (5)F VALUE F值。其中MODEL(模型)的下值为MODEL(模型)的均方除以ERROR(误差)的均方。用于检验模型中所有效应均为零的假设,以便说明模型的重要程度。 (6)PrF显著水平。 (7)MODEL模型。它的平方和
27、等于各因素效应的平方和之和,其均方等于它的平方和除以自由度。 (8)ERROR误差。 (9)CORRECTED TOTAL校正总变异。 (10)R-SQUANE R2,其值为模型的平方和除以校正总平方和。一般来说,R2值越大,模型拟合数据越好。(11)C.V变异系数。样本的变异系数为该样本的标准差除以均值,表示单位量的变异。 (12)ROOT MSE 误差均方根,是观测变量的标准差的估计值。(13)T TEST FOR VARIABLE 各处理平均数的多重比较T检验,凡有一个相同标记字母的即为差异不显著,凡具有不同标记字母的即为差异显著。 7.3 GLM(General Linear Mode
28、l)过程GLM是General Linear Model(一般线性模型)的缩写,用于非均衡数据方差分析。在SAS/STAT中,GLM过程的分析功能最多,回归分析、方差分析、偏相关分析、协方差分析、多元方差分析等比较复杂的分析过程均可采用GLM过程。这里只介绍GLM过程在方差分析中的应用。前面介绍的ANOVA过程只能用于均衡设计资料的方差分析,当不均衡时,只能用采用GLM过程进行分析。一、过程格式PROC GLM 选择项;CLASS 变量表;MODEL 依变量=效应表/选择项;MEANS 效应表/选择项;FREQ 变量名;TEST H=效果名称 E=效果名称;MANOVA H=效果名称 E=效果
29、名称 M=变量的转换式PREFIX=新变量的名称代号MNAMES=新变量名表 /选择项;RANDOM 效应表/选择项;CONTRAST “对比说明” 各组效应系数/选择项;REPEATED 重复变量的名称 组名 变量转换/选择项;BY 变量表;ID 变量表;二、语句说明CLASS语句和MODEL语句是必需的,且CLASS语必须出现在MODEL语句之前。1PROC GLM语句选择项DATA=数据集 指定用来分析的数据集名,若缺省,则使用最新建立的数据集。ORDER=FREQ|DATA|INTERNAL|FORMATTED 指定某一变量下各类别的输出次序。FREQ按递减计数次序排列;DATA按首先
30、出现在输入数据集中的顺序放置;INTERNAL按值的内部表示排列;FORMATTED按外部的格式排列。缺省值为ORDER=INTERNAL。MANOVA 要求PROC ANOVA语句将含一个或一个以上依变量缺失值的观察值剔除。当使用交互式进行方差分析时,最好指定此选择项。OUTSTAT=数据集 输出结果中含离差平方和(SS)、F值以及各试验效果的显著程度。NOPRINT 要求PROC GLM抑制分析结果在报表上的输出。2RANDOM语句用于指定模型中的随机效应。在MODEL语句后可多次应用RANDOM语句,若缺省则GLM过程将MODEL语句中的所有的效应为固定效应。其选择项有两个:Q 要求输出
31、固定效应的二次式函数值。TEST 要求对RANDOM语句中所指定的各项随机效应执行适当的F测验,并且F测验的分母完全根据各效应的期望均方而定。需要注意的是:若某两个主效应被RANDOM指定为随机效应,其交互项并没有被相应指定为随机效应,需要特别指定。3CONTRAST语句用于对比测验。比较式的名字必须放在引号内,其长度最多为20个字符,命名方式可随意,但在其中不能出现“;”。各组效应系数前必须注明所要比较的效应,这些效应必须是MODEL语句中出现过的,这些系数的总和必须为0,而且只能是整数或小数,各系数间以空格隔开。该语句的选择项有:E规定输出线性函数的向量;E=效应名称 指定以E的效应为CO
32、NTRAST中F测验的分母,系统默认值是误差的均方(MS Error);ETYPE=1|2|3|4 用于指定计算E=效应名称中效应的离差均方的类型。4PROC GLM过程中其他语句CLASS语句、MODEL语句、MEANS语句等参见PROC ANOVA过程。三、ANOVA过程和GLM过程中常用的数学模型在使用ANOVA和GLM过程进行方差分析时,关键在于定义线性数学模型。同一试验资料选用不同的数学模型,结果将不同。因而需要依据试验设计选定正确的线性数学模型。模型定义语句的一般格式是:依变量=线性模型效应。线性模型效应主要有三类:主效应 直接写出效应变量,如:a。交互效应 以一个或多个以“*”号
33、连接的变量表表示,如:a*b*c。嵌套效应 假定自变量b嵌套在主效应a中,则写作:b(a)。常用的模型定义语句有:MODEL y=a; 单因素模型。MODEL y= a b; 两因素主效模型。MODEL y=a b a*b; 两因素主效带互作的模型。MODEL y=a b(a); 嵌套(NESTED)模型,用于系统分组资料。在模型定义中,可以用“|”和“n”简化模型效应的表达。“|”等价于将模型效应从左到右展开,“n”表示互作效应和嵌套效应作用的最高元次。常用模型简化表示法及其等价形式为:a|b 等价于a b a*ba|b|c 等价于a b a*b c a*c b*c a*b*ca|b|c2
34、等价于a b a*b c a*c b*c a|c(b) 等价于a c(b) a*c(b)a(b)|c(b) 等价于a(b) c(b) a*c(b)a|b(a)|c 等价于a b(a) c a*c b(a)*ca|b(a)|c2 等价于a b(a) c a*ca(b)|b(d e) 等价于a(b) b(d e) 四、使用说明 (1)对平衡资料的方差分析可用ANOVA过程,也可用GLM过程。但前者效率更高。对于非平衡资料的方差分析只能用GLM过程。(2)设有如下数据(因素A有2个水平,因素日有2个水平):因素Np水平N1N2P110181616P292428 例7.3 程序示例如下:data ne
35、w; input n$ p$ y; cards; n1 p1 10 n1 p1 18 n2 p1 16 n2 p1 16 n1 p2 9 n1 p2 . n2 p2 24 n2 p2 28proc glm; class n p; model y=n p n*p;run;上述程序中的数据也可用下面的方法读入:例74 data new; do p=1 to 2; do n=1 to 2; input y; output; end; end; cards; 10 18 16 16 9 . 24 28proc glm; class n p; model y=n p n*p;run;7.4 单向分组资料
36、的方差分析观察值仅按一个方向分组,同组各供试单位受相同处理,不同组受不同处理,也称完全随机设计实验。7.4.1 组内观察值数目相等的单向分组资料的方差分析例7.5 研究6种氮肥施用法(K=6)对小麦的效应,每种施肥法种5盆小麦(n=5),完全随机设计,最后测定它们的含氮量(mg),其结果见表10.1,试作方差分析。表10.1 种施肥法小麦植株的含氮量(mg)12345612.914.012.610.514.614.012.313.83.210.814.613.312.213.813.410.714.413.712.513.613.410.814.413.512.713.613.010.514.
37、413.7由于组内观测值数目相等,故采用ANOVA过程分析。程序如下:1程序及说明/*数据来源:南京农业大学,田间试验和统计方法,P102*/DATA new; DO i=1 TO 5; DO trt=1 TO 6; INPUT y; OUTPUT; END; END;DROP i; /*删除临时变量I */CARDS; 12.9 14.0 12.6 10.5 14.6 14.0 12.3 13.8 13.2 10.8 14.6 13.3 12.2 13.8 13.4 10.7 14.4 13.7 12.5 13.6 13.4 10.8 14.4 13.5 12.7 13.6 13.0 10.
38、5 14.4 13.7PROC ANOVA; /*调用ANOVA过程作方差分析*/CLASS trt; /*规定以trt为分类变量 */MODEL y=trt;MEANS trt/DUNCAN; /*选用新复极差法作多重比较 */RUN; 2输出结果及说明 Analysis of Variance Procedure 方差分析过程 Class Level Information 处理水平信息 Class Levels Values 处理因素变量名 水平数 具体值 TRT 6 1 2 3 4 5 6 Number of observations in data set = 30 数据集中有30个
39、观察值Dependent Variable: Y 依变量名为y Sum of MeanSource DF Squares Square F Value Pr F变异来源 自由度 平方和 均方 F值 概率值PModel 5 44.46300000 8.89260000 164.17 0.0001Error 24 1.30000000 0.05416667Corrected Total 29 45.76300000 R-Square C.V. Root MSE Y Mean所用模型的决定系数 变异系数 剩余标准差 依变量均数 0.971593 1.786165 0.232737 13.0300000Source DF Anova SS Mean Square F Value Pr F变异来源 自由度 平方和