应用多元统计分析报告SAS作业.doc

上传人:李司机 文档编号:1180785 上传时间:2022-07-15 格式:DOC 页数:12 大小:2.23MB
返回 下载 相关 举报
应用多元统计分析报告SAS作业.doc_第1页
第1页 / 共12页
应用多元统计分析报告SAS作业.doc_第2页
第2页 / 共12页
应用多元统计分析报告SAS作业.doc_第3页
第3页 / 共12页
应用多元统计分析报告SAS作业.doc_第4页
第4页 / 共12页
应用多元统计分析报告SAS作业.doc_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《应用多元统计分析报告SAS作业.doc》由会员分享,可在线阅读,更多相关《应用多元统计分析报告SAS作业.doc(12页珍藏版)》请在三一办公上搜索。

1、5-9 设在某地区抽取了14块岩石标本,其中7块含矿,7块不含矿。对每块岩石测定了Cu,Ag,Bi三种化学成分的含量,得到的数据如表1。表1 岩石化学成分的含量数据类型序号CuAgBi类型序号CuAgBi含矿1不含矿82931041153.5412613714(1)假定两类样本服从正态分布,使用广义平方距离判别法进展判别归类先验概率取为相等,并假定两类样本的协方差阵相等;(2)今得一块标本,并测得其Cu,Ag,Bi的含量分别为2.95,2.15和1.54,试判断该标本是含矿还是不含矿?问题求解1 使用广义平方距离判别法对样本进展判别归类用SAS软件中的DISCRIM过程进展判别归类。SAS程序

2、与结果如下。data d59;input group x1-x3;cards;1 2.9 1.23 11 3.55 1.15 12 1.94 1.4 12 3 1.3 1;procprintdata=d59;run;procdiscrimdata=d59 pool=yes distancelist;class group;var x1-x3;run;由输出结果可知,两总体间的广义平方距离为D2=3.19774。还可知两个三元总体均值相等的检验结果:D=,F=,p=,故在显著性水平时量总体的均值向量有显著差异,即认为讨论这两个三元总体的判别问题是有意义的。线性判别函数为:判别结果为含矿的6号样本

3、错判为不含矿;不含矿的13号样本错判为含矿。2 对给定样本判别归类将Cu,Ag,Bi的含量数值2.95、2.15、1.54分别代入线性判别函数得:。贝叶斯判别的解 为,由于,因此待判的样品判为不含矿。5-10 某研究对象分为三类,每个样品考察4项指标,各类的观测样品数分别为7,4,6;类外还有3个待判样品所有观测数据见表2。假定样本均来自正态总体。表2 判别分类的数据样品号X1X2X3X4类别号1-90.012-36.033-3.024-54.015-35.026-37.037-42.038-35.019-20.0310-15.0111-40.0212-18.02.0213-15.018.01

4、14-14.050.0115-16.056.0116-26.021.0317-22.0-50.031-16.056.02-18.03.03-25.0-36.0(1)试用马氏距离判别法进展判别分析,并对3个待判样品进展判别归类。(2)使用其他的判别法进展判别分析,并对3个待判样品进展判别归类,然后比拟之。问题求解1判别分析与判别归类使用SAS软件中的DISCRIM过程进展判别归类,SAS程序与结果如下。data d510;input x1-x4 group ;cards;619901-1125-363-171732-4-15135410-142035219373-10-1921-4230-235

5、-35120-228-203-1007-151-10015-402131822-51518110-1814501-8-1416561-1326213-40-2022-503-8-141656 .-17183 .-1425-36 .;procprint;run;procdiscrimdata=d510 simplepcovwsscppsscp wcovdistancelist;class group;var x1-x4;run;从结果来看,样本2、3类之间的马氏距离为d212=1.34,检验 的F统计量为0.63177,相应的p=,故在显著性水平时量总体2、3类的均值向量没有显著差异,即认为对讨

6、论样本分为2、3类的判别问题是没有太大意义的。此外,判别结果中两个样本被判错归类:1类中8号样本应属于2类,2类中9号样本应属于1类;且待判得三个样本分别属于1,2,3类。2 二次判别函数判别由第一问SAS运行结果可知三个总体的协方差阵不同,因此使用二次判别函数进展判别。此时贝叶斯判别的解 为,其中将第一问中SAS程序proc discrim data=d510后参加pool=no,使其采用二次判别函数进展再分类,变动局部程序如下:procdiscrimdata=d510 simplepool=nodistancelist;程序运行结果如如下图。由此可知,17个观测全部判别正确;待判的三个观测

7、依次判归1,1,3类。5-11某城市的环保监测站与1982年在全市均匀地布置了14个监测点,每日三年次定时抽取大气样品,测量大气中的二氧化硫、氮氧化物和飘尘的含量。前后5天,每个取样点监测点每种污染元素实测15次,取15次实测值的平均作为该取样点的大气污染元素的含量数据见表3。表中最后一列给出的类号是使用第六章将介绍的聚类分析方法分析得到的结果第1类为严重污染地区,第2类为一般污染地区,第3类为根本没有污染地区。表3 大气污染数据污染元素样品号二氧化硫(X1)氮氧化物(X2)飘尘(X3)类别122232435361728191102113123130.2051140.21521516(1)试用

8、广义平方距离判别法建立判别准如此假设三个总体为多元正态总体,其协方差阵相等,先验概率取为各类样本的比例,并列出回判结果。(2)该城市另有两个单位在同一期间测定了所在单位大气中这三种污染元素的含量见表3中最后两行,试用马氏距离判别方法判断这两个单位的污染情况属于哪一类。问题求解用SAS软件中的DISCRIM过程进展判别归类。data d511;input x1-x3 group ;cards;22233121123312.;procprint;run;procdiscrimdata=d511 simpledistancelist;class group;var x1-x3;run;由输出结果可知三个三元总体均值相等的检验结果中均满足 p,故在显著性水平时量总体的均值向量有显著差异,即认为讨论这三个三元总体的判别问题是有意义的。判别结果:14个监测点全部判对。且待判的两个观测点依次判归2,3类。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号