《第节非参数假设检验法.PPT》由会员分享,可在线阅读,更多相关《第节非参数假设检验法.PPT(55页珍藏版)》请在三一办公上搜索。
1、第4.3节 非参数假设检验法,二、柯尔莫哥洛夫及斯米尔 诺夫检验,三、独立性检验,问题的引入,第二节涉及到的假设检验方法均假设总体服从正态分布。总体服从什么分布,一般无法预先知晓,因而需要利用样本检验总体分布的各种假设。,本节将主要讨论关于总体分布的假设检验问题,此类问题通常称为非参数统计方法.,下面主要介绍其中常见的3种方法.,一、拟合检验法,说明,(1)在这里备择假设H1可以不必写出.,则上述假设相当于,则上述假设相当于,3.皮尔逊定理,定理4.1,注意:,4.多项分布的 检验法,检验的假设为,由前面的分析可以看出,选择皮尔逊统计量,拒绝域为,解,例1,试检验这颗骰子的六个面是否匀称?,根
2、据题意需要检验假设,把一颗骰子重复抛掷 300 次,结果如下:,H0:这颗骰子的六个面是匀称的.,其中X表示抛掷这骰子一次所出现的点数(可能值只有6个),在 H0 为真的前提下,所以拒绝 H0,认为这颗骰子的六个面不是匀称的.,5.一般分布的 检验法,假设检验的问题为,经过上述处理,此问题又转化为检验多项分布问题.,选择皮尔逊统计量,拒绝域为,例2(p131例4.11),某盒中装有白球和黑球,现做,下面的试验,用返回式抽取方式从盒中取球,直到取到白球为止,记录下抽取的次数,重复如此的试验100次,其结果为:,试问该盒中的白球与黑球的个数是否相等(=0.05)?,解,从题意可知,该总体服从几何分
3、布,,若黑球白球个数相等,则p=1/2,因此,由此可知,检验的假设是,计算皮尔逊统计量可得:,查表可得,显然,因而接受原假设,黑球白球个数相等.,6.分布中含有未知参数的 检验法,假设检验的问题为,由此可以看到,此问题又可以转化为多项分布的假设检验问题,其统计量为,定理4.2,此类假设检验的拒绝域为,下面举例说明,在一试验中,每隔一定时间观察一次由某种铀所放射的到达计数器上的 粒子数,共观察了100次,得结果如下表:,例3,解,问题归结为:在水平0.05下 检验假设,由最大似然估计法得,根据题目中已知表格,具体计算结果见下表,表1 例3的,拟合检验计算表,6,6,4.615,5.538,=10
4、6.281,0.078,0.065,故接受H0,认为样本来自泊松分布总体.,自1965年1月1日至1971年2月9日共2231天中,全世界记录到里氏震级4级和4级以上地震共162次,统计如下:,(X表示相继两次地震间隔天数,Y表示出现的频数),试检验相继两次地震间隔天数 X 服从指数分布.,解,所求问题为:在水平0.05下检验假设,例4,由最大似然估计法得,X 为连续型随机变量,(见下页表),=163.5633,13.2192,表2 例4的,拟合检验计算表,在 H0 为真的前提下,X 的分布函数的估计为,故在水平0.05下接受H0,认为样本服从指数分布.,下面列出了84个依特拉斯坎人男子的头颅
5、的最大宽度(mm),试验证这些数据是否来自正态总体.,例5,解,所求问题为检验假设,由最大似然估计法得,(见表3),在 H0 为真的前提下,X 的概率密度的估计为,5.09,14.37,4.91,表3 例5的,拟合检验计算表,故在水平0.1下接受H0,认为样本服从正态分布.,二、柯尔莫哥洛夫及斯米尔诺夫检验,1.检验法的缺点,此种检验依赖于区间划分,划分的巧合可能导致检验的错误,例如,这样的结果不会影响皮尔逊统计量的值,因而可以导致接受错误的假设.,本节将介绍柯尔莫哥洛夫斯米尔诺夫检验法,柯尔莫哥洛夫检验法可以检验经验分布是否服从某种理论分布,斯米尔诺夫检验法可以检验两个样本是否服从同一分布。
6、,2.柯尔莫哥洛夫检验,首先看两个定理,这是柯尔莫哥洛夫检验的基础.,定理4.3,设F是连续的分布函数,则,定理4.4,设F是连续的分布函数,则,上述两个定理证明略。它们将是柯尔莫哥洛夫检验法的理论基础.,假设检验的问题为,只要原假设不真,则统计量的值就会偏大,因而给定显著性水平,可以选择临界值使得,则此检验法的拒绝域为,当n 100时,利用极限分布定理4.4可得,例6(p136例4.13),某矿区煤层厚度的厚度的123个,数据的频数分布如下表所示,试用柯尔莫哥洛夫检验法检验煤层的厚度是否服从正态分布?,解,用X表示煤层厚度,欲假设检验,由于参数未知,因而首先对参数进行估计,显然,因此接受原假
7、设,认为煤层厚度服从正态分布.,注,分布函数F(x)的置信区间,3.斯米尔诺夫检验,假设检验的问题为,为了得到显著性水平下的拒绝域,需要如下定理:,定理4.5,如果F(x)=G(x),且F是连续函数,则,定理4.6,上述两个定理证明略。它们将是斯米尔诺夫检验法的理论基础.,如果F(x)=G(x),且F是连续函数,则,只要原假设不真,则统计量的值就会偏大,因而给定显著性水平,可以选择临界值使得,则此检验法的拒绝域为,例7(p139例4.14),工人刚接班时,先抽取150个零件作为样本,在自动车床工作两小时后,再抽取100个零件作为第二次样本,测得每个零件距离标准的偏差X,其数值列入下表,试比较两个样本是否来自同一总体?,在自动车床上加工某一零件,在,解,欲假设检验,计算两个样本对应的经验分布函数,显然,因此拒绝原假设,即可认为两个样本来自不同总体,三、独立性检验(略),1.列联表的形式,上述问题可以用一个表格列联表来表示如下,列联表,检验的问题为:,统计量选择为,拒绝域为,例8(p143例4.15),调查339名50岁以上的吸烟者与慢性,气管炎的关系,结果如下表,检验的问题为:,解,统计量为,观察值为,上侧分位数,显然,因而拒绝原假设,即认为慢性气管炎与吸烟有关,再 见,