《否则就有显着差异于是提出假设课件.ppt》由会员分享,可在线阅读,更多相关《否则就有显着差异于是提出假设课件.ppt(41页珍藏版)》请在三一办公上搜索。
1、8.1 假设检验的基本原理与两类错误8.2 正态总体的假设检验8.3 分布拟合检验,第8章 假设检验,下面通过一个具体实例引出假设检验的一些重要概念和基本思想。例8.1.1 某厂生产一种零件的尺寸 服从正态分布,从过去较长一段时间的生产情况来看,零件的平均尺寸为 mm,为检验该厂某批零件是否符合标准,现对该批零件随机抽取6件得到其尺寸数据(单位:mm)32.56,29.66,31.64,30.00,31.87,31.03,问该批零件的平均尺寸与过去是否有显著差异?,8.1.1 问题的提出,8.1 假设检验的基本原理与两类错误,我们的问题是判断该批零件的平均尺寸 是否为30.50mm,若 mm,
2、则认为其与过去没有显著差异,否则就有显著差异.于是提出假设:,称 为零假设或原假设(original hypothesis),为备择假设或对立假设(alternative hypothesis).一般地,把关于未知分布的各种陈述称为统计假设,简称为假设.若总体分布类型已知,仅对总体分布中未知参数的假设称为参数假设.如上例中仅对参数 的假设.在有些实际问题中总体分布未知,需对总体分布类型提出假设,这类对总体分布类型的假设称为非参数假设.,在假设检验中,零假设和对立假设的选择要看具体的目的和要求而定,如果我们希望通过样本观测值获得对某个论断的有力支持,则一般把这一论断的否定作为原假设.因为仅通过一
3、次抽样无法去证实一个论断,但用来否定一个论断的理由则比较充分.如上例中 为原假设,为对立假设.,在统计假设提出之后,就要寻找一个检验法则,在 与 之间作出判断,若拒绝原假设,就意味着接受对立假设,否则就不能拒绝(即接受)原假设.例8.1要检验总体均值,根据参数估计知样本均值是总体均值的良好估计,可考虑能否用样本均值 来进行判断,由抽样的结果知样本均值为,本次抽样 的取值 与过去生产零件的平均尺寸之间差异为0.63mm,这种差异有以下两种不同的解释.(1)若 成立,这种差异是由抽样的随机性造成的.,8.1.2 假设检验的基本思想,(2)若 不成立,抽样的随机性不可能造成0.63mm这么大的差异,
4、说明该批零件尺寸与过去生产的零件尺寸确实有明显差异.,从而问题的关键是0.63mm的差异能否用抽样的随机性来解释.为回答这一问题,由参数估计知道,样本均值 的大小在一定程度上反映了总体均值的大小.由于 未知,用 代替 与30.50作比较,如选用 作为衡量 是否成立的指标.如果 成立,则 应该较小,如果 较大,则差异就不能仅仅解释为样本随机性的影响了,从而有理由怀疑 是否成立.这样问题就转化为找一个合理的临界值,使得,当 时,接受;当 时,拒绝;,称(8.1.1)为一个检验例8.1.1中 假设的检验法.该检验法给出的检验规则实质上是把样本 的所有可能取值(或 的子集)分为互不相交的两部分:,于是
5、检验法(8.1.1)又可表述为,当 时,接受;当 时,拒绝;,因此问题是如何确定常数?为确定常数,我们适当选择一个小正数,称作显著性水平(level of significance),在 成立的条件下,确定随机事件 为小概率事件,即,根据小概率事件的实际不可能原理,即“在一次试验中小概率事件几乎是不可能发生的”原理.由(8.1.2)确定的事件为小概率事件,实际上是不可能发生的.如果根据抽样的结果,小概率事件 在一次抽样中发生了,则说明抽样得到的结果与原假设 不相符,因而有理由怀疑 的正确性.即在显著水平 给定时,拒绝.如果在一次抽样中小概率事件 没有发生,则没有充分理由拒绝,从而只能接受,这就
6、是显著性检验.,上例中取,因为总体,在 成立条件下,,查正态分布表有,根据(8.1.2)式,。,所以,即,而代入样本观测值,上式也等价于,给定 时,根据小概率事件原理,不能拒绝,即认为该批零件的尺寸与过去生产的零件尺寸没有显著差异。,通过上例分析,我们知道假设检验的基本思想是:从 成立出发,构造合适的检验法,根据小概率事件原理,如果导出“不合理”的结论,则拒绝,否则就不能拒绝,因而只能接受。上述思想可以概括为具有概率性质的反证法.假设检验的一般步骤为:(1)根据实际问题的要求提出原假设 与对立假设.(2)选取适当的统计量,作为衡量 是否成立的标准,在 成立时,的分布或渐近分布已知.(3)给定显
7、著水平,在 成立的条件下,借助统计量 确定一个小概率事件,从而把样本空间分为两个互不相交的区域,即拒绝域 和接受域.(4)作出判断,若样本观测值落入拒绝域,则拒绝,否则接受.,8.1.3两类错误,显著性检验是根据样本对原假设 作出接受还是拒绝的判断,由于样本的随机性和局限性.因此在作判断时,我们有可能犯两类错误:一类错误是,当 为真时,根据样本拒绝了,这类错误称之为第一类错误,也称为“弃真错误”.其发生的概率称为犯第一类错误的概率,通常记为,即,(拒绝|为真)=.,另一类错误是,当 为不真时,根据样本接受了,这类错误称之为第二类错误,也称为“采伪错误”,其发生的概率称为犯第二类错误的概率,通常
8、记为,即(接受|不真)=.在此我们把两类错的各种情况总结于表8-1中.,表8-1 两类错误,对于给定的一对 和,总可以找到很多不同的拒绝域,我们总希望找到这样的拒绝域,使得犯两类错误的概率 和 都很小.但是当样本容量 固定时,要想 和 都很小是不可能的,通常减少犯其中一类错误的概率,则犯另一类错误的概率就会增加。,基于这种情况,纽曼皮尔逊(Neyman-Pearson)提出了一个原则:即在样本容量 固定时,控制犯第一类错误的概率,寻找最优的检验法则,使犯第二类错误的概率 尽量小.具体实行这一原则有时也有许多困难,因而降低要求,仅对犯第一类错误的概率 加压控制,而不考虑犯第二类错误的概率,这类假
9、设检验问题称为显著性假设检验问题,相应的检验称为显著性检验.一般情形下,显著性检验法是较容易找到的,我们将在正态总体情形下详细讨论.,8.2 正态总体的假设检验,8.2.1 单个正态总体均值 的假设检验,设总体,是来自总体 的样本,为显著水平.(1)方差 已知,均值 的检验 检验的问题为(为已知常数),(8.2.1)由第六章抽样分布的理论知,当 成立时,(8.2.2)选取 作为此假设检验的统计量,对给定的显著水平,,因而拒绝域可取为 或 把样本观测察值 代入,得到统计量 的观察值 若,则拒绝,否则就接受.称此检验法为 检验法.,例8.2.1 某种电器元件的电阻,从过去生产情况看,其平均电阻一直
10、保持在2.64,标准差为0.06.改变加工工艺后,测得100个元件,其平均电阻为2.62,标准差不变.问新工艺的平均电阻与原来的有无显著差异?(取显著水平)解 检验问题为.使用 检验法,计算统计量 的观测值由,查表得,由于,所以拒绝,即认为新工艺元件的平均电阻与原来有显著差异.,以上讨论的假设检验问题中,提出的是双侧检验,即对立假设.有时在实际问题中,我们仅关心总体均值是变大还是减小的情况,因而对立假设为 或,这两类检验统称为单侧检验.其检验方法与双侧检验类似,只是拒绝域相应变为 和.另外,如果总体分布为非正态分布,但在 成立的条件下,统计量 的极限分布为正态分布,则在样本容量 较大时,近似服
11、从正态分布,这时 检验法仍可使用.如对产品次品率的检验,泊松分布参数的检验等.,例8.2.2 某地区成年男性中吸烟占75%,经过戒烟宣传之后,进行了抽样调查,发现100名被调查的成年男性,有63人是吸烟者,问戒烟宣传是否受到了成效?(取显著水平.)解 检验问题为.令 表示该调查该地区一名成年男性中吸烟的人数,则,为来自总体 的样本.由中心极限定理中知,在 成立的条件下,统计量 近似服从标准正态分布.因此可使用 检验法。,计算 的观测值对给定的,查表,因此拒绝,即认为戒烟宣传收到了成效.(2)方差 未知,均值 的检验对(8.3)式给出的假设检验问题,可构造如下的统计量,(8.2.3)其中.从而对
12、给定的显著水平,有,所以拒绝域可取为.称此检验法为 检验法.,例8.2.3 已知某种矿石含铁量服从正态分布,从中抽取5个样品,经测定其含铁量(%)分别为:3.24,3.26,3.24,3.27,3.25,问在显著水平 下,能否接受假设:这批矿石的含铁量为3.25?解 检验问题为.由于总体方差 未知,采用 检验法,.由此得统计量的观测值,对给定的,查表 而,故接受.即能认为这批矿石的含铁量为3.25%.对于以上假设检验问题,若采用第七章的区间估计的方法,能否作出对原假设 的判断?根据方差 未知,对均值 的区间估计.对给定的,可得其置信区间,根据小概率原理,若 成立,对给定的,可得置信度为95%的
13、置信区间应该包含,而现在一次样本的调查结果表明,因而无法拒绝,即认为这批矿石的含铁量为3.25%.通过本例可以看出,区间估计与假设检验的统计之处是相通的.实际上,假设检验的接受域也恰好是相应的区间估计的置信区间.,8.2.2 单个正态总体方差 的假设检验,设总体,是来自总体 的样本,未知.检验的问题为(为已知常数),(8.2.4)由于样本方差 是 的无偏估计,根据Fisher定理,当 成立时,从而可选取 作为检验统计量.对给定的显著水平 有 所以其拒绝域为.称此检验法为 检验法.,例8.2.4设某车间生产的铜丝的折断力,通常情形下,现从某批产品中抽查5根铜丝测得其折断力(单位:公斤)分别为 5
14、78,572,570,568,582,问在显著水平 下,能否接受该批铜丝的折断力的方差仍为 64?解 检验的问题为,由于总体均值 未知,采用 检验法,.由此得统计量的观测值,对给定的,查表,因而,故接受.即能认为这批铜丝的折断力的方差仍为64.以上(8.2.4)式的检验中,若均值 是已知的,检验统计量相应地为 从而对给定的显著水平,其拒绝域为.上述讨论的是关于方差假设检验问题的双侧检验情况,同样关于方差假设检验问题也存在单侧检验情形:,表8-2 单个正态总体参数的假设检验,8.3 分布拟合检验,前面讨论了在总体分布形式已知的前提下对其参数的假设检验问题,但在实际问题中,往往总体分布形式是未知的
15、,需要对总体分布形式进行推断.这类根据样本对总体分布类型进行假设检验的问题,统称为非参数假设检验.本节主要讨论 拟合检验.设总体 的分布 未知,是来自总体的样本,检验问题 总体 的分布,(8.3.1)其中 是某个已知分布函数.,为解决(8.3.1)式提出的假设检验是否成立,皮尔逊(K.Pearson)提出了 拟合检验法.其基本思想是将样本观测值决定的经验分布函数来替代总体分布,并与假设的理论分布相比较.由于抽样的随机性和样本容量有限性,两者之间必然存在一些偏差.问题是这种偏差能否解释为仅仅是样本的随机性和试验次数有限而带来的随机波动,还是因为所配合的理论分布与样本分布之间确实具有实质性差异所导
16、致的.如果两者偏差是显著的,则认为总体分布不服从该理论分布,即拒绝,否则接受.拟合检验法的基本步骤如下:,(1)根据样本观测值的取值范围,把总体 的一切可能取值的集合(或 的子集)分成 个互不相交的区间,统计样本观测值落入各区间的频数 与频率(2)在 成立的条件下,计算总体 落在每个区间的概率.若 中含有未知参数,先需用极大似然估计法估计出参数,再求相应的概率.选取统计量,(8.3.2),直观上,统计量可理解为观测频数与理论期望频数的相对差异,也可理解为观测频率与理论概率差的加权平和.当 成立时,值应该比较小,因此当 值大于某一临界值时,就应该拒绝.基于上述直观理解,皮尔逊采用(8.3.2)式
17、确定的统计量作为检验 的统计量,并证明了如下定理:定理8.3.1(皮尔逊定理)对充分大的,当 成立时,统计量(8.3.2)近似地服从自由度为 的 分布,其中 为待估参数的个数.,(3)在 成立的条件下,给定显著水平 有,可得拒绝域为.(4)根据样本观测值计算 值若,拒绝;若,接受.需要指出的是应用 拟合检验时,要求样本容量 较大,一般分为5至7个区间,且样本观测值落入每个区间的频数不能少于4,若少于4,则应并入相邻的区间.尽管 拟合检验对于离散型和连续型总体分布都适用,但它依赖于区间的划分,拟合检验实质上只是检验了 是否为真,并未真正检验总体分布 是否为.,例8.3.1 自1875年至1955
18、年,对其中63年的观测中,某市夏季共有180天下过暴雨.把5至9月作为夏季,每年夏季共153天.在统计的63年中,某市一年夏季有 天发生过暴雨的年数 如下表:,表8-5,试问:观测结果能否说明某市一年内夏季发生暴雨的天数服从泊松分布?,解 以 表示某市一年内夏季发生暴雨的天数,根据容量为63的样本来检验假设 总体 服从泊松分布.当 成立时,未知.首先要求出 的极大似然估计值把 的一切可能取值分为7个组,则在 成立时,可求出 的值如下:,列表计算 值,表8-6,统计量 给定显著水平,查表,而,所以不能否认某市的一年夏天的暴雨天数 服从泊松分布,即接受.例8.3.2 研究混凝土抗压强度的分布,200件混凝土制件的抗压强度以分组形式列出,如下表:,表8-7,要求在给定显著水平 下检验假设 混泥土抗压强度.解 原假设所定的正态分布的参数 未知,由第七章极大似然估计知,的极大似然估计值分别为 设 表示第 组的中值,于是有,在正态分布 下,计算 落在每组理论概率值为计算统计量 的值,我们把计算的结果列表如下:,表8-8,从以上计算得出 值为1.35.在给定显著水平 下,查 分布表,得临界值为.因为,不能拒绝,即认为混凝土制件的抗压强度的分布为正态分布.,