《教学课件:第5章第3节假设检验.ppt》由会员分享,可在线阅读,更多相关《教学课件:第5章第3节假设检验.ppt(17页珍藏版)》请在三一办公上搜索。
1、5.3 假设检验概述目录,5.3.1 假设检验问题,5.3.2 参数假设检验的思想方法,5.3.3 参数假设检验的一般步骤,5.3.4 检验的显著性水平与两类错误,5.3.5 检验的 p 值,5.3.6 多参数与非参数假设检验问题,5.3 假设检验概述,统计推断的另一个主要内容是(统计)假设检验,本节主要介绍参数假设检验的基本概念和基本思想方法。,例 某厂规定,产品的次品率不超过 1%才能出厂,现有200 件产品准备出厂,从中随机抽取 5 件,发现有次品,试问能否允许这批产品出厂?,5.3.1 假设检验问题,为了说明什么是假设检验问题,先看几个实际例子。,设这批产品的次品率为 p,问题就是要回
2、答“p1%”是否成立。,例 某工厂宣称已采取大力措施治理废水污染,根据经验,废水中所含某种有毒物质的浓度 X(单位:mg/kg)服从正态分布。现环保部门抽测了9个水样,算得样本平均值为,样本标准差为 s=2.4,以往该厂废水中有毒物质的平均浓度为18.2,试问有毒物质的平均浓度有无显著变化?,X N(,2),其中,2均未知,直观上看,有毒物质的平均浓度有所降低,但这种差异也有可能是抽样的随机性造成的。问题是要判定有毒物质的平均浓度是否还是18.2 mg/kg。,例随机抽测了60名2015年 1 月出生的婴儿的体重,希望确定婴儿的体重 X 是否服从正态分布。,问题是要判定 X N(,2)是否成立
3、?,上述各例所述问题的共同点是:对总体分布的参数或总体分布的类型提出假设,希望通过抽得的样本信息对“假设是否成立”进行推断。这类问题称为假设检验问题。,在假设检验问题中,通常把待检验的假设称为原假设或零假设,记为 H0,与之对应的假设则称为备择假设,记为 H1。在统计学中这两个假设统称为统计假设,简称假设。统计假设通常记为 H0 vs H1。,比如,例、例和例的统计假设分别为:,例 某厂规定,产品的次品率不超过 1%才能出厂,现有200 件产品准备出厂,从中随机抽取 5 件,发现有次品,试问能否允许这批产品出厂?,设这批产品的次品率为 p,问题就是要回答“p1%”是否成立。,统计假设为 H0:
4、p1%vs H1:p1%,例 某工厂宣称已采取大力措施治理废水污染,根据经验,废水中所含某种有毒物质的浓度 X(单位:mg/kg)服从正态分布。现环保部门抽测了9个水样,算得样本平均值为,样本标准差为 s=2.4,以往该厂废水中有毒物质的平均浓度为18.2,试问有毒物质的平均浓度有无显著变化?,X N(,2),其中,2均未知,直观上看,有毒物质的平均浓度有所降低,但这种差异也有可能是抽样的随机性造成的。问题是要判定有毒物质的平均浓度是否还是18.2 mg/kg。,统计假设为 H0:=18.2 vs H1:18.2,例随机抽测了60名2015年 1 月出生的婴儿的体重,希望确定婴儿的体重 X 是
5、否服从正态分布。,问题是要判定 X N(,2)是否成立?,统计假设为 H0:X N(,2)vs H1:X 不服从正态分布。,在假设检验问题中,若总体的分布类型是已知的,未知的只是其中的一个或几个参数,统计假设只与这些未知参数有关,我们称为参数假设,相应的检验称为参数假设检验。若总体的分布类型未知,统计假设是总体分布的类型或某些特征,我们称此类假设为非参数假设,相应的检验称为非参数假设检验。,进一步地,在参数假设检验问题中,总体中可能有多个未知的参数,有时只对其中某一个参数提出假设并进行检验,有时需要对多个参数一起提出一个假设并进行检验,根据这一区别,我们可将参数假设检验细分为单参数假设检验与多
6、参数假设检验。,例5.3.1 和例5.3.2 都是参数假设检验问题,而例 5.3.3 就是一个非参数假设检验问题。下面重点讨论单参数假设检验问题。,5.3.2 参数假设检验的思想方法,例(续)某厂规定,产品的次品率不超过 1%才能出厂,现有 200 件产品准备出厂,从中随机抽取 5 件,发现有次品,试问能否允许这批产品出厂?,解统计假设为 H0:p1%vs H1:p1%,仍用上面的例子来说明假设检验的基本思想方法:,若统计假设 H0成立(即 p1%),则事件A=“任取 5 件中有次品”发生的概率为,也就是说,如果H0成立,则任取 5 件中有次品的概率很小,现在这种“罕见”的情况发生了,其根源是
7、假设了H0成立,因此我们有理由拒绝此假设,并作出这批产品不能出厂的决定。,上述思路可归结为:若假设H0:p1%成立,看看会推出什么结果。,若假设 H0:=0=18.2 成立(即假设有毒物质的浓度无显著变化),看看会推出什么结果?,例(续)某工厂宣称已采取大力措施治理废水污染,根据经验,废水中所含某种有毒物质的浓度 X(单位:mg/kg)服从正态分布。现环保部门抽测了 9 个水样,算得样本平均值为,样本标准差为 s=2.4,以往该厂废水中有毒物质的平均浓度为 18.2,试问有毒物质的平均浓度有无显著变化?,解统计假设为 H0:=18.2 vs H1:18.2,设(X1,X2,Xn)为正态总体的一
8、个样本,(x1,x2,xn)是相应的样本观察值。样本均值是未知参数 的无偏估计量,为相应的估计值。我们也许想到用 的估计值代替 来检验H0,但由于样本的随机性造成的估计误差使得几乎不会真正等于,所以即使 H0:=0 为真,由于估计误差的存在,也不会真正等于0。因而我们不能简单地根据是否有来判断H0:=0 是否成立。,但是,如果H0:=0 为真,那么会以很大的概率落在 0 附近的一定范围内,而远离0 的概率会很小。即,只要 d 足够的大,则会很小。如果在一次观察中出现了,根据小概率原理(认为小概率事件在一次试验中不会发生),我们自然有充足的理由否定H0:=0;相反,如果不成立,则没有充足的理由否
9、定H0:=0,也称不能拒绝假设H0。,上面的论述事实上提供了解决例的方法,具体解决步骤后面再作详细论述。,从上面的讨论可以看出,要实施检验(是否拒绝假设 H0),首先要确定小概率的大小,这一小概率在假设检验中称为检验的显著性水平,通常记作。它是根据具体问题而需要事先确定的一个很小的正数,比如0.01,0.05,0.10等。其次,对给定的显著性水平,还需要确定一个由样本所描述的概率不超过显著性水平的小概率事件,这一小概率事件对应的样本取值区域通常称为假设检验的拒绝域,简称拒绝域。最后看样本观察值是否落入拒绝域,若样本观察值落入拒绝域便可以拒绝H0;否则,就不能拒绝H0。,5.3.3 参数假设检验
10、的一般步骤,参数假设检验的一般步骤可归纳为:第一步:提出统计假设 H0 vs H1;第二步:选取 的一个较优的点估计,并根据 给出拒绝域的形式(在 H0 成立前提下);第三步:围绕 构建枢轴量并确定其分布;第四步:对给定的显著性水平,确定拒绝域 C 使得P(X1,X2,Xn)C|H0);第五步:如果(x1,x2,xn)C,则在显著性水平下拒绝 H0;否则,则不能拒绝 H0。,5.3.4 检验的显著性水平与两类错误,在假设检验问题中,由样本提供的信息来推断是否“拒绝假设H0”时,用了“小概率原理”,但小概率事件并非不可能事件,如果零假设H0 本为真,但因样本值落入拒绝域而作出了拒绝,这便犯了弃真
11、错误,通常称为第一类错误;相反,如果零假设H0本不成立,却因样本值没有落入拒绝域而作出了不能拒绝,这便犯了纳伪错误,通常称为第二类错误。,根据检验法则知,当 H0 成立时,拒绝 H0 的概率小于等于显著性水平,这表明犯第一类错误的概率至多为,从而说明检验的显著性水平是用以控制犯第一类错误的概率的。由此可能会产生一种错觉,以为只要把显著性水平取得越小,假设检验的准确程度就会越高。事实上不然,因为显著性水平只是用来控制犯第一类错误的概率,而在假设检验中还存在着犯第二类错误的可能性。一般来说,当样本容量 n 给定时,在降低显著性水平的同时,拒绝域往往也在变小,从而会增大犯第二类错误的可能性。通常的做
12、法是事先给定显著性水平来控制犯第一类错误的概率,再通过选取较好的检验方法尽可能地减少犯第二类错误的概率(比如,拒绝域尽可能取大些)。,5.3.5 检验的 p 值,可以看出,显著性水平越小,则相应的拒绝域就越小;当显著性水平取得足够小时,可以使得样本值不落在相应的拒绝域中,从而在此显著性水平下不能拒绝假设H0。当显著性水平由上述足够小的值不断增大时,相应的拒绝域也就越来越大,当显著性水平大到一定程度时,便可以使得样本值落入相应的拒绝域中,从而在此显著性水平下可以拒绝假设H0。,也就是说,对于一个确定的样本值,存在一个实数 p(0 p 1),在显著性水平等于 p 下可以拒绝假设H0,而在小于 p的
13、显著性水平下不能拒绝假设H0。可见,p 是使得依据给定样本值作出“拒绝假设H0”的最小的显著性水平,称之为检验的 p 值。,多数统计软件都提供 p 值的输出结果,人们就不必针对每个显著性水平查相应分布的下侧分位数,只要直接比较与 p 值即可。,5.3.6 多参数与非参数假设检验问题,前面对单参数假设检验问题作了比较详尽的讨论,其解决问题的基本思想方法也适用于多参数假设检验或非参数假设检验问题,只是在具体细节上作适当调整即可。为此,仅说明两点:对于多参数假设检验问题,需寻求一个包含所有待检验参数的枢轴量,并使之服从或渐近地服从一个已知的确定分布;非参数假设检验问题可以近似地化为一个多参数假设检验问题来解决。,