《数理统计8-假设检验.ppt》由会员分享,可在线阅读,更多相关《数理统计8-假设检验.ppt(54页珍藏版)》请在三一办公上搜索。
1、二、单个正态总体均值和方差,一、参数的假设检验,第四章,假设检验,的假设检验,三、两个正态总体均值相等和方差相等,的假设检验,例,怎么知道这批罐装可乐的容量是否合格呢?,罐装可乐的容量按标准应是355毫升.,通常的办法是进行抽样检查.,每隔一定时间,抽查若干罐.,如每隔1小时,抽查5罐,得5个容量的值X1,X5,根据这些值来判断生产是否正常.,很明显,不能由5罐容量的数据,在把握不大的情况下就判断生产 不正常,也不能总认为正常,,有了问题不能及时发现,这也要造成损失.,如何处理这两者的关系,假设检验面对的就是这种矛盾.,在正常生产条件下,由于种种随机因素的影响,每罐可乐的容量应在355毫升上下
2、波动.这些因素中没有哪一个占有特殊重要的地位.因此,根据中心极限定理,假定每罐容量服从正态分布是合理的.,现在我们就来讨论这个问题.,称H0为原假设(或零假设);,H1为备选假设(或对立假设).,H1:,X1,X5是取自正态总体的样本,,是一个常数.,当生产比较稳定时,,检验假设:,可从历史资料获得 的值.,那么,如何判断原假设H0 是否成立呢?,问题归结为对差异作定量的分析,以确定其性质.,差异可能是由抽样的随机性引起的,称为,“抽样误差”或 随机误差,这种误差反映偶然、非本质的因素所引起的随机波动.,然而,这种随机性的波动是有一定限度的,,如果差异超过了这个限度,则我们就不能用抽样的随机性
3、来解释了.,必须认为这个差异反映了事物的本质差别,即反映了生产已不正常.,是“抽样误差”还是“系统误差”所引起的?,根据所观察到的差异,,这里用到人们在实践中普遍采用的一个原则:,小概率事件在一次试验中基本上不会发生.,实际推断原理(小概率原理),通过大量实践,,人们对小概率事件(即在一次试验中发,生的概率很小的事件)总结出一条原理:,小概率事件在一次试验中几乎不会发生,并称此为实际推断原理,,其为判断假设的根据。,在假设检验时,,若一次试验中小概率事件发生了,就,认为是不合理的。,小概率事件在一次试验中发生的概率,记为,一般取,在假设检验中,称小概率为显著水平、检验水平。,一、假设检验的思想
4、方法,信息看在H0成立下会不会发生矛盾。,最后对H0成立,与否作出判断:,中居然发生,,若小概率事件发生了,,则否定H0。,若不发生,则接受H0,,并称 H0相容。,概率反证法的逻辑是:,如果小概率事件在一次试验,我们就以很大的把握否定原假设.,假设检验使用的方法是概率论的反证法:,即先对所关心的问题提出原假设 H0,然后运用样本,不否定H0并不是肯定H0一定对,而只是说差异还不够显著,还没有达到足以否定H0的程度.,所以假设检验又叫,“显著性检验”,由于作出结论的依据是下述,小概率原理,小概率事件在一次试验中基本上不会发生.,如果H0成立,但统计量的实测值落入否定域,从而作出否定H0的结论,
5、那就犯了“以真为假”的错误.,如果H0不成立,但统计量的实测值未落入否定域,从而没有作出否定H0的结论,即接受了错误的H0,那就犯了“以假为真”的错误.,两类错误:假设检验会不会犯错误呢,假设检验的两类错误,P拒绝H0|H0真=,P接受H0|H0不真=.,犯两类错误的概率:,显著性水平 为犯第一类错误的概率.,P第一类错误=,P第二类错误=,对给定的显著性水平,H0关于 的接受域:,H0关于 的拒绝域:,把本来正确的东西给丢弃了这就范了“弃真”的错误,,其概率是,P拒绝H0|真=,而结论是:若 落在H0的接受域内,就接受H0,,但结论是:若 落在H0的拒绝域内,就拒绝H0,,(1)在H0正确的
6、情况下,落在R上的每一点都是可能的,范了“取伪”的错误,,注意:积分区间长度不变:,但积分区间的中心,(2)要同时降低两类错误的概率 或者要在 不变的条件下降低,需要增加样本容量.,(1)当样本容量固定时,一类错误概率的减少导致另一类错误概率的增加.,因减少,积分区间长度:,实际问题中,我们希望两类错误都能得到控制。一般多是控制第I类错误的概率到适当程度而不管第II类错误的大小,这种检验叫显著性检验。,8.2 单个正态总体均值与方差的假设检验,设总体,为X的样本。,我们对,2作显著性检验,一、总体均值的假设检验,1、已知2,检验,(H1可以不写),其中0是已知常数,,在实际工作中,往往把不轻易
7、否定的命题作为原假设.,提出原假设和备择假设,第一步:,1.已知,已知,,第二步:,取统计量,在H0成立下求出它的分布,第三步:,查表确定临界值,使,对给定的显著性水平,检验假设,的过程分为五个步骤:,或,得H0否定域,第四步:,将样本值 代入算出统计量,选择假设H1 表示Z可能大于0,也可能小于0。,这称为双边假设检验。,由于取用的统计量服从 Z(U)分布,,第五步:判断,则否定H0,接受H1,则H0相容,接受H0,故称其为,Z(U)检验法。,例1 某车间生产铜丝,,X的大小。,铜丝的主要质量指标是折断力,由资料可认为,今换了一批原料,,从性能上看,,估计折断力的方差不会有变换,,但不知,折
8、断力的大小有无差别。,解 方差已知,抽出10个样品,测得其折断力(斤)为,进行检验。,提出假设,(=0.05),第一步:,第二步:,取统计量,在H0成立下求出它的分布,第三步:,查表确定临界值,使,对给定的显著性水平,得H0否定域,第四步:,将样本值 代入算出统计量,第五步:判断,说明小概率事件竟在一次试验中发生了,,故否定H0.,可以接受H1。,2、未知2,检验,(H1可以不写),未知2,可用样本方差,代替2,检验步骤,提出原假设和备择假设,第一步:,第二步:,取一检验统计量,在H0成立下求出它的分布,第三步:,查表确定临界值,使,对给定的显著性水平,确定H0的否定域。,即“”是一个小概率事
9、件.,或,由于取用的统计量服从t分布,,第四步:,得 H0否定域,将样本值 代入算出统计量,第五步:判断,则否定H0,接受H1,则H0相容,接受H0,故称其为t 检验法。,抽取6件,得尺寸数据如下:,32.56,29.66,31.64,30.00,31.87,31.03,问这批产品是否合格?,某工厂生产的一种螺钉,,标准要求长度是32.5,毫米.,实际生产的产品其长度 X 假定服从正态分布,,未知,,现从该厂生产的一批产品中,例2,(=0.01),提出假设,解 已知,未知.,取一检验统计量,在H0 成立下求出它的分布,得否定域,对给定的显著性水平,查表确定,故不能拒绝H0.,将样本值代入算出
10、T0的值,没有落入拒绝域,正态总体均值的假设检验小结,H0接受域,H0接受域,测量值X服从正态分布,取=0.05)?,解:提出假设 H0:=112.6;H1:112.6,用热敏电阻测温仪间接测量地热勘探井底温度,重复测量7次,测得温度():,112.0 113.4 111.2 112.0 114.5 112.9 113.6,而用某种精确办法测得温度为112.6(可看作真值),试问用热敏电阻测温仪间接测温有无系统偏差(设温度,因为未知方差2,故采用t检验法。,取统计量,例3,查表,由样本算得,这里,H0相容,接受H0。,即用热敏电阻测温仪间接测温无系统偏差。,由于S2为2的无偏估计,自然想用S2
11、与2进行比较,若,过大或过于接近0,,则说明2 偏离02较大。,因此有理由否定H0。,三、关于2假设检验,在显著性水平条件下检验假设,其中0是已知常数,,取统计量,提出原假设和备择假设,第一步:,第二步:,取一检验统计量,,第三步:,查表确定临界值,对给定的显著性水平,确定H0的否定域。,或,H0否定域,第四步:,在样本值,下计算,第五步:判断,若,或,则否定H0。,若,则接受H0。,例1 已知某种延期药静止燃烧时间T,今从一批延期药中任取10副测得静止燃烧时间(单位,秒)数据为,问:是否可信这批延期药的静止燃烧时间T的方差为,我们的任务是根据所得的样本值检验,提出假设,第一步:,第二步:,取
12、统计量,,第三步:,查表确定临界值,对给定的显著性水平,或,得 H0否定域,解,根据样本值算得,则H0相容,接受H0。,可信这批延期药的静止燃烧时间T的方差为,显然,第四步:,第五步:判断,(=0.05),解:提出假设,某次统考后随机抽查26份试卷,测得平均成绩:,试分析该次考试成绩标准差是否为,已知该次考试成绩,取统计量,例2,查表,根据样本值算得,则H0相容,故接受H0。,显然,表明考试成绩标准差与12无显著差异。,关于2假设检验,已知,,其中0是已知常数,,取统计量,或,H0否定域,分别是,且X与Y独立,X1,X2,是取自X的样本,取自Y的样本,分别是样本方差,均值,1.,Y1,Y2,是
13、,样本,提出假设,H0:1=2;H1:12,四.检验两正态总体均值相等,取统计量,,拒绝域的形式,对给定,查表确定,1.,提出假设,H0:1=2;H1:12,则否定H0,接受H1,则接受H0,即认为两个正态母体均值无显著差异,即认为两个正态母体均值有显著差异,显著性水平为,由样本值 代入算出统计量,H0:1=2;H1:12,取统计量,提出假设,拒绝域的形式,给定显著性水平,且X与Y独立,1.,提出假设,检验两正态总体均值之差,取统计量,拒绝域的形式,给定,算出统计量,则否定H0,接受H1,则接受H0,即认为两个正态母体均值无显著差异,注意 在关于,的假设检验中,通常遇到的情况是,,即检验,与,
14、是否相等.,例3 某苗圃用两种育苗方案对杨树进行育苗试验,已知在两组育苗试验中苗高的标准差分别为,cm,cm.,cm,设杨树苗高服从正态分布,试在显著性水平,下,判断两种试验方案对平均苗高有无显著影响?,现各抽取80株树苗作为样本,算得苗高的样本均值分别为,cm.,解 设第一种方案的苗高为,第二种方案的苗高为,则,检验假设,选取检验统计量,该拒绝域为,现在,统计量,的值,因为,所以拒绝原假设,即这两种试验方案对苗高有显著影响.,五、检验两正态总体方差相等 F检验,取统计量,分别是样本方差,由样本值算出统计量F的值,并查表得,判断,拒绝域的形式,给定,例4 为比较两台自动机床的精度,分别取容量为10和8的两个样本,测量某个指标的尺寸(假定服从正态分布),得到下列结果:,在=0.1时,问这两台机床是否有同样的精度?,车床甲:1.08,1.10,1.12,1.14,1.15,1.25,1.36,1.38,1.40,1.42,车床乙:1.11,1.12,1.18,1.22,1.33,1.35,1.36,1.38,解:设两台自动机床的方差分别为在=0.1下检验假设:,取统计量,拒绝域为,或,分别是样本方差,由样本值可计算得F的实测值为:,F=1.51,由于 0.3041.513.68,故接受H0.,查表得,