概率论与数理统计课件版第8章假设检验.ppt

上传人:小飞机 文档编号:1335801 上传时间:2022-11-10 格式:PPT 页数:70 大小:1.30MB
返回 下载 相关 举报
概率论与数理统计课件版第8章假设检验.ppt_第1页
第1页 / 共70页
概率论与数理统计课件版第8章假设检验.ppt_第2页
第2页 / 共70页
概率论与数理统计课件版第8章假设检验.ppt_第3页
第3页 / 共70页
概率论与数理统计课件版第8章假设检验.ppt_第4页
第4页 / 共70页
概率论与数理统计课件版第8章假设检验.ppt_第5页
第5页 / 共70页
点击查看更多>>
资源描述

《概率论与数理统计课件版第8章假设检验.ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计课件版第8章假设检验.ppt(70页珍藏版)》请在三一办公上搜索。

1、第六章-第八章知识结构图,数理统计,抽样分布,统计推断,常用的统计量,四个重要分布,参数估计,假设检验,正态总体的样本均值与方差的分布(重要统计量的分布),矩估计法,点估计,区间估计,极大似然估计法,均值的区间估计,方差的区间估计,均值的检验,方差的检验,单个总体,两个总体,正态总体,第六章-第八章知识结构图数理统计抽样分布 统计推断,假设检验,参数假设检验,非参数假设检验,总体分布已知,检验关于未知参数的某个假设,总体分布未知时的假设检验问题,根据样本的信息检验关于总体的某个假设是否正确。,第八章 假设检验,假设检验问题:,假设检验问题分类:,假设检验参数假设检验非参数假设检验总体分布已知,

2、总体分布未知,一. 假设检验的基本思想,设总体 X 含有未知参数 (或总体分布函数 F(x) 未知),检验下述假设:,假设 或,是某个已知常数或 是某个已知的分布函数。,第一节 假设检验,其中:,一. 假设检验的基本思想设总体 X 含有未知参数,例如:,显然 是可以被接受的.,二. 判断 “假设” 的根据,小概率事件原理,小概率事件在一次试验中是几乎不可能发生的,未知,检验假设:,如果在假设 成立的条件下某事件是小概率事件,因为 是总体 X 的待估计参数 的无偏估计。,但在一次试验中却发生了,于是就可怀疑假设,的正确性从而拒绝,例如:显然 是可以被接受的. 二. 判断,现用一个例子来说明这个原

3、则.,现有两个盒子,各装有100个球.,例如:,现从两盒中随机取出一个盒子问:这个盒子里是白球 99个还是红球 99 个?,现用一个例子来说明这个原则.现有两个盒子,各装有100个球.,若假设:这个盒子里有 99 个白球.,当从中随机摸出一个球时,发现是红球:,此时应如何判断这个假设是否成立呢 ?,假设其中真有 99 个白球,摸出红球的概率只有 1/100 ,,但此小概率事件在一次试验中 竟然发生了,这就不得不怀疑所作的假设。,.,这是小概率事件,若假设:这个盒子里有 99 个白球.当从中随机摸出一个球时,,概率反证法,要求在原假设成立的条件下导出的结论是绝对成立的,如果事实与之矛盾, 则完全

4、绝对地否定原假设。,这个例子中所使用的推理方法,称为是带概率性质的反证法.,在假设检验中,常称这个小概率为显著性水平, 用 表示.,如果小概率事件在一次试验中居然发生了,则就可以以很大的把握否定原假设,否则就不能否定原假设。,它不同于一般的反证法,一般反证法,概率反证法要求在原假设成立的条件下导出的结这个例子中所使用的,三. 假设检验的两类错误,1. 第一类错误 (弃真):,如果 是正确的, 但却被错 误地否定了。,2. 第二类错误 (取伪):,如果 是不正确的, 但却被错误地接受了。,若设 犯两类错误的概率分别为:,P 拒绝H0 | H0为真 =,P 接受 H0 | H0 不真 =,则显著性

5、水平 为犯第一类错误的概率。,三. 假设检验的两类错误 1. 第一类错误 (弃真,两类错误是互相关联的,,要同时降低两类错误的概率 ,或者要在 不变的条件下降低 ,则需要增加样本容量 n,先对犯第一类错误(弃真)的概率加以控制,同时再考虑使犯第二类错误(取伪)的概率尽可能的小。,在实际问题中,通常的做法是:,当样本容量 n 固定,时,,一类错误概率的减少必导致另一类错误,概率的增加。,两类错误是互相关联的,要同时降低两类错误的概率,四. 假设检验的具体做法,例1.,罐装可乐容量的检验问题,在一条生产可乐的流水线上罐装可乐不断地封装,然后装箱外运。,试问:如何检验这批罐装可乐的容量是否合格呢?,

6、分析:,若把每一罐可乐都打开倒入量杯, 检验容量是否合于标准。,罐装可乐的容量按标准应在 350 毫升和 360 毫升之间。,这显然是不可行的。,四. 假设检验的具体做法例1.罐装可乐容量的检验,每隔 1小时,抽查 5 罐,得 5个容量的值:X1,X5 ,根据这些值来判断生产是否正常.,如发现不正常 则应停产,找出原因,排除故障,然后再生产;如生产正常, 则继续按规定时间再抽样,以此监督生 产,保 证质量。,通常的办法是:,进行抽样检查.,显然:,即,每隔一定时间,抽查若干罐 。,如:,2. 也不能总认为正常,有了问题不能及时发 现,这也同样要造成损失.,1. 不能由 5 罐容量的数据,在把握

7、不大的情 况下就判断生产 不正常,因为停产的损失 是很大的;,如何处理这两者的关系?,每隔 1小时,抽查 5 罐,得 5个容量的值:X1,X5,如何处理这两者的关系?,现用假设检验的方法来处理这对矛盾,在正常生产条件下,由于种种随机因素的影响,每罐可乐的容量应在 355 毫升上下波动. 这些因素中没有哪一个占有特殊重,注意到:,故: 可以认为样本是取自正态总体,现抽查了n 罐,测得容量为:,现在要检验的假设是:,假定每罐容量服从正态分布是合理的.,要的地位.,因此,根据中心极限定理,,H0:,如何处理这两者的关系?现用假设检验的方法来处理这对矛盾,它的对立假设是:,称 H0 为原假设(或 零假

8、设 ),称 H1 为备择假设(或 对立假设).,H0:,H1:,那么,如何判断原假设H0 是否成立呢?,由于 是正态分布的期望值,它的无偏估计量是,来判断 H0 是否成立 .,样本均值 ,,因此可以根据 与 的差距,它的对立假设是:称 H0 为原假设(或 零假设 )称 H1,而较大、较小是一个相对的概念,那么它应由什么原则来确定?,对差异作定量的分析,以确定其性质.,问题归结为:,非本质的因素所引起的随机波动。,注意到:,生产已不正常,当差异是由抽样的随机性引起时,则称其为,“抽样误差”或 随机误差;,它反映了由偶然、,然而,这种随机性的波动是有一定限度的,而较大、较小是一个相对的概念,对差异

9、作定量的分析,以确定其性,如果差异超过了这个限度,,如何判断差异是由“抽样误差”还是“系统误差”所引起的?,从而问题就转化为:,解决的方法:,给出一个量的界限 ,即显著性水平,从而提出假设:,H0:,H1:,因为 已知,,所以构造统计量为:,则称其为“系统误差”.,则就不能用抽样的随机,性来解释了。,此时可认为这个差异反映了事物的本,质差别,,如果差异超过了这个限度,如何判断差异是由“抽样误差”从而问题,检验统计量:, N ( 0, 1 ),对给定的显著性水平 ,查正态分布的上分位点的值 ,使:,故可以取拒绝域 C为:,如果由样本值算得该统计量的实测值落入区域C, 则拒绝 H0 ;否则就接受

10、H0 .,检验统计量: N ( 0, 1 )对给定的显著性水平,如果H0 是对的,那么衡量差异大小的某个统计量落入区域 C (拒绝域) 是个小概率事件。,这里所依据的逻辑是:,如果该统计量的实测值落入C,即 H0 成立下的小概率事件发生了,那么就认为 H0 不可信而否定它;否则就不能否定 H0 而只好接受 H0,不否定 H0并不是肯定 H0一定对,而只是说差异还不够显著,还没有达到足以否定 H0 的程度 。,故假设检验又称为“显著性检验”,如果H0 是对的,那么衡量差异大小的某个统这里所依据的逻辑是,如果在 很小的情况下H0,基于这个理由,人们常把 时拒绝 H0 称为是显著的。,如果显著性水平

11、 取得很小,则拒绝域也会比,把在 时拒绝 称为是 高度显著的。,难于被拒绝。,较小。,其产生的后果是:,则说明实际情,仍被拒绝了,,况很可能与之有显著差异。,如果在 很小的情况下H0基于这个理由,人们常把,某工厂生产的一种螺钉,标准要求长度是 32.5 毫米. 实际生产的产品,其长度 X 假定服从正态分布 其中 未知,现从该厂生产的一批产品中抽取 6 件, 得尺寸数据如下:,32.56, 29.66, 31.64, 30.00, 31.87, 31.03,问:这批产品是否合格?,这批产品(螺钉长度)的全体组成问题的总体为 X,例2,解:,则问题是要检验 E(X) 是否为32.5.,由已知,,设

12、:,某工厂生产的一种螺钉,标准要求长度是 32.5 32.56,提出原假设和备择假设,第一步:,因为已知,未知.,第二步:,能衡量差异大小且分布已知,故取检验统计量为:,在 成立下求出它的分布为:,提出原假设和备择假设 第一步:因为已,第三步:,即“ ”是一个小概率事件 .,小概率事件在一次试验中基本上是不会发生 .,使得:,故得否定域为:,对给定的显著性水平 查 分布表得临界值:,第三步:即“,故不能拒绝H0 ,即应接受H0,第四步:,没有落入拒绝域,接受 H0 这并不意味着 H0一定对,只是差异还不够显著,不足以否定 H0,将样本值代入,计算出统计量 的实测值:,可认为这批产品是合格的。,

13、结论:,故不能拒绝H0 ,即应接受H0 第四步: 接受 H,例3.,设某异常区磁场强度服从正态分布 ,由以前观察知道 ,现有一台新型号的仪器,用它对该区进行磁测,抽取了41个点,其样本均值与方差为:,问:此仪器测出的结果是否符合要求?,解:,以 分别表示用这台机器测出的异常区的磁场强度 X 的均值和均方差(标准差)。,于是:,这里 是未知的.,根据长期实践的经验表明异常区磁场强度的标准差比较稳定,所以可设,例3.设某异常区磁场强度服从正态分布,提出假设:,第一步:,第二步:,由已知条件取检验统计量为:,第三步:,对给定的显著性水平 查正态分布表得临界值:,提出假设: 第一步: 第二步:由已知条

14、件取检验统计量为: 第,使得:,故得否定域为:,即:,是一个小概率事件 .,使得:故得否定域为:即:是一个小概率事件 .,第四步:,将样本值代入,计算出统计量 的实测值:,没有落入拒绝域,故不能拒绝H0 ,即应接受H0,结论:,可认为这台仪器测出的结果是符合要求的, 即这台机器是基本正常的,第四步:将样本值代入,计算出统计量 的实测值:故不能拒,备择假设 表示 可能大于 也可,故称其为 双边备择假设。,拒绝域与临界点,当统计量取某个区域 C 中的值时,拒绝原假 设 ,则称区域 C 为 拒绝域。,(2) 拒绝域的边界点称为 临界点 .,单边检验,(1) 右边检验:,(2) 左边检验:,从而对应的

15、假设检验称为 双边假设检验。,能小于,备择假设 表示 可能大于,则称 与 的差异显著.,在正态分布中针对显著性水平 ,一般有:,则称 与 的差异不显著.,例如,,当,当,则称 与 的差异显著.在正态分布中针对,五. 假设检验问题的步骤,3. 确定检验统计量及拒绝域的形式,1. 根据实际问题要求,提出原假设 及备择假设,2. 给定显著性水平 及样本容量,4. 按 ,求出拒绝域,5. 取样本,根据样本观察值确定接受 还是拒绝,五. 假设检验问题的步骤3. 确定检验统计量及拒绝域,某编织物强力指标 X 的均值 公斤。 改进工艺后生产了一批编织物,今从中取 30 件,测得 公斤。 假设强力X 指标服从

16、正态分布 ,且已知 公斤。,提出假设:,取统计量:,否定域 C 为:,是一小概率事件,例4,问:在显著性水平 下,新生产编织物比 过去的编织物强力是否有提高 ?,解:,某编织物强力指标 X 的均值,并由样本值计算,得统计量 U 的实测值为:,故拒绝原假设 H0 ,可认为新生产编织物比过去的编织物强力是有提高的,落入否定域,此时可能会犯第一类错误,但犯错误的概率不会超过 0.01.,由已知,,并由样本值计算,得统计量 U 的实测值为:故拒绝原假设 H0,1. 已知,关于 的检验 ( U 检验 ),在 已知条件下用服从 的统计量检验正态总体 的方法为 U 检验法,(1) 检验假设:,取检验统计量:

17、,第二节 正态总体均值的假设检验,一. 单个正态总体 均值 的检验,1. 已知,关于 的检验 ( U 检验,则在显著性水平 下, 的拒绝域:,的拒绝域,的接受域,(2) 检验假设:,或,取检验统计量:,则在显著性水平 下, 的拒绝域:的拒绝,则在显著性水平 下, 的拒绝域:,的接受域,的拒绝域,或,的接受域,的拒绝域,则在显著性水平 下, 的拒绝域:的接受,例1.,问:当总体标准差没有改变时,现在生产是否正常?,解:,假设,总体标准差没有改变,即 已知的情况,统计量,例1.已知某钢铁厂的铁水含碳量在正常情况下服从正态分布 现,给定显著性水平,从而:,经计算,则:,拒绝 ,可认为现在的生产是不正

18、常的。,给定显著性水平从而: 经计算 则:拒绝 ,可,例2,已知某正态总体的方差为 49,抽测 24个样本值的均值为,问:总体均值 是否成立,解:,取统计量,因为是单边检验,,所以:,假设,给定显著性水平,例2已知某正态总体的方差为 49,抽测 24个样本值的均值为,接受 ,即可以认为总体均值 是成立的,(1) 对于,与,的讨论均可归为如下统一形式的讨论:,因为它们的拒绝域是一致的,经计算,或,接受 ,即可以认为总体均值,检验过程中唯一不同的是在查正态分布表时,前者是利用概率关系式:,而后者是利用概率关系式:,或,(2) 对于与检验过程中唯一不同的是在查正态分布表时,而后,2. 未知,关于 的

19、检验 ( t 检验 ),(1) 检验假设:,在 未知条件下用服从 的统计量检验正态总体 的方法为 检验法,因为 未知,所以可以考虑用 的无偏估计 来代替,故有:,取检验统计量,则有:,2. 未知,关于 的检验 ( t 检,(2) 检验假设:,则在显著性水平 下, 的拒绝域:,的拒绝域,的接受域,或,(2) 检验假设:则在显著性水平 下,或,同(1)讨论类似,则在显著性水平 下, 的拒绝域:,的拒绝域,的接 受域,的接 受域,的拒绝域,或 同(1)讨论类似,则在显著性水平 下,例3,某库房要验收大批同类物质,根据以往的经验,这批物质每件的重量服从正态分布。按规定这批物质平均每件重量应为 100

20、公斤,今抽取10 件,测得其均值,问:能否接受这批物质 ?,解:,未知,,所以用 t 检验。,经计算,设,取统计量为:,例3某库房要验收大批同类物质,根据以往的经验,这批物质每件的,接受 ,即可认为该库房应接受这批物质。,二. 两个正态总体均值差的检验,1. 当 未知时 ( t 检验 ),为已知常数,显著水平为,而,检验假设:,接受 ,即可认为该库房应接受这批物质。 二. 两,检验统计量,同单个总体的讨论类似,有:,其中:,检验统计量 同单个总体的讨论类似,有:其中:,在显著性水平 下, 的拒绝域:,当 未知时,检验假设,或,其讨论同前类似 ,,在显著性水平 下, 的拒绝域:,在显著性水平 下

21、, 的拒绝域:,或,2. 当 均已知时 ( U 检验 ),检验假设:,为已知常数,显著水平为,或2. 当 均已知时 ( U 检,检验统计量,同单个正态总体的讨论类似,有:,在显著性水平 下, 的拒绝域:,检验统计量同单个正态总体的讨论类似,有:在显著性水平,当 均已知时,检验假设 :,或,或,其讨论同前类似 ,,在显著性水平 下, 的拒绝域:,当 均已知时检验假设 : 或 或注其,3. 基于成对数据的假设检验 ( t 检验),逐对比较法,为了比较两种性能之间的差异,在相同的条件下作对比试验,得到一批成对的观察值。对观察值进行分析,作出推断的方法。,例4,现要比较甲、乙两种橡胶制成的轮胎的耐磨性

22、。今从甲、乙两种轮胎中各随机的取 8 个,又从两组中各取一个组成一对,共 8 对;,再随机的取 8 架飞机,将 8 对轮胎随机地搭配给这 8 架飞机作耐磨性试验,当飞机飞行了一定时间后测得轮胎的磨损量的数据(单位:毫克)如下:,3. 基于成对数据的假设检验 ( t 检验)逐对比较法为了比,试问:这两种轮胎的耐磨性有无显著的差别?,解:,设 X,Y:甲、乙两种轮胎的磨损量,并设 X,Y 均服从正态分布,即:,方法一:数据不配对分析,将所观察的两行数据分别作为 X,Y 的样本,依题意,检验假设:,甲乙4900 5220 5500 6020 6340,因为已知,所以在给定的显著性水平,经计算,取统计

23、量为:,因为已知所以在给定的显著性水平下的拒绝域为:经计算 取统计量,因为:,所以接受 ,可认为这两种轮胎的耐磨性无显著差异。,方法二:数据配对分析,在方法一中是将所观察的两行数据分别作为X,Y 的样本,而没有去区别它们是否来自于同一架飞机。,注意到:,事实上:,不同的飞机其试验的条件是不完全一致的,,有的甚至于有很大的差异,,的试验条件的不同会对试验数据产生干扰.,所以飞机之间,因为:所以接受 ,可认为这两种轮胎的耐磨性无显著差,容易将飞机之间的试验条件的差异与轮胎之间耐磨性的差异交织在一起,分辨不出轮胎之间真正的差异。,方法一的不足:,方法二的做法:,观察分析同一架飞机上两种轮胎的磨损量的

24、差异,作出推断。,今令:,检验假设:,容易将飞机之间的试验条件的差异方法一的不足:方法二的做法:观,按单个正态总体中当 未知时,关于 的假设检验的计算公式,可得 的拒绝域为:,经计算,因为:,取统计量为:,所以拒绝 ,可认为这两种轮胎的耐磨性有显著差异。,按单个正态总体中当 未知时,关于 的假设检,用两种不同的方法得到了两种不同的结论,那么究竟应该采取哪一个结论比较合理呢?,显然,应该采取第二种方法得出的结论是合理的,因为数据配对的方法是针对同一架飞机的,它是排除了因飞机之间的试验条件的不同而对数据产生的干扰,,所以它是直接反映了这两种轮胎的耐磨性的显著差异的情况.,可认为这两种轮胎的耐磨性有

25、显著差异,方法得出的结论, 即,因此,应采取第二种,用两种不同的方法得到了两种不同的结论,显然,应该采取第二种方,基于成对数据的假设检验的一般提法:,设有 对相互独立的观察结果:,令,又由于,是由同一因素所引起的,所以可认为它们服从同,现假设,未知,其样本均值与样本方差的观察值为,一分布。,基于成对数据的假设检验的一般提法:设有 对相互独立,检验假设,由单个正态总体均值的 t 检验,可得检验问题(1)、(2)、(3) 的拒绝域分别为:,检验假设由单个正态总体均值的 t 检验,可得检验问题,是来自总体的样本。,检验假设,( 为已知常数),取检验统计量,第三节 正态总体方差的假设检验,一. 单个正

26、态总体 方差 的检验 ( 检验),是来自总体的样本。 检验假设( 为已知常数) 取,其中:,使得:,P 当 为真时拒绝 ,为计算方便,习惯上取:,其中:使得:P 当 为真时拒绝,则在显著性水平 下, 的拒绝域:,或,的拒绝域,的接受域,则在显著性水平 下, 的拒绝域:或的拒绝,例1.,某厂生产的钢丝质量一贯比较稳定,今从产品中随机抽取10 根,检查其折断力,得数据如下:,578, 572, 570, 568, 572, 570, 570, 572, 590, 584,钢丝折断力服从,问:是否可接受钢丝折断力的方差为 64,解:,检验假设:,所以取检验统计量:,例1.某厂生产的钢丝质量一贯比较稳

27、定,今从产品中随机抽取10,经计算:,接受 ,即可认为钢丝的折断力的方差为 64,经计算:接受 ,即可认为钢丝的折断力的方差为,当总体服从正态分布, 未知,是否成立时其讨论完全同上述类似,,检验假设:,则在显著性水平 下, 的拒绝域:,或,当总体服从正态分布, 未知是否成立时其讨论完全同上述类,二. 两个正态总体方差的假设检验( F 检验),是来自总体 的样本,,是来自总体 的样本,,且两个样本相互独立。其样本方差分别为,且 均未知。,检验假设,取检验统计量,二. 两个正态总体方差的假设检验( F 检验) 是来自,P 当 为真时拒绝 ,使得:,则在显著性水平 下, 的拒绝域:,或,P 当 为真时拒绝 使得:则,的拒绝域,的接受域,的接受域,的拒绝域,的拒绝域的接受域的接受域的拒绝域,检验假设:,单边检验,同上面双边检验的讨论类似,可得 的拒绝域为:,或,习惯上亦称两个总体方差相等的检验为:两总体方差齐性的检验,检验假设: 单边检验同上面双边检验的讨论类似,可得,例2.,解:,试问:这两批葡萄酒的醇含量的均方差有无显著 差异?,检验假设,因为 均未知,,所以由 F 检验取,检验统计量为:,例2.解:试问:这两批葡萄酒的醇含量的均方差有无显著检验假设,接受 即认为这两批葡萄酒的醇含量的均方差无显著差别,经计算:,又,接受 即认为这两批葡萄酒 经计算:又,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号