《概率论与数理统计第八章.ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计第八章.ppt(64页珍藏版)》请在三一办公上搜索。
1、ch8,1,第八章,假 设 检 验,ch8,2,引例1,某产品出厂检验规定:次品率p不超过4%才能出厂.现从一大批产品中任意抽查12件发现3件次品,问该批产品能否出厂?若抽查结果发现1件次品,问能否出厂?,ch8,3,解 假设H0:,这是小概率()事件,一般在一次试验中是不会发生的,现一次试验竟然发生,故认为原假设不成立,即该批产品次品率p0.04,则该批产品不能出厂.,这不是小概率事件,没理由拒绝原假设,从而接受原假设,即该批产品可以出厂.,12件中有3件不合格的概率,12件中有1件不合格的概率,ch8,4,若不用假设检验,按理说应不能出厂;,注1,直接算,注2,本检验方法是 概率意义下的反
2、证法,故拒绝原假设是有说服力的,而接受原假设是没有说服力的.因此应把希望否定的假设作为原假设.,ch8,5,所谓假设检验是指提出关于总体的某项假设,然后根据所获得的样本来判断这个假设是否成立。,假设检验问题可分为参数假设检验和非参数假设检验两类。,做假设检验,首先要提出假设。假设分为原假设(记为H0)和备择假设(记为H1)。备择假设又分为双边备择假设和单边备择假设(右边备择假设或左边备择假设)。,1 假设检验,ch8,6,例1、某车间用一台包装机包装葡萄糖,每包的重量是一个随机变量,它服从正态分布。当机器正常时,其均值为0.5公斤,标准差为0.015公斤。某日开工后为检验包装机是否正常工作,随
3、机地抽取它所包装地9袋葡萄糖,称得净重为(千克):,现设标准差不变,问机器是否正常工作?,由题意知:XN(,0.0152),这里未知,问题是根据样本值来判断是 00.5,还是 0?,0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512,ch8,7,假设检验的基本步骤:,1、建立假设:在假设检验中,常把一个被检验的假设称为原假设,用H0表示,通常将不应轻易加以否定的假设作为原假设;当H0被拒绝时而接受的假设称为备择假设,用H1表示,,在例1中我们可以建立两个假设:H0:00.5;原假设;H1:0 备择假设,ch8,8,2、选择检验统计量,给出
4、拒绝域形式 由样本对假设进行判断,总是通过一个统计量来完成的,该统计量称为检验统计量。使原假设被拒绝的样本观测值的区域称为拒绝域。选择合适的统计量,由H1确定拒绝域形式。在例1中,由于样本均值 是0的无偏估计量,我们说H1:0是指:,某个正数,ch8,9,3、选择显著性水平,任何检验方法都不能完全排除犯错误的可能性.在假设检验中可能犯的错误有两种:一种是H0为真时而拒绝H0,称之为第一类错误;一种是H0为假时而接受H0,称之为第二类错误。理想的检验方法应使犯两类错误的概率都很小,但在样本容量给定的情形下,不可能使两者都很小。而是降低一个,往往会使另一个增大.,ch8,10,假设检验的两类错误,
5、犯第一类错误的概率通常记为 犯第二类错误的概率通常记为,ch8,11,假设检验的指导思想是“犯第一类错误为小概率事件”,即控制犯第一类错误的概率不超过一个较小的数称为显著性水平,一般取 0.05,0.01等,然后,若有必要,通过增大样本容量的方法来减少。,在例1中,我们取 0.05,ch8,12,4、求出拒绝域,做出判断 根据显著性水平,我们可以求出拒绝域,根据所取样本观测值,做出接受还是拒绝H0的判断。,ch8,13,例1的解题过程:解 按题意需检验假设 H0:00.5 原假设;H1:0 备择假设。,选择检验统计量:,拒绝域:,在显著性水平取 0.05时:,ch8,14,由所给样本计算得:,
6、于是,因此,拒绝H0认为这天包装机工作不正常。,ch8,15,某厂生产的螺钉,按标准强度为68/mm2,而实际生产的强度X 服N(,3.62).当E(X)=68时,认为这批螺钉符合要求,否则认为不符合要求.现从整批螺钉中取容量为36的样本,其均值为 68.5。在显著性水平取 0.05时,检验这批螺钉是否符合要求?解:提出如下假设:,H0:=068,原假设的对立面:H1:068,例2,ch8,16,著性水平取 0.05,则,由,即区间(,66.824)与(69.18,+)为检验的拒绝域,ch8,17,为检验的接受域(实际上没理由拒绝),现,落入接受域,则接受原假设 H0:=68,即认为这批螺钉是
7、符合要求的。,ch8,18,单侧检验,前面的检验,拒绝域取在两侧,称为双侧检验.即做假设:H0:0原假设;H1:0,除了双侧检验以外,我们还常做单边检验.,如需检验假设:H0:0;H1:0右边检验;或H0:0;H1:0左边检验,ch8,19,H0:0;H1:0右边检验的拒绝域的确定:由于H0中的全部比H1中的全部要小,当H1为真时观察值 x 一般偏大。因此,拒绝域为:,H0:0;H1:0右边检验的拒绝域的确定:由于H0中的全部比H1中的全部要大,当H1为真时观察值x 一般偏小。因此,拒绝域为:,ch8,20,例3 某工厂生产的固体燃料推进器的燃烧率服从正态分布N(,2),40cm/s,2cm/
8、s.现在用新方法生产了一批推进器,从中随机地取 n=25只,测得燃烧率的样本均值为41.25cm/s.设在新方法下总体均方差仍为2cm/s,问用新方法生产的推进器的燃烧率较以往生产的推进器的燃烧率是否有显著提高,取显著性水平0.05.,ch8,21,解 按题意需检验假设:H0:0=40(即假设新方法没有显著提高);H1:0=40(即假设新方法有显著提高)。,通过样本均值计算得:,这是右边检验问题。其拒绝域为,拒绝假设H0,即认为新方法使得燃烧率有显著提高。,ch8,22,例4 某织物强力指标X的均值=21公斤.改进工艺后生产一批织物,今从中取30件,测得=21.25公斤.假设强力指标服从正态分
9、布 且已知=1.2公斤,问在显著性水平=0.01下,新生产织物比过去的织物强力是否有提高?,ch8,23,解:提出假设:,取统计量,是一小概率事件,U=1.1412.33,故接受原假设H0.认为新生产织物比过去的织物强力没有显著提高。,落入接受域,ch8,24,一般,作假设检验时,先控制犯第一类错误的概率,在此基础上使 尽量地小.要降低 一般要增大样本容量.当H0不真时,参数值越接近真值,越大.,注 1,ch8,25,备择假设可以是单侧,也可以双侧.,H0:=68;,H1:68,注 2,引例2中的备择假设是双侧的.若根据以往生产情况,0=68.现采用了新工艺,关心的是新工艺能否提高螺钉强度,越
10、大越好.此时可作如下的右边假设检验:,ch8,26,关于原假设与备择假设的选取,H0与H1地位应平等,但在控制犯第一类错误的概率 的原则下,使得采取拒绝H0 的决策变得较慎重,即H0 得到特别的保护.,因而,通常把有把握的、有经验的结论即不应轻易否定结论的作为原假设,或者尽可能使后果严重的错误成为第一类错误.,注 3,ch8,27,2 正态总体的均值与方差检验,ch8,28,拒绝域的推导,设 X N(2),2 已知,做双边检验,需检验:,H0:0;H1:0,构造统计量,给定显著性水平与样本值(x1,x2,xn),单个正态总体均值与方差的假设检验,一、方差已知时,总体均值的假设检验U检验,ch8
11、,29,P拒绝H0|H0为真,所以本检验的拒绝域为,W:,U检验法,0,0,0,0,0,0,U 检验法(2 已知),原假设 H0,备择假设 H1,检验统计量及其H0为真时的分布,拒绝域,ch8,31,例1某厂生产一种零件,其平均长度等于100mm才算合格.现从一批这种零件中随机抽出25个,测得其长度平均值为98.5mm,已知这种零件的长度且已知N(2),其标准差=10mm,试在显著性水平=0.05之下判定该批零件是否合格.,解:本题要在显著性水平=0.05下,检验假设 H0:=100;H1:100;,此时,是在2已知条件下对作检验,故用Z检验,取,ch8,32,而,由于,故接受H0,判定该批零
12、件合格.,ch8,33,二、2未知时,均值的假设检验t 检验,设总体XN(,2),2未知,(X1,X2,Xn)是来自总体 X 的样本这里要检验的是,对于给定的显著性水平,拒绝域为,我们用 S 2 代替 2,当H0为真时,检验统计量,上述检验统计量服从 t 分布,称这种检验为 t 检验类似地可以进行单边检验.,H0:0;H1:0,0,0,0,0,0,0,t 检验法(2 未知),原假设 H0,备择假设 H1,检验统计量及其H0为真时的分布,拒绝域,ch8,35,例1 某厂生产的马达说明书上写着:在正常负载下马达平均消耗电流不会超过0.8 安培.现随机抽取16台马达试验,求得平均消耗电流为0.92安
13、培,消耗电流的标准差为0.32安培.假设马达所消耗的电流服从正态分布,取显著性水平为=0.05,问据此样本,能否否定厂方的断言?,ch8,36,解 根据题意待检假设可设为,H0:0.8;H1:0.8,未知,检验统计量:,拒绝域W为,现,故接受原假设,即不能否定厂方断言.,ch8,37,解二 H0:0.8;H1:0.8,故接受原假设,即否定厂方断言.,检验统计量:,拒绝域W为,现,ch8,38,由例1可见:对问题的提法不同(把哪个假设作为原假设),统计检验的结果也会不同.,上述两种解法的立场不同,因此得到不同的结论.,第一种假设是不轻易否定厂方的结论;,第二种假设是不轻易相信厂方的结论.,ch8
14、,39,由于假设检验是控制犯第一类错误的概率,使得拒绝原假设 H0 的决策变得比较慎重,也就是 H0 得到特别的保护.因而,通常把有把握的,经验的结论作为原假设,或者尽量使后果严重的错误成为第一类错误.,2 02,2 02,2 02,2 02,2=02,2 02,原假设 H0,备择假设 H1,检验统计量及其在H0为真时的分布,拒绝域,(未知),2 检验法,三、关于 2 的检验,ch8,41,例2 某汽车配件厂在新工艺下对加工好的25个活塞的直径进行测量,得样本方差S2=0.00066.已知老工艺生产的活塞直径的方差为0.00040.问进一步改革的方向应如何?,ch8,42,解 一般进行工艺改革
15、时,若指标的方差显著增大,则改革需朝相反方向进行以减少方差;若方差变化不显著,则需试行别的改革方案.,设测量值,ch8,43,需考察改革后活塞直径的方差是否不大于改革前的方差?故待检验假设可设为:,H0:2 0.00040;H1:2 0.00040.,此时可采用效果相同的单边假设检验,H0:2=0.00040;H1:2 0.00040.,取统计量,ch8,44,落在拒绝域内,故拒绝H0.即改革后的方差显著大于改革前,因此下一步的改革应朝相反方向进行.,拒绝域:,ch8,45,例3 某自动机床加工车轴,根据要求车轴直径的方差不应超过0.1.为检验自动机床的工作精度,从加工后的车轴中抽取25件产品
16、,测得数据如下:,车轴直径 xi 3.2 3.6 3.9 4.3 4.5 频 数 ni 3 5 8 7 2,设车轴直径服从正态分布,取0.05,检验机床是否达到所要求的精度?,ch8,46,解 设X为加工车轴的直径,则,作右侧假设检验,取检验统计量,拒绝域,算得,ch8,47,ch8,48,落拒绝域W外,接受Ho即认为机床达到所要求的精度.,ch8,49,设 X N(1 1 2),Y N(2 2 2)两样本 X,Y 相互独立,样本(X1,X2,Xn1),(Y1,Y2,Yn2)样本值(x1,x2,xn1),(y1,y2,yn2)显著性水平,1 2=,(12,22 已知),(1)关于均值差 1 2
17、 的U检验,1 2,1 2,1 2,1 2,1 2,原假设 H0,备择假设 H1,检验统计量及其在H0为真时的分布,拒绝域,1 2=,1 2,1 2,1 2,1 2,1 2,其中,12,22未知12=22,原假设 H0,备择假设 H1,检验统计量及其在H0为真时的分布,拒绝域,ch8,52,例4 杜鹃总是把蛋生在别的鸟巢中,现从两种鸟巢中得到杜鹃蛋24个.其中9个来自一种鸟巢,15个来自另一种鸟巢,测得杜鹃蛋的长度(mm)如下:,m=15,19.8 20.0 20.3 20.8 20.9 20.9 21.0 21.0 21.0 21.2 21.5 22.0 22.0 22.1 22.3,n=9
18、,21.2 21.6 21.9 22.0 22.022.2 22.8 22.9 23.2,ch8,53,试判别两个样本均值的差异是仅由随机因素造成的还是与来自不同的鸟巢有关(=0.05).,解,H0:1=2;H1:1 2,取统计量,ch8,54,拒绝域 0:,统计量值.落在0内,拒绝H0 即蛋的长度与不同鸟巢有关.,12=22,12 22,12 22,12 22,12 22,12 22,(2)关于方差比 12/22 的检验,1,2,均未知,原假设 H0,备择假设 H1,检验统计量及其在H0为真时的分布,拒绝域,ch8,56,例4 为比较两台自动机床的精度,分别取容量为10和8的两个样本,测量某
19、个指标的尺寸(假定服从正态分布),得到下列结果:,在=0.1时,问这两台机床是否有同样的精度?,车床甲:1.08,1.10,1.12,1.14,1.15,1.25,1.36,1.38,1.40,1.42,车床乙:1.11,1.12,1.18,1.22,1.33,1.35,1.36,1.38,ch8,57,解:设两台自动机床的方差分别为在=0.1下检验假设:,ch8,58,由样本值可计算得F的实测值为:,查表得,由于 0.3041.513.68,故接受H0.,F=1.51,这时可能犯第二类错误.,ch8,59,例5 假设机器 A 和 B 都生产钢管,要检验 A 和 B 生产的钢管内径的稳定程度.
20、设它们生产的钢管内径分别为 X 和 Y,且都服从正态分布 X N(1,12),Y N(2,22),现从机器 A和 B生产的钢管中各抽出18 根和13 根,测得 s12=0.34,s22=0.29,ch8,60,设两样本相互独立.问是否能认为两台机器生产的钢管内径的稳定程度相同?(取=0.1),解,设 H0:12=22;H1:12 22,查表得 F0.05(17,12)=2.59,F0.95(17,12)=,ch8,61,拒绝域为:,或,由给定值算得:,落在拒绝域外,故接受原假设,即认为内径的稳定程度相同.,ch8,62,作业P2291,2,3,ch8,63,已知某次考试的成绩服从正态分布N(,152),现从中随机的抽取36位考生的成绩,算得平均成绩为,,试在显著水平0.05下检验:,ch8,64,自测试题浏览:上海理工大学主页课程中心课程资源全部课程理学院22000172 概率论与数理统计B 教师网站水平自测,