《第7章统计假设检验和区间估计.ppt》由会员分享,可在线阅读,更多相关《第7章统计假设检验和区间估计.ppt(65页珍藏版)》请在三一办公上搜索。
1、第7章 统计假设检验和区间估计,统计假设检验概要,单正态总体的统计检验,两正态总体的统计检验,需要说明的问题,正态总体的区间估计,(1)小概率原理(实际推断原理)认为概率很小的事件在一次试验中实际上不会出现,并且小概率事件在一次试验中出现了,就被认为是不合理的.,(2)基本思想 先对总体的参数或分布函数的表达式做出某种假设,然后找出一个在假设成立条件下出现可能性甚小的(条件)小概率事件.如果试验或抽样的结果使该小概率事件出现了,表明原来的假设有问题,应予以否定,即拒绝这个假设.若该小概率事件在一次试验或抽样中并未出现,就没有理由否定这个假设,可以接受原来的假设.,1.统计检验的基本思想,统计检
2、验概要,利用样本检验统计假设真伪的过程叫做统计检验(假设检验),小概率原理中,关于“小概率”的值通常根据实际问题的要求而定,如取=0.1,0.05,0.01等,为检验的显著性水平(检验水平).,(3)显著性水平与否定域,/2,/2,接受域,P(|Z|z1-/2)=,否定域的大小,依赖于显著性水平的取值,一般说来,显著性水平越高,即越小,否定域也越小,这时原假设就越难否定.,注意:,否定域,否定域,z1-/2,-z1-/2,(1)提出待检验的原假设 和备则假设;,(2)选择检验统计量,并找出在假设 成立条件下,该统计量所服从的分布;,(3)根据所要求的显著性水平 和所选取的统计量,确定一个合理的
3、拒绝H0的条件;,(4)由样本观察值计算出统计检验量的值,若该值落入否定域,则拒绝原假设,否则接受原假设,注 若H1位于H0的两侧,称之为双侧检验;若H1位于H0的一侧,称之为单侧检验.,2.统计检验的实施程序,另一方面,当原假设不成立时,却作出接受原假设的结论,造成犯“取伪”的错误,称为第二类错误,就是犯第一类错误的概率的最大允许值.,一般用 表示犯第二类错误的概率.,根据小概率原理否定原假设,有可能把本来客观上正确的假设否定了,造成犯“弃真”的错误,称为第一类错误,弃真取伪,当样本容量 一定时,小,就大,反之,小,就大.,另外,一般,3.两类错误,增大样本容量n时,可以使和同时减小.,注意
4、:,2)确定检验统计量:,设总体XN(,2),X1,X2,Xn 为一组样本,,(1)总体方差2已知时,H0:=0(已知);H1:0,1)提出原假设和备择假设:,H0:=0;H1:0,3)对给定,由原假设成立时P(|Z|z1-/2)=得 拒绝条件为|Z|z1-/2,其中,1.期望的检验,单正态总体的统计检验,/2,/2,接受域,P(|Z|z1-/2)=,否定域,否定域,z1-/2,-z1-/2,双侧统计检验,Z检验,例:用精确方法测量某化工厂排放的气体中有害气体含量服从正态分布N(23,22),现用一简便方法测量6次得一组数据23,21,19,24,18,18(单位:十万分之一),若用简便方法测
5、得有害气体含量的方差不变,问用该方法测得有害气体含量的均值是否有系统偏差?,分析 用简便方法测得有害气体含量XN(,22),若H0成立,则,若取=0.05,则,P|Z|z1-/2=a,即:P|Z|1.96=0.05,在假设成立的条件下,|Z|1.96为概率很小事件,一般认为:小概率事件在一次实验中是不会发生的,将样本观测值代入Z得,|Z|1.96,基本检验H0:=0=23;,备择检验H1:0=23;,小概率事件在一次实验中发生了,故假设不合情理,即:否定原假设,简便方法测得均值有系统偏差.,2)选择检验统计量:,1)提出原假设和备择假设:,H0:=0;H1:0,3)对给定,拒绝条件为|T|t1
6、-/2(n-1),/2,/2,接受域,否定域,否定域,(T检验),(2)2未知,的检验,例:从电话公司每月长途电话的帐单中,随机抽取37张,计算平均费用为33.15元,标准差为21.21元.假定费用服从正态分布,未知,要检验假设,解:取检验统计量,依样本计算检验统计量的值为,说明样本支持原假设,故要接受原假设.,接受域,2)选择检验统计量:,1)提出原假设和备择假设:,3)给定,取,H0:2=02;H1:2 02,/2,/2,1,2,否定域,否定域,设总体XN(,2),X1,X2,Xn 为一组样本,,(1)2的检验(未知),有P(1 2)=1-,所以,拒绝条件为,2.方差2的检验,例:在正常的
7、生产条件下,某产品的测试指标总体XN(0,02),其中0=0.23.后来改变生产工艺,出了新产品,假设新产品的测试指标总体仍为X,且XN(,2).从新产品中随机地抽取10件,测得样本值为x1,x2,x10,计算得到样本标准差S=0.33.试在检验水平=0.05的情况下检验:方差2有没有显著变化?,解,建立假设,新产品指标的方差与正常情况下产品指标的方差比较没有显著变化.,2.718.5319.023,接受,接受域,否定域,z1-,单侧(右侧)统计检验,P(z1-),原假设的确定一般应遵循以下原则 要把等号放在原假设里.,2)对统计量:,设总体XN(,2),X1,X2,Xn 为一组样本,,1)提
8、出原假设和备择假设:,H0:0;H1:0,3)故 拒绝条件为Z z1-,其中,对给定的有,在H0下有,所以,H0:0(已知);H1:0,2)选择统计量:,1)提出原假设和备择假设:,H0:0;H1:0,3)对给定,否定域为Z-z1-,其中,H0:0(已知);H1:0,2)选择检验统计量:,1)提出原假设和备择假设:,H0:=0;H1:0,3)对给定,拒绝条件为|T|,/2,/2,接受域,否定域,否定域,(T检验),(2)2未知,的检验,类似可得:,2未知,期望的单侧统计检验,H0:0;H1:0的拒绝条件为,统计检验,H0:0;H1:0的拒绝条件为,统计检验,接受域,2)选择检验统计量:,1)提
9、出原假设和备择假设:,3)给定,取,H0:2=02;H1:2 02,/2,/2,1,2,否定域,否定域,设总体XN(,2),X1,X2,Xn 为一组样本,,(1)2的检验(未知),有P(1 2)=1-,所以,拒绝条件为,2.方差2的检验,1)提出原假设和备择假设:,H0:2 02;H1:2 02,2)选择统计量,则在H0下,对给定的,有,即,3)所以,拒绝条件为,总体期望未知时,2的单侧假设检验,接受域,否定域,单侧假设检验,H0:2 02;H1:2 02,类似对单侧假设,拒绝H0:2 02 的条件为,接受域,否定域,例 在正常的生产条件下,某产品的测试指标总体XN(0,02),其中0=0.2
10、3.后来改变生产工艺,出了新产品,假设新产品的测试指标总体仍为X,且XN(,2).从新产品中随机地抽取10件,测得样本值为x1,x2,x10,计算得到样本标准差S=0.33.试在检验水平=0.05的情况下检验:方差2是否变大?,解,建立假设,新产品指标的方差比正常情况下产品指标方差显著地变大.,18.5316.919,拒绝,例 某地区高考负责人从某年来自A市中学考生和来自B市中学考生中抽样获得如下资料:,已知两地考生成绩服从正态分布,方差大致相同,由以上资料能不能说某年来自A市中学考生的平均成绩比来自B市中学考生的平均成绩高.,设A市考生成绩XN(1,12),B市考生成绩Y N(2,22),假
11、设检验,A市中学考生:B市中学考生:,两个正态总体的统计检验,设总体XN(1,12),总体Y N(2,22),从中分别取相互独立的容量为n1,n2的两组样本X1,和Y1,样本均值和样本方差分别记为,(1)12,22已知,选择检验统计量:,对于给定的显著性水平:,1.两总体均值差的检验,选择检验统计量:,对于给定的显著性水平:,H0:1=2的拒绝条件为,:1 2的拒绝条件为,:1 2的拒绝条件为,(2)12=22=2,2未知,例 从两个教学班各随机选取14名学生进行数学测验,第一教学班与第二教学班测验结果分别由图中的A列与B列单元格所示,已知两教学班数学成绩的方差分别为57与53,在显著性水平0
12、.05下,可否认为这两个教学班学生的数学测验成绩有差异?,解 设第一个教学班数学成绩XN(1,57),第二个教学班数学成绩YN(2,53),建立假设,H0:1-2=0;H1:1-2 0,选择检验统计量:,接受H0:1=2,对于给定的显著性水平=0.05,例某地区高考负责人想知道能不能说某年来自城市中学考生的平均成绩比来自农村中学考生的平均成绩高,已知总体服从正态分布且方差大致相同,由抽样获得资料如图A列和B列:,选择检验统计量:,:1 2,拒绝1 2,12=22=2,2未知,解:建立假设H0:1-20;H1:1-2 0,设总体XN(1,12),总体Y N(2,22),从中取相互独立的容量分别为
13、n1,n2的样本X1,和Y1,样本均值和样本方差分别记为,选择检验统计量:,H0:12=22;H1:12 22,对于给定的显著性水平:,所以拒绝条件为,3.两总体方差比的检验,类似可得,的拒绝条件为,的拒绝条件为,例 假定分别抽选男生与女生各14名进行英语测验(成绩如下),假定男生与女生的英语测验成绩分别服从正态分布 和,试以0.05的显著性水平检验,选择检验统计量:,H0:12=22;H1:12 22,对于给定的显著性水平=0.05:,例:任选19名工人分成两组,让他们每人做同样的工作,测得他们完工时间(单位:分钟)如下:,问饮酒对工作能力是否有显著响?(显著水平),拒绝H0:1=2,故饮酒
14、对工作能力有影响.,设总体分布中含有未知参数,根据来自该总体的s.r.s,如果能够找到两个统计量,使得随机区间 包含 达到一定的把握,那么,便称该随机区间为未知参数的区间估计.即 当 成立时,称概率 为置信度或置信水平;称区间 是 的置信度为 的置信区间;分别称为置信下限和置信上限.,区间估计的定义,选择包含的分布已知函数:,构造Z的一个1-a区间:,的1-置信区间:,设总体XN(,2),X1,X2,Xn 为一组样本,,(1)2已知,求的置信度为1-置信区间,即,1.单正态总体数学期望的区间估计,/2,/2,1-,Z1-/2,P(|Z|)=1-,1-/2,例:设正态总体的方差为1,根据取自该总
15、体的容量为100的样本计算得到样本均值为5,求总体均值的置信度为0.95的置信区间.,解 已知2=1,=0.05,求 的1-置信区间:,设总体XN(,2),X1,X2,Xn 为一组样本,,(2)2未知,求的置信度为1-置信区间,从点估计着手构造变量:,构造T的 一个1-区间:,的1-置信区间:,/2,/2,1-,例:某种零件的重量服从正态分布.现从中抽取容量为16的样本,其观测到的重量(单位:千克)分别为4.8,4.7,5.0,5.2,4.7,4.9,5.0,5.0,4.6,4.7,5.0,5.1,4.7,4.5,4.9,4.9.需要估计零件平均重量,求平均重量的区间估计,置信系数是0.95.
16、,解 未知2,=0.05,求 的1-置信区间:,应用t分布,需要计算,构造枢轴变量:,构造Q的 一个1-区间:,解不等式得到2的1-置信区间:,/2,/2,1-,1,2,1-/2,(3)2的置信度为1-置信区间,例:投资的回收利用率常常用来衡量投资的风险.随机地调查了26个年回收利润率(%),标准差S=1(%).设回收利润率为正态分布,求它的方差的区间估计(置信系数为0.95).,解 总体均值 未知,=0.05,方差的区间估计.,(1)12,22已知,1-2的1-置信区间,相对1-2,构造枢轴变量:,构造Z的 一个1-区间:,概率恒等变形,得到1-2的1-置信区间:,设XN(1,12),Y N
17、(2,22),从中分别抽取容量为n1,n2的样本,且两组样本独立,样本均值和样本方差分别记为,2.两个正态总体均值差的区间估计,(2)12=22=2,2未知,1-2的1-置信区间,对于1-2,构造变量:,构造T的 一个1-区间:,变形得到1-2的1-置信区间:,例:某工厂利用两条自动化流水线罐装番茄酱,分别从两条流水线上抽取随机样本:和,计算出(克),(克),.假设这两条流水线上罐装番茄酱的重量都服从正态分布,其总体均值分别为,且有相同的总体方差.试求总体均值差 的区间估计,置信系数为0.95.,解 12=22=2,2未知,1-2的0.95置信区间:,(1)对于12/22,构造枢轴变量:,(2
18、)构造F的 一个1-区间:,(3)解不等式得12/22 的1-置信区间:,/2,/2,1,2,1-,P(1F 2)=1-,3.两个正态总体方差比 12/22的1-置信区间,统计检验与区间估计的关系,(1)利用统计检验可建立区间估计,反之亦然,设 为取自正态总体 的样本,方差未知,接受条件为:,亦即,改成,便可得到的 置信度为1-的置信区间.,需要说明的问题,反之,若我们先确定了 的区间估计:,改成,得到了原假设 的接受条件,也就得到了 的拒绝条件,检验水平为.,(1)小概率原理(实际推断原理),(2)基本思想,1.统计检验的基本思想,统计检验概要,小结:,(3)显著性水平与否定域,(1)提出待
19、检验的原假设 和备则假设;,(2)选择检验统计量,并找出在假设 成立条件下,该统计量所服从的分布;,(3)根据所要求的显著性水平 和所选取的统计量,确定一个合理的拒绝H0的条件;,(4)由样本观察值计算出统计检验量的值,若该值落入否定域,则拒绝原假设,否则接受原假设,注 若H1位于H0的两侧,称之为双侧检验;若H1位于H0的一侧,称之为单侧检验.,2.统计检验的实施程序,/2,/2,接受域,否定域,否定域,z1-/2,-z1-/2,(1)总体方差2已知时,H0:=0(已知);H1:0,拒绝条件为|Z|z1-/2,1.期望的检验,单正态总体的统计检验,接受域,否定域,z1-,1),2)拒绝条件为
20、Z z1-,H0:0(已知);H1:0,接受域,否定域,-z1-,2),3)否定域为Z-z1-,H0:0(已知);H1:0,2)选择检验统计量:,1)提出原假设和备择假设:,H0:=0;H1:0,3)对给定,拒绝条件为|T|,/2,/2,接受域,否定域,否定域,(T检验),(2)2未知,的检验,接受域,否定域,2未知,期望的单侧统计检验,H0:0;H1:0的拒绝条件为,统计检验,H0:0;H1:0的拒绝条件为,统计检验,接受域,2)选择检验统计量:,1)提出原假设和备择假设:,3)给定,取,H0:2=02;H1:2 02,/2,/2,1,2,否定域,否定域,设总体XN(,2),X1,X2,Xn
21、 为一组样本,,(1)2的检验(未知),有P(1 2)=1-,所以,拒绝条件为,2.方差2的检验,接受域,1,否定域,总体期望未知时,2的单侧假设检验,H0:2 02;H1:2 02,拒绝H0:2 02 的条件为,接受域,否定域,H0:2 02;H1:2 02,拒绝条件为,(1)12,22已知,对于给定的显著性水平:,1.两总体均值差的检验,对于给定的显著性水平:,H0:1=2的拒绝条件为,:1 2的拒绝条件为,:1 2的拒绝条件为,(2)12=22=2,2未知,H0:12=22;H1:12 22,拒绝条件为,3.两总体方差比的检验,的拒绝条件为,的拒绝条件为,(1)2已知,求的置信度为1-置信区间,1.单正态总体数学期望的区间估计,区间估计,(2)2未知,求的置信度为1-置信区间,(3)2的置信度为1-置信区间,(1)12,22已知,1-2的1-置信区间,2.两个正态总体均值差的区间估计,(2)12=22=2,2未知,1-2的1-置信区间,3.两个正态总体方差比 12/22的1-置信区间,