《线代与概率论第七章.ppt》由会员分享,可在线阅读,更多相关《线代与概率论第七章.ppt(64页珍藏版)》请在三一办公上搜索。
1、第 七 章,假 设 检 验,第7.1节 假设检验,二、假设检验的相关概念,三、假设检验的一般步骤,一、假设检验的基本原理,四、小结,一、假设检验的基本原理,在总体的分布函数完全未知或只知其形式、但不知其参数的情况下,为了推断总体的某些性质,提出某些关于总体的假设.,假设检验就是根据样本对所提出的假设作出判断:是接受,还是拒绝.,例如,提出总体服从泊松分布的假设;,一、假设检验的基本原理,什么是假设检验问题?我们先看几个简单的例子。,例1:在超市上出售的某种品牌方便面,按规定每袋净重少于100克的比例不得超过1%。技术监督部门从某超市的货架上任意抽取200袋该种品牌的方便面,经检验发现有3袋重量
2、少于100克,试问:该超市出售的这种方便面是否符合质量标准。,在本例中,在超市上出售的这种方便面的不合格率是未知的,,我们关心的问题是,如何根据样本的不合格率 p=1.5%来判断:在超市上出售的这种方便面的不合格率 p1%是否成立?,例2:某车间用一台包装机包装葡萄糖,包得的袋装糖重是一个随机变量,它服从正态分布.当机器正常时,其均值为0.5公斤,标准差为0.015公斤.某日开工后为检验包装机是否正常,随机地抽取它所包装的糖9袋,称得净重为(公斤):0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512,问机器是否正常?,如何利用样本值对一个
3、具体的假设进行检验?,通常借助于直观分析和理论分析相结合的做法,其基本原理就是人们在实际问题中经常采用的所谓小概率原理:“一个小概率事件在一次试验中几乎是不可能发生的”.,下面结合实例来说明假设检验的基本思想.,例 2:某车间用一台包装机包装葡萄糖,包得的袋装糖重是一个随机变量,它服从正态分布.当机器正常时,其均值为0.5公斤,标准差为0.015公斤.某日开工后为检验包装机是否正常,随机地抽取它所包装的糖9袋,称得净重为(公斤):0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512,问机器是否正常?,分析:,由长期实践可知,标准差较稳定,问
4、题:根据样本值判断,提出两个对立假设,再利用已知样本作出判断是接受假设H0(拒绝假设H1),还是拒绝假设H0(接受假设H1).,如果作出的判断是接受H0,即认为机器工作是正常的,否则,认为是不正常的.,由于要检验的假设涉及总体均值,故可借助于样本均值来判断.,于是可以选定一个适当的正数k,使得,由标准正态分布分位点的定义得,于是拒绝假设H0,认为包装机工作不正常.,1.原假设与备择假设,假设检验问题通常叙述为:,二、假设检验的相关概念,2.拒绝域与临界点,如在前面实例中,为拒绝域,拒绝域,3.两类错误及记号,假设检验是根据样本的信息并依据小概率原理,作出接受还是拒绝H0的判断。由于样本具有随机
5、性,因而假设检验所作出的结论有可能是错误的.这种错误有两类:,(1)当原假设H0为真,观察值却落入拒绝域,而作出了拒绝H0的判断,称做第一类错误,又叫弃真错误.犯第一类错误的概率是显著性水平,(2)当原假设H0不真,而观察值却落入接受域,而作出了接受H0的判断,称做第二类错误,又叫取伪错误.,当样本容量 n 一定时,若减少犯第一类错误的概率,则犯第二类错误的概率往往增大.,犯第二类错误的概率记为,若要使犯两类错误的概率都减小,除非增加样本容量.,三、假设检验的一般步骤,五、小结,假设检验的基本原理、相关概念和一般步骤.,假设检验的两类错误,第7.2节 正态总体均值与方差的假设检验,一、单个总体
6、参数的检验,二、两个总体参数的检验,三、基于成对数据的检验(t 检验),四、小结,一、单个正态总体均值与方差的检验,对于给定的,检验水平,由标准正态分布分位数定义知,,因此,检验的拒绝域为,其中,为统计量U的观测值。这种利用U统计量,来检验的方法称为U检验法。,例1 某切割机在正常工作时,切割每段金属棒的平均长度为10.5cm,标准差是0.15cm,今从一批产品中随机的抽取15段进行测量,其结果如下:,假定切割的长度X服从正态分布,且标准差没有变化,试问该机工作是否正常?,解,查表得,上述利用 t 统计量得出的检验法称为t 检验法.,在实际中,正态总体的方差常为未知,所以我们常用 t 检验法来
7、检验关于正态总体均值的检验问题.,如果在例1中只假定切割的长度服从正态分布,问该机切割的金属棒的平均长度有无显著变化?,解,查表得,t分布表,例2,定理三,根据第五章3定理5.8的推论1知,由t分布分位数的定义知,在实际中,正态总体的方差常为未知,所以我们常用 t 检验法来检验关于正态总体均值的检验问题.,在实际中,正态总体的方差常为未知,所以我们常用 t 检验法来检验关于正态总体均值的检验问题.,上述利用 t 统计量得出的检验法称为t 检验法.,要检验假设:,根据第五章3知,指它们的和集,拒绝域为:,解,例3 某厂生产的某种型号的电池,其寿命长期以来服从方差=5000(小时2)的正态分布,现
8、有一批这种电池,从它生产情况来看,寿命的波动性有所变化.现随机的取26只电池,测出其寿命的样本方差=9200(小时2).问根据这一数据能否推断这批电池的寿命的波动性较以往的有显著的变化?,拒绝域为:,可认为这批电池的寿命的波动性较以往的有显著的变化.,二、两个正态总体均值与方差的检验,1.已知方差时两正态总体均值的检验,需要检验假设:,上述假设可等价的变为,利用u检验法检验.,故拒绝域为,由标准正态分布分位数的定义知,2.未知方差时两正态总体均值的检验,利用t检验法检验具有相同方差的两正态总体均值差的假设.,定理四,根据第五章3定理5.8的推论2知,对给定的,故拒绝域为,解,即甲、乙两台机床加
9、工的产品直径无显著差异.,需要检验假设:,3.两正态总体方差的检验,定理5.8,根据第五章3定理5.8的推论2知,为了计算方便,习惯上取,检验问题的拒绝域为,上述检验法称为F检验法.,解,某砖厂制成两批机制红砖,抽样检查测量砖的抗折强度(公斤),得到结果如下:,已知砖的抗折强度服从正态分布,试检验:,(1)两批红砖的抗折强度的方差是否有显著差异?(2)两批红砖的抗折强度的数学期望是否有显著差异?,(1)检验假设:,例3,查表7-3知拒绝域为,(2)检验假设:,查表7-3知拒绝域为,三、基于配对数据的检验(t检验),有时为了比较两种产品,两种仪器,或两种试验方法等的差异,我们常常在相同的条件下做
10、对比试验,得到一批成对(配对)的观测值,然后对观测数据进行分析。作出推断,这种方法常称为配对分析法。,例7.9 比较甲乙两种橡胶轮胎的耐磨性,今从甲乙两种轮胎中各随机地抽取8个,其中各取一个组成一对。再随机选择8架飞机,将8对轮胎随机地搭配给8架飞机,做耐磨性实验,飞行一段时间的起落后,测得轮胎磨损量(单位:mg)数据如下:,轮胎甲:4900,5220,5500,6020 6340,7660,8650,4870轮胎乙;4930,4900,5140,5700 6110,6880,7930,5010,试问这两种轮胎的耐磨性有无显著差异?,解:用X及Y分别表示甲乙两种轮胎的磨损量,假定,其中 欲检验
11、假设,下面分两种情况讨论:,(1)实验数据配对分析:记,则,由正态分布的可加性知,Z服从正态分布。于是,对 与 是否相等的检验,就变对 的检验,这时我们可采用关于一个正态总体均值的 检验法。将甲,乙两种轮胎的数据对应相减得Z的样本值为:,-30,320,360,320,230,780,720,-140,计算得样本均值,对给定,查自由度为 的 分布表得临界值,由于 因而否定,即认为这种轮胎的耐磨性有显著差异。,(2)实验数据不配对分析:将两种轮胎的数据看作来自两个总体的样本观测值,这种方法称为不配对分析法。欲检验假设,我们选择统计量,由样本数据及 可得,对给定的,,查自由度为16-2=14的t分
12、布,表,得临界值,,由于,,因而接受,,即认为这两种轮胎的耐磨性无显著差异。,以上是在同一检验水平,的分析结果,方法不同所得结果也比一致,到底哪个结果正确呢?下面作一简要分析。因为我们将8对轮胎随机地搭配给8架飞机作轮胎耐磨性试验,两种轮胎不仅对试验数据产生影响,而且不同的飞机也对试验数据产生干扰,因此试验数据配对分析,消除了飞机本身对数据的干扰,突出了比较两种轮胎之间耐磨性的差异。,下采用不同方法,对试验数据不做配对分析,轮胎之间和飞机之间对数据的影响交织在一起,这时样本 不独立。因此,用两个独立正态总体的t检验法是不合适的。由本例看出,对同一批试验数据,采用配对分析还是不配对分析方法,要根据抽样方法而定。,与样本,四、小结,本节学习的正态总体均值的假设检验有:,正态总体均值、方差的检验法见下表,附表7.1,3,2,1,附表7-2,5,6,7,t分布表a,2.1448,t分布表b,1.7531,