《计量经济学第5章假设检验ppt课件.ppt》由会员分享,可在线阅读,更多相关《计量经济学第5章假设检验ppt课件.ppt(83页珍藏版)》请在三一办公上搜索。
1、第 5 章 假设检验,5-2,假设检验在统计方法中的地位,5-3,假设检验与区间估计的关系,假设检验与区间估计是统计推断的两个组成部分。假设检验与区间估计的区别主要在于:区间估计是用给定的大概率推断出总体参数的范围,总体参数在估计前是未知的。假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。如先对总体均值提出一个假设,然后利用样本信息去检验这个假设是否成立。,第一节 假设检验概述,5-5,主要内容,假设检验的概念与思想假设检验的步骤假设检验中的小概率原理双侧检验和单侧检验假设检验中的 P 值,假设检验的概念与思想,5-7,什么是假设?(hypothesis), 对总体参数的的数值所作
2、的一种陈述总体参数包括总体均值、成数、方差等分析之前必需陈述,我认为该地区新生婴儿的平均体重为3190克!,5-8,什么是假设检验? (hypothesis testing),1.事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立2.有参数假设检验和非参数假设检验3.采用逻辑上的反证法,依据统计上的小概率原理,5-9,假设检验的基本思想,. 因此我们拒绝假设= 50,样本均值, = 50,抽样分布,H0,5-10,假设检验的过程,假设检验的步骤,5-12,假设检验的步骤,提出假设确定适当的检验统计量规定显著性水平计算检验统计量的值作出统计决策,5-13,提出原假设和备择
3、假设, 什么是原假设?(null hypothesis)待检验的假设,又称“0假设”表示为 H0 什么是备择假设?(alternative hypothesis)与原假设对立的假设表示为 H1,5-14,确定适当的检验统计量, 什么检验统计量?1.用于假设检验决策的统计量2.选择统计量的方法与参数估计相同,需考虑是大样本还是小样本总体方差已知还是未知检验统计量的基本形式为,5-15,规定显著性水平(significant level), 什么显著性水平?1.是一个概率值2.原假设为真时,拒绝原假设的概率,被称为抽样分布的拒绝域3.表示为,常用的值有0.01, 0.05, 0.104.由研究者事
4、先确定,5-16,作出统计决策,计算检验的统计量根据给定的显著性水平 ,查表得出相应的临界值z或z/2,t或t/2。将检验统计量的值与临界值进行比较得出接受或拒绝原假设的结论,假设检验中的小概率原理,5-18,假设检验中的小概率原理, 什么小概率?1.在一次试验中,一个几乎不可能发生的事件发生的概率2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3.小概率由研究者事先确定,5-19,假设检验中的小概率原理,3190,3205.68,3174.32,3210,由以往的资料可知,某地新生儿的平均体重为3190克,从今年的新生儿中随机抽取100个,测得其平均体重为3210克,问今年新生儿的
5、平均体重是否为3190克(即与以往的体重是否有显著差异)?,为方便,设今年新生儿总体的体重标准差为80克。,右图是在假设今年新生儿总体平均体重为3190克(这就是原假设)的情况下,样本平均体重的抽样分布( 标准差为80克,样本容量为100 ),可以看出95%样本均值落在红线之间的区域。,小概率原理:我们认为某次抽样得到的样本平均体重不可能落在红线之外的区域(即落在红线之外被看成是小概率事件),如果落在红线之外,则是在一次试验中小概率事件发生了,那么我们据此认为“今年新生儿总体平均体重为3190克”这一假设是不成立的。 红线的位置在哪里,即显著性水平是多大,由研究者事先确定。,0.025,假设检
6、验中的两类错误,(决策风险),5-21,假设检验中的两类错误,1.第一类错误(弃真错误)原假设为真时拒绝原假设会产生一系列后果第一类错误的概率为 ,被称为显著性水平2.第二类错误(取伪错误)原假设为假时接受原假设第二类错误的概率为(Beta),5-22,H0: 无罪,假设检验就好像一场审判过程,统计检验过程,假设检验中的两类错误(决策结果),5-23, 错误和 错误的关系,你不能同时减少两类错误!,和的关系就像翘翘板,小就大, 大就小,5-24,它们这种关系可通过正态分布的统计检验,图示如下:,5-25,/2,/2,增大样本容量n时,可以使和同时减小.,注意:,z1-/2,- z1-/2,=0
7、,0(0),5-26,影响 错误的因素,1.总体参数的真值随着假设的总体参数的减少而增大2.显著性水平 当 减少时增大3.总体标准差当 增大时增大4.样本容量 n当 n 减少时增大,5-27,哪类错误是首要控制目标,一般来讲,我们更关心原假设为真时,却把它拒绝的可能性,而这正是错误所表现的内容。错误是首要控制目标。,双侧检验和单侧检验,5-29,双侧检验与单侧检验 (假设的形式),是何种检验,决定于备择假设的不等式形式与方向,5-30,双侧检验(原假设与备择假设的确定),属于决策中的假设检验不论是拒绝H0还是不能拒绝H0,都必需采取相应的行动措施例如,某种零件的尺寸,要求其平均长度为10cm,
8、大于或小于10cm均属于不合格我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立建立的原假设与备择假设应为 H0: = 10 H1: 10,5-31,双侧检验(显著性水平与拒绝域 ),5-32,双侧检验(显著性水平与拒绝域),5-33,双侧检验 (显著性水平与拒绝域),5-34,双侧检验 (显著性水平与拒绝域),5-35,单侧检验(原假设与备择假设的确定),将研究者想收集证据予以支持的假设作为备择假设H1例如,一个研究者总是想证明自己的研究结论是正确的一个销售商总是想正确供货商的说法是不正确的备择假设的方向与想要证明其正确性的方向一致将研究者想收集证据证明其不正确的假设作为原假设H
9、0先确立备择假设H1,5-36,单侧检验 (原假设与备择假设的确定),一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。检验这一结论是否成立研究者总是想证明自己的研究结论(寿命延长)是正确的备择假设的方向为“”(寿命延长)建立的原假设与备择假设应为 H0: 1500 H1: 1500,5-37,单侧检验 (原假设与备择假设的确定),一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是否成立?研究者总是想证明自己的研究结论(废品率降低)是正确的备择假设的方向为“”(废品率降低)建立的原假设与备择假设应为 H0: 2% H1: 2%,5-38,
10、单侧检验 (原假设与备择假设的确定),某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上。如果你准备进一批货,怎样进行检验检验权在销售商一方作为销售商,你总是想收集证据证明生产商的说法(寿命在1000小时以上)是不是正确的备择假设的方向为“”(寿命不足1000小时)建立的原假设与备择假设应为 H0: 1000 H1: 1000,5-39,单侧检验(显著性水平与拒绝域),5-40,左侧检验 (显著性水平与拒绝域),5-41,左侧检验 (显著性水平与拒绝域),5-42,右侧检验 (显著性水平与拒绝域),5-43,右侧检验 (显著性水平与拒绝域),假设检验中的 P 值,5-45,什
11、么是P 值?(P-value),是一个概率值如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积被称为观察到的(或实测的)显著性水平,5-46,双侧检验的P 值,5-47,左侧检验的P 值,5-48,右侧检验的P 值,5-49,利用 P 值进行检验(决策准则),单侧检验若p-值 ,不能拒绝 H0若p-值 /2, 不能拒绝 H0若p-值 /2, 拒绝 H0,第二节 一个总体参数的检验,5-51,主要内容,总体均值检验总体成数的检验总体方差的检验用置信区间进行检验,5-52,一个
12、总体参数的检验,总体均值检验,5-54,总体均值的检验(检验统计量),总体 是否已知?,5-55,总体均值的检验 (2 已知或2未知大样本),1.假定条件总体服从正态分布若不服从正态分布, 可用正态分布来近似(n30)2.使用Z-统计量2 已知:2 未知:,5-56,2 已知均值的检验(例题分析),【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为= 0.025 。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(0.05),双侧检验
13、,5-57,H0: 0= 0.081H1: 0 0.081 = 0.05n = 200临界值(s):,2 已知均值的检验 (例题分析),检验统计量:,决策:,结论:,在 = 0.05的水平上拒绝H0,有证据表明新机床加工的零件的椭圆度与以前有显著差异,5-58,2 已知均值的检验 (P 值的计算与应用),第1步:进入Excel表格界面,选择“插入”下拉菜单第2步:选择“函数”点击第3步:在函数分类中点击“统计”,在函数名的菜单下选择字符“NORMSDIST”然后确定第4步:将Z的绝对值2.83录入,得到的函数值为 0.997672537 P值=2(10.997672537)=0.004654
14、P值远远小于,故拒绝H0,5-59,2 已知均值的检验 (小样本例题分析),【例】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(0.05),单侧检验,5-60,2 已知均值的检验 (小样本例题分析),H0: 1020H1: 1020 = 0.05n = 16临界值(s):,检验统计量:,在 = 0.05的水平上拒绝H0,有证据表明这批灯泡的使用寿命有显著提高,决策:,结论:,5-61,2 未知大样本均值的检验 (例题分析),
15、【例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准? (0.05),单侧检验,5-62,2 未知大样本均值的检验 (例题分析),H0: 1200H1: 1200 = 0.05n = 100临界值(s):,检验统计量:,在 = 0.05的水平上不能拒绝H0,不能认为该厂生产的元件寿命显著地高于1200小时,决策:,结论:,5-63,总体均值的检验 (2未知小样本),1.假定条件总体为正态分布2
16、未知,且小样本2.使用t 统计量,5-64,2 未知小样本均值的检验 (例题分析),【例】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。,双侧检验,5-65,2 未知小样本均值的检验 (例题分析),H0: = 5H1: 5 = 0.05df = 10 - 1 = 9临界值(s):,检验统计量:,在 = 0.05的水平上拒绝H0,说明该机器的性能不好,决策:,结论:,5-66,2 未知小样本均值的检验 (P 值的计算与应用),第1步:进入Excel表格界面,选择“插
17、入”下拉菜单第2步:选择“函数”点击,并在函数分类中点击“统 计” ,然后,在函数名的菜单中选择字符 “TDIST”,确定第3步:在弹出的X栏中录入计算出的t值3.16 在自由度(Deg-freedom)栏中录入9 在Tails栏中录入2,表明是双侧检验(单测 检验则在该栏内录入1) P值的结果为0.011550.025,拒绝H0,5-67,2 未知小样本均值的检验 (例题分析),【例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里
18、数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?( = 0.05),单侧检验!,5-68,均值的单尾 t 检验 (计算结果),H0: 40000H1: 40000 = 0.05df = 20 - 1 = 19临界值(s):,检验统计量:,在 = 0.05的水平上不能拒绝H0,有证据表明轮胎使用寿命显著地大于40000公里,决策:,结论:,总体比例的检验(Z 检验),5-70,一个总体比例检验,假定条件有两类结果总体服从二项分布可用正态分布来近似比例检验的 Z 统计量,0为假设的总体比例,5-71,一个总体比例的检验 (例题分析),【例】一项统计结果声称,某市老年
19、人口(年龄在65岁以上)的比重为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法?(= 0.05),双侧检验,5-72,一个总体比例的检验 (例题分析),H0: = 14.7%H1: 14.7% = 0.05n = 400临界值(s):,检验统计量:,在 = 0.05的水平上不能拒绝H0,该市老年人口比重为14.7%,决策:,结论:,总体方差的检验(2 检验),5-74,方差的卡方 (2) 检验,检验一个总体的方差或标准差假设总体近似服从正态分布检验统计量,5-75,方差的卡方
20、(2) 检验(例题分析),【例】某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升(1000cm3)的饮料误差上下不超过1cm3。如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随机抽取25瓶,分别进行测定(用样本减1000cm3),得到如下结果。检验该机器的性能是否达到设计要求 (=0.05),绿色健康饮品,绿色健康饮品,双侧检验,5-76,方差的卡方 (2) 检验(例题分析),H0: 2 = 1H1: 2 1 = 0.05df = 25 - 1 = 24临界值(s):,统计量:,在 = 0.05的水平上不能拒绝H0,可以认为该机器的性能达到设计要求,决策:,结
21、论:,用置信区间进行检验,5-78,用置信区间进行检验(双侧检验),1.求出双侧检验均值的置信区间,2已知时:,2未知时:,2.若总体的假设值0在置信区间外,拒绝H0,5-79,用置信区间进行检验(单侧检验),1.左侧检验:求出单边置信下限,2.若总体的假设值0小于单边置信下限,拒绝H03.右侧检验:求出单边置信上限,4.若总体的假设值0大于单边置信上限,拒绝H0,5-80,用置信区间进行检验 (例题分析),【例】一种袋装食品每包的标准重量应为1000克。现从生产的一批产品中随机抽取16袋,测得其平均重量为991克。已知这种产品重量服从标准差为50克的正态分布。试确定这批产品的包装重量是否合格
22、?( = 0.05),双侧检验!,香脆蛋卷,5-81,用置信区间进行检验 (例题分析),H0: = 1000H1: 1000 = 0.05n = 49临界值(s):,置信区间为,决策:,结论:,假设的0 =1000在置信区间内,不能拒绝H0,表明这批产品的包装重量合格,假设检验注意事项,5-83,备择假设比原假设更重要,由实际问题来确定,一般把期望出现的结论作为备择假设。在进行假设检验时,一般是通过拒绝原假设接受备择假设,来支持/得到我们所想要的。拒绝原假设时,可能犯的错误是弃真错误(概率为),这一错误是可控的,并且是首要控制的目标。而如果是接受了假设,此时可能犯的错误是纳伪错误,概率是,这是不容易控制的,而且一般来讲其值较大。假设检验的结果不是100%可靠的,是有可能犯错误的,大家一定要牢记这一点!,