贾俊平《统计学》第8章假设检验ppt课件.ppt

上传人:牧羊曲112 文档编号:1366744 上传时间:2022-11-14 格式:PPT 页数:81 大小:1.49MB
返回 下载 相关 举报
贾俊平《统计学》第8章假设检验ppt课件.ppt_第1页
第1页 / 共81页
贾俊平《统计学》第8章假设检验ppt课件.ppt_第2页
第2页 / 共81页
贾俊平《统计学》第8章假设检验ppt课件.ppt_第3页
第3页 / 共81页
贾俊平《统计学》第8章假设检验ppt课件.ppt_第4页
第4页 / 共81页
贾俊平《统计学》第8章假设检验ppt课件.ppt_第5页
第5页 / 共81页
点击查看更多>>
资源描述

《贾俊平《统计学》第8章假设检验ppt课件.ppt》由会员分享,可在线阅读,更多相关《贾俊平《统计学》第8章假设检验ppt课件.ppt(81页珍藏版)》请在三一办公上搜索。

1、正如一个法庭宣告某一判决为“无罪(not guilty)”而不为“清白(innocent)”,统计检验的结论也应为“不拒绝”而不为“接受”。 Jan Kmenta,假设检验在统计方法中的地位,第 8 章 假设检验,8.1 假设检验的基本问题 8.2 一个总体参数的检验8.3 假设检验中的其他问题,8.1 假设检验的基本问题,8.1.1 假设问题的提出8.1.2 假设的表达式8.1.3 两类错误8.1.4 假设检验的流程8.1.5 利用P值进行决策8.1.6 单侧检验,假设问题的提出,什么是假设检验? (hypothesis test),1、先对总体的参数(或分布形式)提出某种假设,然后利用样本

2、信息判断假设是否成立的过程2、逻辑上运用反证法,统计上依据小概率原理,1989年新生儿平均体重3190克;1990年的新生儿随机抽取100个,平均体重3210克;问:1990年的新生儿与1989年相比,体重有无明显差异?,分析: 这20克产生的原因可能是随机抽样产生的,亦可能是确实1990年体重增加。 那么,到底是哪个答案,则需要我们提出假设。,假设办法: 假设1990与1989没有明显差异。 用m0表示1989年新生儿体重,u表示1990新生儿体重,则可以表示为u= m0,或u- m0 =0。 那么,现在的任务就是利用1990样本信息检验这个等式是否成立,看1990新生儿平均体重是否等于我们

3、感兴趣的数值。,假设的表达式,原假设(null hypothesis),H0:u=3190(克) 由于H0表示原假设,下标用0修饰,又称“零假设”解释:3190克是我们感兴趣的1989年的新生儿体重均值,即,我们在假设1990年的新生儿与1989年的新生儿的体重没有什么差异。,零假设的内涵,之所以用零来修饰原假设,其原因是原假设的内容总是表示没有差异或没有改变,或变量间没有关系等等 零假设总是一个与总体参数有关的问题,而关于样本统计量之间的零假设是没有意义的,如样本均值或样本均值之差,因为样本统计量是已知的,当然能说出它们等于几或是否相等,1、H0:u=3190毕竟是假设,如果不成立,就要拒绝

4、原假设。这时需要选择另一个假设,这个假设就是备择假设。即: H1 : u3190(克) (有符号 , 或 )2、H1为备择假设,表示1990年新生儿与1989年新生儿体重有明显差异。也可表达为: H1:u m0 或 H1:u- m0 0,备择假设(alternative hypothesis),原假设和备择假设是一个完备事件组,而且相互对立在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立先确定备择假设,再确定原假设 等号“=”总是放在原假设上 因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论),提出假设(结论与建议),【例】一种零件的生产标准是直径应为10cm

5、,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设,提出假设(例题分析),解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为 H0 : 10cm H1 : 10cm,【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500g。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设,提出假设(例题分析),解:研究者抽检

6、的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为 H0 : 500 H1 : 500,【例】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设,提出假设(例题分析),解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%”。建立的原假设和备择假设为 H0 : 30% H1 : 30%,1、某厂生产的化纤度服从正态分布,纤维度的均值为1.4。某天测得25根纤维的均值为1.39,检验与原来设计的标准均值相比是否有所变化,则假设形式是?,2、

7、某一贫困地区估计营养不良人数高达20%,然而有人认为这个比例实际上还要高,要经验该说法是否正确,则假设形式为?,3、一项新的减肥计划声称:在计划实施的第一周内,参加者的体重平均可以减轻8磅。随机抽取40位样本,发现样本的体重平均减少7磅,标准差为3.2磅,则假设形式为?,两类错误,假设检验中的两类错误,1.第类错误(弃真错误)原假设为正确时拒绝原假设第类错误的概率记为2.第类错误(取伪错误)原假设为错误时未拒绝原假设第类错误的概率记为(Beta),显著性水平 (significant level),1.是一个概率值2.原假设为真时,拒绝原假设的概率抽样分布的拒绝域3.表示为 (alpha)4.

8、由研究者事先确定,影响 错误的因素,1.总体参数的真值随着假设的总体参数的减少而增大2.显著性水平 当 减少时增大3.样本容量 n当 n 减少时增大, 错误和 错误的关系,你要同时减少两类错误的惟一办法是增加样本容量!,和 的关系就像翘翘板,小 就大, 大 就小,两类错误的控制,一般来说,对于一个给定的样本,如果犯第类错误的代价比犯第类错误的代价相对较高,则将犯第类错误的概率定得低些较为合理;反之,如果犯第类错误的代价比犯第类错误的代价相对较低,则将犯第类错误的概率定得高些一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于大家一般首先控制 错误,另外,第类错误常常

9、比较明确,而第类比较模糊,因此在假设检验中,人们往往先控制第类错误的发生概率,假设检验中的小概率原理,什么是小概率?1.在一次试验中,一个几乎不可能发生的事件发生的概率2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3.小概率由研究者事先确定,在假设检验中,不拒绝原假设意味着()A原假设肯定是正确的B原假设肯定是错误的C没有证据证明原假设是正确的D没有证据证明原假设是错误的,在假设检验中,原假设和备择假设()A都有可能成立B都有可能不成立C只有一个成立而且必有一个成立D原假设一定成立,备择假设不一定成立,在假设检验中,第一类错误是指()A当原假设正确时拒绝原假设B当原假设错误时拒绝原

10、假设C当备择假设正确时拒绝备择假设D当备择假设错误时未拒绝备择假设,假设检验步骤,陈述原假设和备择假设从所研究的总体中抽出一个随机样本确定一个适当的检验统计量,并利用样本数据算出其具体数值确定一个适当的显著性水平,并计算出其临界值,指定拒绝域将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0,根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量,检验统计量(test statistic),备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailed test) 备择假设具有特定的方向性,并含有符号“”

11、或“”,称为右侧检验,双侧检验与单侧检验,双侧检验与单侧检验 (假设的形式),以总体均值的检验为例,显著性水平和拒绝域(双侧检验 ),显著性水平和拒绝域(双侧检验 ),显著性水平和拒绝域(双侧检验 ),显著性水平和拒绝域(双侧检验 ),显著性水平和拒绝域(单侧检验 ),H0,临界值,a,拒绝H0,抽样分布,1 - ,置信水平,显著性水平和拒绝域(左侧检验 ),显著性水平和拒绝域(左侧检验 ),显著性水平和拒绝域(右侧检验 ),显著性水平和拒绝域(右侧检验 ),利用 P 值 进行决策,什么是P 值? (P-value),如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率P值告

12、诉我们:如果原假设是正确的话,我们得到目前这个样本数据的可能性有多大,如果这个可能性很小,就应该拒绝原假设 被称为观察到的(或实测的)显著性水平决策规则:若p值, 拒绝 H0,双侧检验的P 值,左侧检验的P 值,右侧检验的P 值,假设检验结论的表述,假设检验结论的表述(“显著”与“不显著”),当拒绝原假设时,我们称样本结果是统计上显著的拒绝原假设时结论是清楚的当不拒绝原假设时,我们称样本结果是统计上不显著的不拒绝原假设时,并未给出明确的结论,不能说原假设是正确的,也不能说它不是正确(宣判无罪,不代表真正的无罪,只是无证据说有罪而已),假设检验结论的表述(“接受”与“不拒绝”),假设检验的目的在

13、于试图找到证据拒绝原假设,而不在于证明什么是正确的当没有足够证据拒绝原假设时,不采用“接受原假设”的表述,而采用“不拒绝原假设”的表述。“不拒绝”的表述实际上意味着并未给出明确的结论,我们没有说原假设正确,也没有说它不正确“接受”的说法有时会产生误导,因为这种说法似乎暗示着原假设已经被证明是正确的了。但事实上,H0的真实值我们永远也无法知道,H0只是对总体真实值的一个假定值,由样本提供的信息也就自然无法证明它是否正确,假设检验结论的表述 (为什么不说“接受”),【例】比如原假设为H0: =10,从该总体中抽出一个随机样本,得到x=9.8,在=0.05的水平上,样本提供的证据没有推翻这一假设,我

14、们说“接受”原假设,这意味着样本提供的证据已经证明=10是正确的。如果我们将原假设改为H0: =10.5,同样,在=0.05的水平上,样本提供的证据也没有推翻这一假设,我们又说“接受”原假设。但这两个原假设究竟哪一个是“真实的”呢?我们不知道,因而改用不拒绝的说法。,随机抽取一个n=40的样本,得到 =16.5,s=7.在=0.02的显著性水平下,检验假设H0:u 15,H1 15,统计量的临界值为( ),8.2 一个总体参数的检验,8.2.1 检验统计量的确定8.2.2 总体均值的检验8.2.3 总体比例的检验8.2.4 总体方差的检验,检验统计量的确定,一个总体参数的检验,检验统计量主要有

15、Z统计量、t统计量和卡方统计量。 1、大样本情况下,把样本统计量视为正态分布,如总体方差未知,则用样本方差s代替。 2、小样本情况下,看总体方差是否已知。若已知,用Z统计量;若未知,采用t分布。,一个总体参数的检验,总体均值的检验,总体均值的检验(作出判断),样本容量n,总体均值的检验(大样本),总体均值的检验 (大样本),1.假定条件正态总体或非正态总体大样本(n30)使用z检验统计量 2 已知: 2 未知:,总体均值的检验( 2 已知)(例题分析),【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了

16、40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05 ,检验该天生产的饮料容量是否符合标准要求?,双侧检验,总体均值的检验( 2 已知)(例题分析),H0 : = 255H1 : 255 = 0.05n = 40临界值(c):,检验统计量:,决策:,结论:,不拒绝H0,样本提供的证据还不足以推翻“该天生产的饮料符合标准要求 ”的看法,总体均值的检验( 2 未知)(例题分析),【例】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进

17、行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低? (=0.01),左侧检验,总体均值的检验( 2 未知)(例题分析),H0 : 1.35H1 : 1.35 = 0.01n = 50临界值(c):,检验统计量:,拒绝H0,新机床加工的零件尺寸的平均误差与旧机床相比有显著降低,决策:,结论:,总体均值的检验(z检验) (P 值的图示),总体均值的检验( 2 未知)(例题分析),【例】某一小麦品种的平均产量为5200kg/hm2 。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均

18、产量为5275kg/hm2,标准差为120/hm2 。试检验改良后的新品种产量是否有显著提高? (=0.05),右侧检验,总体均值的检验( 2 未知)(例题分析),H0 : 5200H1 : 5200 = 0.05n = 36临界值(c):,检验统计量:,拒绝H0 (P = 0.000088 = 0.05),改良后的新品种产量有显著提高,决策:,结论:,总体均值的检验(z检验) (P 值的图示),总体均值的检验 (大样本检验方法的总结),总体均值的检验(小样本),总体均值的检验 (小样本),1.假定条件总体服从正态分布小样本(n 30)检验统计量 2 已知: 2 未知:,总体均值的检验 (小样

19、本检验方法的总结),注: 已知的拒绝域同大样本,总体均值的检验 (例题分析),【例】一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?,总体均值的检验 (例题分析),H0 : =12H1 : 12 = 0.05df = 10 - 1= 9临界值(c):,检验统计量:,不拒绝H0,样本提供的证据还不足以推翻“该供货商提供的零件符

20、合要求 ”的看法,决策:,结论:,总体比例的检验,总体比例检验,假定条件总体服从二项分布可用正态分布来近似(大样本)检验的 z 统计量, 0为假设的总体比例,总体比例的检验 (检验方法的总结),总体比例的检验 (例题分析),【例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平 =0.05和=0.01 ,检验该杂志读者群中女性的比例是否为80%?它们的P值各是多少?,双侧检验,总体比例的检验 (例题分析),H0 : = 80%H1 : 80% = 0.05n = 200临界值(c):,检验统计量:,拒绝H0 (P = 0.013328 = 0.05),该杂志的说法并不属实,决策:,结论:,总体比例的检验 (例题分析),H0 : = 80%H1 : 80% = 0.01n = 200临界值(c):,检验统计量:,不拒绝H0 (P = 0.013328 = 0.01),样本提供的证据还不足以推翻“该杂志声称读者群中有80%为女性”的看法,决策:,结论:,结 束,THANKS,:,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号