第八章假设检验ppt课件.ppt

上传人:小飞机 文档编号:1372957 上传时间:2022-11-15 格式:PPT 页数:102 大小:1.16MB
返回 下载 相关 举报
第八章假设检验ppt课件.ppt_第1页
第1页 / 共102页
第八章假设检验ppt课件.ppt_第2页
第2页 / 共102页
第八章假设检验ppt课件.ppt_第3页
第3页 / 共102页
第八章假设检验ppt课件.ppt_第4页
第4页 / 共102页
第八章假设检验ppt课件.ppt_第5页
第5页 / 共102页
点击查看更多>>
资源描述

《第八章假设检验ppt课件.ppt》由会员分享,可在线阅读,更多相关《第八章假设检验ppt课件.ppt(102页珍藏版)》请在三一办公上搜索。

1、第八章 假设检验,假设检验的基本问题 一个总体参数的检验两个总体参数的检验,学习目标,假设检验的基本思想和原理 假设检验的步骤一个总体参数的检验两个总体参数的检验P值的计算与应用用Excel进行检验,正常人的平均体温是37oC吗?,当问起健康的成年人体温是多少时,多数人的回答是37oC,这似乎已经成了一种共识。下面是一个研究人员测量的50个健康成年人的体温数据,正常人的平均体温是37oC吗?,根据样本数据计算的平均值是36.8oC ,标准差为0.36oC 根据参数估计方法得到的健康成年人平均体温的95%的置信区间为(36.7,36.9)。研究人员发现这个区间内并没有包括37oC 因此提出“不应

2、该再把37oC作为正常人体温的一个有任何特定意义的概念”我们应该放弃“正常人的平均体温是37oC”这个共识吗?本章的内容就将提供一套标准统计程序来检验这样的观点,假设检验的基本原理 怎样提出假设? 怎样做出决策? 怎样表述决策结果?,假设检验,怎样提出假设?,假设检验的基本原理,什么是假设?(hypothesis), 在参数检验中,对总体参数的具体数值所作的陈述就一个总体而言,总体参数包括总体均值、成数、方差等分析之前必需陈述,什么是假设检验? (hypothesis test),先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的统计方法有参数检验和非参数检验逻辑上运

3、用反证法,统计上依据小概率原理小概率是在一次试验中,一个几乎不可能发生的事件发生的概率在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设,原假设(null hypothesis),又称“0假设”,研究者想收集证据予以反对的假设,用H0表示所表达的含义总是指参数没有变化或变量之间没有关系 最初被假设是成立的,之后根据样本数据确定是否有足够的证据拒绝它 总是有符号 , 或H0 : = 某一数值H0 : 某一数值H0 : 某一数值例如, H0 : 10cm,也称“研究假设”,研究者想收集证据予以支持的假设(期望出现的结论作为备选假设),用H1或Ha表示所表达的含义是总体参数发生了变化或变量之间有

4、某种关系备择假设通常用于表达研究者自己倾向于支持的看法,然后就是想办法收集证据拒绝原假设,以支持备择假设 总是有符号 ,或 H1 : 某一数值H1 : 某一数值H1 : 某一数值,备择假设(alternative hypothesis),假设检验中的两类错误(决策风险),假设检验中的两类错误,1.第一类错误(弃真错误)原假设为真时拒绝原假设会产生一系列后果第一类错误的概率为被称为显著性水平2.第二类错误(取伪错误)原假设为假时接受原假设第二类错误的概率为(Beta),两类错误的控制,一般来说,对于一个给定的样本,如果犯第类错误的代价比犯第类错误的代价相对较高,则将犯第类错误的概率定得低些较为合

5、理;反之,如果犯第类错误的代价比犯第类错误的代价相对较低,则将犯第类错误的概率定得高些一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于犯第类错误的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第类错误的发生概率错误与错误的关系: 与的关系就像跷跷板, 小就大, 大就小,同时减小两类错误惟一的办法就是增加样本容量。,假设检验的流程提出假设确定适当的检验统计量规定显著性水平计算检验统计量的值作出统计决策, 什么是检验统计量?1.用于假设检验决策的统计量2.选择统计量的方法与参数估计相同,需考虑是大样本还是小样本总体方差已知还是未知检验统计量的基本形式为,

6、确定适当的检验统计量,规定显著性水平(significant level), 什么是显著性水平?1.是一个概率值2.原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3.表示为 (alpha)常用的 值有0.01, 0.05, 0.104.由研究者事先确定,作出统计决策,计算检验的统计量根据给定的显著性水平,查表得出相应的临界值z或z/2, t或t/2将检验统计量的值与 水平的临界值进行比较得出拒绝或不拒绝原假设的结论,统计量决策规则,给定显著性水平,查表得出相应的临界值z或z/2, t或t/2将检验统计量的值与 水平的临界值进行比较作出决策双侧检验:I统计量I 临界值,拒绝H0左侧检验:统

7、计量 临界值,拒绝H0,利用P值进行决策,什么是P 值?(P-value),是一个概率值如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积被称为观察到的(或实测的)显著性水平H0 能被拒绝的最小值,双侧检验的P 值,左侧检验的P 值,右侧检验的P 值,利用 P 值进行检验(决策准则),单侧检验若p-值 ,不拒绝 H0若p-值 /2, 不拒绝 H0若p-值 /2, 拒绝 H0,双侧检验和单侧检验,备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(tw

8、o-tailed test) 备择假设具有特定的方向性,并含有符号“”或“”,称为右侧检验,双侧检验与单侧检验,双侧检验与单侧检验 (假设的形式),双侧检验(原假设与备择假设的确定),属于决策中的假设检验不论是拒绝H0还是不拒绝H0,都必需采取相应的行动措施例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立建立的原假设与备择假设应为 H0: = 10 H1: 10,双侧检验(显著性水平与拒绝域 ),单侧检验(显著性水平与拒绝域),3)显著性水平和拒绝域(右侧检验 ) H0 : m m0 H1 : m m0

9、,拒绝H0,P 值决策与统计量的比较,拒绝H0的两个统计量的不同显著性,Z,拒绝H0,0,统计量1,P1 值,统计量2,P2 值,拒绝H0,临界值,假设检验步骤的总结,陈述原假设和备择假设从所研究的总体中抽出一个随机样本确定一个适当的检验统计量,并利用样本数据算出其具体数值确定一个适当的显著性水平,并计算出其临界值,指定拒绝域将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0也可以直接利用P值作出决策,总体均值的检验,一个总体参数的检验,总体均值的检验 (2 已知或2未知大样本),1.假定条件总体服从正态分布若不服从正态分布, 可用正态分布来近似(n30)使用

10、Z-统计量2 已知:2 未知:,总体均值检验(大样本检验方法的总结),总结,2 已知均值的检验(例题分析),【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为= 0.025 。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(0.05),双侧检验,2 已知均值的检验 (例题分析),H0: = 0.081H1: 0.081 = 0.05n = 200临界值(s):,检验统计量:,决策:,结论:,在 = 0.05的水平上拒绝H0,有证据表

11、明新机床加工的零件的椭圆度与以前有显著差异,总体均值的检验( 2 已知)(例题分析大样本),【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05 ,检验该天生产的饮料容量是否符合标准要求?,双侧检验,总体均值的检验( 2 已知)(例题分析大样本),H0 : = 255H1 : 255 = 0.05n = 40临界值(c):,检验统计量:,决策:,结论:,用Excel中的【NORMSDIST】函数得到的双尾检验P=0.312945不拒绝

12、H0,没有证据表明该天生产的饮料不符合标准要求,总体均值的检验( 2 未知) (例题分析大样本),【例】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低? (=0.01),左侧检验,总体均值的检验(例题分析大样本),H0 : 1.35H1 : 1.35 = 0.01n = 50临界值(c):,检验统计量:,拒绝H0,新机床加工的零件尺寸的平均误差与旧机床相比有显著

13、降低,决策:,结论:,总体均值的检验 (P 值的图示),计算出的样本统计量=2.6061,P=0.004579,Z,拒绝H0,0,临界值,P 值,总体均值的检验( 2 未知)(例题分析),【例】某一小麦品种的平均产量为5200kg/hm2 。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120/hm2 。试检验改良后的新品种产量是否有显著提高? (=0.05),右侧检验,总体均值的检验( 2 未知)(例题分析),H0 : 5200H1 : 5200 = 0.05n = 36临

14、界值(c):,检验统计量:,拒绝H0 (P = 0.000088 = 0.05),改良后的新品种产量有显著提高,决策:,结论:,总体均值的检验(z检验) (P 值的图示),2 未知大样本均值的检验 (例题分析),【例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准? (0.05),单侧检验,2 未知大样本均值的检验 (例题分析),H0: 1200H1: 1200 = 0.05n = 100临界

15、值(s):,检验统计量:,在 = 0.05的水平上不拒绝H0,不能认为该厂生产的元件寿命显著地高于1200小时,决策:,结论:,总体均值的检验 (小样本),1.假定条件总体服从正态分布小样本(n 30)检验统计量 2 已知: 2 未知:,总体均值的检验 (小样本检验方法的总结),注:s 已知的拒绝域同大样本,总结,2 已知均值的检验 (小样本例题分析),【例】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(0.05),单侧检验

16、,2 已知均值的检验 (小样本例题分析),H0: 1020H1: 1020 = 0.05n = 16临界值(s):,检验统计量:,在 = 0.05的水平上拒绝H0,有证据表明这批灯泡的使用寿命有显著提高,决策:,结论:,总体均值的检验 (2未知小样本),1.假定条件总体为正态分布2未知,且小样本2.使用t 统计量,2 未知小样本均值的检验 (例题分析),【例】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。,双侧检验,2 未知小样本均值的检验 (例题分析),H0:

17、= 5H1: 5 = 0.05df = 10 - 1 = 9临界值(s):,检验统计量:,在 = 0.05的水平上拒绝H0,说明该机器的性能不好,决策:,结论:,一个总体均值的检验(作出判断),样本量n,练习,1.某电子元件批量生产的质量标准为平均使用寿命1200小时,标准差为150小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随即抽取了20件作为样本,测得平均使用寿命1245小时,能否说明该厂的元件质量显著地高于规定标准?( 给定显著性水平=0.05),练习,某批发商欲从厂家购进一批灯泡,根据合同规定灯泡的使用寿命平均不能低于1000小时。已知灯泡燃烧寿命服从

18、正态分布,标准差为200小时。在总体中随机抽取了100个灯泡,得知样本均值为960小时,批发商是否应该买这批灯泡?( 给定显著性水平=0.05) 某地区小麦的一般生产水平为亩产250公斤,其标准差为30公斤。现用一种化肥进行试验,从25个小区抽样结果,平均产量为270公斤。问这种化肥是否使小麦明显增产? (=0.05),总体比例的检验,一个总体参数的检验,总体成数检验,假定条件总体服从二项分布可用正态分布来近似(大样本)检验的 z 统计量, 0为假设的总体成数,总体成数的检验(检验方法的总结),一个总体比例的检验 (例题分析),【例】一项统计结果声称,某市老年人口(年龄在65岁以上)的比重为1

19、4.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法?(= 0.05),双侧检验,一个总体比例的检验 (例题分析),H0: = 14.7%H1: 14.7% = 0.05n = 400临界值(s):,检验统计量:,在 = 0.05的水平上不拒绝H0,该市老年人口比重为14.7%,决策:,结论:,总体成数的检验 (练习),【例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志

20、。分别取显著性水平 =0.05和=0.01 ,检验该杂志读者群中女性的成数是否为80%?它们的P值各是多少?,总体成数的检验 (例题分析),H0 : = 80%H1 : 80% = 0.05n = 200临界值(c):,检验统计量:,拒绝H0 (P = 0.013328 = 0.05),该杂志的说法并不属实,决策:,结论:,总体成数的检验 (分析),H0 : = 80%H1 : 80% = 0.01n = 200临界值(c):,检验统计量:,不拒绝H0 (P = 0.013328 = 0.01),没有证据表明“该杂志声称读者群中有80%为女性”的看法不正确,决策:,结论:,总体方差的检验,一个

21、总体参数的检验,总体方差的检验 ( 2检验),检验一个总体的方差或标准差假设总体近似服从正态分布使用 2分布检验统计量,假设的总体方差,总体方差的检验(检验方法的总结),方差的卡方 (2) 检验(例题分析),【例】某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升(1000cm3)的饮料误差上下不超过1cm3。如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随机抽取25瓶,分别进行测定(用样本减1000cm3),得到如下结果。检验该机器的性能是否达到设计要求 (=0.05),绿色健康饮品,绿色健康饮品,双侧检验,方差的卡方 (2) 检验(例题分析),H0: 2 =

22、 1H1: 2 1 = 0.05df = 25 - 1 = 24临界值(s):,统计量:,在 = 0.05的水平上不拒绝H0,不能认为该机器的性能未达到设计要求,决策:,结论:,总体方差的检验(习题),【例】啤酒生产企业采用自动生产线灌装啤酒,每瓶的装填量为640ml,但由于受某些不可控因素的影响,每瓶的装填量会有差异。此时,不仅每瓶的平均装填量很重要,装填量的方差同样很重要。如果方差很大,会出现装填量太多或太少的情况,这样要么生产企业不划算,要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过4ml。企业质检部门抽取了10瓶啤酒进行检验,得到的样本标准差为s=3.8ml。试以0.05

23、的显著性水平检验装填量的标准差是否符合要求?,总体方差的检验(例题分析),H0 : 2 42H1 : 2 42 = 0.10df = 10 - 1 = 9临界值(s):,统计量:,不拒绝H0 (p=0.52185),没有证据表明装填量的标准差不符合要求,决策:,结论:,练习,某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶1000ml的饮料误差上下不超过1ml。如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随机抽取25瓶进行检验,得到的样本标准差为s=0.9ml,试以=0.05的显著性水平检验该机器的性能是否达到设计要求。,两个总体参数的检验 两个总体均值之差的检

24、验 两个总体成数之差的检验 两个总体方差比的检验,假设检验,两个正态总体参数的检验,两个总体均值之差的检验,两个总体参数的检验,两个总体均值之差的检验 (独立大样本),1.假定条件两个样本是独立的随机样本正态总体或非正态总体大样本(n130和 n230)检验统计量 12 , 22 已知: 12 , 22 未知:,两个总体均值之差的检验 (假设的形式),两个总体均值之差的检验 (例题分析),双侧检验!,【例】有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样

25、本,样本量分别为n1=32,n2=40,测得x1= 50公斤,x2= 44公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别? ( = 0.05),两个总体均值之差的检验 (例题分析),H0: 1- 2 = 0H1: 1- 2 0 = 0.05n1 = 32,n2 = 40临界值(s):,检验统计量:,决策:,结论:,在 = 0.05的水平上拒绝H0,有证据表明两种方法生产的产品其抗拉强度有显著差异,两个总体均值之差的检验 (练习独立大样本),【例】某公司对男女职员的平均小时工资进行了调查,独立抽取了具有同类工作经验的男女职员的两个随机样本,并记录下两个样本的均值、方差等资料如右表。在显著

26、性水平为0.05的条件下,能否认为男性职员与女性职员的平均小时工资存在显著差异?,两个总体均值之差的检验 (分析独立大样本),H0 :1- 2 = 0H1 :1- 2 0 = 0.05n1 = 44,n2 = 32临界值(c):,检验统计量:,决策:,结论:,拒绝H0,该公司男女职员的平均小时工资之间存在显著差异,两个总体均值之差的检验 (独立小样本: 12, 22 已知),假定条件两个独立的小样本两个总体都是正态分布 12, 22已知检验统计量,两个总体均值之差的检验 (独立小样本:12,22 未知但12=22),假定条件两个独立的小样本两个总体都是正态分布12、22未知但相等,即12=22

27、检验统计量,其中:,自由度:,两个总体均值之差的检验 (独立小样本:12,22 未知且不等1222),假定条件两个总体都是正态分布12,22未知且不相等,即1222样本量不相等,即n1n2检验统计量,自由度:,两个总体均值之差的检验 (例题分析独立小样本,12=22),【例】甲、乙两台机床同时加工某种同类型的零件,已知两台机床加工的零件直径(单位:cm)分别服从正态分布,并且有12=22 。为比较两台机床的加工精度有无显著差异,分别独立抽取了甲机床加工的8个零件和乙机床加工的7个零件,通过测量得到如下数据 。在=0.05的显著性水平下,样本数据是否提供证据支持 “两台机床加工的零件直径不一致”

28、的看法?,两个总体均值之差的检验 (例题分析12=22),H0 :1- 2 = 0H1 :1- 2 0 = 0.05n1 = 8,n2 = 7临界值(c):,检验统计量:,决策:,结论:,不拒绝H0,没有证据表明两台机床加工的零件直径不一致,两个总体均值之差的检验(方法总结),两个总体比例之差的检验,1.假定条件两个总体是独立的两个总体都服从二项分布可以用正态分布来近似检验统计量,两个总体比例之差的Z检验,两个总体比例之差的检验(假设的形式),两个总体比例之差的Z检验 (例题分析),单侧检验,【例】对两个大型企业青年工人参加技术培训的情况进行调查,调查结果如下:甲厂:调查60人,18人参加技术

29、培训。乙厂调查40人,14人参加技术培训。能否根据以上调查结果认为乙厂工人参加技术培训的人数比例高于甲厂?( = 0.05),两个总体比例之差的Z检验 (例题分析),H0: 1- 2 0H1: 1- 2 0 = 0.05n1 = 60,n2 = 40临界值(s):,检验统计量:,决策:,结论:,在 = 0.05的水平上不拒绝H0,没有证据表明乙厂工人参加技术培训的人数比例高于甲厂,两个总体方差比的检验,两个总体参数的检验,两个总体方差比的检验(F 检验),假定条件两个总体都服从正态分布,且方差相等两个独立的随机样本假定形式H0:s12 = s22 或 H0:s12 s22 (或 ) H1:s1

30、2 s22 H1:s12 )检验统计量F = S12 /S22F(n1 1 , n2 1),两个总体方差的 F 检验(临界值),两个总体方差的 F 检验 (例题分析),H0: 12 = 22 H1: 12 22 = 0.05n1 = 15,n2 = 20临界值(s):,检验统计量:,决策:,结论:,在 = 0.05的水平上不拒绝H0,不能认为这两个总体的方差有显著差异,两个总体方差比的检验 (例题分析),【例】一家房地产开发公司准备购进一批灯泡,公司打算在两个供货商之间选择一家购买。这两家供货商生产的灯泡平均使用寿命差别不大,价格也很相近,考虑的主要因素就是灯泡使用寿命的方差大小。如果方差相同,就选择距离较近的一家供货商进货。为此,公司管理人员对两家供货商提供的样品进行了检测,得到的数据如右表。检验两家供货商灯泡使用寿命的方差是否有显著差异 (=0.05),Excel中的统计函数,ZTEST计算Z检验的P值TDIST计算t分布的概率TINV计算t分布的临界值TTEST计算t分布检验的P值FDIST计算F分布的概率FINV计算F分布的逆函数(临界值)FTEST计算F检验(两个总体方差比的检验)单尾概率,本章小节,本章小节,假设检验的基本原理 一个总体参数的检验两个总体参数的检验用Excel进行检验利用P 值进行检验,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号