统计学假设检验.ppt

上传人:李司机 文档编号:4104448 上传时间:2023-04-04 格式:PPT 页数:125 大小:3.52MB
返回 下载 相关 举报
统计学假设检验.ppt_第1页
第1页 / 共125页
统计学假设检验.ppt_第2页
第2页 / 共125页
统计学假设检验.ppt_第3页
第3页 / 共125页
统计学假设检验.ppt_第4页
第4页 / 共125页
统计学假设检验.ppt_第5页
第5页 / 共125页
点击查看更多>>
资源描述

《统计学假设检验.ppt》由会员分享,可在线阅读,更多相关《统计学假设检验.ppt(125页珍藏版)》请在三一办公上搜索。

1、第七章 假设检验,第七章 假设检验,第一节 假设检验的一般问题 第二节 一个正态总体的参数检验第三节 两个正态总体的参数检验第四节 假设检验中的其他问题,假设检验在统计方法中的地位,学习目标,了解假设检验的基本思想 掌握假设检验的步骤能对实际问题作假设检验利用置信区间进行假设检验利用P-值进行假设检验,第一节 假设检验的一般问题,假设检验的概念假设检验的步骤假设检验中的小概率原理假设检验中的两类错误双侧检验和单侧检验,假设检验的概念与思想,什么是假设检验?,概念事先对总体参数或分布形式作出某种假设利用样本资料检验总体参数的真伪。(原假设是否成立)类型参数假设检验非参数假设检验特点采用逻辑上的反

2、证法依据统计上的小概率原理,假设检验的基本思想,例:以往新生儿体重X(3190,2),现随机抽取30个新生儿,得平均体重3120g,问与往年相比,体重是否发生了显著变化。,样本均值3120与总体均值3190是有差异的,这种差异表示为。如果H0真,则这种差异一般是很小的,根据 的差异的大小,可决定接受还是拒绝H0。如果 越大,越倾向于拒绝原假设,大到何种程度,需要时定一个检验规则:,当 时,拒绝H0,当 时,接受H0,以样本3120检验总体3190,提出假设,H0:=3190,续,利用统计量,小概率事件在一次试验中几乎是不可能发生的。如果原假设为真,以样本数据判断总体参数,所冒风险仅为,假如发生

3、了,则对原假设表示怀疑。,称C为临界值。它是根据小概率事件原理来确定的。即:,是一个小概率事件,给定一个显著性水平,认定:,几个相关的的概念,原假设和备择假设:根据样本数据推断总体参数真伪,事先提出两个必居其一的假设,假设总体参数为真或假设总体参数为假,习惯上把其中一个称为原假设记为H0,而另一个为对立假设(备择假设)记为H1。,检验统计量:用于假设检验问题的统计量。选择 统计量的方法与参数估计相同,检验统计量的基本 形式为:,续,显著性水平:是一个概率值即原假设为真时,拒绝原假设的概率,被称为抽样分布的拒绝域,以表示,常用的 值有0.01,0.05,0.10 通常由研究者根据被研究的对象特点

4、及研究任务的要求加以确定。,假设检验的过程(提出假设抽取样本作出决策),假设检验的步骤,提出原假设和备择假设 计算检验统计量 根据显著性水平,确立分位数 比较统计量与分位数并作出统计决策,假设检验中的两类错误(决策风险),续,的概率,是H0成立时,被舍弃的概率;(1-)的概率,即不发生的概率。一个好的检验应把一切不真得H0全都舍弃,尽量不要犯错误,所以(1-)越接近于1,说明检验功效越好,反之越差。所以(1-)成为检验功效大小的统计指标。的大小,取决于0的真值与H0假设的伪值1之间的差距的大小,差距越小,越难鉴别,越容易犯错误;差距越大,越容易鉴别,越不易犯错误。,双侧检验和单侧检验,双侧检验

5、与单侧检验(假设的形式),双侧检验,双侧检验属于决策中的假设检验。我们都必需作出“是”还是“非”假设。例如,某种零件的尺寸,要求其平均长度为10厘米,大于或小于10厘米均属于不合格建立的原假设与备择假设应为 H0:=10 H1:10,1-,单侧检验,左单侧检验:0 一般统计量为负值时。,右单侧检验:0一般统计量为正值时。,如何确定原假设和备择假设,检验研究中的假设:将所研究的假设作为备择假设 H1,然后再确立原假设。,例1,采用新技术生产后,将会使产品的使用寿命明显 延长到1500小时以上。,H0:1500 H1:1500,例2,改进生产工艺后,会使产品的废品率降低到2%以下。,H0:2%H1

6、:2%,例3,学生中经常上网的人数超过25%吗,H0:25 H1:25,检验某项声明的有效性 将所作出的说明(声明)作为原假设H0,然后将其对立面作为备择假设。例:某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上 建立的原假设与备择假设应为 H0:1000 H1:1000,续,第二节 一个正态总体的参数检验,一.总体方差已知时的均值检验二.总体方差未知时的均值检验三.总体比例的假设检验,一个总体的检验的参数,总体方差已知时的均值检验(双尾 Z 检验),一个总体的检验,均值的双尾 Z 检验(2 已知),1.假定条件总体服从正态分布若不服从正态分布,可用正态分布来近似(n30)

7、2.原假设为:H0:=0;备择假设为:H1:0使用z-统计量,实例,某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(0.05),计算结果,H0:=0.081H1:0.081=0.05n=200临界值(s):,检验统计量:,决策:,结论:,拒绝H0,有证据表明新机床加工的零件的椭圆度与以前有显著差异,总体方差已知时的均值检验(单尾 Z 检验),均值的单尾 Z 检验(2 已知),

8、假定条件总体服从正态分布若不服从正态分布,可以用正态分布来近似(n30)2.使用z-统计量,实例一,根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(0.05),计算结果,H0:1020H1:1020=0.05n=16临界值(s):,检验统计量:,在=0.05的水平上拒绝H0,有证据表明这批灯泡的使用寿命有显著提高,决策:,结论:,NORMS(0.95),实例二,某批发商欲从生产厂家购进一批灯泡,根据合同规定,灯泡的使用寿命平均

9、不能低于1000小时。已知灯泡使用寿命服从正态分布,标准差为20小时。在总体中随机抽取100只灯泡,测得样本均值为960小时。批发商是否应该购买这批灯泡?(0.05),计算结果,H0:1000H1:1000=0.05n=100临界值(s):,检验统计量:,总体方差未知时的均值检验(双尾 t 检验),一个总体的检验,均值的双尾 t 检验(2 未知),1.假定条件总体为正态分布如果不是正态分布,只有轻微偏斜和大样本(n 30)条件下2.使用t 统计量,实例,【例】某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克。某日随机抽查9包,测得样本平均重量为986克,样本

10、标准差为24克。试问在0.05的显著性水平上,能否认为这天自动包装机工作正常?,计算结果,H0:=1000H1:1000=0.05df=9-1=8临界值(s):,检验统计量:,总体方差未知时的均值检验(单尾 t 检验),实例,【例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由120个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?(=0.05),计算结果,H0:40000H1:40000=0.05df=1

11、20-1=119临界值(s):,检验统计量:,在=0.05的水平上拒绝H0,有证据表明轮胎使用寿命显著地大于40000公里,决策:,结论:,总体比例的假设检验(Z 检验),适用的数据类型,离散数据,连续数据,数值型数据,数 据,品质数据,一个总体的检验,一个总体比例的 Z 检验,假定条件有两类结果总体服从二项分布可用正态分布来近似比例检验的 z 统计量,为假设的总体比例,实例,【例】某研究者估计本市居民家庭的电脑拥有率为30%。现随机抽查了200的家庭,其中68个家庭拥有电脑。试问研究者的估计是否可信?(=0.05),结果,H0:p=0.3H1:p 0.3=0.05n=200临界值(s):,检

12、验统计量:,在=0.05的水平上接受H0,有证据表明研究者的估计可信,决策:,结论:,总体方差的检验(2 检验),一个总体的检验,方差的卡方(2)检验,1.检验一个总体的方差或标准差2.假设总体近似服从正态分布3.原假设为 H0:2=024.检验统计量,实例,【例】根据长期正常生产的资料可知,某厂所产维尼纶的纤度服从正态分布,其方差为0.0025。现从某日产品中随机抽取20根,测得样本方差为0.0042。试判断该日纤度的波动与平日有无显著差异?(=0.05),计算结果,H0:2=0.0025H1:2 0.0025=0.05df=20-1=19临界值(s):,统计量:,在=0.05的水平上接受H

13、0,有证据表明该日纤度的波动比平时没有显著差异,决策:,结论:,第三节 两个正态总体的参数检验,一.两个总体参数之差的抽样分布两个总体均值之差的检验假设检验中相关样本的利用两个总体比例之差的检验,两个正态总体的参数检验,两个独立样本的均值检验,两个总体均值之差的Z检验(假设的形式),两个独立样本之差的抽样分布,两个总体均值之差的Z检验(12、22 已知),1.假定条件两个样本是独立的随机样本两个总体都是正态分布若不是正态分布,可以用正态分布来近似(n130和 n230)原假设:H0:1-2=0;备择假设:H1:1-2 0检验统计量为,实例,【例】有两种方法可用于制造某种以抗拉强度为重要特征的产

14、品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样本,样本容量分别为n1=32,n2=40,测得x2=50公斤,x1=44公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别?(=0.05),计算结果,H0:1-2=0H1:1-2 0=0.05n1=32,n2=40临界值(s):,检验统计量:,决策:,结论:,拒绝H0,有证据表明两种方法生产的产品其抗拉强度有显著差异,NORMSINV(0.025)=1.96,NORMSINV(0.975)=-1.96,两个总体均值之差的 t 检验(12、22未知),

15、检验具有等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知但相等12=22检验统计量,其中:,实例,【例】一个车间研究用两种不同的工艺组装某种产品所用的时间是否相同。让一个组的10名工人用第一种工艺组装该产品,平均所需时间为26.1分钟,样本标准差为12分钟;另一组8名工人用第二种工艺组装,平均所需时间为17.6分钟,样本标准差为10.5分钟。已知用两种工艺组装产品所用时间服从正态分布,且s12s22。试问能否认为用第二种方法组装比用第一中方法组装更好?(=0.05),计算结果,H0:1-2 0H1:1-2 0=0.05n1=10,n2=8临界值(s):

16、,检验统计量:,决策:,结论:,接受H0,没有证据表明用第二种方法组装更好,TINV(0.1,16),假设检验中相关样本的利用,两个相关(配对或匹配)样本的均值检验,两个总体均值之差的检验(配对样本的 t 检验),1.检验两个相关总体的均值配对或匹配重复测量(前/后)2.利用相关样本可消除项目间的方差3.假定条件两个总体都服从正态分布如果不服从正态分布,可用正态分布来近似(n1 30,n2 30),配对样本的 t 检验(假设的形式),注:Di=X1i-X2i,对第 i 对观察值,配对样本的 t 检验(数据形式),配对样本的 t 检验(检验统计量),自由度df nD-1,统计量,样本均值,样本标

17、准差,【例】一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5公斤以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:,实例,在=0.05的显著性水平下,调查结果是否支持该俱乐部的声称?,98.5,样本差值计算表,计算表,计算结果,样本均值,样本标准差,样本均值的方差,样本均值的标准差(抽样的平均误差),H0:m1 m2 8.5H1:m1 m2 8.5a=0.05df=10-1=9临界值(s):,检验统计量:,续,或用置信区间判断:,TINV(0.1,9),两个总体比例之差的检验(Z 检验),经济、管理类基础课程统计学,1.

18、假定条件两个总体是独立的两个总体都服从二项分布可以用正态分布来近似检验统计量,两个总体比例之差的Z检验,两个总体比例之差的检验(假设的形式),实例,【例】对两个大型企业青年工人参加技术培训的情况进行调查,调查结果如下:甲厂:调查60人,18人参加技术培训。乙厂调查40人,14人参加技术培训。能否根据以上调查结果认为乙厂工人参加技术培训的人数比例高于甲厂?(=0.05),计算结果,H0:P1-P2 0H1:P1-P2 0=0.05n1=60,n2=40临界值(s):,检验统计量:,决策:,结论:,接受H0,没有证据表明乙厂工人参加技术培训的人数比例高于甲厂,NORMS(0.95),第四节 假设检

19、验中的其他问题,一.用置信区间进行检验利用P-值进行检验,利用置信区间进行假设检验,利用置信区间进行假设检验(双侧检验),1.由样本求出双侧检验均值的置信区间,2已知时:,2未知时:,2.若总体的假设值0在置信区间外,拒绝H0,利用置信区间进行假设检验(左侧检验),求出单边置信下限,若总体的假设值0小于单边置信下限,拒绝H0,利用置信区间进行假设检验(右侧检验),求出单边置信上限,若总体的假设值0大于单边置信上限,拒绝H0,利用区间宽度检验法,置信区间中允许误差(区间宽度):,单侧:,双侧:,实例双侧检验,区间宽度:,或:置信区间,1000已经超过此区间,所以拒绝H0,950,922,978,

20、CONFIDENCE(0.05,100,49),统计实验CH7 抽样与参数估计(描述统计的区间宽度).xls,实例单侧检验,区间宽度:,或:置信区间上限,1000已经超过此区间,同样所以拒绝H0,950,973.5,(因为1000950,在950的右侧,故以上限判断),CONFIDENCE(0.1,100,49),实例(双侧),【例】一种袋装食品每包的标准重量应为1000克。现从生产的一批产品中随机抽取16袋,测得其平均重量为991克。已知这种产品重量服从标准差为50克的正态分布。试确定这批产品的包装重量是否合格?(=0.05),属于决策的假设!,香脆蛋卷,计算结果,H0:=1000H1:10

21、00=0.05n=49临界值(s):,置信区间为,决策:,结论:,假设的0=1000在置信区间内,接受H0,表明这批产品的包装重量合格,利用 P-值进行假设检验,观察到的显著性水平 P-值,利用 P 值进行决策(P-Value),双侧检验:p-值为 P(Z-z 或 Z z),左单侧检验:p-值为 P(Z-z),右单侧检验:p-值为 P(Z z),1-,1-,若p-值/2,则接受 H0若p-值/2,则拒绝 H0,P-值计算实例双尾Z检验,【例1】欣欣儿童食品厂生产的盒装儿童食品每盒的标准重量为368克。现从某天生产的一批食品中随机抽取25盒进行检查,测得每盒的平均重量为x=372.5克。企业规定

22、每盒重量的标准差为15克。确定P-值。,计算结果,p-值为 P(Z-1.50 或 Z 1.50),样本统计量的Z值,计算的检验统计量为:,P-值计算实例单尾 Z 检验,【例2】欣欣儿童食品厂生产的某种盒装儿童食品,规定每盒的重量不低于368克。现从某天生产的一批食品中随机抽取25盒进行检查,测得每盒的平均重量为x=372.5克。企业规定每盒重量的标准差为15克。确定P-值。,P-值计算结果,p-值为 P(Z 1.50)=1-P(Z 1.50)=1-0.933=0.067,本章小节,1.假设检验的概念和类型 2.假设检验的过程3.基于一个样本的假设检验问题4.基于两个样本的假设检验问题5.利用置

23、信区间进行假设检验6.利用p-值进行假设检验,结 束,均值的单尾 Z 检验(提出假设),续,续,样本统计量的Z值(观察到的),续,续,续,双尾 Z 检验(P-值计算结果),单尾 Z 检验(P-值计算结果),样本统计量的Z值,计算的检验统计量为:,单尾 Z 检验(P-值计算结果),p-值为 P(Z 1.50),样本统计量的Z值,用备择假设找出方向,单尾 Z 检验(P-值计算结果),p-值为 P(Z 1.50),样本统计量的Z值,用备择假设找出方向,从Z分布表:查找1.50,单尾 Z 检验(P-值计算结果),p-值为 P(Z 1.50)=.0668,样本统计量的Z值,用备择假设找出方向,从Z分布表

24、:查找1.50,0.5000-0.4332 0.0668,单尾 Z 检验(P-值计算结果),0,1.50,Z,1 p-值=0.067,=0.05,拒绝,单尾 Z 检验(P-值计算结果),检验统计量未在拒绝区域,(p-值=0.0668)(=.05),不能拒绝H0,0,1.50,Z,1 p-值=.0668,=.05,拒绝,双侧检验(显著性水平与拒绝域),抽样分布,H0值,临界值,临界值,a/2,a/2,样本统计量,拒绝域,拒绝域,接受域,1-,置信水平,第 8 章 假设检验,8.01某乐器厂以往生产的乐器采用的是一种镍合金弦线,这种弦线的平均抗拉强度不超过1035MPa,现产品开发小组研究了一种新

25、型弦线,他们认为其抗拉强度得到了提高并想寻找证据予以支持。在对研究小组开发的产品进行检验时,应该采取以下哪种形式的假设?为什么?H0:1035 H0:1035 H0:=1035 H1:1035 H1:1035 H1:1035,第 8 章 假设检验,8.02研究人员发现,当禽类被拘禁在一个很小的空间内时,就会发生同类相残的现象。一名孵化并出售小鸡的商人想检验某一品种的小鸡因为同类相残而导致的死亡率是否小于0.04。试帮助这位商人定义检验参数并建立适当的原假设和备择假设。,第 8 章 假设检验,8.03一条产品生产线用于生产玻璃纸,正常状态下要求玻璃纸的横向延伸率为65,质量控制监督人员需要定期进

26、行抽检,如果证实玻璃纸的横向延伸率不符合规格,该生产线就必须立即停产调整。监控人员应该怎样提出原假设和备择假设,来达到判断该生产线是否运转正常的目的?,第 8 章 假设检验,8.04一家大型超市连锁店上个月接到许多消费者投诉某种品牌炸土豆片中60g一袋的那种土豆片的重量不符。店方猜想引起这些投诉的原因是运输过程中沉积在食品袋底部的土豆片碎屑,但为了使顾客们对花钱买到的土豆片感到物有所值,店方仍然决定对来自于一家最大的供应商的下一批袋装炸土豆片的平均重量(g)进行检验,假设陈述如下:H0:60 H1:60 如果有证据可以拒绝原假设,店方就拒收这批炸土豆片并向供应商提出投诉。(1)与这一假设检验问

27、题相关联的第一类错误是什么?(2)与这一假设检验问题相关联的第二类错误是什么?(3)你认为连锁店的顾客们会将哪类错误看得较为严重?而 供应商会将哪类错误看得较为严重?,第 8 章 假设检验,8.05某种纤维原有的平均强度不超过6g,现希望通过改进工艺来提高其平均强度。研究人员测得了100个关于新纤维的强度数据,发现其均值为6.35。假定纤维强度的标准差仍保持为1.19不变,在5的显著性水平下对该问题进行假设检验。(1)选择检验统计量并说明其抽样分布是什么样的?(2)检验的拒绝规则是什么?(3)计算检验统计量的值,你的结论是什么?,第 8 章 假设检验,8.06一项调查显示,每天每个家庭看电视的

28、平均时间为7.25小时,假定该调查中包括了200个家庭,且样本标准差为平均每天2.5小时。据报道,10年前每天每个家庭看电视的平均时间是6.70小时,取显著性水平=0.01,这个调查是否提供了证据支持你认为“如今每个家庭每天收看电视的平均时间增加了”?,第 8 章 假设检验,8.07经验表明,一个矩形的宽与长之比等于0.618的时候会给人们比较良好的感觉。某工艺品工厂生产的矩形工艺品框架的宽与长要求也按这一比例设计,假定其总体服从正态分布,现随机抽取了20个框架测得比值数据见book8.07 在显著性水平=0.05时能否认为该厂生产的工艺品框架宽与长的平均比例为0.618?,第 8 章 假设检

29、验,8.08一个著名的医生声称有75的女性所穿鞋子过小,一个研究组织对356名女性进行了研究,发现其中有313名妇女所穿鞋子的号码至少小一号。取=0.05,检验如下的假设:H0:=0.75 H1:0.75 对这个医生的论断你有什么看法?,第 8 章 假设检验,8.09 一个视频录像设备(VCR)的平均使用寿命为6年,标准差为0.75年,而抽选了由30台电视组成的一个随机样本表明,电视使用寿命的样本方差为2年。试构造一个假设检验,能够帮助判定电视的使用寿命的方差是否显著大于视频录像设备的使用寿命的标准差。并在=0.05的显著性水平下作出结论。,第 8 章 假设检验,8.10某生产线是按照两种操作

30、平均装配时间之差为5分钟而设计的,两种装配操作的独立样本产生如下资料:对=0.02,检验平均装配时间之差是否等于5分钟。,第 8 章 假设检验,8.11某市场研究机构用一组被调查者样本来给某特定商品的潜在购买力打分。样本中每个人都分别在看过该产品的新的电视广告之前与之后打分。潜在购买力的分值为010分,分值越高表示潜在购买力越高。原假设认为“看后”平均得分小于或等于“看前”平均得分,拒绝该假设就表明广告提高了平均潜在购买力得分。对=0.05的显著性水平,用book8.11的数据检验该假设,并对该广告给予评价。,第 8 章 假设检验,8.12在旅游业中,特定目的地的旅游文化由旅游手册提供,这种小

31、册子由旅游管理当局向有需要的旅游者免费提供。有人曾进行过一项研究,内容是调查信息的追求者(即需要旅游手册者)与非追求者之间在种种旅游消费方面的差别。两个独立随机样本分别由288名信息追求者和367名非信息追求者组成。对样本成员就他们最近一次离家两天或两天以上的愉快旅行或度假提出若干问题。问题之一是:“你这次度假是积极的(即主要包括一些富有挑战性的事件或教育活动),还是消极的(即主要是休息和放松)?”每个样本中消极休假的人数列于下表,试问:这些数据是否提供了充分证据,说明信息追求者消极度假的可能性比非信息追求者小?显著性水平=0.01,第 8 章 假设检验,8.13生产工序中的方差是工序质量的一

32、个重要测度,通常较大的方差就意味着要通过寻找减小工序方差的途径来改进工序。某杂志上刊载了关于两部机器生产的袋茶重量的数据(单位:g)见book8.13,请进行检验以确定这两部机器生产的袋茶重量的方差是否存在显著差异。取=0.05,第 8 章 假设检验,8.14为比较新旧两种肥料对产量的影响,一边决定是否采用新肥料。研究者选择了面积相等、土壤等条件相同的40块田地,分别施用新旧两种肥料,得到的产量数据见book8.14,请进行检验以确定这两部机器生产的袋茶重量的方差是否存在显著差异。取 取显著性水平=0.05 用Excel 检验:(1)新肥料获得的平均产量是否显著地高于旧肥料?假定条件为:两种肥料产量的方差未但相等,即12=22。两种肥料产量的方差未且不相等,即12 22。(2)两种肥料产量的方差是否有显著差异?,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号