《沈阳理工大学徐静霞版统计学(12)第6章 假设检验ppt课件.ppt》由会员分享,可在线阅读,更多相关《沈阳理工大学徐静霞版统计学(12)第6章 假设检验ppt课件.ppt(65页珍藏版)》请在三一办公上搜索。
1、Fundamental Statistics,统计学基础,第6章 假设检验,6.1 假设检验的基本原理6.2 总体均值的检验6.3 总体比例的检验,学习目标,假设检验的基本原理。掌握假设检验的基本思想和假设检验中的一些基本问题,包括如何陈述假设、假设检验中的两类错误和显著性水平、检验统计量和拒绝域以及利用P值进行检验等。总体均值检验。掌握在大样本和小样本的条件下,对总体均值进行假设检验的程序。总体比例检验。掌握大样本情形下总体比例的检验方法。,导入案例,航空公司的售票超时了吗? 航空公司服务规定,销售一张机票的平均时间为2分钟。为检验航空公司的售票服务质量,特抽验30名顾客购买机票所用时间组成
2、的一个随机样本,下表是抽验的30个顾客的购买时间数据,导入案例,根据样本数据计算的平均值是2.18分钟,标准差为0.41分钟。根据参数估计方法得到的顾客购买机票所用时间的95%的置信区间为(2.03,2.33)分钟。调查人员发现这个区间内并没有包括2分钟。因此提出航空公司的售票超时,没有达到规定的标准要求。我们能否根据这一样本断定航空公司的售票时间没有达标呢?本章的内容将提供一套标准统计程序来检验这样的结论。,6.1 假设检验的基本原理 6.1.1 假设检验的基本思想 6.1.2 原假设和备择假设及其提出 6.1.3 假设检验中的两类错误 6.1.4 显著性水平 6.1.5 检验统计量与拒绝域
3、 6.1.6 利用P值进行决策,6.1.1 假设检验的基本思想,基本思想:利用样本信息 来对总体参数提出的一个假设值做出拒绝和不拒绝的决策。 决策的依据: 小概率原理,是指概率很小的事件在一次试验中是不可能发生的。在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设,假设(hypothesis)就是对总体参数的一种事先猜想,并将这种猜想的具体数值陈述出来,也称为称统计假设。 假设检验(hypothesis test)就是对总体参数提出假设的基础上,利用样本信息来判断假设是否成立的一种统计方法。,原假设(null hypothesis),又称“0假设”,研究者想收集证据予以反对的假设,用H0表
4、示所表达的含义总是指参数没有变化或变量之间没有关系 最初被认为是成立的,之后根据样本数据确定是否有足够的证据拒绝它 总是有符号 , 或H0 : = 某一数值H0 : 某一数值H0 : 某一数值例如, H0 : 10cm,null,也称“研究假设”,研究者想收集证据予以支持的假设,用H1表示所表达的含义是总体参数发生了变化或变量之间有某种关系备择假设通常用于表达研究者自己倾向于支持的看法,然后就是想办法收集证据拒绝原假设,以支持备择假设 总是有符号 , 或 H1 : 某一数值H1 : 某一数值H1 : 某一数值,备择假设(alternative hypothesis),原假设和备择假设是一个完备
5、事件组,而且相互对立在一项假设检验中,原假设和备择假设有且只有一个成立先确定备择假设,再确定原假设 等号“=”总是放在原假设上 因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论),提出假设(结论与建议),备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailed test) 备择假设具有特定的方向性,并含有符号“”或“”,称为右侧检验,双侧检验与单侧检验,假设检验的基本形式,解:,【例6. 1】一种袋装酸奶采用自动生产线生产,每袋重量是150g,标准差为3g。为检验每袋重量是否符合要求,质检人员在某天生产的酸奶中随机抽取了50袋进行检验,
6、试陈述用来检验生产过程是否正常的原假设和备择假设。,(生产过程不正常),(生产过程正常),解:,【例6.2】一个生产宇航飞行器的工厂需要经常购置一种耐高温的零件,要求抗热的平均温度是1250度 。在过去,供货者提供的产品都符合要求,并从大量的数据获知零件抗热的标准差是150 度,在最近的一批进货中随机测试了100个零件,其平均的抗热为1200 度,问能否接受这批产品?试陈述用于检验的原假设与备择假设。,(抗热性能达标,不拒绝采购),(抗热性能没达标,拒绝采购),(由于接打电话而造成交通事故的比例不超过30%),【例6.3】一家研究机构估计,由于接打电话而造成交通事故的比例超过30%。为验证这一
7、估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设。,(由于接打电话而造成交通事故的比例超过30%),假设提出的主观性与研究目的,尽管通过原假设与备择假设的概念就能确定两个假设的内容,但实质上它们是带有一定的主观色彩的,因为所谓的“将研究者对总体参数值提出的假设”和“研究者通过检验希望支持的假设”显然最终仍都取决于研究者本人的意向。所以,在面对某一实际问题时,由于不同的研究者有不同的研究目的,即使对同一问题也可能提出截然相反的原假设和备择假设,这是十分正常的,也并不违背关于原假设与备择假设的最初定义。无论怎样确定假设的形式,只要它们符合研究者的最终目的,便是合
8、理的。,6.1.3假设检验中的两类错误,研究者总是希望能做出正确的决策,但由于决策是建立在样本信息的基础之上,而样本又是随机的,因而就有可能犯错误。原假设和备择假设不能同时成立,决策的结果要么拒绝H0,要么不拒绝H0。决策时总是希望当原假设正确时没有拒绝它,当原假设不正确时拒绝它,但实际上很难保证不犯错误 第类错误(错误)原假设为正确时拒绝原假设第类错误的概率记为,被称为显著性水平4.第类错误(错误)原假设为错误时未拒绝原假设第类错误的概率记为(Beta),6.1.3 假设检验中的两类错误,法官判案的结论与后果,假设检验的结论与后果, 错误和 错误的关系,你要同时减少两类错误的惟一办法是增加样
9、本量,和 的关系就像翘翘板,小 就大, 大 就小,两类错误的控制,一般来说,对于一个给定的样本,如果犯第类错误的代价比犯第类错误的代价相对较高,则将犯第类错误的概率定得低些较为合理;反之,如果犯第类错误的代价比犯第类错误的代价相对较低,则将犯第类错误的概率定得高些。一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于犯第类错误的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第类错误的发生概率。,6.1.4 显著性水平,假设检验中犯第一类错误的概率,称为显著性水平(level of significance),记为,是人们事先指定的犯第一类错误概率的最大允
10、许值。 显著性水平是指当原假设实际上是正确时,检验统计量出现了本不应该出现的极端情况的概率。显著性水平越小,犯第一类错误的可能性自然就越小,但犯第二类错误的可能性则随之增大。 常用的显著性水平有=0.01、=0.05、=0.1 等,当然也可以取其他值,但一般不会大于0.1。,依据什么做出决策?,若假设为H0:=500,H1:500。样本均值为495,拒绝H0吗?样本均值为502,拒绝H0吗?做出拒绝或不拒绝原假设的依据是什么?传统上,做出决策所依据的是样本统计量,现代检验中人们直接使用由统计量算出的犯第类错误的概率,即所谓的P值,6.1.5 检验统计量与拒绝域,根据样本观测结果计算得到的,并据
11、以对原假设和备择假设做出决策的某个样本统计量,称为检验统计量(test statistic)。标准化检验统计量(standardized test statistic)反映了点估计量(比如样本均值)与假设的总体参数(比如假设的总体均值)相比相差多少个标准差。拒绝域(rejection region)就是由显著性水平 和相应的临界值所围成的区域。根据给定的显著性水平确定的拒绝域的边界值,称为临界值(critical value)。,用统计量决策(双侧检验 ),用统计量决策(左侧检验 ),抽样分布,H0,临界值,a,拒绝H0,1 - ,置信水平,Region of Rejection,Region
12、 of Nonrejection,用统计量决策(右侧检验 ),抽样分布,H0,临界值,拒绝H0,1 - ,置信水平,Region of Nonrejection,Region of Rejection,统计量决策规则,给定显著性水平,并计算出其临界值将检验统计量的值与 的临界值比较作出决策双侧检验:I统计量I 临界值,拒绝H0左侧检验:统计量 临界值,拒绝H0,6.1.6 利用P值进行决策,如果原假设H0为是正确的,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值( P value),也称为观察到的显著性水平(observed significance level)。决策规则:
13、若p值, 拒绝 H0,用P值进行检验比根据统计量检验提供更多的信息统计量检验是我们事先给出的一个显著性水平,以此为标准进行决策,无法知道实际的显著性水平究竟是多少比如,根据统计量进行检验时,只要统计量的值落在拒绝域,我们拒绝原假设得出的结论都是一样的,即结果显著。但实际上,统计量落在拒绝域不同的地方,实际的显著性是不同的。比如,统计量落在临界值附近与落在远离临界值的地方,实际的显著性就有较大差异。而P值给出的是实际算出的显著水平,它告诉我们实际的显著性水平是多少,P 值决策与统计量的比较,P 值是用于确定是否拒绝原假设的另一个重要工具,它有效地补充了 提供的关于检验可靠性的有限信息。,假设检验
14、结论的表述(“显著”与“不显著”),当拒绝原假设时,我们称样本结果是统计上显著的。拒绝原假设时结论是清楚的当不拒绝原假设时,我们称样本结果是统计上不显著的不拒绝原假设时,并未给出明确的结论,不能说原假设是正确的,也不能说它不是正确的。,假设检验结论的表述( “不拒绝” 不等于“接受”),假设检验的目的在于试图找到证据拒绝原假设,而不在于证明什么是正确的。当没有足够证据拒绝原假设时,不采用“接受原假设”的表述,而采用“不拒绝原假设”的表述。“不拒绝”的表述实际上意为着并未给出明确的结论,我们没有说原假设正确,也没有说它不正确。“接受”的说法有时会产生误导,因为这种说法似乎暗示着原假设已经被证明是
15、正确的了。但实事上,H0的真实值我们永远也无法知道,H0只是对总体真实值的一个假定值,由样本提供的信息也就自然无法证明它是否正确。,第一步: 提出原假设H0和备择假设H1;第二步:从总体中抽出一个随机样本; 第三步:构造合适的统计量,根据样本观测数据计算出检验统计量值; 第四步:确定检验的显著性水平 ,计算临界值,确定拒绝域;第五步:利用P值或利用临界值进行决策。其中P值决策既简单又精确,双侧检验若2P ,不拒绝原假设;若2P ,拒绝原假设。在单侧检验中,若P ,不拒绝原假设;若P ,则要拒绝原假设。,假设检验的具体步骤:,第6章 假设检验,6.1 假设检验的基本原理6.2 总体均值的检验6.
16、3 总体比例的检验,6.2 总体均值的检验 6.2.1 大样本总体均值的检验 6.2.2 小样本总体均值的检验,6.2.1 大样本总体均值的检验,1.假定条件大样本(n30),对于双侧检验,对于给定的显著性水平 ,当| z |z /2 ,拒绝原假设,否则不拒绝原假设;利用P值决策时,若2P ,拒绝原假设,否则不拒绝原假设。,1.假定条件大样本(n30),2. 使用z检验统计量 2 已知: 2 未知:,【例6.4】一种袋装酸奶采用自动生产线生产,每袋重量是150g,标准差为3g。为检验每袋重量是否符合要求,质检人员在某天生产的酸奶中随机抽取了50袋进行检验,测得每袋平均重量为150.4g。取显著
17、性水平 ,检验该天生产的酸奶重量是否符合标准要求。,解:提出如下原假设和备择假设:,计算检验统计量的具体数值,得:,根据给定的显著性水平 ,由Excel中的【NORMSINV】函数得:,由于所以,不拒绝原假设。,该决策过程可用下面的图:,用Excel计算正态分布P值的操作步骤第1步: 进入Excel表格界面,直接点击【f(x)】(插入函数)命令。第2步:在函数分类中点击【统计】,并在函数名菜单下选择【NORMSDIST】,然后【确定】。第3步:将z的绝对值0.9428录入,得到的函数值为0.8271,该值表示的是在标准正态分布条件下z值为0.9428左边的面积。第4步:z=0.9428右边和z
18、= -0.9428左边的面积是一样的,所以双侧检验最后的P值为P=2(1-0.8271)= 0.3458。,Excel操作演示,【6.5】为监测空气质量,沈阳市环保部门每隔几周对空气烟尘质量进行一次随机测试。已知该城市过去每立方米空气中悬浮颗粒的平均值是82微克。在最近一段时期的检测中,每立方米空气中悬浮颗粒的数值如下。(单位:微克),沈阳市35天中每立方米空气中悬浮颗粒重量,利用这些样本数据,能否认为沈阳市空气中悬浮颗粒的平均值与过去相比有显著降低?(=0.01 )。,解:提出如下原假设和备择假设:,计算检验统计量的具体数值,得:,根据给定的显著性水平 ,由Excel中的【NORMSINV】
19、函数得:,由于所以,不拒绝原假设。检验结果表明:沈阳市空气中悬浮颗粒的平均值与过去相比有显著降低。,由样本数据计算,得:,另一种就是直接利用原始数据计算P值进行检验,步骤如下:第1步: 进入Excel表格界面,直接点击【f(x)】(插入函数)命令。第2步:在函数分类中点击【统计】,并在函数名菜单下选择 【ZTEST】,然后【确定】。第3步:在所出现的对话框【Array】框中,输入原始数据所在区域;在【X】后输入参数的某一假定值(本例题为82);在【Sigma】后输入已知的总体标准差(若总体标准差未知则可忽略不填,系统将自动使用样本标准差代替)。第4步:给出的分布左侧面积为0.9907,用1减去
20、该值,即为单侧检验的P值,即P值=1-0.9907=0.0093。,Excel操作演示,由于P值小于给定的显著性水平 ,所以拒绝原假设,结论与统计量检验一致。上面的决策过程可用下面的图来表示。,对于右侧检验,对于给定的显著性水平 ,当zza,拒绝原假设,否则不拒绝原假设;利用P值决策时,与左侧检验一样仍然是P ,拒绝原假设,否则不拒绝原假设。,【例6.6】电视机显像管批量生产的质量标准是平均使用寿命为1200小时,标准差为150小时。某电视机厂宣称其生产的显像管质量大大超过规定的标准。为了进行验证,随机抽取了100件为样本,测得平均使用寿命1245小时。能否说该厂的显像管质量显著的高于规定的标
21、准?(=0.05),解:提出如下原假设和备择假设:,计算检验统计量的具体数值,得:,根据给定的显著性水平 ,由Excel中的【NORMSINV】函数得:,由于所以拒绝原假设,认为该厂生产的显像管质量大大超过规定的标准。,该的决策过程可用下图来表示:,6.2.2 小样本总体均值的检验,1.假定条件大样本(,若采用临界值法决策: 拒绝域分别为:双侧检验时| t |t /2 (n-1); 左侧检验时 t t (n-1)。,1.假定条件: 小样本(n30),2. 使用T检验统计量 2 已知: 2 未知:,【例6.7】已知某机床厂职工用一条旧生产线加工零件所需操作时间渐进服从正态分布,根据历史资料可知,
22、职工加工一个零件平均所需时间为16分钟,标准差为3.2分钟。工厂现拟采用一条新的生产线,随机抽取10名职工进行操作,测得结果平均所需时间为13.5分钟。试问在0.05的显著性水平下,采用新的生产线平均操作时间有无明显差异。,解:依题意建立如下原假设与备择假设:,计算检验统计量的具体数值,得:,根据给定的显著性水平0.05 ,由Excel中的【NORMSINV】函数得:,由于 所以,拒绝原假设。 若采用P值决策,计算z=-2.47时,p=0.0135,p ,所以拒绝原假设,所得结论与统计量检验完全一致。,【例6.8】在例6.7中,如果问在0.01的显著性水平下,采用新的生产线平均操作时间有无明显
23、缩短?,解:根据题意,该问题属左侧检验,依题意,建立如下假设:,计算检验统计量的具体数值,得:,根据给定的显著性水平0.01 ,由Excel中的【NORMSINV】函数得:,由于 所以,拒绝原假设。 若采用P值决策,计算z=-2.47时,p=0.00675,p ,所以拒绝原假设,所得结论与统计量检验完全一致。,【例6.9】 2010年12月份,某个航线往返机票的平均折扣费是258美元。已知机票折扣费服从正态分布,现随机抽取了在2011年1月份中15个往返机票的折扣作为一个简单随机样本,结果得到下面的数据: 310 260 265 255 300 310 250 265 280 290 240
24、285 250 260 230 在0.05的显著性水平下检验1月份往返机票的平均折扣费是否有所增加。,解:本题采用T统计量进行检验。分析题意并建立如下原假设与备择假设:,由样本数据计算得:,由于n30为小样本,采用式(6-4)计算检验统计量为:,上面的决策过程可用下图来表示。,由Excel中的【TINV】函数得:,由于所以拒绝原假设,样本提供的证据足以推翻原假设,结论是1月份往返机票的平均折扣费有所增加。,t检验的P值同样可以利用Excel计算,具体操作步骤如下:第1步:进入Excel表格界面,直接点击【f(x)】(插入函数)命令。第2步:在函数分类中点击【统计】,并在函数名菜单下选择 【TD
25、IST】,然后【确定】。第3步:在出现对话框的【X】栏中输入计算出的t的绝对值1.875。 在【Deg-freedom】(自由度)栏中,输入本例中的自由度14。 在【Tails】栏中,输入1(表明是单侧检验,如果是双测检验则在该栏输入2)。,Excel操作演示,【例6.10】已知某种零件的标准长度应为15厘米 ,现从一批零件中随机抽取16只,测得其长度(厘米)如下: 15.1 14.5 14.8 14.6 15.2 14.8 14.9 14.6 14.8 15.1 15.3 14.7 15.0 15.2 15.1 14.7 在0.05的显著性水平下,检验该批零件是否符合要求?,解:分析题意建立
26、如下原假设与备择假设:,由样本数据计算得:,由于n30为小样本,采用式(6-4)计算检验统计量为:,上面的决策过程可用下图来表示。,由Excel中的【TINV】函数得:,由于所以不拒绝原假设,样本提供的证据还不足以推翻原假设,认为该批零件符合要求。,用Excel计算t分布P值的操作步骤:第1步:进入Excel表格界面,直接点击【f(x)】(插入函数)命令。第2步:在函数分类中点击【统计】,并在函数名菜单下选择 【TDIST】,然后【确定】。第3步:在出现对话框的【X】栏中输入计算出的t的绝对值1.6129。 在【Deg-freedom】(自由度)栏中,输入本例中的自由度15。 在【Tails】
27、栏中,输入2(表明是双侧检验,如果是单测检验则在该栏输入1)。,Excel操作演示,总体均值的检验 (小样本检验方法的总结),注: 已知的拒绝域同大样本,一个总体均值的检验(作出判断),第6章 假设检验,6.1 假设检验的基本原理6.2 总体均值的检验6.3 总体比例的检验,6.3 总体比例的检验,总体比例是指是非变量总体中具有某种相同特征的个体所占的比例,这些特征既可以是数值型的,也可以是品质型的。通常用字母表示总体比例,0表示对总体比例的某一假设值,用p表示样本比例。,总体比例检验的三种基本形式为:双侧检验: , ;左侧检验: , ;右侧检验: , 。,总体比例检验的统计量,在构造检验统计
28、量时,我们仍然利用样本比例p 与总体比例 之间的距离等于多少个标准差p 来衡量,因为在大样本情形下统计量p 渐进服从正态分布,而统计量为:,在给定显著性水平 的条件下,总体比例检验的显著性水平、拒绝域和临界值的图示可参见下图: 若采用临界值法决策:拒绝域分别为,双侧检验时|z|z/2 ;左侧检验时zz 。采用p值决策时 , p ,拒绝原假设H0 。,【例6.11】外贸公司的进口部门相信最近进口的一批产品的次品率是8%,公司决定抽取一批200个产品来检验这一说法是否正确。发现其中有17件为次品,取显著性水平=0.05 ,检验该批产品的次品率是否为8%?,解:公司想证明的是这批产品的次品率是8%这
29、一说法是否属实,因此提出的原假设和备择假设为由抽样结果计算得: 检验统计量为: 根据给定的显著性水平=0.05,由Excel中的【NORMSINV】函数得z/2 = z0.025=1.96 。由于|z|=0.2607z/2 =1.96, z=0.2607 z0.025=1.96,所以不拒绝原假设。在显著性水平为0.05的条件下,样本提供的证据表明该公司说法属实。,案例分析与讨论,假设检验和法庭审判过程的对比分析,法庭审判的过程与假设检验颇有相似之处。假定原假设为“H0:被告清白;”备择假设为“H1:被告有罪 ”。判一个无辜的人有罪即为犯第一类错误;释放一个有罪的人则犯了第二类错误。 控制审判的
30、法规与统计检验的规则有点类似。任何降低第一类错误发生可能性法规都必然导致第二类错误出现的可能性增大。比如,规定被告不必作不利于自己的证明,这一规定减少了一位无辜的人被判有罪的可能,但同时也增加了放过一个有罪人的概率。,案例分析与讨论,同时,一项规定降低了犯第二类错误的概率,就必然会导致第一类错误出现的概率上升。比如,规定陪审团半数及以上的人裁定有罪即可判被告有罪,这一规定使判一个有罪的人无罪的可能性减小了,但冤案发生的可能性却增大了。想让和都趋于0或趋于1是不可能的。假设检验中要求样本是随机的,同样,法庭上要求陪审员能代表全体公民。通过法律程序由陪审团做出的最后裁定与通过假设检验而得到的结论有
31、些类似。当用于定罪的证据不充分时,陪审员有理由怀疑被告真的是有罪,从而不能拒绝原假设。但这并不意味着陪审团认为被告是“清白的”,他们只是裁定“无罪”,这是一个介于“有罪”和“青白”之间的概念。同样,在假设检验中,当我们没有足够的证据拒绝原假设时,通常只是说我们“不能拒绝H0 ”,而不说“接受H0 ”,这同样运用了中性的概念。,案例分析与讨论,在大多数假设检验中,如认为第一类错误较第二类错误严重,则从防止第一类错误发生的角度确定原假设。类似地,在法律审判过程中,一般认为判一个清白的人有罪的错误要比放过一个有罪的人严重得多。所以,在假设检验中最重要的概率是 ,即犯第一类错误发生的概率(当原假设为真
32、时拒绝原假设。)法律法规制定的一个出发点就是将清白的人误判为有罪的概率保持较低的水平。 例如,除非有充分的证据,只有陪审团全体通过才判被告有罪。曾经有这样一起杀人案,一位年轻有为IT从业者惨遭杀害。事后,死者的一位同事王某向警方提供了一条线索,暗示另一位同事李某与谋杀有关。王某因为提供证据举证李某而免于起诉。但随后的调查发现,王某也是本案的参与者之一,检察院因而试图取消对王某的赦免。经审判,李某罪名成立,法院还裁定不能撤销对王某的赦免,虽然后来有证据表明王某与本案有牵连,是本案的参与者之一。按照法庭程序,王某被释放并依据审判结果获得证人费。,讨论题:,1、要对王某提出起诉,原假设和备择假设是什么?2、假定王某有罪,那么本案审判中出现了哪类错误?3、法庭裁定驳回撤销赦免的指导思想是什么?在假设检验中如何体现这种指导思想?,Thank You !,