《第二章参数估计与假设检验ppt课件.ppt》由会员分享,可在线阅读,更多相关《第二章参数估计与假设检验ppt课件.ppt(59页珍藏版)》请在三一办公上搜索。
1、1,第5章 假设检验,本章教学目标了解和掌握统计推断中的另一个基本问题:参假设检验及其在经济管理中的应用;掌握运用 Excel 的“数据分析”及其统计函数功能求解假设检验问题。,2,本章主要内容,5.1 案例介绍 5.2 假设检验的基本原理5.3 单个正态总体均值的检验 5.4 单个正态总体方差的检验5.5 两个独立正态总体均值的检验5.6 成对样本试验的均值检验5.7 两个正态总体方差的检验5.5 总体比例的检验本章重点:假设检验中不可避免的两类错误及其应用 Excel“数据分析”功能的使用及其运行输出结果分析。难点:假设检验中不可避免的两类错误及其应用。,3,5.1 案例介绍,【案例1】新
2、工艺是否有效?某厂生产的一种钢丝的平均抗拉强度为 10560 (kg/cm2)。现采用新工艺生产了一种新钢丝,随机抽取 10 根,测得抗拉强度为: 10512, 10623, 10668, 10554, 10776 10707, 10557, 10581, 10666, 10670求得新钢丝的平均抗拉强度为 10631.4(kg/cm2)。是否就可以作出新钢丝的平均抗拉强度高于原钢丝,即新工艺有效的结论?,4,某台加工缸套外径的机床,正常状态下所加工缸套外径的标准差应不超过 0.02 mm。检验人员从加工的缸套中随机抽取 9 个,测得外径的样本标准差为 S = 0.03 mm。问:该机床的加工
3、精度是否符合要求?,【案例2】机床加工精度是否符合要求?,5,新车的平均首次故障里程数是汽车的一个主要可靠性指标。现测得甲、乙两种品牌轿车的首次故障里程数数据如下:甲品牌 X1:1200, 1400, 1580, 1700, 1900乙品牌 X2:1100, 1300, 1800, 1800, 2000, 2400 其中,【案例3】两种轿车的质量有无差异?,问:能否据此判定乙品牌轿车的平均首次故障里程高于甲品牌?,=1733,=1556,6,为分析甲、乙两种安眠药的效果,某医院将20个失眠病人分成两组,每组10人,两组病人分别服用甲、乙两种安眠药作对比试验。试验结果如下: 两种安眠药延长睡眠时
4、间对比试验(小时),(1)哪种安眠药的疗效好?(2)如果将试验方法改为对同一组10个病人,每人分别服用甲、乙两种安眠药作对比试验,试验结果仍如上表,此时结论如何?,【案例4】哪种安眠药的疗效好?,7,【案例5】某一系列电视剧是否获得成功,如果能够证明某一系列电视剧在播出的头13周其观众的收视率超过了25,则可以断定它获得了成功。假定由400个家庭组成的样本中,有112个家庭在头13周看过了某系列电视剧。现在要判断这部电视剧是否获得了成功。,8,【案例6】女企业家对成功的理解是否不同,对女企业家进行了一项研究来看她们对成功的理解。给她们提供了几个备选答案,如快乐/自我实现,销售/利润,成就/挑战
5、。根据她们业务的总销售额将其分为几组。销售额在10万50万元的在一组,少于10万元的在另一组。要研究的问题是:把销售/利润作为成功定义的比率,前一组是否高于后一组?,9,5.2 假设检验的原理,一、实际推断原理假设检验的理论是小概率原理,又称为实际推断原理,其具体内容是:小概率事件在一次试验中是几乎不可能发生的。二、假设检验推理的思想方法假设检验推理的思想方法是某种带有概率性质的反证法。,10,三、基本原理和步骤例1:统计资料表明,某电子元件的寿命 XN(0 , 2 ),其中 0 已知, 2 未知。现采用了新工艺生产,测得新工艺生产的 n 个元件寿命为 x1, x2, , xn。问:新工艺生产
6、的元件期望寿命 是否比原工艺的元件期望寿命 0 有显著提高?此问题要推断的是: 是否 0?这可用假设检验的方法解决,步骤如下:,. 5.2 假设检验的原理,11,1.提出一个希望推翻的假设,本例中 H0: = 02. 按希望出现的结果提出一个与原假设对立的假设, 称为备择假设,记为 H1。 本例中 H1: 03. 构造一个能用来检验原假设 H0 的统计量,t (n-1),本例中,要检验的是总体均值 ,,当 H0 为真时,,估计,故应使用,来构造检验 的统计量。,统计量,称为原假设,记为 H0,12,4. 给定一个小概率 ,,称为显著性水平,显著性水平 是当 H0 为真时,,拒绝 H0 的概率,
7、(即犯“弃真”错误的概率)。,也即当检验结果拒绝 H0 时,,不犯错误的概率为 1-,,从而可以有1- 的可信度接受,备择假设 H1。,5. 确定要拒绝 H0 时统计量的取值范围,,称为拒绝域,,拒绝域的边界点称为临界值。,本例中,,由于 H1: 0,而当 H0 为真时,,有,P t t ( n-1 ) = 1-,可知当统计量 t t(n-1) 时,,就可以有1- 的把握判定,H0 不真,(犯错误的概率仅为 ),,故此时应拒绝 H0。,从而拒绝域为 t t(n-1),,临界值为 t(n-1)。,(右边检验),,13,6. 计算统计量 t 的值,,本例中,,若计算结果为 t t(n-1),,并作
8、出检验结论,则拒绝 H0,,接受 H1,,即在水平 下,,认为 显著高于 0。,若 t t(n-1),,就不能拒绝 H0,,即认为 并不显,著高于 0。,当拒绝 H0 时,,说明在给定的水平 下,, 和 0,间存在显著差异。,这就是称 为显著性水平的原因。,14,设 t 为检验原假设 H0 所用的统计量,t(n-1)为检验的临界值,由显著性水平 的定义(右边检验) P t t(n-1) | H0 为真= 可知检验中可能出现以下两类判断错误:,二.检验中可能犯的两类错误,第一类错误,当 H0 为真时拒绝 H0 的错误,,即“弃真”错误,,犯此类错误的概率为 。,第二类错误,当 H0 不真时接受
9、H0 的错误,,即“取伪”错误,,记犯该类错误的概率为 ,,即,P tt(n-1)H0 不真= ,由于 H0 不真时与 H0 为真时,,统计量 t 的分布是,不同的,,故 1-。,Result Possibilities结果的各种可能性,Relationship Between a & ba & b 间的联系,17,两类错误的关系,由图可知,减少 会增大 ,反之也然。在样本容量 n 不变时,不可能同时减小犯两类错误的概率。应着重控制犯哪类错误的概率,这应由问题的实际背景决定。当第一类错误造成的损失大时,就应控制犯第一类错误的概率 (通常取 0.05,0.01等);反之,当第二类错误造成的损失大
10、时,就应控制犯第二类错误的概率 。要同时减小须犯两类错误的概率,必须增大样本容量 n。,x,0,H0:=0,t(n-1),H1:=1,18,t (n -1),5.3 单个总体均值的检验,设 XN( , 2 ),, 2 未知,,X1, X2, , Xn 为总体,X 的样本,,给定水平 ,,原假设为,H0: =0 ( 0为某一给定值),当 H0 为真时,,统计量,1. H1:0 (双边检验),当 H0 为真时,,由,P-t/2 (n-1)tt/2 (n-1)=1- ,可得:,若 |t| t/2 (n-1),就拒绝 H0,接受 H1;,否则接受 H0。,19,当 H0 为真时,由 P t t ( n
11、-1) =1-可得:若 t t ( n-1 ) 就拒绝 H0,接受 H1;否则就认为 并不显著高于 0 。,3. H1: 0 (左边检验) 由 P t -t (n-1) =1-可得:若 t -t ( n-1 ) 就拒绝 H0,接受 H1;否则就认为 并不显著小于 0 。,2. H1: 0,(右边检验),20,案例1. 检验新工艺的效果,某厂生产的一种钢丝抗拉强度服从均值为10560(kg/cm2)的正态分布,现采用新工艺生产了一种新钢丝,随机抽取10根测得抗拉强度为: 10512, 10623, 10668, 10554, 10776 10707, 10557, 10581, 10666, 1
12、0670问在显著性水平 = 0.05下,新钢丝的平均抗拉强度比原钢丝是否有显著提高?,21,案例 1 解答:,说明新工艺对提高钢丝绳的抗拉强度是有显著效果的。,本案例为右边检验问题,,设新钢丝的平均抗拉强度为 ,, 2 未知,,故使用,t 检验。,由题意,,H0: =0,,H1: 0,由所给样本数据,,可求得:,S = 81,,n =10,, =0.05,,t0.05(9)=1.8331, t =2.7875,故拒绝 H0,,即在水平 =0.05下,, 显著高于 0。,t(n-1),= t0.05(9),=1.8331,22,在案例1中,若取 = 0.01,问结论如何?,【解】 t0.01(9
13、) = 2.8214, t =2.7875 t0.01(9) = 2.8214故不能拒绝 H0。即在水平 = 0.01下,新钢丝平均抗拉强度并无显著提高。 通常,在 =0.05 下拒绝 H0,则称检验结果为一般显著的; 若在 =0.01 下拒绝 H0,则称检验结果为高度显著的; 若在 =0.001 下拒绝 H0,则称检验结果为极高度显著的。,23,课堂练习 3,一台自动包装奶粉的包装机,其额定标准为每袋净重 0.5 kg。某天开工时,随机抽取了 10 袋产品,称得其净重为:0.497,0.506,0.509,0.508,0.4970.510,0.506,0.495,0.502,0.507 (1
14、)在水平 = 0.20下,检验该天包装机的重量设定是否正确?( ,S= 0.00554 ) (2)在本题的检验问题中,为什么要将 取得较大?,24,5.4大样本单个总体比例的检验,设总体成数为 P,,则当 nP 和 n (1-P) 都大于5时,,样本成数 p 近似服从均值为 P,,方差为 P (1-P)/n 的正态,分布。,从而当原假设 H0:P = P0 为真时,,统计量,与前面分析完全类似地,可得如下检验方法:,PP0,P P0,P P0,25,【案例5】某一系列电视剧是否获得成功如果能够证明某一系列电视剧在播出的头13周其观众的收视率超过了25,则可以断定它获得了成功。假定由400个家庭
15、组成的样本中,有112个家庭在头13周看过了某系列电视剧。在 = 0.01 的显著性水平下,检验这部。系列电视剧是否获得了成功。,解:由题意,H0:P = P0 = 25%,H1:P 25%, 样本比例 p = 112/400 = 0.28,26,设 H0: 2 = 02 (02为某一给定值)则当 H0为真时,统计量,与前面分析完全类似地,可得如下检验方法:,5.5. 单个总体方差的检验, 2 02, 2 02, 2 02,( 2 检验 ),27,卡方检验的拒绝域,28,某台加工缸套外径的机床,正常状态下所加工缸套外径的标准差应不超过 0.02 mm,现从所生产的缸套中随机抽取了 9 个,测得
16、外径的样本标准差为 S = 0.03 mm。问:在水平 = 0.05下,该机床加工精度是否符合要求? 解:由题意,0 = 0.02, H0: 2=02,H1: 202 ,故拒绝 H0,即该机床加工精度已显著下降。 应立即停工检修,否则废品率会大大增加。,【案例2】 机床加工精度问题,29,课堂练习 4,一台奶粉自动包装的包装精度指标为 标准差 = 0.005 (kg) 某天开工时,随机抽检了 10 袋产品,测得其样本标准差为 S = 0.00554 (kg) (1)在水平 = 0.25 下,检验该天包装机的包装精度是否符合要求。 (2)在本检验问题中,为什么要将 取得较大?,30,统计意义上的
17、显著和实际的显著,有时,由于非常大的样本容量,你很有可能会得出统计意义上的显著性但实际中的显著性却很小。比如,假设在全国性的关于高档次的商业电视市场推广活动之前,你知道人们对你的品牌认知度是0.3。在活动结束之后,根据对20,000人的调查显示有6,168人认识你的品牌。单边检验希望能证明现在的认知比例是大于0.3,而p-值结果为0.0047,正确的统计结论是品牌名字消费者的比例现在取得了显著性改变,而在实际上这个增长重要吗?总体比例现在的估计值在6,168/2,00000.3084,或是30.84%。这个增长量只比假设检验值30%多了1%。在市场推广活动中的高额费用产生的结果是否对品牌认知度
18、有意义呢?现实中的低于1的市场认知度的微小增长与高成本的市场活动费用相比,你应该认为这次市场活动是不成功的。如果品牌知名度提高了20,你就能得出活动是非常成功的。,31,5.6.两个总体均值的检验,设总体 X1 N ( 1, 12),,X2N ( 2, 22),,且 X1和 X2 相互独立。,和 S12, S22 分别是,它们的样本的均值和样本方差,,样本容量分别为,n1和 n2。,原假设为,H0:1 = 2,32,可以证明,当 H0 为真时,统计量,其中:,完全类似地,可以得到如下检验方法:, t ( n1+n2-2 ),称为合并方差。,1. 12 = 22 = 2,,但 2 未知,( t
19、检验 ),33,测得甲, 乙两种品牌轿车的首次故障里程数数据如下:甲品牌 X1:1200, 1400, 1580, 1700, 1900乙品牌 X2:1100, 1300, 1800, 1800, 2000, 2400设 X1和 X2 的方差相同。问在水平 0.05 下,(1)两种轿车的平均首次故障里程数之间有无显著差异?(2)乙品牌轿车的平均首次故障里程是否比甲品牌有显著提高?,【案例3】轿车质量差异的检验,34,解:,双边检验问题,S12=269.62,,S22=471.92,12 = 22 = 2 未知,,n1= 5,,H0:1= 2,H1:12。,由所给数据,可求得, | t | =
20、0.74, t/2 (n1+n2-2),= t0.025(9),故两种轿车的平均首次故障里程间无显著差异,,即两种轿车的该项质量指标是处于同一水平的。,n2= 6,,= 2.2622,35,(2)左边检验, t = - 0.74 -t(n1+n2-2) = -t0.05(9) = -1.833故乙品牌轿车平均首次故障里程并不显著高于甲品牌。 显然,对给定的水平 ,若单边检验不显著,则双边检验肯定不显著。 但反之却不然,即若双边检验不显著,单边检验则有可能是显著的。,H1:12,36,用 Excel 检验两总体均值,可用 Excel 的【工具】“数据分析”“ t检验:双样本等方差假设”,检验 1
21、2=22= 2,但 2未知时两个总体的均值。,在Excel 的输出结果中: “P(T=t)单尾”,t (统计量),0,f (t),“P(T=t)单尾”的值(概率),单边检验达到的临界显著性水平;,“P(T=t)双尾”,双边检验达到的临界显著性水平。,由图可知:,P(T=t)双尾 = 2P(T=t)单尾,“P(T=t)单尾”和“P(T=t)双尾”统称为“ p 值 ”。,37,“P(T=t)单尾”与“P(T=t)双尾”的使用,从而,若“P(T0.05,则结果为不显著;“P(T0.05; “P(T0.05, 故无论单边还是双边检验结果都不显著。,t,t,“P(T=t)单尾”,由图可知:,t t,等价
22、于,“P(T=t)单尾” ,t t/2,等价于,“P(T=t)双尾” ,38,此时,可用 Excel 的【工具】“数据分析”“ t 检验:双样本异方差假设”检验 1222且都未知时两个正态总体的均值。,2. 1222 且未知,39,为分析甲、乙两种安眠药的效果,某医院将20个失眠病人分成两组,每组10人,两组病人分别服用甲、乙两种安眠药作对比试验。试验结果如下: 两种安眠药延长睡眠时间对比试验(小时),(1)两种安眠药的疗效有无显著差异?(2)如果将试验方法改为对同一组10个病人,每人分别服用甲、乙两种安眠药作对比试验,试验结果仍如上表,此时两种安眠药的疗效间有无差异?,【案例5】哪种安眠药的
23、疗效好?,40,(1)设服用甲、乙两种安眠药的延长睡眠时间分别为X1, X2,,故不能拒绝H0,两种安眠药的疗效间无显著差异。 用Excel 求解本案例,S22=1.7892,S12=2.0022,,案例 5 解答,X1N( 1, 2),,X2N( 2, 2),,n1 = n2 =10。,由试验方法知 X1, X2 独立。,H0:1=2,H1:12由表中所给数据,可求得:,41,故两种安眠药疗效间的差异是高度显著的!,= 4.0621,5.7. 成对样本试验,由于此时 X1, X2 为同一组病人分别服用两种安眠,药的疗效,,因此 X1, X2 不独立,,属于成对样本试验。,对于这类“成对样本试
24、验”的均值检验,,应当化,为单个正态总体的均值检验。,方法如下:,设 X=X1-X2,(服用甲、乙两种安眠药延长睡眠时,间之差),,则 XN ( , 2 )。,H0: = 0,,H1:0,由表中所给数据,可求得,S =1.23,,n =10, t 0.005(9) = 3.2498, 案例 5 解答,42,可用 Excel 的【工具】“数据分析”“ t检验:平均值的成对二样本分析”进行成对样本试验的均值检验。,用 Excel 求解,本例中“P(T=t)双尾”= 0.0028 0.01, 故两种安眠药的疗效间存在高度显著差异。,43,5.8. 两总体方差的检验,1. F 分布,设 X 2(n1)
25、,,Y 2(n2),,且 X 和 Y 相互独立,,则随机变量,服从自由度为( n1, n2 )的 F 分布,,记为,F F ( n1, n2 ),n1 为第一(分子的)自由度,,n2 为第二(分母的)自由度。,44,F 分布密度函数的图形,x,f (x),0,n1=20, n2=10,n1=20, n2=25,n1=20, n2=100,45,F 分布的右侧 分位点 F ( n1, n2 ),F 分布的右侧 分位点为满足 P F F ( n1, n2 ) = 的数值 F (n1, n2)。,F( n1, n2 ),F (n1, n2)有以下性质: F1- (n1, n2)=1/F(n2, n1
26、)利用上式可求得 F 分布表中未给出的 值的百分位点。,如 F0.95(10, 15) = 1/F0.05(15, 10),46,可用 Excel 的统计函数 FINV 返回 F(n1,n2)。语法规则如下:格式:FINV( , n1, n2 )功能: 返回 F ( n1, n2 )的值。,用 Excel 求 F( n1, n2 ),47,2. 两总体方差的检验 ( F 检验 ),原假设为 H0:12=22。,完全类似地,可以得到如下检验方法:, F ( n1-1, n2-1 ),当 H0为真时,,统计量,48,【例2】在 0.20下,检验【案例3】中两个正态总体的方差是否存在显著差异。,解:
27、由题意,H0:12=22,H1:1222,n1=5,n2=6由例5的计算结果,S12=269.62,S22=471.92,= 0.326,F/2(n1-1, n2-1),= F0.1(4, 5),= 3.52,F1-/2(n1-1, n2-1),= F1-0.1(4, 5),=1/F0.1(5, 4),=1/4.05,= 0.247,F = 0.326,F1-0.1(4, 5) = 0.247, F0.1(4, 5) = 3.52,故在水平 = 0.20下,,12 与 22 间无显著差异。,可知案例4 中关于 12 = 22 的假定是合理的。思考题:本例中为什么要将 取得较大?,49,可用 E
28、xcel 的【工具】“数据分析”“F检验: 双样本方差”检验两个正态总体是否是同方差的。 在 Excel 的输出结果中 “P(F=f)单尾”与“P(T=t)单尾”的含义是相同的,即 p 值。,用 Excel 求解,本例中“P(F 0.20故在在水平 0.20下,12 与 22 间无显著差异。,50,5.9. 大样本两个总体比例的检验,设 P1, P2 分别是两个独立总体的总体比例,,原假设为,H0: P1 = P2,设 p1, p2 分别是它们的样本比例,,n1, n2 分别是它们的,样本容量。,则在大样本的条件下,,统计量,由此,可以得到如下检验方法:,51,【案例6】女企业家对成功的理解是
29、否不同,对女企业家进行了一项研究来看她们对成功的理解。给她们提供了几个备选答案,如快乐/自我实现,销售/利润,成就/挑战。根据她们业务的总销售额将其分为几组。销售额在100万500万元的为一组,少于100万元的为另一组,要研究的问题是:把销售/利润作为成功定义的比率,前一组是否高于后一组?假定我们以总销售额对女企业家进行定位。我们采访了100名总销售额低于100万元的女企业家,她们中有24个将销售/利润定义为成功。随后我们又采访了95名总销售额在100万500万元的女企业家,其中有39人把销售/利润定义为成功。问在显著性水平0.01下,两组中将销售/利润定义为成功的比率是否有显著的差异。,52
30、,单个总体 = 0,两个独立总体1 = 2,成对样本 = 0,两个独立比例P1 = P2,比例P = P0, 2未知,12=22未知,两总体不独立,化为单个总体均值, 0, 0, 0,1 2,1 2,1 2,同单个总体,同单个总体,类同单个总体,同两个独立总体成数,P1 P2,P1 P2,P1 P2,总体均值和总体比例的检验小结,53,单 个总 体 2=02,两个独立总体12 = 22,1222,12 22,12 22, 202, 2 02, 2 02,总体方差的检验小结,54,小样本总体比例值的参数检验问题(补充),【案例】招聘测试问题 某公司人力资源部要要招聘若干名某专业领域的工程师。出了
31、10道选择题,每题有4个备选答案,其中只有一个是正确地。或者说,正确的比率只有0.25。问至少应当答对几道,才能考虑录取?分析:总体是01分布,B(1,p)。应聘者答对了X取值为1;答错了,X取值为0。一个完全瞎猜的应聘者,答对的概率应当是0.25,即p=0.25。,55,56,课堂练习 1 解答,故 2 的 95% 置信区间为 (0.00016, 0.00114),57,课堂练习 2 解答,故 的 95% 置信区间为,58,课堂练习 3 解答,由所给数据,,可求得,S = 0.00554, H0: = 0.5,H1:0.5,, = 0.20,/2 = 0.10,拒绝 H0,,包装机重量设定不
32、正确,,应重新调整。,由于对于本问题,,犯第一类错误,(包装机重量设定,正确但判定不正确),的损失很小;,而犯第二类错误,(包装机重量设定不正确但判定正确),的损失很大,,因此应控制犯第二类错误的概率,,取较大的 可,使较小。,59,课堂练习 4 解答,(1) 注意,,仅当包装重量的方差 0.0052 时,,包装精度才不符合要求,,故本问题是右边检验。,H0:2 = 0.0052,,H1:2 0.0052,, = 0.25,不能拒绝 H0,,包装机精度符合要求。,(2)对于机床精度的检验问题,,犯第一类错误,(精度符合要求但判定不符合要求),的损失很小;,而犯第二类错误,(精度已显著下降但判定仍符合,要求),的损失很大。,因此应控制犯第二类错误的概率,,取较大的 可使较小。,