第5章假设检验.ppt

上传人:sccc 文档编号:5759030 上传时间:2023-08-17 格式:PPT 页数:82 大小:1.27MB
返回 下载 相关 举报
第5章假设检验.ppt_第1页
第1页 / 共82页
第5章假设检验.ppt_第2页
第2页 / 共82页
第5章假设检验.ppt_第3页
第3页 / 共82页
第5章假设检验.ppt_第4页
第4页 / 共82页
第5章假设检验.ppt_第5页
第5页 / 共82页
点击查看更多>>
资源描述

《第5章假设检验.ppt》由会员分享,可在线阅读,更多相关《第5章假设检验.ppt(82页珍藏版)》请在三一办公上搜索。

1、第5章 假设检验,本章内容5.1 假设检验的基本思想 5.2 总体标准差已知条件下均值双侧检验5.3 案例研究:运输天数单侧检验5.4 标准差未知时总体均值的假设检验5.5 案例研究:顾客满意度假设检验5.6 总体方差的假设检验,下一页,返回目录,上一页,下一页,返回本章首页,5.1.1 假设检验的基本思想5.1.2 假设检验的基本内容,5.1 假设检验的基本思想,5.1.1 假设检验的基本思想,1假设检验命题 例 某粮食加工厂的包装部门欲对其包装进行检测。如果包装过程操作正确,每袋粮食重量服从均值为 16公斤,标准差为0.50公斤的正态分布。现随机抽 取10袋作为样本,样本的平均重量是15.

2、43 公斤。问样本平均重量与总体平均重量是否具有显著差异,以上数据能否证明包装工作过程正常。,上一页,下一页,返回本节首页,在统计学中,把需要通过样本去推断其正确与否的命题称为原假设,用Ho表示。与原假设相对立的假设便是备择假设,用Ha表示。假设检验的目的是判断原假设是否正确,所以这里首先假定原假设正确,即每袋的平均重量是16公斤;然后,通过Excel模拟抽样,从原假设的总体中获得样本;最后,判断样本均值15.43公斤是否符合条件。如果符合,说明样本与原假设是一致的,如果不符合,则说明样本与原假设不一致,即原假设不正确。,上一页,下一页,返回本节首页,2模拟抽样样本重量均值是15.43公斤,与

3、总体均值16公斤相差0.57公斤。那么判断0.57公斤的差异是由于随机因素造成的,还是由于包装过程中出现的质量问题,可以通过模拟抽样来进行分析。已知粮袋的平均重量服从均值为16公斤和标准差为0.50公斤的正态分布,据此可用随机数生成工具模拟一个粮袋的填装重量,以检查0.57公斤的差异是否正常。打开“第5章 假设检验.XLS”工作簿,选择“模拟”工作表。,上一页,下一页,返回本节首页,在“工具”菜单选择“数据分析”选项,打开“数据分析”对话框。在“分析工具”列表中选择“随机数发生器”,单击“确定”按钮,打开“随机数发生器”对话框如图所示。,上一页,下一页,返回本节首页,在“变量个数”选项中输入1

4、0,“随机数个数”选项中键入1。单击“分布”框,选择“正态分布”。在“参数”选项中输入均值16,标准偏差0.5。在“输出区域”中输入单元格A2,单击“确定”按钮。10个袋重量的数值将分别显示在单元格A2:J2中。在单元格K1中输入“样本均值”。在单元格K2中输入计算A2:J2中数值均值的公式“=AVERAGE(A2:J2)”,注意需要使用相对引用。,上一页,下一页,返回本节首页,在单元格N1 中输入“总体均值”,在单元格O1处输入16。在单元格L1中输入“离差”。在单元格L2中放置样本均值与总体均值的离差绝对值,可以使用绝对值函数ABS输入公式,其公式为“=ABS(K2-$O$1)”,它表示样

5、本均值K2与总体均值O1之差的绝对值。返回随机数发成器对话框,再抽取一个容量为10的样本。不改变其他内容单击“确定”。将两次抽样的样本均值与总体均值进行比较。,上一页,下一页,返回本节首页,上面两个样本只是说明样本均值不可能完全等于16,如果观察大量样本,结果会更有说服力。下面利用Excel模拟1000个样本。打开随机数发生器对话框 由于重复前面的操作,只需将随机变量个数从1改为1000,单击“确定”按钮。将单元格K2和L2中的公式复制到K3:L1001区域中的各个单元格中。K列中显示的是本行中的样本均值,L列显示的是样本均值与16的离差绝对值。,上一页,下一页,返回本节首页,3.判断是否存在

6、显著差异 在1000个样本中,如果样本均值与总体均值的离差绝对值小于0.57的样本非常少,那么上例中出现的0.57离差便可能是质量问题。反之,如果在1000个样本中,离差绝对值大于0.57的样本有许多,则上例中的离差则可能是出于偶然,不一定是质量问题。如何确定有多少样本均值与总体均值的离差小于0.57呢?一个简单的办法是:根据离差进行排序,以便样本均值与16相差最大的样本出现在最顶端。,上一页,下一页,返回本节首页,选择单元格A1到L1001。打开“数据”菜单中的“排序”选项,打开“排序”对话框如图所示。,上一页,下一页,返回本节首页,在“当前数据清单”框中选择“有标题行”。单击“主要关键字”

7、框中的下拉箭头,从列表中选择“离差”。选择“递减”排序方式。单击“确定”按钮,Excel将根据样本均值与16的离差值对模拟样本进行降序排列如图所示。,上一页,下一页,返回本节首页,从图中可以看出,在1000个样本中,样本均值与16的离差等于或大于0.57的样本是非常有限的。这说明如果随机抽取均值为16,标准差为0.5,样本容量为10的1000个样本,其离差大于或等于0.57的可能性是很小的。随机抽取到离差为0.57公斤的样本的可能性是很小。换言之,包装过程中可能出现了某些问题,使总体均值不再是16公斤。因而拒绝接受总体均值等于16的原假设,而认为备择假设是正确的。,上一页,下一页,返回本节首页

8、,如果样本平均重量为15.89公斤,将做如何解释呢?此时样本均值与16相差为0.11,在1000个样本中离差超过0.11的样本所占比重约为0.40。这表明离差0.11(或更多)出现的可能性很大,它可能是由于随机原因引起,所以不能判断包装过程是否出错,无法拒绝原假设。假设检验的基本思想是应用小概率的原理。所谓小概率原理是指发生概率很小的随机数在一次试验中是几乎不可能发生的,根据这一原理,可以作出是否拒绝原假设的决定。,上一页,下一页,返回本节首页,5.1.2 假设检验的基本内容,假设检验的规则就是把随机变量取值区间划分为两个互不相交的部分,即拒绝区域与接受区域。当样本的某个统计量属于拒绝区域时,

9、将拒绝原假设。落入拒绝区域的概率,就是小概率,一般用显著性水平表示。,上一页,下一页,返回本节首页,假设检验操作步骤:1构造假设 根据研究问题的需要提出原假设和备择假设。在统计的假设检验中,总是原假设Ho(或)估计值,相应的备择假设用Ha,“”估计值。2确定检验的统计量及其分布假设确定以后,决定是否拒绝原假设需根据某一统计量出现的数值,从概率意义上来判断,这取决于样本观察值。对于均值检验来说,当总体方差已知时,或大样本条件下,现象服从正态分布,可选用z统计量;如果在总体标准差未知,且小样本情况下,现象服从t分布,则选择 t 统计量。,上一页,下一页,返回本节首页,3确定显著性水平确定显著性水平

10、以后,拒绝区域也就随之而定。如果拒绝区域放在两侧,则称为双侧检验或双尾检验,两边各为a/2。如果拒绝区域放在曲线一侧,称为单侧检验或单尾检验。显著性水平性的大小可根据研究问题所需要的精确程度和可靠程度而定。,上一页,下一页,返回本节首页,4确定决策规则 决策规则通常有两种方法。一种是临界值法,即统计量与临界值z或 t进行比较,通常对于双侧检验,统计量绝对值大于临界值便拒绝原假设,小于临界值便不能拒绝原假设。另一种是P值法,它是将统计量所计算的z值或t值转换成概率P,然后与显著性水平进行比较。Pa,不能拒绝Ho,说明所采用的检验方法不能证明样本所描述的总体与原假设所描述的总体具有显著差异。,上一

11、页,下一页,返回本节首页,5判断决策在确定决策规则之后,就根据抽样观察结果,计算检验统计量的具体数值,按照决策规则作出统计决策。,上一页,下一页,返回本节首页,5.2 总体标准差已知条件下均值双侧检验,5.2.1 构造检验统计量 5.2.2 P值法 5.2.3 临界值法,上一页,下一页,返回本章首页,5.2.1 构造检验统计量,例 某企业购买金属板供应商声称金属板的厚度渐近服从正态分布,其总体均值为15毫米,总体标准差为0.1毫米。该企业随机抽取了50张金属板作为样本,测得样本均值为14.982毫米。以0.05显著性水平,能否证明供应商提供的总体均值是正确的。,上一页,下一页,返回本节首页,提

12、出假设:原假设:Ho:=15;备择假设:Ha:15。统计量:由于总体服从正态分布且总体标准差已知,选z作为统计量。又因为如果样本均值显著大于或小于15,都拒绝原假设,故该检验是双侧检验。确定显著性水平:根据题意可知显著性水平为a=0.05。,上一页,下一页,返回本节首页,决策规则 根据显著性水平可得下图。从图可以看出,临界值为1.96,所以,统计量绝对值如果大于1.96,则落入拒绝区域,拒绝原假设。同样,如果统计量的P值小于,则落入拒绝区域,拒绝原假设。,上一页,下一页,返回本节首页,进行假设检验:打开“第5章 假设检验.xls”工作簿,选择“z双侧检验”工作表如图所示。,上一页,下一页,返回

13、本节首页,在单元格B4中输入总体均值15,单元格B5输入标准差0.1,在单元格E4中输入14.982,在单元格E6输入样本容量50。在单元格B6输入公式“=B3/SQRT(E3)”,计算标准误差,显示的值将是0.014142。在单元格B9中输入显著性水平0.05。在单元格E10中,输入计算统计量z值的公式“=(E2-B2)/B4”,显示值为-1.27279。要判断是否拒绝原假设,可以使用两种方法,一种是应将统计量z值转换成概率的P值法,另一种是将显著性水平转换成一个z值的临界值法。,上一页,下一页,返回本节首页,5.2.2 P值法,P值法是将统计量z值转换成概率,即大于统计量z的绝对值的概率。

14、下图中阴影区域的面积和即为该概率。,上一页,下一页,返回本节首页,Excel的标准正态分布函数NORMSDIST可被用来计算这个面积,返回小于已知标准正态变量的概率。如果变量值是负1.2729,则标准正态分布函数NORMSDIST返回密度函数图中左侧阴影区域的面积;如果变量值为正1.27279,则NORMSDIST中将返回这个值左边区域的面积。它等于1减去密度函数图中右侧阴影部分的概率。此题所要求的是双侧阴影区域的面积,可以把由-1.27279所计算的概率加倍,即可得到该值。,上一页,下一页,返回本节首页,在单元格E9中输入公式“=2*NORMSDIST(-ABS(E10)”,回车后得0.20

15、3092。如果P值小于显著性水平,则拒绝原假设;否则,不能拒绝原假设。本例中P值是0.203092,大于显著性水平0.05,所以不能拒绝原假设。选择单元格B13,打开“插入”菜单中“函数”选项,打开“粘贴函数”对话框如图所示。,上一页,下一页,返回本节首页,在“函数分类”列表中选择“逻辑”类,在“函数名”列表中选择条件函数IF,单击“确定”按钮,打开条件函数IF对话框如图所示。,上一页,下一页,返回本节首页,在“logical-test”区域中输入“E9B9”在“Value-if-true”区域中输入“拒绝”。在“Value-if-false”区域内,输入“不能拒绝”,单击“确定”键。在单元格

16、B13中显示“不能拒绝”。在这个检验中,“不能拒绝”原假设是因为样本均值与假设总体均值(15)非常接近,它的离差可以通过概率(P值)大于显著性水平来解释。当样本均值为14.982时,它很接近供应商提供的总体金属板的均值,所以经过检验得出的结论是:没有证据证明供应商提供的总体均值是不正确的。,上一页,下一页,返回本节首页,如果样本均值远离15时会怎样解释呢?选择单元格E4并输入14.95,我们会看到统计量z值(用绝对值表示)增加到3.53553,P值减少到0.000407,P值小于显著性水平,此时便可以拒绝原假设。,上一页,下一页,返回本节首页,5.2.3 临界值法,临界值法是将显著性水平转换成

17、临界值,定义“拒绝区域”。落入拒绝区域中的z值的概率等于显著性水平所对应的阴影面积。对于双侧检验来说每个单侧的面积是显著性水平的一半。计算临界值需要使用函数NORMSINV。,上一页,下一页,返回本节首页,选定单元格10,选择“插入”菜单中“函数”选项,打开“粘贴函数”对话框。在“函数分类”列表中选择“统计”类,在“函数名”列表中选择函数“NORMSINV”。单击“确定”按钮,打开函数对话框如图所示。,上一页,下一页,返回本节首页,函数NORMSINV的对话窗口中只有一个参数“Probability”,即小于z值的标准正态分布函数的概率。对于上页图中的下限临界值z来说,这个概率就是左侧区域的面

18、积。因为显著性水平给出的是双侧区域的面积,那么下限临界值z的概率就是它的一半。在“Probability”区域内输入“B9/2”。单击“确定”按钮后,在B10单元格中显示z的下限临界值-1.95996。,上一页,下一页,返回本节首页,选定单元格B10,公式“=NORMSINV(B9/2)”呈现在编辑窗口中,将光标切入编辑窗口,在公式前加上绝对值函数ABS(),得新公式“=ABS(NORMSINV(B9/2)”,敲回车键,得临界值1.95996。将检验统计量和临界值进行比较来决定是否拒绝原假设。如果检验统计量的绝对值小于临界值,则不能拒绝原假设;如果检验统计量的绝对值大于临界值,则拒绝原假设。也

19、可以利用Excel创建公式,自动得出结论。方法如下:,上一页,下一页,返回本节首页,选定单元格B14,选择Excel“插入”菜单中“函数”选项,打开“粘贴函数”对话框在“函数分类”列表中选择“逻辑”类,在“函数名”列表中选择条件函数IF,单击“确定”按钮,打开条件函数IF对话框。在“Logical_test”的区域内输入“E10B10”。输入后,在该区域的右侧将会显示“FALSE”,这是因为E10中数值是1.27279,它小于临界值1.959961。在“Value_if_true”区域中输入“拒绝”。,上一页,下一页,返回本节首页,在“Value_if_false”区域中输入“不能拒绝”,单击

20、“确定”按钮。B13和B14都显示“不能拒绝”。将E4中的样本均值由14.982改为14.95,注意检验统计量变为-3.53553,而临界值的绝对值没变。B13和B14中将显示“拒绝”。当已知时,要完成任何双侧假设检验问题,只需在B4,B5,B9,E4和E5中输入相应的值,Excel中的工作表就可自动完成检验。以下页的问题为例:,上一页,下一页,返回本节首页,例 某企业生产家用磅秤,质量控制检验员想要检查磅秤的精度。当制造工序正常工作时,所有磅秤称量结果的均值为120公斤,标准误差为0.015公斤。质量检查员随机选取了30个磅称并用标准重量对它们进行检测。得到样本均值为120.01公斤。在显著

21、性水平为0.01时,质检员能证明制造工序的工作不正常吗?,上一页,下一页,返回本节首页,原假设和备择假设分别为 Ho:=120,Ha:120。在相应的单元格中输入总体均值,总体标准差,样本容量,样本均值和显著性水平。正确输入后,样本z值是3.651484,P值是0.000261,z的下限临界值是2.575835。结论是拒绝原假设,质检员可以证明制造工序工作不正常。,上一页,下一页,返回本节首页,5.3 案例研究:运输天数单侧检验,某邮递家具公司收到了许多客户关于不按期送货的投诉。该公司怀疑责任在于他们雇用的货物运输公司。货物运输公司保证说它们的平均运输时间不超过24天,标准差为1.5天。家具公

22、司随机抽选50次运输记录,得知样本均值为24.49天试以0.01的显著性水平对货运公司的保证作出判断。,上一页,下一页,返回本章首页,提出假设:原假设:Ho:24;备择假设:Ha:24统计量:由于总体标准差已知,所以可以选z作为统计量。又因为如果样本均值大于24,便拒绝原假设,则该检验是单侧检验。确定显著性水平:根据题意可知显著性水平 为a=0.01。,上一页,下一页,返回本节首页,决策规则:根据显著性水平可得下图。从图中可以看出,临界值为2.33,所以,统计量绝对值如果大于2.0537,则落入拒绝区域,需拒绝原假设。同样,如果统计量的P值小于a,则落入拒绝区域,需拒绝原假设。,上一页,下一页

23、,返回本节首页,具体操作过程如下:打开“第5章 假设检验.xls”工作簿,选择“z单侧检验”工作表如图所示。,上一页,下一页,返回本节首页,在单元格B4、B5、E4、E5、B9中分别键入总体均值24、标准差1.5、样本均值24.9、样本容量50和显著性水平0.01。选择单元格E9,输入公式“=(NORMSDIST(-ABS(E10)”。按回车键。正确值显示为0.00000105025。选定单元格B10,输入单侧检验公式“=ABS(NORMSINV(B9)”,按回车键,所显示值将为2.33。单元格B13和B14中都显示“拒绝”,它表明运输公司的保证是不可信的,平均运输时间可能超过24天。假如总体

24、均值为24,从随机抽取的50个样本中,得到的均值为24或更大,如此之高的样本均值是不可能用偶然因素来解释的。,上一页,下一页,返回本节首页,5.4 标准差未知时总体均值的假设检验,在实际工作中,许多假设检验过程并无总体信息,因而需要使用样本标准差S代替总体标准差,这时可用t分布代替标准正态分布进行假设检验。例 某外资银行的一种特定类型的储蓄存款平均为$9350。为拓展业务,银行在异地开设了一家支行,经理想知道该支行的这种类型储蓄的平均存款与$9350是否相同。他随机抽取12个帐户,得到样本均值为$9323,标准差为$80。问以0.05为显著性水平,该经理是否有足够证据证明这家新分支机构平均储蓄

25、不同于$9350。,上一页,下一页,返回本章首页,提出假设:原假设:Ho:=9350;备择假设:Ha:9350。统计量:由于总体标准差未知,可选t作为统计量。又因为如果样本均值大于或小于9350,都拒绝原假设,该检验是双侧检验。确定显著性水平:根据题意可知显著性水平为a=0.05。,上一页,下一页,返回本节首页,决策规则:根据显著性水平可得下图。从图中可以看出,当显著性水平,自由度为11时,t临界值为2.201。所以,统计量t绝对值如果大于2.201,则落入拒绝区域,拒绝原假设。同样,如果统计量的P值小于,即0.025,则落入拒绝区域,拒绝原假设。,上一页,下一页,返回本节首页,具体操作步骤如

26、下:(1)输入数据 打开“第7章 假设检验.xls”工作簿,选择“标准差未知t”工作表如图所示。,上一页,下一页,返回本节首页,在单元格B4中输入总体均值9350,单元格B5中输入标准差80,单元格E4中输入样本均值9323,单元格E5中输入样本容量12,单元格B9中输入显著性水平0.05。单元格B6中的标准误差与单元格E10中的统计量t值自动变化。(2)计算统计量t与P值使用样本标准差代替总体标准差,其计算方法并未改变,因此表中标准误差和检验统计量t的计算是正确的。但是Excel使用的分布函数和对该分布的解释与正态分布不同。,上一页,下一页,返回本节首页,为了确定临界值t,需要通过TINV函

27、数将显著性水平转换成t值,TINV函数可以把已知参数概率解释为图中两个侧面阴影区域的面积。选定单元格B10,选择“插入”菜单中“函数”选项,打开“粘贴函数”对话框。在“函数分类”列表中选择“统计”类,在“函数名”列表中选择TINV函数,单击“确定”按钮,打开TINV函数对话框如下页图所示。,上一页,下一页,返回本节首页,TINV函数返回的是已知自由度和双侧概率的t值。虽然Excel能够给出概率等于显著性水平t值,但不能简单把显著性水平作为参数值,要计算单侧临界值,参数值应输入显著性水平的两倍。对于双侧临界值,参数就是显著性水平。,上一页,下一页,返回本节首页,在“Probability”中输入

28、单元格B9,右端将显示0.05。在“Deg_freedom”后输入自由度的表达式,即E5-1,显示为11,在窗口下面显示的t值为2.20986273,单击“确定”按钮,这个值将会显示在单元格B10中。下面根据样本数据计算P值。选定单元格E9,选择“插入”菜单中“函数”选项,打开“粘贴函数”对话框。在“函数分类”列表中选择“统计”类,在“函数名”列表中选择TDIST函数,单击“确定”按钮,打开TDIST函数对话框如图所示。,上一页,下一页,返回本节首页,在“X”中输入E10,参数区的右端将显示1.169。在 Deg_freedom中输入自由度,输入E5-1,右端将显示 11。在Tails中输入2

29、,因为是双侧检验。一旦输入2,P值0.267061将会显现在函数功能对话框的下面。单击“确定”按钮,该值将会出现在单元格E9中。,上一页,下一页,返回本节首页,(3)决策规则在单元格B13中输入公式“=IF(E9B10,拒绝,不能拒绝)”,单击回车键,单元格B14中显示“不能拒绝”。工作表显示“不能拒绝”,即不能拒绝原假设,因此经理有足够证据证明新支行的平均储蓄存款与总部没有什么不同,可以开展业务。,上一页,下一页,返回本节首页,5.5 案例研究:顾客满意度假设检验,例 某公司市场部非常重视调查顾客对其品牌的满意情况,通过加强质量,提高服务,一直使消费者对其品牌的满意程度保持在 0.65的水平

30、上。最近,市场部经理接到一些消费者的抱怨,也得到一些消费者的表扬,这使他对目前的顾客满意程度产生了怀疑,为了掌握市场情况,了解本品牌在市场中的位置,他委托一家市场调查公司在该地区随机抽取了315个有效样本,其中有214人对其品牌表示满意。以0.1为显著性水平,能否证明顾客满意度有所变化。,上一页,下一页,返回本章首页,提出假设:原假设:HO:=0.65;备择假设:Ha:0.65统计量:由于总体比例已知且为大样本,选z为统计量。本题中只关心顾客满意度是否有变化因而是双侧检验。确定显著性水平:根据题意可知显著性水平为:a=0.1。,上一页,下一页,返回本节首页,决策规则:根据显著性水平可得下图。从

31、图中可以看出,临界值的绝对值为1.65,所以,统计量绝对值如果大于1.65,则落入拒绝区域,拒绝原假设。同样,如果统计量的P值小于0.05,则落入拒绝区域,拒绝原假设。,上一页,下一页,返回本节首页,具体操作步骤如下:(1)数据计算打开“第7假设检验.xls”工作簿,选择“比例检验”工作表,如图所示。,上一页,下一页,返回本节首页,确定样本比例是否与原假设一致,就是确定顾客满意度是否等于0.65。样本比例Pi=214/315=0.6794,与原假设比例不一致。所以需要确认样本比例是否是由于随机原因形成的。与总体均值假设检验一样,需要回答下面的问题:“当原假设为真时,样本比例不等于期望比例的概率

32、有多大?”如果该比例P值低于显著性水平,则可认为它不能用随机因素解释,与总体比例具有显著差异,需拒绝原假设;反之,则认为它是随机因素影响的结果,不能拒绝原假设。在单元格B4中输入总体比例值0.65。,上一页,下一页,返回本节首页,在单元格B9中输入显著性水平0.1。在单元格E4中输入样本比例的公式“=214/315”。在单元格E5中输入样本容量n为315。在单元格B5中根据比例标准误差公式:输入标准误差公式“=SQRT(B4*(1-B4)/E5)”,B5中显示0.026874。,上一页,下一页,返回本节首页,在单元格E10中根据公式 输入公式“=ABS(E4-B4)/B5)”,以计算样本 比例

33、z值,结果显示为1.092687。(2)确定临界值确定临界值,需要通过NORMSINV函数将显著性水平转换成z值。在单元格B10中输入公式“=ABS(NORMSINV(B9/2)”得值为1.95995。,上一页,下一页,返回本节首页,(3)计算样本统计量及相应的P值在单元格E9中输入公式“=2*(NORMSDIST(-ABS(E10)”,得值0.274531。(4)决策规则在单元格B13中输入公式“=IF(E9B10,拒绝,不能拒绝)”,单击回车键,单元格B14中显示“不能拒绝”。由于检验结果为不能拒绝,所以尽管顾客存在不同的反映,但不足以影响该公司品牌的整体顾客满意水平。,上一页,下一页,返

34、回本节首页,上一页,下一页,返回本章首页,5.6.1 总体方差假设检验的基本内容5.6.2 方差检验的基本内容 5.6.3 总体方差(或标准差)的双侧检验,5.6 总体方差的假设检验,5.6.1 总体方差假设检验的基本内容,1总体方差检验的基本思想如下页图所示,检验方差的基本思想是:利用样本方差建立一个统计量,并为这个总体方差的统计量构造一个置信区间。这个置信区间包括总体方差的概率是1-a,显著性水平是 a。在确定的水平下,统计量有其固定的拒绝区域,在单侧检验中,拒绝区域分布在统计量的分布曲线的一边;,上一页,下一页,返回本节首页,在双侧检验中,拒绝区域分布在统计量的分布曲线的两边。如果检验统

35、计量大于或等于临界值而落入拒绝区域,或P值小于显著性水平而落入拒绝区域,便拒绝原假设,反之,则不能拒绝原假设。,上一页,下一页,返回本节首页,2方差检验过程(1)提出原假设Ho和备择假设Ha。(2)构造检验统计量:(n-1)在Ho成立的条件下,统计量 服从自由度为n-1 的 分布。,上一页,下一页,返回本节首页,(3)确定显著性水平。(4)规定决策规则。在双侧检验的情况下,拒绝区域在两侧,如果检验统计量大于右侧临界值,或小于左侧临界值,则拒绝原假设。若是单侧检验,拒绝区域分布在一侧,具体左侧还是右侧,可根据备择假设Ha的情况而定。(5)进行判断决策。,上一页,下一页,返回本节首页,5.6.2

36、方差检验的基本内容,例 某公司生产的清洁剂包装净重为64克,尽管每盒净重量存在差异不可避免,但公司还是期望这种差异尽可能的小些。如果净重过大,会增加成本;如果净重过少,会使顾客不满。正常情况下,每盒净重的标准差为1.6克。为了控制生产质量,公司随机抽取了50盒作为样本,测得样本标准差为1.9克,以0.05为显著性水平,公司是否有证据说明清洁剂净重的标准差不超过1.6克。,上一页,下一页,返回本节首页,构建假设:原假设Ho:1.6;备择假设Ha:1.6 选择统计量:由于总体标准差未知,且小样本,选择 作为检验统计量。样本标准差S为1.9克,大于1.6克。所以,样本 标准差与原假设并不一致,需要判

37、断这个差异 是否是由于随机原因所致。这是一个单侧检验。,上一页,下一页,返回本节首页,具体步骤如下:(1)输入数据打开“第7章 假设检验.xls”工作簿,选择“方差检验”工作表,如图所示。,上一页,下一页,返回本节首页,在单元格B4中输入原假设中的总体标准差()1.6,在单元格B5中输入样本标准差1.9,在单元格B6中输入样本容量50,在单元格B9中输入显著性水平0.05。(2)计算检验 统计量及其对应P值和右侧 临界值 根据公式:在单元格E9中输入公式“=(B52*(B6-1)/B42”,计算检验统计量 值,在单元格E9中显示的值为 69.09766。,上一页,下一页,返回本节首页,选择单元

38、格E10,选择“插入”菜单,从中选择“函数”选项,打开“粘贴函数”对话框。在“函数分类”列表中选择“统计”,在“函数名”列表中选择函数CHIDIST,单击“确定”按钮,打开CHIDIST对话框如图所示。,上一页,下一页,返回本节首页,在“X”中输入E9;在“Deg_freedom”中输入B6-1,单击“确定”按钮。显示P值为0.030749。如图所示:,上一页,下一页,返回本节首页,下面计算单侧右侧 临界值。选择单元格B10,打开“插入”菜单,从中选择“函数”选项,打开“粘贴函数”对话框。在“函数分类”列表中选择“统计”,在“函数名”列表中选择函数CHIINV,单击“确定”按钮,打开函数CHI

39、INV对话框如图所示。,上一页,下一页,返回本节首页,在“Probability”中输入B9,显著性水平为0.05,在“Deg_freedom”中,输入自由度B6-1,单击“确定”按钮,计算结果 临界值为66.33865,显示在单元格B10中。(3)使用条件函数IF进行决策判断在单元格B16,打开“插入”菜单,从中选择“函数”选项,打开“粘贴函数”对话框。,上一页,下一页,返回本节首页,在“函数分类”列表中选择“逻辑”,在“函数名”列表中选择条件函数IF,单击“确定”按钮,打开条件函数IF对话框如下图所示。,上一页,下一页,返回本节首页,在“Logical_test”输入“E10=B9”,表示

40、当单元格E10 中的P值小于单元格B9中显著性水平时,结果为真。在“Value_if_true”输入“拒绝”,表示结果为真时便拒 绝原假设。在“Value_if_false”输入“不能拒绝”表示结果为假时不能拒绝原假设。单击“确定”按钮,显示结果为“拒绝”。检验也可以使用临界值法。选择单元格B17,输入公式“=IF(B10=E9,拒绝,不能拒绝)”,按回车键,显示“拒绝”。,上一页,下一页,返回本节首页,拒绝区域是位于66.33865以上的区域,由于样本统计量 值69.09766大于临界值66.33865,所以样本统计量 值在拒绝区域中。由于本问题中拒绝原假设,所以结论是:该公司有证据说明清洁

41、剂净重的标准差不小于1.60克。,上一页,下一页,返回本节首页,5.6.3 总体方差(或标准差)的双侧检验,例 继上例,若在0.05的显著性水平下,该公 司可否证明洗洁剂净重标准差不是1.60克?这是一个双侧检验问题。原假设为Ho:=1.6,备择假设为Ha:1.6.,上一页,下一页,返回本节首页,打开“第5章 假设检验.xls”工作簿,选择“方差检验”工作表。在单元格E11中输入公式“=2*E10”,将单元格E10的值加倍。选定单元格B18,输入公式“IF(E110.05,所以不能拒绝原假设。,上一页,下一页,返回本节首页,用临界值法可以得出相同的结论。在本题中显著 性水平为0.05,左侧卡方

42、临界值cL2和右侧卡方临 界值cR2位于分布两侧,两侧面积相等,之和为 0.05。利用函数CHINV可以根据右侧面积与左侧 面积得出每个临界值。右侧卡方临界值右侧部分 的面积(cR2)为0.025,是显著性水平的一半,左 侧卡方临界值cL2右侧部分的面积为1减去显著性 水平的另一半(即为1-0.025=0.975)。,上一页,下一页,返回本节首页,选择单元格B12,输入公式“=CHIINV(B9/2,B6-1)”,按回车键,得双侧右侧cR2 临界值为70.22236。选择单元格B13,输入公式“=CHIINV(1-B9/2,B6-1)”,按回车键,得双侧左侧 cL2 临界值为31.55493。由于样本卡方值69.0976介于两个临界值之间,不在拒绝区域中,所以不能拒绝原假设。,上一页,下一页,返回本节首页,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号