统计学第八章ppt课件.ppt

上传人:牧羊曲112 文档编号:1467698 上传时间:2022-11-28 格式:PPT 页数:82 大小:1.43MB
返回 下载 相关 举报
统计学第八章ppt课件.ppt_第1页
第1页 / 共82页
统计学第八章ppt课件.ppt_第2页
第2页 / 共82页
统计学第八章ppt课件.ppt_第3页
第3页 / 共82页
统计学第八章ppt课件.ppt_第4页
第4页 / 共82页
统计学第八章ppt课件.ppt_第5页
第5页 / 共82页
点击查看更多>>
资源描述

《统计学第八章ppt课件.ppt》由会员分享,可在线阅读,更多相关《统计学第八章ppt课件.ppt(82页珍藏版)》请在三一办公上搜索。

1、,8.1 假设检验的基本问题,假设问题的提出,什么是假设?(hypothesis), 对总体参数的的数值所作的一种陈述总体参数包括总体均值、比例、方差等分析之前必需陈述,什么是假设检验? (hypothesis testing),事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立有参数假设检验和非参数假设检验采用逻辑上的反证法,依据统计上的小概率原理,假设检验的流程提出假设确定适当的检验统计量规定显著性水平计算检验统计量的值作出统计决策,提出原假设和备择假设, 什么是原假设?(null hypothesis)待检验的假设,又称“0假设”研究者想收集证据予以反对的假设3.

2、总是有等号 , 或4.表示为 H0H0: 某一数值 指定为 = 号,即 或 例如, H0: 3190(克), 什么是备择假设?(alternative hypothesis)与原假设对立的假设,也称“研究假设”研究者想收集证据予以支持的假设总是有不等号: , 或 表示为 H1H1: 某一数值,或 某一数值例如, H1: 3910(克),或 3910(克),提出原假设和备择假设,一项新的减肥计划声称:在计划实施第一周内,参加者体重平均至少可以减少8磅。随机抽取40位参加该项计划的样本,结果显示:样本的体重平均减少7磅,标准差为3.2磅,则其原假设和备择假设是( )A. B. C. D.,假设检验

3、中的两类错误(决策风险),假设检验中的两类错误,1.第一类错误(弃真错误)原假设为真时拒绝原假设会产生一系列后果第一类错误的概率为被称为显著性水平2.第二类错误(取伪错误)原假设为假时接受原假设第二类错误的概率为(Beta), 什么是检验统计量?1.用于假设检验决策的统计量2.选择统计量的方法与参数估计相同,需考虑是大样本还是小样本总体方差已知还是未知 3.检验统计量的基本形式为,确定适当的检验统计量,规定显著性水平(significant level), 什么是显著性水平?1.是一个概率值2.原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3.表示为 (alpha)常用的 值有0.01,

4、 0.05, 0.104.由研究者事先确定,作出统计决策,计算检验的统计量根据给定的显著性水平,查表得出相应的临界值z或z/2, t或t/2将检验统计量的值与 水平的临界值进行比较得出拒绝或不拒绝原假设的结论,假设检验中,不拒绝原假设意味着( )A. 原假设肯定是正确的 B. 原假设肯定是错误的C. 没有证据证明原假设是正确的 D. 没有证据证明原假设是错误的,利用P值进行决策,什么是P 值?(P-value),是一个概率值如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积

5、被称为观察到的(或实测的)显著性水平H0 能被拒绝的最小值,双侧检验的P 值,左侧检验的P 值,右侧检验的P 值,利用 P 值进行检验(决策准则),单侧检验若p-值 ,不拒绝 H0若p-值 /2, 不拒绝 H0若p-值 /2, 拒绝 H0,双侧检验和单侧检验,双侧检验与单侧检验 (假设的形式),双侧检验(原假设与备择假设的确定),属于决策中的假设检验不论是拒绝H0还是不拒绝H0,都必需采取相应的行动措施例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立建立的原假设与备择假设应为 H0: = 10 H1:

6、10,双侧检验(显著性水平与拒绝域 ),单侧检验(显著性水平与拒绝域),8.2 一个总体参数的检验,一个总体参数的检验,总体均值检验,总体均值的检验(检验统计量),总体 是否已知?,总体均值的检验 (2 已知或2未知大样本),1.假定条件总体服从正态分布若不服从正态分布, 可用正态分布来近似(n30)使用Z-统计量2 已知:2 未知:,2 已知均值的检验(例题分析),【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为= 0.025 。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问

7、新机床加工零件的椭圆度的均值与以前有无显著差异?(0.05),双侧检验,2 已知均值的检验 (例题分析),H0: = 0.081H1: 0.081 = 0.05n = 200临界值(s):,检验统计量:,决策:,结论:,在 = 0.05的水平上拒绝H0,有证据表明新机床加工的零件的椭圆度与以前有显著差异,2 已知均值的检验 (P 值的计算与应用),第1步:进入Excel表格界面,选择“插入”下拉菜单第2步:选择“函数”点击第3步:在函数分类中点击“统计”,在函数名的菜 单下选择字符“NORMSDIST”然后确定第4步:将Z的绝对值2.83录入,得到的函数值为 0.997672537 P值=2(

8、10.997672537)=0.004654 P值远远小于,故拒绝H0,2 已知均值的检验 (小样本例题分析),【例】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(0.05),单侧检验,2 已知均值的检验 (小样本例题分析),H0: 1020H1: 1020 = 0.05n = 16临界值(s):,检验统计量:,在 = 0.05的水平上拒绝H0,有证据表明这批灯泡的使用寿命有显著提高,决策:,结论:,2 未知大样本均值的检验

9、 (例题分析),【例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准? (0.05),单侧检验,2 未知大样本均值的检验 (例题分析),H0: 1200H1: 1200 = 0.05n = 100临界值(s):,检验统计量:,在 = 0.05的水平上不拒绝H0,不能认为该厂生产的元件寿命显著地高于1200小时,决策:,结论:,总体均值的检验 (2未知小样本),1.假定条件总体为正态分布2未知,

10、且小样本2.使用t 统计量,2 未知小样本均值的检验 (例题分析),【例】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。,双侧检验,2 未知小样本均值的检验 (例题分析),H0: = 5H1: 5 = 0.05df = 10 - 1 = 9临界值(s):,检验统计量:,在 = 0.05的水平上拒绝H0,说明该机器的性能不好,决策:,结论:,2 未知小样本均值的检验 (P 值的计算与应用),第1步:进入Excel表格界面,选择“插入”下拉菜单第2步:选择“函数”点击

11、,并在函数分类中点击“统 计” ,然后,在函数名的菜单中选择字符 “TDIST”,确定第3步:在弹出的X栏中录入计算出的t值3.16 在自由度(Deg-freedom)栏中录入9 在Tails栏中录入2,表明是双侧检验(单测 检验则在该栏内录入1) P值的结果为0.011550.025,拒绝H0,2 未知小样本均值的检验 (例题分析),【例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,

12、该制造商的产品同他所说的标准相符?( = 0.05),单侧检验!,均值的单尾 t 检验 (计算结果),H0: 40000H1: 40000 = 0.05df = 20 - 1 = 19临界值(s):,检验统计量:,在 = 0.05的水平上不拒绝H0,不能认为制造商的产品同他所说的标准不相符,决策:,结论:,总体比例的检验(Z 检验),一个总体比例检验,假定条件有两类结果总体服从二项分布可用正态分布来近似比例检验的 Z 统计量,0为假设的总体比例,一个总体比例的检验 (例题分析),【例】一项统计结果声称,某市老年人口(年龄在65岁以上)的比重为14.7%,该市老年人口研究会为了检验该项统计是否可

13、靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法?(= 0.05),双侧检验,一个总体比例的检验 (例题分析),H0: = 14.7%H1: 14.7% = 0.05n = 400临界值(s):,检验统计量:,在 = 0.05的水平上不拒绝H0,该市老年人口比重为14.7%,决策:,结论:,总体方差的检验(2 检验),方差的卡方 (2) 检验,检验一个总体的方差或标准差假设总体近似服从正态分布检验统计量,方差的卡方 (2) 检验(例题分析),【例】某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升(1000cm3)的

14、饮料误差上下不超过1cm3。如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随机抽取25瓶,分别进行测定(用样本减1000cm3),得到如下结果。检验该机器的性能是否达到设计要求 (=0.05),绿色健康饮品,绿色健康饮品,双侧检验,方差的卡方 (2) 检验(例题分析),H0: 2 = 1H1: 2 1 = 0.05df = 25 - 1 = 24临界值(s):,统计量:,在 = 0.05的水平上不拒绝H0,不能认为该机器的性能未达到设计要求,决策:,结论:,8.3 两个总体参数的检验,两个正态总体参数的检验,独立样本总体均值之差的检验,两个总体均值之差的检验 (12、 22

15、已知),1.假定条件两个样本是独立的随机样本两个总体都是正态分布若不是正态分布, 可以用正态分布来近似(n130和 n230)检验统计量为,两个总体均值之差的检验 (假设的形式),两个总体均值之差的检验 (例题分析),双侧检验!,【例】有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样本,样本量分别为n1=32,n2=40,测得x1= 50公斤,x2= 44公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别? ( = 0.05),两个总体均值之差的检验

16、 (例题分析),H0: 1- 2 = 0H1: 1- 2 0 = 0.05n1 = 32,n2 = 40临界值(s):,检验统计量:,决策:,结论:,在 = 0.05的水平上拒绝H0,有证据表明两种方法生产的产品其抗拉强度有显著差异,两个总体均值之差的检验 (12、 22 未知且不相等,小样本),检验具有不等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知且不相等12 = 22检验统计量,其中:,两个总体均值之差的检验 (12、 22 未知但相等,小样本),检验具有等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知

17、但相等12 22检验统计量,两个总体均值之差的检验 (例题分析),单侧检验,【例】 “多吃谷物,将有助于减肥。”为了验证这个假设,随机抽取了35人,询问他们早餐和午餐的通常食谱,根据他们的食谱,将其分为二类,一类为经常的谷类食用者(总体1),一类为非经常谷类食用者(总体2)。然后测度每人午餐的大卡摄取量。经过一段时间的实验,得到如下结果:检验该假设 ( = 0.05),两个总体均值之差的检验 (例题分析用统计量进行检验),H0: 1- 2 0H1: 1- 2 0 = 0.05n1 = 15,n2 = 20临界值(s):,检验统计量:,决策:,结论:,在 = 0.05的水平上拒绝H0,没有证据表

18、明多吃谷物将有助于减肥,两个总体均值之差的检验 (例题分析用Excel进行检验),第1步:选择“工具”下拉菜单,并选择“数据分析”选项第2步:选择“t检验,双样本异方差假设”第3步:当出现对话框后 在“变量1的区域”方框内键入数据区域 在“变量2的区域”方框内键入数据区域 在“假设平均差”的方框内键入0 在“(A)”框内键入0.05 在“输出选项”中选择输出区域 选择“确定”,两个匹配(或配对)样本的均值检验,两个总体均值之差的检验(匹配样本的 t 检验),1.检验两个总体的均值配对或匹配重复测量 (前/后)3.假定条件两个总体都服从正态分布如果不服从正态分布,可用正态分布来近似 (n1 30

19、 , n2 30 ),匹配样本的 t 检验 (假设的形式),注:Di = X1i - X2i ,对第 i 对观察值,匹配样本的 t 检验 (数据形式),匹配样本的 t 检验(检验统计量),样本差值均值,样本差值标准差,自由度df nD - 1,统计量,D0:假设的差值,【例】一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5kg以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:,匹配样本的 t 检验 (例题分析),在 = 0.05的显著性水平下,调查结果是否支持该俱乐部的声称?,单侧检验,配对样本的 t 检验(例题分析),

20、配对样本的 t 检验 (例题分析),差值均值,差值标准差,H0: m1 m2 8.5H1: m1 m2 8.5a = 0.05df = 10 - 1 = 9临界值(s):,检验统计量:,决策:,结论:,在 = 0.05的水平上不拒绝H0,不能认为该俱乐部的宣称不可信,配对样本的 t 检验 (例题分析),配对样本的 t 检验 (例题分析用Excel进行检验),第1步:选择“工具” 第2步:选择“数据分析”选项第3步:在分析工具中选择“t检验:平均值的成对二样本分析”第4步:当出现对话框后 在“变量1的区域”方框内键入数据区域 在“变量2的区域”方框内键入数据区域 在“假设平均差”方框内键入8.5

21、 显著性水平保持默认值,两个总体比例之差的检验,1.假定条件两个总体是独立的两个总体都服从二项分布可以用正态分布来近似检验统计量,两个总体比例之差的Z检验,两个总体比例之差的检验(假设的形式),两个总体比例之差的Z检验 (例题分析),单侧检验,【例】对两个大型企业青年工人参加技术培训的情况进行调查,调查结果如下:甲厂:调查60人,18人参加技术培训。乙厂调查40人,14人参加技术培训。能否根据以上调查结果认为乙厂工人参加技术培训的人数比例高于甲厂?( = 0.05),两个总体比例之差的Z检验 (例题分析),H0: 1- 2 0H1: 1- 2 0 = 0.05n1 = 60,n2 = 40临界

22、值(s):,检验统计量:,决策:,结论:,在 = 0.05的水平上不拒绝H0,没有证据表明乙厂工人参加技术培训的人数比例高于甲厂,两个总体方差比的检验,两个总体方差比的检验(F 检验),假定条件两个总体都服从正态分布,且方差相等两个独立的随机样本假定形式H0:s12 = s22 或 H0:s12 s22 (或 ) H1:s12 s22 H1:s12 )检验统计量F = S12 /S22F(n1 1 , n2 1),两个总体方差的 F 检验(临界值),两个总体方差的 F 检验 (例题分析),H0: 12 = 22 H1: 12 22 = 0.05n1 = 15,n2 = 20临界值(s):,检验统计量:,决策:,结论:,在 = 0.05的水平上不拒绝H0,不能认为这两个总体的方差有显著差异,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号