第6章参数估计与假设检验课件.ppt

上传人:小飞机 文档编号:2109381 上传时间:2023-01-11 格式:PPT 页数:54 大小:778.99KB
返回 下载 相关 举报
第6章参数估计与假设检验课件.ppt_第1页
第1页 / 共54页
第6章参数估计与假设检验课件.ppt_第2页
第2页 / 共54页
第6章参数估计与假设检验课件.ppt_第3页
第3页 / 共54页
第6章参数估计与假设检验课件.ppt_第4页
第4页 / 共54页
第6章参数估计与假设检验课件.ppt_第5页
第5页 / 共54页
点击查看更多>>
资源描述

《第6章参数估计与假设检验课件.ppt》由会员分享,可在线阅读,更多相关《第6章参数估计与假设检验课件.ppt(54页珍藏版)》请在三一办公上搜索。

1、第六章,参数估计和假设检验,第六章参数估计和假设检验,统计学的基本内容,描述 统计,推断 统计,数据描述性分析时间数列分析指数分析,参数估计假设检验,描述统计是推断统计的前提,推断统计是描述统计的发展。,统 描述 推断数据描述性分析参数估计描述统计是推断统计的前提,随机原则,总体,参数,统计量,参数估计,假设检验,抽样分布,概 分率 布,理 基论 础,容量 均值 方差 标准差 成数 总体参数样本统计量,随机原则总体样本参数统计量参数估计假设检验抽样分布概 分理,第一节 抽样分布,一、简单随机样本的性质,无限总体,有限总体,放 回,不放回,样本,不放回,放回,样本,样本,同分布且独立,同分布但不

2、独立,几种常用的分布,第一节 抽样分布一、简单随机样本的性质无限总体有限总体放,统计量:样本指标,不依赖与任何未知参数。,样本均值,样本成数,样本方差,二、统计量与抽样分布,抽样分布:某一统计量所有可能取值的概率分布,数字特征,均值,方差,统计量:样本指标,不依赖与任何未知参数。样本均值样本成数样本,(一)样本均值的抽样分布,1、样本均值的数字特征,有限总体的校正系数,当N很大时,简化为,当抽样比 时可忽略不计。,抽样误差,(一)样本均值的抽样分布1、样本均值的数字特征 抽,正态总体的样本均值的分布,由正态分布的性质知,样本均值也服从正态分布,标准化,非正态总体或总体分布未知的样本均值的分布,

3、根据中心极限定理,当样本容量足够大时()不管总体分布如何,样本均值的抽样分布总可以看作是正态分布。,标准化,2、样本均值的抽样分布,正态总体的样本均值的分布由正态分布的性质知,样本均值也服从正,(二)样本成数的抽样分布,1、样本成数的数字特征,实质上是总体“是非标志”的均值总体“是非标志”的方差为,(二)样本成数的抽样分布1、样本成数的数字特征 抽,根据中心极限定理,当样本容量足够大时(、),不管总体分布如何,样本成数的抽样分布总可以看作是正态分布。,标准化,2、样本成数的抽样分布,根据中心极限定理,当样本容量足够大时(、,第二节 参数估计,直接用某一个样本的指标值 作为总体未知参数 的估计值

4、,根据给定可靠程度的要求,估计总体未知参数 所在的可能区间,参数估计,点估计,区间估计,第二节 参数估计直接用某一个样本的指标值,一、点估计,无偏性,有效性,一致性,1、点估计的优良性标准,一、点估计无偏性有效性一致性1、点估计的优良性标准,数理统计证明:,点估计的不足是不能反映估计的误差和精确程度,但一个优良的点估计量为区间估计提供了基础,决定了区间的位置。,是 的无偏、有效、一致估计量,是 的无偏、有效、一致估计量,2、点估计的评价,数理统计证明:点估计的不足是不能反映估计的误差和精确程度,,二、区间估计,在一定的置信度 的保证下,利用抽样分布理论,确定参数的置信区间。,称为参数 的置信度

5、为 的置信区间,置信区间包括置信度和精确度两个方面,置信度:随机区间 包含 的概率,越大越好,精确度:随机区间 长度,越短精确度越好,样本容量一定时,置信度和精确度是一对矛盾,在保证置信度的前提下,尽可能提高精确度。,二、区间估计在一定的置信度 的保证下,利用抽样分布理论,(一)总体均值的置信区间,标准化,1、正态总体,方差已知,为了使置信区间长度最小,将事先给定的置信度 对称分配到分布的两侧,0,(一)总体均值的置信区间标准化1、正态总体,方差已知为了使置,为样本均值的抽样误差,的置信度 的置信区间为:,为抽样极限误差,表明在给定置信度的条件下对总体均值进行区间估计所允许的最大误差。,为样本

6、均值的抽样误差的置信度 的置信区间为:,2、正态总体,方差未知(小样本),0,2、正态总体,方差未知(小样本)0,的置信度 的置信区间为:,的置信度 的置信区间为:,3、非正态总体(大样本),在总体方差已知条件下,根据 分布进行区间估计,可得 的置信度为 的置信区间为:,在总体方差未知条件下,以 代替 根据 分布进行区间估计,可得 的置信度为 的置信区间为:,3、非正态总体(大样本)在总体方差已知条件下,根据 分布进,(二)总体成数的置信区间,标准化,的置信度 的置信区间为:,为待估参数,以样本 代替,例题,(二)总体成数的置信区间标准化的置信度 的置信区间为:,三、样本容量的确定,样本容量一

7、定时,置信度与精确度不能同时满足;在给定置信度 的前提下,通过样本容量的改变来确保一定的估计精确度。,在总体均值的估计中,在总体成数的估计中,三、样本容量的确定样本容量一定时,置信度与精确度不能同时满足,第三节 假设检验,一、假设检验的基本原理,基本思路:假设检验就是事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断该假设是否成立。,逻辑推理方法:反证法,先假定原假设正确,然后对样本值与原假设的差异进行分析:,如果有充分的理由证明这种差异完全是由于样本的随机性引起的(差异不显著),就接受原假设(一般很难);,反之,如果有充分的理由证明这种差异并非完全是由于样本的随机性引起的(差异是显

8、著的),就否定原假设(较有说服力)。,第三节 假设检验一、假设检验的基本原理基本思路:假设检验就,基本思想:小概率原理,小概率原理:小概率事件在一次试验中几乎不可能发生,如果对总体所作的某种假设是真的,那么样本值与原假设出现显著性差异的概率是很小的。如果在某一次随机抽样中,显著性差异竟然出现了,我们就有理由怀疑这一假设的真实性,拒绝这一假设。,总 体(某种假设),抽 样,样 本(观察结果),检 验,接 受,拒 绝,小概率事件未 发 生,小概率事件发 生,基本思想:小概率原理小概率原理:小概率事件在一次试验中几乎不,假设检验的显著性差异,假设检验的显著性差异是一定的显著性水平下的差异,显著性水平

9、是出现显著性差异的概率,在检验之前事先给定,假设检验又称为显著性检验。,以总体均值的检验为例说明,u,样本均值落在非阴影区间内的概率为(大概率),认为该差异是由于样本的随机性引起(有 的可靠程度的保证),样本均值落在阴影区间内的概率为(小概率),认为该差异是显著的,即为显著性水平,假设检验的显著性差异假设检验的显著性差异是一定的显著性水平下,二、假设检验规则(以总体均值检验为例),(一)提出总体的假设,原假设 H0备择假设H1(与原假设相对立的假设),在实际问题中,为了通过样本信息对总体某一假设取得强有力的支持,通常把这种假设本身作为备择假设,对这一假设的否定作为原假设。,二、假设检验规则(以

10、总体均值检验为例)(一)提出总体的假设,(二)检验规则的制定(正态总体方差已知双侧检验),0,标准化,H0为真时,检验统计量,(二)检验规则的制定(正态总体方差已知双侧检验)0标准化H0,(三)两类错误,在样本容量一定时,不能同时减少两类错误!力求在控制前提下减少。,原假设正确时却被检验规则否定了,这类错误称为弃真错误或第一类错误(发生的概率记为)。,原假设本来不正确而检验规则却接受了原假设,这类错误称为取伪错误或第二类错误(发生的概率为)。,(三)两类错误在样本容量一定时,不能同时减少两类错误!力求,(四)检验步骤,建立总体假设H0,H1,抽样得到样本观察值,1,2,根据H0为真时的统计量抽

11、样分布选择检验统计量,4,根据具体决策要求确定,确定分布上的临界点值及检验规则,计算检验统计量的数值,比较并作出检验判断,7,3,6,5,(四)检验步骤建立总体假设抽样得到样124根据具体决策确定分,三、假设检验与置信区间,当假设检验在 水平下接受H0,则 的置信度为 的置信区间必定包含,当假设检验在 水平下拒绝H0,则 的置信度为 的置信区间必定不包含,可通过构造 的置信度为 的置信区间来检验总体的假设,当 在该置信区间内时,接受H0;当 不在该置信区间内时,拒绝H0。,三、假设检验与置信区间当假设检验在 水平下接受H0,,四、几种常见的假设检验,(一)总体均值的检验,四、几种常见的假设检验

12、(一)总体均值的检验,构造检验统计量,1、正态总体,方差已知,检验规则,双侧检验,左侧检验,右侧检验,图示,构造检验统计量1、正态总体,方差已知检验规则双侧检验左侧检验,构造检验统计量,2、正态总体,方差未知,检验规则,双侧检验,左侧检验,右侧检验,构造检验统计量2、正态总体,方差未知检验规则双侧检验左侧检验,方差已知时,3、非正态总体(必须是大样本),方差未知时,检验规则同正态总体方差已知的情况,方差已知时3、非正态总体(必须是大样本)方差未知时检验规则同,(二)总体成数的检验,构造检验统计量,检验规则(同正态总体的均值检验),例题,(二)总体成数的检验构造检验统计量检验规则(同正态总体的均

13、值,正态分布,=1,正态分布的标准化,a,b,x,f(x),几种常见的分布,正态分布=1 正态分布的标准化abxf(x,分布,设随机变量 皆服从,且相互独立,则随机变量 服从自由度为n的 分布,并记为,x,f(x),分布一般为正偏态分布,但随着自由度n的增大,曲线趋向于正态分布。,几种常见的分布,分布设随机变量,t 分布,设随机变量,且X与Y相互独立,则随机变量 服从自由度为n的t分布,并记为,t分布是均值为0的对称钟形分布,但与标准正态分布相比,中心较低尾部较高,随着自由度n的增大,曲线趋向于标准正态分布。,t(11),t(15),x,f(x),返回,几种常见的分布,t 分布设随机变量,【例

14、1】某种零件长度服从正态分布,从该批产品中随机抽取件,测得其平均长度为21.4 mm。已知总体标准差=0.15mm,试建立该种零件平均长度的置信区间,给定置信水平为0.95。,因此,我们可以95的概率保证该种零件的平均长度在21.3021.50 mm之间。,解:由题意,正态总体方差已知,总体均值的置信区间为,下页,区间估计例题,已知,【例1】某种零件长度服从正态分布,从该批产品中随机抽取件,,52 59 11 54 44 50 12 58 55 54 13 60 44 62 14 62 45 10 46 15 63,职员 时间 职员 时间 职员时间,根据上述资料建立置信度为95的总体均值的区间

15、估计(假定培训时间总体服从正态分布),【例2】谢尔工业公司拟采用一项计算机辅助程序来培训公司的维修人员,以减少培训工人所需要的时间。为了评价这种培训方法,生产经理需要对这种程序所需要的平均时间进行估计。以下是利用新方法对15名职员进行培训的培训天数资料。,解答,区间估计例题,52 59,解:由题意,正态总体方差未知,且为小样本(15)时,总体均值的置信区间为,根据已知资料可计算,,因此,我们可以95的概率保证该种程序所需要的平均时间在50.0957.65 天之间。,下页,区间估计例题,解:由题意,正态总体方差未知,且为小样本(15)时,根据,【例3】某大学从该校学生中随机抽取100人,调查到他

16、们平均每天参加体育锻炼的时间为26分钟。试以95的置信水平估计该大学全体学生平均每天参加体育锻炼的时间(已知总体方差为6分钟)。,解:由题意,总体分布未知方差已知,且为大样本(100)时,总体均值的置信区间为,因此,我们可以95的概率保证该校学生平均每天参加体育锻炼的时间在24.8227.18 分钟之间。,已知,下页,区间估计例题,【例3】某大学从该校学生中随机抽取100人,调查到他们平均每,192021222324252627,投保人,473136394645393845,年龄,343934354253284939,28 2930313233343536,274354363448233642

17、,101112131415161718,325040243344454844,123456789,年龄,投保人,年龄,投保人,年龄,投保人,【例4】斯泰特怀特保险公司每年都要对人寿保险单进行审查,现公司抽取36个寿保人作为一个简单随机样本,得到关于投保人年龄、保费数量等项目的资料。为了便于研究,某位经理要求了解寿险投保人总体平均年龄的90%的区间估计。,解答,区间估计例题,19投保人47年龄3428 2710321年龄投保人年龄投保,解:由题意,总体分布未知方差未知,且为大样本(36)时,总体均值的置信区间为,根据已知资料可计算,,因此,我们可以90的概率保证该公司寿险投保人总体平均年龄在37

18、.3641.64 岁。,下页,区间估计例题,解:由题意,总体分布未知方差未知,且为大样本(36)时,,【例5】某企业在一项关于职工流动原因的研究中,从该企业前职工总体中随机选取了200人组成一个样本。在对其进行访问时,有140人说他们离开该企业是由于同管理人员不能融洽相处。试对由于这种原因而离开该企业的人员的真正比例构造95%的置信区间。,解:由题意,,总体成数p的置信区间为,因此,我们可以95的概率保证该企业职工由于同管理人员不能融洽相处而离开的比例在0.640.76之间。,返回,区间估计例题,【例5】某企业在一项关于职工流动原因的研究中,从该企业前职工,双侧检验,拒绝域,拒绝域,接受域,左

19、侧检验,拒绝域,接受域,右侧检验,拒绝域,接受域,检验规则图解,返回,双侧检验拒绝域拒绝域接受域左侧检验拒绝域接受域右侧检验拒绝域,【例1】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0.081mm,总体标准差=0.025mm。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(0.05),解答,假设检验例题,【例1】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭,1、提出原假设和备择假设:,2、确定检验统计量并计算数值,3、给定显著性水平确定检验规则,4、作出

20、结论,拒绝 H0,也即新机床加工零件的椭圆度的均值与以前有显著差异。,下页,解:,假设检验例题,1、提出原假设和备择假设:2、确定检验统计量并计算数值3、给,【例2】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?,解答,假设检验例题,【例2】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分,1、提出原假设和备择假设:,2、确定检验统计量并计算数值,3、给定显著性水平确定检验规则,4、作出结论,拒绝 H0,也即这批灯泡的使用

21、寿命有明显提高。,解:,假设检验例题,下页,1、提出原假设和备择假设:2、确定检验统计量并计算数值3、给,【例3】如果机场的总体平均质量等级得分大于7分,那么就可以认为该机场提供的服务质量为优良。现随机抽取了12个乘客作为样本,得到伦敦某机场的质量等级分数如下:7、8、10、8、6、9、6、7、7、8、9、8。假定总体的等级近似服从正态分布,在0.05的显著性水平下可以认为该机场服务质量优良吗?,解答,假设检验例题,【例3】如果机场的总体平均质量等级得分大于7分,那么就可以认,1、提出原假设和备择假设:,2、确定检验统计量并计算数值,3、给定显著性水平确定检验规则,4、作出结论,拒绝 H0,也

22、即认为该机场提供了优良的服务。,下页,解:,假设检验例题,根据已知资料可计算,,1、提出原假设和备择假设:2、确定检验统计量并计算数值3、给,【例4】某市的一家公司生产一种新型的轮胎,这种新型轮胎的设计规格是平均行驶里程至少为28000英里。随机抽取了30只轮胎作为一个样本进行检验。结果,样本均值为27500英里,样本标准差是1000英里。采用0.05的显著性水平,检验是否有足够的证据拒绝轮胎的平均行驶里程至少为28000英里的陈述。,解答,假设检验例题,【例4】某市的一家公司生产一种新型的轮胎,,1、提出原假设和备择假设:,2、确定检验统计量并计算数值,3、给定显著性水平确定检验规则,4、作

23、出结论,拒绝 H0,也即不能接受该公司关于轮胎的陈述。,下页,假设检验例题,解:,1、提出原假设和备择假设:2、确定检验统计量并计算数值3、给,【例5】过去的几个月中,在松树溪打高尔夫球的人中有20%是女性。为了提高女性高尔夫球手的比例,球场采取了一项特殊的激励措施来吸引女性。一周以后,随机抽取了400名球手作为一个样本,结果有300名男性和100名女性。课程经理想知道这些数据是否支持他们的结论?(0.05),解答,假设检验例题,【例5】过去的几个月中,在松树溪打高尔夫球的人中有20%是女,1、提出原假设和备择假设:,2、确定检验统计量并计算数值,3、给定显著性水平确定检验规则,4、作出结论,拒绝 H0,即可认为女性球手的比例有所增加。,返回,假设检验例题,解:,1、提出原假设和备择假设:2、确定检验统计量并计算数值3、给,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号