《统计学》课件参数估计.ppt

上传人:小飞机 文档编号:5903696 上传时间:2023-09-01 格式:PPT 页数:47 大小:4.68MB
返回 下载 相关 举报
《统计学》课件参数估计.ppt_第1页
第1页 / 共47页
《统计学》课件参数估计.ppt_第2页
第2页 / 共47页
《统计学》课件参数估计.ppt_第3页
第3页 / 共47页
《统计学》课件参数估计.ppt_第4页
第4页 / 共47页
《统计学》课件参数估计.ppt_第5页
第5页 / 共47页
点击查看更多>>
资源描述

《《统计学》课件参数估计.ppt》由会员分享,可在线阅读,更多相关《《统计学》课件参数估计.ppt(47页珍藏版)》请在三一办公上搜索。

1、参数估计方法,参数估计概述,参数估计在统计估计问题中的地位,统计估计方法,非参数估计,参数估计,点估计,区间估计,统计估计问题的产生,以下情况会导致统计估计问题:需要估计分别类型的问题:在许多实际问题中,总体被理解为我们所研究的某个统计指标,它在一定范围内取值,而且以一定的概率取各种可能的值,从而形成一个概率分布;而这个概率分布往往未知。如为了制定绿色食品的有关规定,需要研究蔬菜中残留农药的分布状况。对这个分布我们知之甚少,甚至不清楚它属于何种类型的分布。需要估计分布参数的问题:有时分布类型已知,如在农民收入调查中,根据实际经验和理论分析,可以断定收入服从正态分布;但分布中的参数未知,需要估计

2、。,统计估计的类别,统计估计问题专门研究由样本估计总体的未知分布或分布中的未知参数。非参数估计和参数估计:直接对总体的未知分布进行估计的问题为非参数估计;当总体分布类型已知,仅需对分布的未知参数进行估计,称为参数估计。,5.3.2 参数估计的方法,点估计、区间估计,估计量:用于估计总体参数的样本统计量。如样本均值、样本比例(成数)、样本方差等;例如:样本均值就是总体均值 的一个估计量。估计值:估计参数时计算出来的统计量的具体值。如果样本均值x=80,则80就是的估计值。注:有时,对估计量和估计值并不刻意区分,都称为估计,根据上下文很容易明确其指代。,估计量与估计值(estimator&esti

3、mated value),随机变量,一个总体参数的估计,参数估计的方法,估 计 方 法,点 估 计,区间估计,点估计(point estimate),做法:用样本估计量的值直接作为总体参数的估计值。例:用样本均值直接作为总体均值的估计;用样本成数直接作为总体成数的估计。例:用两个样本均值之差直接作为总体均值之差的估计。2.缺点:没有考虑抽样误差的大小;没有给出估计值接近总体参数的程度。点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等。,评价估计量的标准,无偏性(unbiasedness),无偏性:估计量(随机变量)的数学期望等于被估计的总体参数中心极限定理证明了:样本平均数和样本

4、成数都满足无偏性。,有效性(efficiency),有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效。,样本平均数比中位数更有效,一致性(consistency),一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数。大数定律已经证明了:样本平均数和样本成数都满足一致性。,区间估计(interval estimate),在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减一个误差范围(即抽样极限误差)而得到的,2.根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如,某班级平均分数在7585之间,置信水平是95%,

5、区间估计的基本原理,区间估计的图示,将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平;表示为(1-;为是总体参数未在区间内的比例常用的置信水平值有 99%,95%,90%。相应的 为0.01,0.05,0.10,置信水平(confidence level),由样本统计量所构造的总体参数的估计区间称为置信区间;统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间。,置信区间(confidence interval),置信区间与置信水平,均值的抽样分布,用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含

6、总体参数的真值;我们只能希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个。,(1-)%区间包含了%的区间未包含,总体参数区间估计的特点:根据给定的概率保证程度的要求,利用实际抽样资料,指出总体被估计值的上限和下限,即指出总体参数可能存在的区间范围,而不是直接给出总体参数的估计值。,总体参数的区间估计必须同时具备的三个要素:点估计值(区间的中心)抽样误差范围(区间的半径)置信水平/概率保证程度(1-),抽样误差范围决定估计的精度而概率保证程度则决定估计的可靠性,5.4 总体均值的区间估计,总体均值的区间估计(正态总体、已知,或非正态总体、大样本)

7、,总体均值的区间估计,假定条件总体服从正态分布,方差()已知若非正态分布,但是大样本(n 30),可近似正态总体均值 在1-置信水平下的置信区间为,重复抽样,不重复抽样,总体均值的区间估计(例题分析),【例】某种零件的长度服从正态分布,从某天生产一批零件中按重复抽样方法随机抽取9个,测得其平均长度为21.4cm。已知总体标准差为=0.15cm。试估计该批零件平均长度的置信区间,置信水平为95%。,该批零件平均长度的置信区间在21.302cm21.498cm之间。,解:已知N(,0.152),n=9,1-=95%,z/2=1.96 总体均值 在1-置信水平下的置信区间为,总体均值的区间估计(例题

8、分析),【例】在某天生产的500袋食品中,按不重复抽样方法随机抽取25袋进行检查,测得平均每袋的重量为996g。已知该种袋装食品的重量服从正态分布,且标准差为20g。试估计该种食品平均重量的置信区间,置信水平为95%。,该种食品平均重量的置信区间为988.35g1003.65g之间。,解:已知N(,202),n=25,1-=95%,z/2=1.96 总体均值 在1-置信水平下的置信区间为,总体均值的区间估计(正态总体、未知、小样本),总体均值的区间估计,1.假定条件总体服从正态分布,且方差()未知小样本(n 30)使用 t 分布统计量,总体均值 在1-置信水平下的置信区间为,t 分布,t分布是

9、类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布。,总体均值的区间估计(例题分析),【例】已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(小时)如下。建立该批灯泡平均使用寿命95%的置信区间。,总体均值的区间估计(例题分析),该种灯泡平均使用寿命的置信区间为1476.8小时1503.2小时。,解:已知N(,2),n=16,1-=95%,t/2=2.131。根据样本数据计算得:,总体均值 在1-置信水平下的置信区间为,5.5 总体比例的区间估计,总体比例的区间估计(大样本,重复

10、抽样),1.假定条件总体服从二项分布可以由正态分布来近似使用正态分布统计量,3.总体比例P在1-置信水平下的置信区间为,总体比例的区间估计(大样本,不重复抽样),1.假定条件总体服从二项分布可以由正态分布来近似使用正态分布统计量,3.总体比例P在1-置信水平下的置信区间为,总体比例的区间估计(例题分析),【例】某城市想要估计下岗职工中女性所占的比例,随机重复抽取了100个下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间。,解:已知 n=100,p65%,z/2=1.96,该城市下岗职工中女性比例的置信区间为55.65%74.35%。,总体比例的区间估计

11、(例题分析),【例】某企业共有职工1000人。企业准备实行一项改革,在职工中征求意见,采取不重复抽样方法随机抽取200人作为样本,调查结果显示,有150人表示赞成该项改革,50人表示反对。试以95%的概率确定赞成改革的人数比例的置信区间。,解:已知 n=100,p75%,z/2=1.96,该企业职工中赞成改革的人数比例的置信区间为69.63%80.37%之间。,区间估计的方法,区间估计的方法,方法一:根据已经给定的抽样误差范围,求F(Z)(1)抽取样本,计算抽样指标,如计算抽样平均数或抽样成数作为相应总体指标的估计值,并计算样本标准差以推算抽样平均误差;(2)根据给定的抽样误差范围,估计总体指

12、标的上、下限;(3)将抽样误差除以抽样平均误差求出概率度Z值,再根据Z值查“正态分布概率表”求出相应的置信度F(Z),并对总体参数做区间估计。,区间估计方法,方法二:根据已给定的置信度要求,来推算抽样极限误差的可能范围。(1)抽取样本,计算抽样指标,如计算抽样平均数或抽样成数作为相应总体指标的估计值,并计算样本标准差以推算抽样平均误差;(2)根据给定的置信度F(Z)要求,求得概率度Z值;(3)根据概率度Z和抽样平均误差来推算抽样极限误差的可能范围,再根据抽样极限误差求出被估计总体指标的上下限,对总体参数做区间估计。,例 题 分 析,例某外贸公司出口一种茶叶,规定每包规格不低于150克,现用不重

13、复抽样方法从中随机抽取1%进行检验,抽检结果如表所示:,要求:(1)以允许误差范围0.2克,估计该批茶叶每包平均重量的区间及其概率保证程度。(2)茶叶包装合格率的误差范围不超过6%,估计包装合格率的区间及其概率保证程度。(3)要求以95.45%的概率保证程度,估计该批茶叶每包平均重量的区间。(4)要求以95.45%的概率保证程度,估计该批茶叶的包装合格率的区间。,解 答,解:要求(1)的计算过程为,上限=150.3+0.2=150.5克 下限=150.3-0.2=150.1克 查概率表:该批茶叶每包平均重量落在区间150.1,150.5克内,概率保证程度为97.91%。,要求(2)的计算过程为:上限 70%+6%76%下限=70%-6%64%,查概率表:t1.32时 该批茶叶的包装合格率落在区间64%,76%内,概率保证程度为81.32%。要求(3)的计算过程为:上限=150.3+0.1734=150.47克下限=150.3-0.1734=150.13克,以95.45%的概率保证程度估计该批茶叶每包平均重量在区间150.13,150.47内。要求(4)的计算过程为:上限=70%+9.12%79.12%下限=70%-9.12%61.88%以95.45%的概率保证程度估计该批茶叶包装合格率的区间为61.88%,79.12%。,本节结束,谢谢!,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号