《医用数理统计方法课件第五章抽样估计.ppt》由会员分享,可在线阅读,更多相关《医用数理统计方法课件第五章抽样估计.ppt(118页珍藏版)》请在三一办公上搜索。
1、第五章,抽样估计,引言,上一讲,我们介绍了总体、样本、简单随机样本、统计量和抽样分布的概念,介绍了统计中常用的三大分布,给出了几个重要的抽样分布定理.它们是进一步学习统计推断的基础.,总体,样本,统计量,描述,作出推断,研究统计量的性质和评价一个统计推断的优良性,完全取决于其抽样分布的性质.,随机抽样,统计推断既是利用样本来推断总 体,是数理统计的核心,统计推断的基本问题可以分两大类:1、参数估计2、假设检验,第5.1节 参数的点估计,一、点估计问题的提法,二、估计量的求法,三、小结,现在我们来介绍一类重要的统计推断问题,参数估计问题是利用从总体抽样得到的信息来估计总体的某些参数或者参数的某些
2、函数.,参数估计,估计废品率,估计新生儿的平均体重,估计湖中鱼数,估计平均降雨量,在参数估计问题中,假定总体分布形式已知,未知的仅仅是一个或几个参数.,这类问题称为参数估计.,参数估计问题的一般提法,X1,X2,Xn,参数估计,点估计,区间估计,一、点估计问题的提法,设总体X的分布函数形式已知,但它的一个或多个参数为未知,借助于总体X的一个样本来估计总体未知参数的问题称为点估计问题.,解,例1,二、估计量的求法,由于估计量是样本的函数,是随机变量,故对不同的样本值,得到的参数值往往不同,求估计量的问题是关键问题.,估计量的求法:(四种),常用矩估计法和最大似然估计法.,一、矩估计法,其基本思想
3、是用样本矩估计总体矩.,理论依据:,它是基于一种简单的“替换”思想建立起来的一种估计方法.,是英国统计学家K.皮尔逊最早提出的.,大数定律,设 X1,X2,Xn 来自总体X的样本,记总体k阶矩为,样本k阶矩为,用样本矩来估计总体矩,用样本矩的连续函数来估计总体矩的连续函数,从而得出参数估计,这种估计法称为矩估计法.,记总体k阶中心矩为,样本k阶中心矩为,那么用诸 的估计量 Ai分别代替上式中的诸,即可得诸 的矩估计量:,j=1,2,k,矩估计法的具体步骤:,矩估计量的观察值称为矩估计值.,例 2 设总体 服从泊松分布,求参数 的估计量.,解:设 是总体 的一个样本,由于,可得,解,例3,解方程
4、组得到a,b的矩估计量分别为,解,例4,解,解方程组得到矩估计量分别为,例5,上例表明:,总体均值与方差的矩估计量的表达式,不因不同的总体分布而异.,一般地:,矩法的优点是简单易行,缺点是,当总体类型已知时,没有 充分利用分布提供的信息.一般场合下,矩估计量不具有唯一性.,例6 设总体 的分布密度为,为总体 的样本,求参数 的矩估 计量.,解:由于 只含有一个未知参数,一般只需求出 便能得到 的矩估计量,但是,即 不含有,故不能由此得到 的矩估计量.为此,求,故令,于是解得 的矩估计量为,本例 的矩估计量也可以这样求得,故令,即 的矩估计量为,该例表明参数的矩估计量不唯一,二、最大(极大)似然
5、估计法,最大似然法是在总体类型已知条件下使用的一种参数估计方法.,它首先是由德国数学家高斯在1821年提出的,然而,,Gauss,Fisher,这个方法常归功于英国统计学家费歇.,费歇在1922年重新发现了 这一方法,并首先研究了这 种方法的一些性质.,(或分,似然函数设总体X的分布律为,,其中,是未知参数,,是总体X的一个样,为,布密度为),本,则样本,,当给定样本值,后,它只是参数,的函数,记为,即,的分布律,2.最大似然估计法最大似然估计法,是建立在最大似然原理的基础上的求点估计量的方法。最大似然原理的直观想法是:在试验中概率最大的事件最有可能出现。因此,一个试验如有若干个可能的结果,若
6、在一次试验中,结果,出现,则一般,出现的概率最大。,认为,定义6.1,设总体 的分布密度(或分布律)为,其中 为未知参数。又设 是总体 的一个样本值,如果似然函数,(6.1),替换成样本,分别为,似然估计值。,需要注意的是,最大似然估计值,依赖于样本值,即,若将上式中样本值,则所得的,的最大,称为参数,的最大似然估计量。,由于,而,与,在同一 处达到最大值,,为最大似然估计的必要条件为,称它为似然方程,其中,(6.2),因此,,求最大似然估计量的一般步骤为:,(1)求似然函数,(2)一般地,求出,及似然方程,(3)解似然方程得到最大似然估计值,(4)最后得到最大似然估计量,解,似然函数,例1,
7、这一估计量与矩估计量是相同的.,解,X 的似然函数为,例2,它们与相应的矩估计量相同.,用上述求导方法求参数的最大似然估计有时行不通,这时要用极大似然原则来求.,说明:,三、小结,两种求点估计的方法:,矩估计法,最大似然估计法,在统计问题中往往先使用最大似然估计法,在最大似然估计法使用不方便时,再用矩估计法.,第5.2节 估计量的评价标准,一、问题的提出,二、无偏估计,三、最小方差无偏估计,四、相合估计,五、小结,一、问题的提出,从前一节可以看到,对于同一个参数,用不同的估计方法求出的估计量可能不相同,那么那一个估计量好?好坏的标准是什么?,下面介绍几个常用标准.,二、无偏估计,无偏估计的实际
8、意义:无系统误差.,无偏性是对估计量的一个常见而重要的要求.,证,例1,特别地:,不论总体 X 服从什么分布,只要它的数学期望存在,证,例2,(这种方法称为无偏化).,证,例4,由以上两例可知,同一个参数可以有不同的无偏估计量.,无偏性虽然是评价估计量的一个重要标准,而且在许多场合是合理的,必要的。然而,有时一个参数的无偏估计可能不存在。,三、最小方差无偏估计,由于方差是随机变量取值与其数学期望的偏离程度,所以无偏估计以方差小者为好.,说明,最小方差无偏估计是一种最优估计.,定义,四、相合估计有时候我们不仅要求估计量有较小的方差,还希望当样本容量n充分大时,估计量能在某种意义下收敛于被估计参数
9、,这就是所谓相合性(或一致性)概念。,定义 设 是未知参数 估计序列,如果 依概率收敛于,即对任,有,或,则 称是 的相合估计(量)(或一致估量)。,例 若总体 的 和 存在,则样本均值 是总体均值的相合估计.,解:,一般地,样本的 阶原点矩 是总体 的 阶原点矩 的相合估计.由此可见,矩估计往往是相合估计.,证明,例,由大数定律知,六、小结,估计量的评选的三个标准,无偏估计,最小方差无偏估计,相合估计,相合性是对估计量的一个基本要求,不具备相合性的估计量是不予以考虑的.,由最大似然估计法得到的估计量,在一定条件下也具有相合性.,估计量的相合性只有当样本容量相当大时,才能显示出优越性,这在实际
10、中往往难以做到,因此,在工程中往往使用无偏性和有效性这两个标准.,第5.3节 参数的区间估计,一、区间估计基本概念,二、正态总体均值与方差的区间估计,三、小结,引言,前面,我们讨论了参数点估计.它是用样本算得的一个值去估计未知参数.但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误差范围,使用起来把握不大.区间估计正好弥补了点估计的这个缺陷.,一、区间估计基本概念,1.置信区间的定义(6.7),关于定义的说明,例如,由定义可见,,即要求估计尽量可靠.,可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度.,2.求置信区间的一般步骤(共3步),单击图形播放/暂停ES
11、C键退出,单击图形播放/暂停ESC键退出,二、正态总体均值与方差的区间估计,1.,I 单个总体,的情况,推导过程如下:,这样的置信区间常写成,其置信区间的长度为,包糖机某日开工包了12包糖,称得重量(单位:克)分别为506,500,495,488,504,486,505,513,521,520,512,485.假设重量服从正态分布,解,附表2-1,例1,附表2-2,查表得,推导过程如下:,解,有一大批糖果,现从中随机地取16袋,称得重量(克)如下:,设袋装糖果的重量服从正态分布,试求总体均值,附表3-1,例2,就是说估计袋装糖果重量的均值在500.4克与507.1克之间,这个估计的可信程度为9
12、5%.,这个误差的可信度为95%.,解,附表3-2,例3,(续例1)如果只假设糖包的重量服从正态分布,解,例4,推导过程如下:,根据第五章第三节定理5.8知,II.,进一步可得:,注意:在密度函数不对称时,习惯上仍取对称的分位点来确定置信区间(如图).,(续例2)求例2中总体标准差 的置信度为0.95的置信区间.,解,代入公式得标准差的置信区间,附表4-1,附表4-2,例5,2、两个总体 的情况,讨论两个总体均值差和方差比的估计问题.,推导过程如下:,I.,例6机床厂某日从两台机床加工的零件中,分别抽取若干个样品,测得零件尺寸分别如下(单位:cm):第一台机器 6.2,5.7,6.5,6.0,
13、6.3,5.8 5.7,6.0,6.0,5.8,6.0 第二台机器 5.6,5.9,5.6,5.7,5.8 6.0,5.5,5.7,5.5 假设两台机器加工的零件尺寸均服从正态分布,且方差相等,试求两机床加工的零件平均尺寸之差的区间估计,解 用 X 表示第一台机床加工的零件尺寸,用 Y表示第二台机床加工的零件尺寸,由题设,经计算,得,推导过程如下:,II.,根据F分布的定义,知,解,例7,信,解,例8,的置,三、小结,点估计不能反映估计的精度,故而本节引入了区间估计.,求置信区间的一般步骤(分三步).,正态总体均值与方差的区间估计,但n充分大时近似置信区间,附表2-1,标准正态分布表,1.645,1.96,附表2-2,标准正态分布表,附表3-1,分布表,2.1315,2.2010,附表3-2,分布表,附表4-1,分布表,27.488,附表4-2,分布表,6.262,六、小结,估计量的评选的三个标准,无偏估计,最小方差无偏估计,相合估计,相合性是对估计量的一个基本要求,不具备相合性的估计量是不予以考虑的.,由最大似然估计法得到的估计量,在一定条件下也具有相合性.,估计量的相合性只有当样本容量相当大时,才能显示出优越性,这在实际中往往难以做到,因此,在工程中往往使用无偏性和有效性这两个标准.,