《浙大概率论与数理统计课件第七章参数估计概率论ppt课件.ppt》由会员分享,可在线阅读,更多相关《浙大概率论与数理统计课件第七章参数估计概率论ppt课件.ppt(100页珍藏版)》请在三一办公上搜索。
1、,统计方法,描述统计,推断统计,假设检验,第七章、参数估计,第一节:点估计第三节:估计量的评选标准第四节:区间估计第五节:正太总体均值与方差的区间估计第六节:(01)分布参数的区间估计第七节:单侧置信区间,现在我们来介绍一类重要的统计推断问题:参数估计问题是利用从总体抽样得到的信息来估计总体的某些参数或者参数的某些函数.,参数估计,估计废品率,估计湖中鱼数,估计平均降雨量,在参数估计问题中,假定总体分布形式已知,未知的仅仅是一个或几个参数.,第一节 点 估 计,一、点估计问题的提法,二、估计量的求法,三、估计量的评选标准,设总体X的分布函数 形式已知, 是待估参数, 是 X 的一个样本, 是相
2、应的一个样本值.,一、点估计问题的提法,解,例1,二、估计量的求法,由于估计量是样本的函数, 是随机变量, 故对不同的样本值, 得到的参数值往往不同, 求估计量的问题是关键问题.,估计量的求法: (两种),矩估计法和最大似然估计法.,1. 矩估计法,它是基于一种简单的“替换”思想建立起来的一种估计方法 .是英国统计学家K.皮尔逊最早提出的 .其基本思想是用样本矩估计总体矩 .,其中 为未知参数,现在从总体X 中抽取样本 . 由辛钦大数定律,设总体X的分布函数为,可以推广为,,设 X1, X2, , Xn 来自总体X的样本,记总体k阶矩为,样本k阶矩为,用样本矩来估计总体矩, 用样本矩的连续函数
3、来估计总体矩的连续函数, 从而得出参数估计,这种估计法称为矩估计法.,记总体k阶中心矩为,样本k阶中心矩为,矩估计法的具体步骤:,(4) 用方程组的解 分别作为 的估计量,这种估计量称为矩估计量. 矩估计量的观察值称为矩估计值.,解,例2,解方程组得到a, b的矩估计量分别为,解,解方程组得到矩估计量分别为,例3,上例表明:,总体均值与方差的矩估计量的表达式,不因不同的总体分布而异.,矩法的优点是简单易行. 缺点是,当总体类型已知时,没有 充分利用分布提供的信息. 一般场合下,矩估计量不具有唯一性 .,2. 最大(极大)似然估计法,最大似然法是在总体类型已知条件下使用的一种参数估计方法 .,它
4、首先是由德国数学家高斯在1821年提出的. 然而,这个方法常归功于英国统计学家费歇. 费歇在1922年重新发现了这一方法,并首先研究了这种方法的一些性质 .,Gauss,Fisher,极大似然法的基本思想:,一只野兔从前方窜过 .,是谁打中的呢?,某位同学与一位猎人一起外出打猎 .,如果要你推测,,你会如何想呢?,只听一声枪响,野兔应声倒下 .,你就会想,猎人命中的概率一般大于这位同学命中的概率 . 看来这一枪是猎人射中的 .,这个例子所作的推断已经体现了极大似然法的基本思想 .,设有外形完全相同的两个箱子,甲箱有99个白球1个黑球,乙箱有1个白球99个黑球.今随机地抽取一箱,然后再从这箱中任
5、取一球,结果发现是白球.问这球是从哪一个箱子中取出的?,分析 导致结果是白球的原因有两个,一个是这球从甲箱取的,另一个就是这球从乙箱取的.如果是从甲箱取的,则取得白球的概率为99%;如果是从乙箱取的,则取得白球的概率为1%,由此看到,这球是从甲箱中取出的概率比从乙箱中取出的概率要大得多,因此很自然的,我们认为结论“这球是从甲箱中取出的”比结论“这球是从乙箱中取出的”要合理得多.最后我们作出推断,这球是从甲箱取出的.,最大似然估计法,是建立在最大似然原理的基础上的求点估计量的方法。最大似然原理的直观想法是:在试验中概率最大的事件最有可能出现。例如,一个试验如有若干个可能的结果 ,若在一次试验中,
6、结果A出现,则一般认为A出现的概率最大。,极大似然估计法:,当给定样本X1,X2,Xn时,定义似然函数为:,这里 x1, x2 , xn 是样本的观察值 .,看作参数 的函数,它可作为 将以多大可能产生样本值 x1, x2, ,xn 的一种度量 .,选择 ,使 达到最大值.,若总体X属离散型, 其分布律为,似然函数,形式已知,为待估参数,的概率为,若总体X属连续型, 其概率密度函数为,形式已知,为待估参数,的一个样本值, 则,因 不随 而变,故只需考虑,若,替换成样,若将上式中样本值,称为似然方程,解,似然函数,例4,这一估计量与矩估计量是相同的.,解,X 的似然函数为,例5,它们与相应的矩估
7、计量相同.,解,例6,说明:用求导方法求参数的最大似然估计有时行不通,这时要用极大似然原则来求 .,小结,两种求点估计的方法:,矩估计法,最大似然估计法,在统计问题中往往先使用最大似然估计法, 在最大似然估计法使用不方便时, 再用矩估计法.,费希尔资料,Ronald Aylmer Fisher,Born: 17 Feb 1890 in London, EnglandDied: 29 July 1962 in Adelaide, Australia,第三节 估计量的评价标准,一、无偏性二、有效性三、相合性,问题的提出,从前一节可以看到, 对于同一个参数, 用不同的估计方法求出的估计量可能不相同,
8、那么那一个估计量好?好坏的标准是什么?,下面介绍几个常用标准.,一、无偏性(无偏估计),无偏估计的实际意义: 无系统误差.,无偏性是对估计量的一个常见而重要的要求 .,证,例1,特别地:,不论总体 X 服从什么分布,只要它的数学期望存在,证,例2,由以上两例可知,同一个参数可以有不同的无偏估计量.,具有概率密度,无偏性虽然是评价估计量的一个重要标准,而且在许多场合是合理的、必要的。然而,有时一个参数的无偏估计可能不存在或者不合理。,于是,人们又在无偏性的基础上增加了对方差的要求。若估计量的方差越小。表明该估计量的取值(即估计值)围绕着待估参数的波动就越小,也就是更为理想的估计量。为此,引入最小
9、方差无偏计。,设,二、有效性(最小方差无偏估计),由于方差是随机变量取值与其数学期望的偏离程度, 所以无偏估计以方差小者为好.,都是 的无偏估计量,若有 ,则称 比 有效.,证明,例3 (续例2),说明,最小方差无偏估计是一种最优估计.,定义,有时候我们不仅要求估计量有较小的方差,还希望当样本容量n充分大时,估计量能在某种意义下收敛于被估计参数,这就是所谓相合性(或一致性)概念。,定义 设 是未知参数 估计序列,如果 依概率收敛于 ,即对任有,三、相合性(相合估计),或,则 称是 的相合估计量(或一致估计)。,定理 设 是 的一个估计量,若,则 是 的相合估计(或一致估计)。,证明:由于,且,
10、令 且由定理的假设,得,即 是 的相合估计,小结,估计量的评选的三个标准,无偏估计,最小方差无偏估计,相合估计,相合性是对估计量的一个基本要求, 不具备相合性的估计量是不予以考虑的.,由最大似然估计法得到的估计量, 在一定条件下也具有相合性.估计量的相合性只有当样本容量相当大时,才能显示出优越性, 这在实际中往往难以做到,因此,在工程中往往使用无偏性和有效性这两个标准.,第四节 区间估计,一、区间估计基本概念,二、正态总体均值与方差 的区间估计,引言,前面,我们讨论了参数点估计. 它是用样本算得的一个值去估计未知参数. 但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误差范围
11、,使用起来把握不大. 区间估计正好弥补了点估计的这个缺陷 .,一、区间估计基本概念,1. 置信区间的定义,关于定义的说明,例如,这里有两个要求:,由定义可见,,对参数 作区间估计,就是要设法找出两个只依赖于样本的界限(构造统计量),一旦有了样本,就把 估计在区间 内.,可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度.,2. 求置信区间的一般步骤(共3步),二、正态总体均值与方差的区间估计,1.,推导过程如下:,这样的置信区间常写成,其置信区间的长度为,包糖机某日开工包了12包糖,称得重量(单位:克)分别为506,500,495,488,504,486,505,513,521,
12、520,512,485. 假设重量服从正态分布,解,附表2-1,例1,附表2-2,查表得,推导过程如下:,考虑 是 的无偏估计,可用 替换,有一大批糖果,现从中随机地取16袋, 称得重量(克)如下:,设袋装糖果的重量服从正态分布, 试求总体均值,解,附表3-1,例2,就是说估计袋装糖果重量的均值在500.4克与507.1克之间, 这个估计的可信程度为95%.,这个误差的可信度为95%.,解,附表3-2,例3,(续例1)如果只假设糖包的重量服从正态分布,推导过程如下:,又知,II.,因为 是 的无偏估计,进一步可得:,注意: 在密度函数不对称时,习惯上仍取对称的分位点来确定置信区间(如图).,解
13、,代入公式得标准差的置信区间,附表4-1,(续例2) 求例2中总体标准差 的置信度为0.95的置信区间.,附表4-2,例4,2、两个总体 的情况,讨论两个总体均值差和方差比的估计问题.,推导过程如下:,I.,例6机床厂某日从两台机床加工的零件中,分别抽取若干个样品,测得零件尺寸分别如下(单位:cm): 第一台机器 6.2, 5.7, 6.5, 6.0, 6.3, 5.8 5.7, 6.0, 6.0, 5.8, 6.0 第二台机器 5.6, 5.9, 5.6, 5.7, 5.8 6.0, 5.5, 5.7, 5.5 假设两台机器加工的零件尺寸均服从正态分布,且方差相等,试求两机床加工的零件平均尺寸之差的区间估计,解 用 X 表示第一台机床加工的零件尺寸,用 Y表示第二台机床加工的零件尺寸,由题设,经计算,得,推导过程如下:,II.,根据F分布的定义, 知,解,例7,信,解,例8,的置,三、小结,点估计不能反映估计的精度, 故而本节引入了区间估计.,求置信区间的一般步骤(分三步).,正态总体均值与方差的区间估计,但n充分大时近似置信区间,附表2-1,标准正态分布表,1.645,1.96,附表2-2,标准正态分布表,附表3-1,分布表,2.1315,2.2010,附表3-2,分布表,附表4-1,分布表,27.488,附表4-2,分布表,6.262,