《参数估计方法及其应用ppt课件.ppt》由会员分享,可在线阅读,更多相关《参数估计方法及其应用ppt课件.ppt(80页珍藏版)》请在三一办公上搜索。
1、参数估计方法及其应用,数理统计的基本概念,总体,个体,样本,常用统计量的分布,分位点,统计量,常用统计量,t分布,F分布,分布,一、总体与个体,一个统计问题总有它明确的研究对象.,研究对象的全体称为总体(母体),,总体中每个成员称为个体.,研究某批灯泡的质量,总体,总体,然而在统计研究中,人们往往关心每个个体的一项 (或几项)数量指标和该数量指标在总体中的分布情况. 这时,每个个体具有的数量指标的全体就是总体.,总体就是一个概率分布.,由于每个个体的出现带有随机性,即相 应的数量指标值的出现带有随机性。从而可 把此种数量指标看作随机变量,我们用一个 随机变量或其分布来描述总体。为此常用随 机变
2、量的符号或分布的符号来表示总体。,如:研究某批灯泡的寿命时,我们关心的数量指标就是寿命,那么,此总体就可以用随机变量X表示,或用其分布函数F(x)表示.,二、随机样本的定义,1. 样本的定义,为推断总体的分布及各种特征,按一定的规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息.这一抽取过程称为“抽样”.,所抽取的部分个体称为样本.通常记为,样本中所包含的个体数目n称为样本容量.,(X1, X2, , Xn),2. 简单随机样本,抽取样本的目的是为了利用样本对总体进行统计推断, 这就要求样本能很好的反映总体的特性, 且便于处理. 为此, 需对抽样提出一些要求, 通常有两条:,满足上述两
3、条性质的样本称为简单随机样本.,代表性: X1,X2, Xn中每一个与所考察的总体 X有相同的分布.,2. 独立性: X1,X2, Xn是相互独立的随机变量.,定义1,3.简单随机样本的分布,例1,解,例2,解,三、统计量,1. 统计量的定义,使用样本推断总体特征,需要对样本值进行“加工”,“提炼”.这就需要构造一些样本的函数,它把样本中所含的信息集中起来.,例1,是,不是,2. 几个常用统计量(样本矩)的定义,(1)样本平均值,(2)样本方差,其观察值,它反映了总体均值的信息,其观察值,(3)样本标准差,其观察值,(4)修正样本方差,其观察值,(5) 样本 k 阶(原点)矩,其观察值,(6)
4、样本 k 阶中心矩,其观察值,样本矩具有下列性质:,3. 经验分布函数,四、常见分布,常用统计量的分布(一),常用统计量的分布(二),常用统计量的分布(三),常用统计量的分布的分位点1,常用统计量的分布的分位点2,关于正态总体的样本和方差的定理,定理一,定理二,关于正态总体的样本和方差的定理,定理三,关于正态总体的样本和方差的定理,定理四,参数估计方法,矩估计量,估计量的评选,最大似然估计量,似然函数,无偏性,正态总体均值方差的置信区间与上下限,有效性,置信区间和上下限,求置信区间的步骤,相合性,一、参数的点估计,参数估计问题是利用从总体抽样得到的信息来估计总体的某些参数或者参数的某些函数.,
5、估计废品率,估计新生儿的平均体重,估计湖中鱼数, ,估计平均降雨量,参数估计问题的一般提法,设有一个统计总体,总体的分布函数,为 F(x,,),其中,为未知参数。,在参数估计问题中,假定总体分布形式已,未知的仅仅是一个或几个参数.,现从该总体中抽取样本,X1, X2, , Xn,要依据该样本对参数,作出估计,或估计,的某个已知函数,这类问题称为参数估计.,1、点估计问题的提法,设总体X 的分布函数形式已知, 但它的一个或多个参数为未知, 借助于总体X的一个样本来估计总体未知参数的问题称为点估计问题.,例1,解,2、估计量的求法,由于估计量是样本的函数, 是随机变量, 故对不同的样本值, 得到的
6、参数值往往不同, 求估计量的问题是关键问题.,估计量的求法: (两种),矩估计法和最大似然估计法.,矩估计法,其基本思想是用样本矩估计总体矩 .,它是基于一种简单的“替换”思想建立起来的一种估计方法 .,是英国统计学家K.皮尔逊最早提出的 .,记总体k阶矩为,样本k阶矩为,用样本矩来估计总体矩,用样本矩的连续函数来估计总体矩的连续函数,从而得出参数估计,这种估计法称为矩估计法.,矩估计法的具体步骤:,设总体X服从泊松分布,求参数,的估计量.,解:设,是总体 X 的一个,样本,由于,可得,例 2,例 3,解,例3续,解方程组得到a, b的矩估计量分别为,例4,解,总体均值与方差的矩估计量的表达式
7、,不因不同的总体分布而异.,一般地:,矩法的优点是简单易行,缺点是,当总体类型已知时,没有 充分利用分布提供的信息 . 一般场合下,矩估计量不具有唯一性 .,最大(极大)似然估计法,最大似然法是在总体类型已知条件下使用的一种参数估计方法 .,它首先是由德国数学家高斯在1821年提出的 .,Gauss,Fisher,英国统计学家费歇在1922年重新发现了这一方法,并首先研究了这种方法的一些性质 .,1.似然函数,(或分,设总体X的分布律为,,其中,是未知参数,,是总体X的一个样,为,布密度为 ),本,则样本,,当给定样本值,后,它只是参数,的函数,记为,即,的分布律,2.最大似然估计法定义,设总
8、体 的分布密度(或分布律)为 ,其中 为未知参数。又设 是总体 的一个样本值,如果似然函数,替换成样本,分别为,似然估计值。,需要注意的是,最大似然估计值,依赖于样本值,即,若将上式中样本值,则所得的,的最大,称为参数,的最大似然估计量。,由于,而,与,在同一 处达到最大值,,为最大似然估计的必要条件为,称它为似然方程,其中,因此,,例6,解,似然函数,这一估计量与矩估计量是相同的.,例6续,二、估计量的评价标准,从前一节可以看到, 对于同一个参数, 用不同的估计方法求出的估计量可能不相同,那么那一个估计量好?好坏的标准是什么?,下面介绍几个常用标准.,无偏性、有效性 、相合性,无偏估计,无偏
9、估计的实际意义: 无系统误差.,例7,证,例8,证,例8续,(这种方法称为无偏化).,最小方差无偏估计,由于方差是随机变量取值与其数学期望的偏离程度, 所以无偏估计以方差小者为好.,设总体X的期望E(X)与方差D(X)均存在,,例9,是X的一个样本,试证明下列统,计量都是E(X)的无偏估计,并说明哪个有效。,例9解1,可见上统计量都是E(X)的无偏估计,例9解2,由于方差更小,所以第二个比第一个更有效。,三、参数的区间估计,前面,我们讨论了参数的点估计. 它是用样本算得的一个值去估计未知参数. 但是点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误差范围,使用起来把握不大. 区间估
10、计正好弥补了点估计的这个缺陷 .,1. 置信区间的定义,关于定义的说明,区间估计的两个要求,即要求估计尽量可靠.,可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度.,2. 求置信区间的一般步骤(共3步),一般有,四、正态总体均值与方差的区间估计,(1)单个正态总体的情况,1.,期望的置信区间,这样的置信区间常写成,其置信区间的长度为,例10,包糖机某日开工包了12包糖,称得重量(单位:克)分别为506,500,495,488,504,486,505,513,521,520,512,485. 假设重量服从正态分布,解,例10解,例10解2,查表得,(2),注意,例11,解,(续例1)如果只假设糖包的重量服从正态分布,II.,推导过程如下:,由第六章定理二知,进一步可得:,注意: 在密度函数不对称时,习惯上仍取对称的分位点来确定置信区间(如图).,例12,有一大批糖果,现从中随机地取16袋, 称得重量(克)如下:,设袋装糖果的重量服从正态分布, 试求总体标准,差的置信度为0.95的置信区间.,解,代入公式得标准差的置信区间,标准差的置信区间,