《概率论课件-煤炭工业出版.ppt》由会员分享,可在线阅读,更多相关《概率论课件-煤炭工业出版.ppt(87页珍藏版)》请在三一办公上搜索。
1、,参数估计问题,假设检验问题,点 估 计,区间估 计,7-2,什么是参数估计?,参数是刻画总体某方面概率特性的数量.,当此数量未知时,从总体抽出一个样本,用某种方法对这个未知参数进行估计就是参数估计.,例如,X N(,2),若,2未知,通过构造样本的函数,给出它们的估计值或取值范围就是参数估计的内容.,参数估计的类型,点估计 估计未知参数的值,区间估计 估计未知参数的取值范围,并使此范围包含未知参数 真值的概率为给定的值.,第七章 参数估计,二、估计量的评选标准,一、点估计,三、区间估计,四、正态总体均值与方差的区间估计,7.1 点估计方法,点估计的思想方法,设总体X 的分布函数的形式已知,但
2、含有一个或多个未知参数:1,2,k,设 X1,X2,Xn为总体的一个样本,构造 k 个统计量:,随机变量,7-5,7.1,当测得样本值(x1,x2,xn)时,代入上述统计量,即可得到 k 个数:,数 值,如何构造统计量?,如何评价估计量的好坏?,7-6,对未知参数估计的两种方法:矩估计法、最,一、矩估计法,基本思想是用样本矩估计总体矩。,英国统计学家K.皮尔逊最早,提出的。,大似然估计法。,命题:若总体X 的 k 阶矩,存在,则,证明,因为样本,相互独立且与总,体X 服从相同的分布。则,也相互,独立且与,服从相同的分布。,由辛钦定理,即,基本思想:令,若X为连续型随机变量,设概率密度为,令,,
3、其中,为样本,,为样本值,,解出,例1设总体,解 令,其中,所以的矩估计量为,例2设总体X 的概率密度为,解,即,X1,X2,Xn是取自X 的样本,求参数的矩估计量.,令,,则,从而的矩估计量,例3设总体,解,令,例4 设,解,令,其中,则,解得数学期望,的矩估计量分别为,若X为离散型随机变量,设其分布律为,令,,其中,为样本,,为样本值,,解出,例5设总体,解 令,其中,所以的矩估计值为,二、极大似然估计法,思想方法:一次试验就出现的事件 有较大的概率,例如:有两外形相同的箱子,各装100个球 一箱 99个白球 1 个红球 一箱 1 个白球 99个红球,现从两箱中任取一箱,并从箱中任取一球,
4、结果所取得的球是白球.,答:第一箱.,7-17,问:所取的球来自哪一箱?,法三,例6 设总体 X 服从0-1分布,且P(X=1)=p,用极大似然法求 p 的估计值.,解,总体 X 的概率分布为,设 x1,x2,xn为总体样本X1,X2,Xn的样本值,则,7-18,例6,对于不同的 p,L(p)不同,见右下图,现经过一次试验,,7-19,在容许范围内选择 p,使L(p)最大,注意到,ln L(p)是 L 的单调增函数,故若某个p 使ln L(p)最大,则这个p 必使L(p)最大。,7-20,称为似然函数。,当,时,称统计量,为的最大似然估计量;,为的最大似然估计值.,分布律为,,其中未知。,为X
5、 的样本,,为样本值,,X 为离散型,具体算法:,令,两边取对数,令,解,例1,似然函数为:,X 的概率密度为,,其中未知。,似然函数为,求极大值,或,得,X 为连续型,例2,解,似然函数,当,令,所以,例3,解,似然函数,所以,所以,则要使得,取最大值,注:特殊的似然函数通过求导得不到其最大,需要用其它的方法。,例4,解,似然函数,所以的最大似然估计值为,例5,解,令,所以,的最大似然估计值为,例6,解,令,所以,解得参数和的矩估计量为,设x1,x2,xn是X1,X2,Xn的样本值,则,似然函数为,其中,当,时,令,第二个似然方程求不出的估计值,观察,,表明L是的严格递增函数,又,,故,所以
6、当,时L 取到最大值,从而参数和的最大似然估计值分别为,则参数和的最大似然估计量分别为,7.2 点估计的评价标准,对于同一个未知参数,不同的方法得到的估计量可能不同,于是提出问题,(1)无偏性,(3)一致性,(2)有效性,7.2,若,无偏,定义,我们不可能要求每一次由样本得到的,估计值与真值都相等,但可以要求这些估,计值的期望与真值相等.,是总体X 的样本,证明:不论 X 服从什么分布(但期望存在),证,因而,由于,例1,则,特别地,是总体期望 E(X)的,样本均值,无偏估计量,例2 设总体 X 的期望 与方差存在,X 的,样本为(n 1).,(1)不是 D(X)的无偏估量;,(2)是 D(X
7、)的无偏估计量.,证,证明,例2,因而,故 证毕.,例3 设总体 X 的密度函数为,为常数,为 X 的一个样本,证,故,是 的无偏估计量.,例4,令,即,故 n Z 是 的无偏估计量.,都是总体参数 的无偏估计量,且,则称 比 更有效.,有效,例如 X N(,2),(X 1,X 2)是一样本.,都是 的无偏估计量,定义 设 是总体参数,的估计量.若对于任意的,当n 时,依概率收敛于,即,一致性估计量仅在样本容量 n 足够大时,才显示其优越性.,一致,P73.29 已知 X N(0,1),Y=X 2,求 f Y(y),解 从分布函数出发,y,当 y 0 时,FY(y)=0,当 y 0 时,,例5
8、,故,P73,31 设 X 的 p.d.f.为,解,故当 y 0 或 y 1 时,f Y(y)=0,由图可知,Y 的取值范围为(0,1),例7,当0 y 1 时,故,设A,B 为随机试验 E 的两个事件,0 P(A)1,0 P(B)1,令,P142.26,证明:若 XY=0,则随机变量 X,Y 相互独立.,而,?,题23,错误原因,而这并不表明 X,Y 相互独立.,本题要证明离散随机变量 X,Y 相互,独立,必需证明如下四个等式都成立:,重新证明,由,即,即,由于事件 A,B 相互独立,必有,也相互独立,即,同理可证,,故 X,Y 相互独立.,第三节 区 间 估 计,二、正态总体均值与方差的区
9、间估计,一、置信区间,三、两个正态总体均值与方差 的区间估计,机动 目录 上页 下页 返回 结束,例如,在估计湖中鱼数的问题中,若我们根据一个实际样本,得到鱼数 N 的最大似然估计值为1000条.,也就是说,希望确定一个区间,使我们能以比较高的可靠程度相信它包含真参数值.,机动 目录 上页 下页 返回 结束,这里所说的“可靠程度”是用概率来度量的,很小的正数.,的,称为置信概率,置信度或置信水平。,机动 目录 上页 下页 返回 结束,一、置信区间,定义1 设总体,含一待估参数,对于样本,找出统计量,使得,,称区间,为,的置信区间,,为该区间的置信度。,是一个随机区间;,给出该区间,可能性。,区
10、间,的分布函数为,,其中,机动 目录 上页 下页 返回 结束,通常,采用95%的置信度,有时也取99%或 90%.,即置信度为,这时重复,抽样 100次,则在得到的100个区间中包含,真值,的有95个左右,不包含,真值的有5个左右。,例如 若,具体的计算方法,,其中只含有一个未知参数,机动 目录 上页 下页 返回 结束,不等式,是的置信度为,的置信区间。,机动 目录 上页 下页 返回 结束,二、正态总体均值与方差的区间估计,设,为总体,的一个样本,设已知方差,且,一个无偏点估计,,又,机动 目录 上页 下页 返回 结束,对于给定的置信度,查正态分布表,找出,临界值,使得:,由此可找出无穷多组,
11、通常我们取对称,使:,区间,由上 分位点的定义,机动 目录 上页 下页 返回 结束,对于给定的,有,可得,机动 目录 上页 下页 返回 结束,所以的置信水平为1-的置信区间为,简记为,例 若取,查表得,值算得样本均值的观察值,则得到一个置信度为0.95的的置信区间,,若由一个样本,机动 目录 上页 下页 返回 结束,注:的置信水平1的置信区间不唯一。,上例中同样给定,可以取标准正态分,布上分位点-Z0.04和Z0.01,则也有,则的置信度为0.95的置信区间为,但对称时的区间长度,最短。184页,机动 目录 上页 下页 返回 结束,已知幼儿身高服从正态分布,现从56岁的幼,儿中随机地抽查了9人
12、,其高度分别为:115,120,131,115,109,115,115,105,110 cm;假设标准差,置信度为95%;试求总体均值的置信区间,解 已知,由样本值算得:,查正态分布表得,,由此得置信区间,例1,机动 目录 上页 下页 返回 结束,设总体,问需要抽取容量为多,的长度不大于 0.49?,解 设需要抽取容量为n,的样本,其样本均值为,查表得,于是的置,信水平为0.95的置信区间为,该区间长度,例2,解得,取,机动 目录 上页 下页 返回 结束,而选取样本函数,对于给定的,查 t 分布表,得临界值,使,我们取对称区间,使,可用样本方差:,机动 目录 上页 下页 返回 结束,即,由 t
13、 分布表,找出,其中 n 是样本容量,是表中自由度;,得,由 t 分布表,机动 目录 上页 下页 返回 结束,所以的置信水平为1-的置信区间为,简记为,机动 目录 上页 下页 返回 结束,对某种型号飞机的飞行速度进行15次试验,测,得最大飞行速度(单位:米/秒)为,420.3,425.8,423.1,418.7,438.3,434.0,412.3,431.5,最大飞行速度服从正态分布.求飞机最大飞行速度,422.2,417.2,425.6,413.5,441.3,423.0,428.2,根据长期经验,可以认为,的期望值的置信水平为 0.95 的置信区间。,例3,解 以X 表示该飞机的最大飞行速
14、度,则,机动 目录 上页 下页 返回 结束,查表得,由于总体方差,未知,因此,的置信水平为0.95,的置信区间为:,由,机动 目录 上页 下页 返回 结束,(均值未知),设,为总体,的一个样本,我们知道,并且样本函数:,找使概率对称的区间,即,机动 目录 上页 下页 返回 结束,置信区间,即,机动 目录 上页 下页 返回 结束,标准差的一个置信水平为,的置信区间,注意:在密度函数不对称时,如,习惯上仍取对称的分位点,但其置信区间的长度,并不最短。,机动 目录 上页 下页 返回 结束,例4,某自动车床加工零件,抽查16个测得长,加工零件长度的方差。,解 先求,2的估计值,度(毫米),,怎样估计该
15、车床,机动 目录 上页 下页 返回 结束,查表,所求2的置信度为0.95的置信区间,机动 目录 上页 下页 返回 结束,例5,假设总体,信区间。,的样本为,,求,未知,X,的置信度为95%的置,解,的置信区间为,机动 目录 上页 下页 返回 结束,2的置信区间为,所以2的置信区间为,机动 目录 上页 下页 返回 结束,三、两个正态总体均值与方差的区间估计,设,为总体,的一个样本,为总体,的一个样本,X与Y,相互独立。,且,是,的,一个无偏估计,,因为X与Y 相互独立,所以,机动 目录 上页 下页 返回 结束,所以,的置信水平为1-的置信区间为,机动 目录 上页 下页 返回 结束,所以,的置信水平为1-的置信区间为,机动 目录 上页 下页 返回 结束,所以,的置信水平为1-的置信区间为,