《《期末数理统计》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《期末数理统计》PPT课件.ppt(45页珍藏版)》请在三一办公上搜索。
1、复习课,第五章 统计量及其分布,5.1 总体与样本5.2 样本数据的整理与显示5.3 统计量及其分布5.4 三大抽样分布5.5 充分统计量,样本均值的分布,样本方差的分布,n取不同值时 的分布,证明:,所以,例2,解,例3,解,例4 设x1,x2,xn是取自总体U(0,)的样本,即总体的密度函数为,于是样本的联合密度函数为,取T=x(n),并令 g(t;)=(1/)nIt,h(x)=1,由因子分解定理知T=x(n)是 的充分统计量。,p(x1;)p(xn;)=,0,其它,(1/)n,0minximaxxi,由于诸xi0,所以我们可将上式改写为,p(x1;)p(xn;)=(1/)nI,x(n),
2、练习:设x1,x2,xn 是来自泊松分布 P()的一个样本,证明,是充分统计量。,取T(x)=xi,h(x)=,P(X=x)=T(x)e-nh(x),由因子分解定理,T(x)=xi 是的充分统计量。,则上式可改写为,6.1 点估计的几种方法6.2 点估计的评价标准6.5 区间估计,第六章 参数估计,点估计的几种方法,替换原理和矩法估计,替换原理是指用样本矩及其函数去替换相应的总体矩及其函数,譬如:用样本均值估计总体均值E(X),即;用样本方差估计总体方差Var(X),即用样本的 p 分位数估计总体的 p 分位数.,矩法估计的基本思想:,用样本矩,代替母体矩,即,从中解出.,例5 x1,x2,x
3、n是来自(a,b)上的均匀分布U(a,b)的样本,a与b均是未知参数,这里k=2,由于 不难推出 由此即可得到a,b的矩估计:,解:,练习,极大似然估计的关键点,X1,X2,Xn出现的可能性:,(1)离散场合:,(2)连续场合:,称以上 L 的为似然函数。,例6 求泊松分布中参数l的最大似然估计.解 已知总体x的概率函数为,泊松分布(续),例7:指数分布,已知,x1,x2,.,xn为x的一组样本观察值,求q的最大似然估计.,解 似然函数,解 似然函数为,对数似然函数为,练习:设X1,X2,Xn是取自总体X的一个样本,求 的最大似然估计值.,其中 0,求导并令其为0,=0,从中解得,即为 的最大
4、似然估计值.,对数似然函数为,1、相合性(大样本的角度)2、无偏性(从期望的角度)3、有效性(从方差的角度)4、均方误差准则(角度),点估计的评价标准,解 似然函数 要使L()达到最大,即1/n尽可能大,所以的取值应尽可能小,但不能小于X(n),由此给出的极大似然估计:,例8 设 x1,x2,xn 是来自均匀总体U(0,)的样本,证明 的极大似然估计是相合估计。,由次序统计量的分布,我们知道 x(n)的分布密度函数为 p(y)=nyn-1/n,y,故有,故X(n)是 的相合估计。,例9 对均匀总体U(0,),由 的极大似然估计得到的无偏估计是,它的均方误差 现我们考虑的形如 的估计,其均方差为
5、 用求导的方法不难求出当 时上述均方误差达到最小,且其均方误差 所以在均方误差的标准下,有偏估计 优于无偏估计。,正态总体未知参数的置信区间,共分四种情况:,(1)已知,的置信区间,(2)未知,的置信区间,(3)已知,2的置信区间,(4)未知,2的置信区间,例10 设总体 X N(,0.92),X1,X2,X9 为X 的 一个样本,样本均值为5,求 的95%的置信区间。,解 因为 的1 置信区间为,所以由 u0.975=1.96,得,4.412,5.588,所求置信区间为,(4.412,5.588),2未知时 的置信区间,这时可用t 统计量,因为,因此 t 可以用来作为枢轴量。完全类似于上一小
6、节,可得到 的1-置信区间为 此处 是 2的无偏估计。,例11 假设轮胎的寿命服从正态分布。为估计某种轮胎的平均寿命,现随机地抽12只轮胎试用,测得它们的寿命(单位:万公里)如下:4.68 4.85 4.32 4.85 4.61 5.025.20 4.60 4.58 4.72 4.38 4.70 此处正态总体标准差未知,可使用t分布求均值的置信区间。经计算有=4.7092,s2=0.0615。取=0.05,查表知t0.975(11)=2.2010,于是平均寿命的0.95置信区间为(单位:万公里),正态总体参数假设检验,参数假设检验常见的有三种基本形式,(1),(2),(3),(1)关于,2巳知
7、 用 u 检验,iii)H0:=0 H1:0,i)H0:0 H1:0,ii)H0:0 H1:0,拒绝域为 W3=|u|u1/2,拒绝域为 W1=u u1,拒绝域为 W2=u u,二、未知时的t 检验,由于 未知,一个自然的想法是将()中未知的 替换成样本标准差s,这就形成t 检验统计量,(7.2.9),三种假设的检验拒绝域分别为,例 某厂生产的某种铝材的长度服从正态分 布,其均值设定为240厘米。现从该厂抽取5件 产品,测得其长度为(单位:厘米),239.7 239.6 239 240 239.2,试判断该厂此类铝材的长度是否满足设定要求?,解:这是一个关于正态均值的双侧假设检验问题。采用t
8、检验,拒绝域为:,现由样本计算得到:,由于2.79512.776,故拒绝原假设,认为该厂生产的铝材的长度不满足设定要求。,若取=0.05,则 t0.975(4)=2.776.,故,单个正态总体方差的检验,设 是来自 的样本,对方差亦可考虑如下三个检验问题:,通常假定 未知,它们采用的检验统计量是,相同的,均为 若取显著性水平为,则对应三个检验问题的拒绝域依次分别为,1000位高中生的性别与色盲调查数据,解:用A表示性别情况,它有两个水平:表示 性别为男,表示性别为女;B表示视觉情况,它有两个水平,分别表示表中两种 情况。沿用前面的记号,首先建立假设 H0:性别与色盲无关联,即A与B独立的。统计表示如下:,在原假设H0成立下,我们可以计算诸参数的极大似然估计值:,表7.4.6 诸 的计算结果,此处r=2,c=2,(r-1)(c-1)=1,若取=0.05,查表有,由于12.64823.8415,故拒绝原假设,不能认为色盲与性别无关。本例中检验的p 值为0.0003759。,