《统计量与抽样分布).ppt》由会员分享,可在线阅读,更多相关《统计量与抽样分布).ppt(44页珍藏版)》请在三一办公上搜索。
1、6.3 统计量与抽样分布 在利用样本推断总体的性质时,往往不能直接利用样本,而需要对它进行一定的加工,这样才能有效地利用其中的信息,否则,样本只是呈现为一堆“杂乱无章”的数据,对样本的加工是十分重要的对样本加工,主要就是构造统计量6.3.1 统计量定义6.1 设X1,X2,Xn为来自总体X的样本,称不含未知参数的样本的函数g(X1,X2,Xn)为统计量若x1,x2,.,xn为样本观测值,则称g(x1,x2,.,xn)为统计量g(X1,X2,Xn)的观测值.统计量是处理、分析数据的主要工具对统计量的一个最基本的要求就是可以将样本观测值代入进行计算,因而不能含有任何未知的参数,6.3 统计量与抽样
2、分布,【例】设X1,X2,Xn是来自总体X的样本,XN(,2),其中、2为未知参数,则X1,min X1,X2,Xn 均为统计量,但诸如等均不是统计量,因它含有未知参数 或下面介绍几种常用的统计量,6.3.1 统计量,设X1,X2,Xn为总体X的样本,x1,x2,.,xn为样本观测值,(1)样本均值 常用来作为总体期望(均值)的估计量,其观测值为,6.3.2常用的统计量,(2)样本方差(3)样本标准差 样本方差和样本标准差刻画了样本数据的分散程度,常用来作为总体方差和标准差的估计量.观测值分别为,6.2.1 统计量,(4)样本k阶原点矩(简称样本k阶矩),(k=1,2,)(5)样本k阶中心矩,
3、(k=2,3,)显然Ak和Bk的观测值分别记为,6.2.1 统计量,6.3 统计量与抽样分布,6.3.3 统计中的常用分布 统计量的分布称为抽样分布为了研究抽样分布,先研究数理统计中三种重要的分布,一.2分布 定义6.3 设X1,X2,Xn为相互独立的随机变量,它们都服从标准正态N(0,1)分布,则称随机变量服从自由度为n的2分布,记为2 2(n)此处自由度指的是2中包含独立变量的个数 2(n)的概率密度为其中()称为伽马函数,,6.3.3 统计中的常用分布,2分布概率密度 图6-1 2(n)分布的概率密度曲线可以看出,随着n的增大,的图形趋于“平缓”,其图形下区域的重心亦逐渐往右下移动,6.
4、3.3 统计中的常用分布,2分布具有下面性质:(1)(可加性)设 是两个相互独立的随机变量,且(2)设 证明(1)由2分布的定义易得证明(2)因为 相互独立、同分布于N(0,1)的随机变量X1,X2,Xn,使则,6.3.3 统计中的常用分布,由于Xi独立,且注意到N(0,1)的四阶矩为3,可得,6.3.3 统计中的常用分布,【例】设总体XN(0,1),X1,X2,X6是来自总体X的样本。又假设 试确定c,使得cY服从 分布。解:由已知条件及正态分布的独立可加性,有且 与 相互独立,显然应有c0,且,于是当3c=1,即c=1/3时,cY是两个相互独立且服从N(0,1)的随机变量的平方和,由定义得
5、故当c=1/3时,cY服从 分布。,二.t分布定义6.4 设X N(0,1),Y 2(n),X与Y独立,则称随机变量 服从自由度为n的t分布,又称为学生氏分布(Student distribution),记为T t(n)t(n)的概率密度为 图6-3 t分布的概率密度曲线,6.3.3 统计中的常用分布,图6-3 t分布的概率密度曲线 显然t分布的概率密度是x的偶函数,图6-3描绘了n=1,3,7时t(n)的概率密度曲线作为比较,还描绘了N(0,1)的概率密度曲线,6.3.3 统计中的常用分布,可看出,随着n的增大,t(n)的概率密度曲线与N(0,1)的概率密度曲线越来越接近可以证明t分布具有下
6、面性质:即当n趋向无穷时,t(n)近似于标准正态分布N(0,1)一般地,若n 45,就可认为t(n)基本与N(0,1)相差无几了,6.3.3 统计中的常用分布,三.F分布定义6.5 设X2(n1),Y2(n2),且X与Y独立,称随机变量 服从自由度为(n1,n2)的F分布,记为FF(n1,n2)可以证明的概率密度函数为,6.3.3 统计中的常用分布,6.3.3 统计中的常用分布,图6-5 F分布的概率密度曲线 由F分布的定义容易看出,若F F(n1,n2),则1/F F(n2,n1),【例】设总体,而X1,X2,X15是来自总体X的简单随机样本。求 的分布解:因为,且两者相互独立,利用F分布的
7、定义有,分位数 设X为一随机变量,我们知道对于给定的实数x,PX x是事件X x的概率在统计中,我们常常需要利用给定事件X x的概率,由此确定的x是一个临界点,称为分位数(点),有如下定义:定义 设X为随机变量,若对给定的(0,1),存在x满足 PX x=,则称x为X的上 分位数(点),若X具有密度f(x),PX x=说明分位数x右边的一块阴影面积为,即 容易看出,X的上分位数x是关于 的减函数,即增大时x减少.下面给出几种常用分布的上分位数的求法:,分位数,1.设Z N(0,1),记N(0,1)的上分位数为z,即有PZ z=.由于(z)=PZ z=1 PZ z=1,由标准正态分布函数表(附表
8、3,P185)反过来查,即可以得到z的值.为使用方便,表6-1列出了标准正态分布的几个常用分位数z的值,分位数,由N(0,1)的概率密度的对称性(见图6-6)可知所以 z1-=z 图6-6 z1-与z,分位数,2.设2 2(n),记2(n)的上分位数为2(n),即有P2 2(n)=.附表5(p189)中给出了时2(n)的值,当n45时,由2(n)的渐近性质,有,分位数,3.设T t(n),记t(n)的上分位数为t(n),即有PT t(n)=;由t(n)的概率密度的对称性t1-(n)=t(n)图6-7 t1-(n)与t(n)附表6(p192)中给出了t(n)的值,当n45 时,由于t(n)近似N
9、(0,1),所以t(n)z,分位数,4.设F F(n1,n2),记F(n1,n2)的上分位数为F(n1,n2),即有 PF F(n1,n2)=附表7(p194)中给出部分F(n1,n2)的值.另外,由于FF(n1,n2)时,1/F F(n2,n1),所以故,分位数,【例】求下列分位数:(1)z0.025;20.05(20);t0.1(25);F0.05(10,15);(2)t0.975(4);(3)t0.05(55);(4)F0.9(14,10);(5)20.975(200).解:(1)查表6-1知z0.025=1.96也可由标准正态分布函数表(附表3),对函数值(z0.025)=1 0.02
10、5=0.975反查表得z0.025=1.96,分位数,分别查附表5、附表6、附表7得到 20.05(20)=31.410、t0.1(25)=1.3163、F0.05(10,15)=2.54;(2)在附表6中没有=0.975,可先查出t0.025(4)=2.7764,利用对称性得到t0.975(4)=t0.025(4)=2.7764(3)在附表6中查不到t0.05(55),用近似公式t0.05(55)z0.05=1.645,分位数,(4)在附表7中,查不到F0.9(14,10),但可查出F0.1(10,14)=2.10,故(5)在附表5表中查不到20.975(200),先查出z0.975=z0.
11、025=1.96,再作如下近似计算,分位数,正态总体的抽样分布定理 在数理统计问题中,正态分布占据着十分重要的位置,一方面因为在应用中,许多随机变量的分布或者是正态分布,或者接近于正态分布;另一方面,正态分布有许多优良性质,便于进行较深入的理论研究因此,我们着重讨论正态总体下的抽样分布,给出有关最重要的统计量样本均值和样本方差S2的抽样分布定理,6.3.4 正态总体的样本均值与样本方差的分布,定理6.1 设X1,X2,Xn为来自总体N(,2)的样本,则有 推论:,定理6.2 设X1,X2,Xn为来自总体N(,2)的样本,S 2分别为样本均值和样本方差,则有(1)(2)与S 2相互独立。,定理6
12、.3 设X1,X2,Xn为来自总体N(,2)的样本,S 2分别为样本均值和样本方差,则有,证明:由,进而 且 根据t分布的定义,【例】某厂生产的灯泡寿命近似服从正态分布N(800,402),抽取16个灯泡的样本,求平均寿命小于775小时的概率.解:设灯泡寿命总体为X,因为XN(800,402),n=16,所以样本均值 故,【例】设总体XN(62,102),为使样本均值大于60的概率不小于0.95,样本容量n至少应该取多大?解:设所需的样本容量为n,由于又查表得 即从而取n=68即可满足条件。,【例】设X1,X2,Xn为总体X N(,2)的样本,求样本方差的均值和方差 解:本题可以通过2分布的均
13、值和方差简单求出由定理6.2,所以有 于是,定理6.4 设,分别为来自N(1,12)和N(2,22)的样本,且它们相互独立,设,S12,S22,分别为相应样本的样本均值和样本方差,则(1)(2),证:(1)由于,,又 与 独立,故由正态分布的性质知所以,证(2)由定理6.2,且来自两个总体的样本是独立的,由F分布的定义知,【例】设X1,X2,X25,Y1,Y2,Y25分别为来自两个独立总体N(0,16)和N(1,9)的样本,和 分别表示相应的样本均值,求 解:因为,且相互独立,所以故=1 0.8413=0.1587,【例】若从方差相等的两个正态总体中分别抽出n1=8和n2=12的独立样本,样本方差分别为S12和S22,求 解:由于,n1=8,n2=12,所以因此 查表知F0.01(7,11)=4.89,即PF 4.89=0.01,故,作业:P130 习题6.3 5、9,