《正态总体下的抽样分布.ppt》由会员分享,可在线阅读,更多相关《正态总体下的抽样分布.ppt(29页珍藏版)》请在三一办公上搜索。
1、第二节正态总体下的抽样分布,统计量 是样本 的不含任何未知数的函数,它是一个随机变量,统计量的分布称为抽样分布。,由于正态总体是最常见的总体,因此这里主要讨论正态总体下的抽样分布.,由于这些抽样分布的论证要用到较多的数学知识,故在本节中,我们主要给出有关结论,以供应用.,正态总体样本均值的分布,设总体,是 的一个样本,则样本均值服从正态分布,U分布,概率分布的分位数(分位点),如图.,PXx=,双侧 分位数或双侧临界值的特例,当X的分布关于y轴对称时,,则称 为X分布的双侧分位数或双侧临界值.,如图.,若存在 使,U分布的上侧分位数,对标准正态分布变量UN(0,1)和给定的,上侧分位数是由:,
2、PUu=,即,PUu=1-,(u)=1-,确定的点u.,如图.,例如,=0.05,而,PU1.645=0.05,所以,u0.05=1.645.,U分布的双侧分位数,的点u/2为标准正态分布的双侧分位数或双侧临界值.,如图.,u/2可由PUu/2=/2,即(u/2)=1-/2,反查标准正态分布表得到,,PU1.96=0.05/2,例如,求u0.05/2,,得u0.05/2=1.96,标准正态分布的分位数,在实际问题中,常取0.1、0.05、0.01.,常用到下面几个临界值:,u0.05=1.645,u0.01=2.326 u0.05/2=1.96,u0.01/2=2.575,数理统计中常用的分布
3、除正态分布外,还有三个非常有用的连续型分布,即,数理统计的三大分布(都是连续型).,它们都与正态分布有密切的联系.,!,在本章中特别要求掌握对正态分布、2分布、t分布、F分布的一些结论的熟练运用.它们是后面章节的基础.,分布,定义 设总体,是 的一个样本,则称统计量 服从自由度为n的 分布,记作,自由度是指独立随机变量的个数,,分布的密度函数为,其图形随自由度的不同而有所改变.,2分布表(附表5(P175).,分布密度函数的图形,满足,的数 为 2分布的上分位数或上侧临界值,,其几何意义见图5-5所示.,其中f(y)是 2-分布的概率密度.,显然,在自由度n取定以后,的值只与有关.,例如,当n
4、=21,=0.05时,由附表5(P175)可查得,,32.67,即,2分布的上分位数,2分布的双侧分位数,把满足,的数,称为 2分布的双侧分位数,或双侧临界值.,见图.,显然,,为 2分布的上 分位数.,为 2分布的上 分位数.,如当n=8,=0.05时,,2.18,17.54,2分布的数学期望与方差,设 2 2(n),则E(2)=n,D(2)=2n.,2分布的可加性,设,则,性质 设(X1,X2,Xn)为取自正态总体XN(,2)的样本,则,证明,由已知,有,XiN(,2)且X1,X2,Xn相互独立,,则,由定义5.3得,定理 设(X1,X2,Xn)为来自正态总体 XN(,2)的样本,则,(1
5、)样本均值 与样本方差S 2相互独立;,(2)式的自由度为什么是n-1?,从表面上看,,但实际上它们不是独立的,,它们之间有一种线性约束关系:,=0,这表明,当这个n个正态随机变量中有n-1个取值给定时,剩下的一个的取值就跟着唯一确定了,故在这n项平方和中只有n-1项是独立的.所以(2)式的自由度是n-1.,定理 设(X1,X2,Xn)为来自正态总体 XN(,2)的样本,则,(1)样本均值 与样本方差S 2相互独立;,与以下补充性质的结论比较:,性质 设(X1,X2,Xn)为取自正态总体XN(,2)的样本,则,三、t分布,设随机变量XN(0,1),Y 2(n),且X与Y相互独立,则称统计量,服
6、从自由度为n的t分布(Student)分布,,记作,t分布的概率密度函数为,T t(n).,其图形如图5-4所示(P123),,其形状类似标准正态分布的概率密度的图形.,当n较大时,t分布近似于标准正态分布.,当n较大时,t分布近似于标准正态分布.,一般说来,当n30时,t分布与标准正态分布N(0,1)就非常接近.,但对较小的n值,t分布与标准正态分布之间有较大差异.且P|T|t0P|X|t0,其中X N(0,1),即在t分布的尾部比在标准正态分布的尾部有着更大的概率.,t 分布的数学期望与方差(补充),设Tt(n),则E(T)=0,D(T)=,定理,设(X1,X2,Xn)为来自正态总体 XN
7、(,2)的样本,则统计量,证,由定义得,定理,设(X1,X2,Xn1)和(Y1,Y2,Yn2)分别是来自正态总体N(1,2)和N(2,2)的样本,且它们相互独立,则统计量,其中,、,分别为两总体的样本方差.,t 分布的上分位数,对于给定的(0 1),称满足条件,的数t(n)为t分布的上分位数或上侧临界值,,其几何意义见图.,t 分布的双侧分位数,由于t分布的对称性,称满足条件,的数t/2(n)为t分布的双侧分位数或双侧临界值,,其几何意义如图所示.,在附表4(P174)中给出了t分布的临界值表.,例如,当n=15,=0.05时,查t分布表得,,t0.05(15)=t0.05/2(15)=,1.
8、753,2.131,其中t0.05/2(15)由Pt(15)t0.025(15)=0.025查得.,但当n45时,如无详细表格可查,可以用标准正态分布代替t分布查t(n)的值.,即,t(n)u,n45.,一般的t分布临界值表中,详列至n=30,当n30就用标准正态分布N(0,1)来近似.,四、F分布,服从第一自由度为n1,第二自由度为n2的F分布,,概率密度函数,其中,其图形见图5-6.(P124),F 分布的上分位数,对于给定的(0 1),称满足条件,的数F(n1,n2)为F分布的上分位数或上侧临界值,,其几何意义如图5-7所示.,其中f(y)是F分布的概率密度.,F 分布的上分位数,F(n1,n2)的值可由F 分布表查得.,附表6(P177P182)分=0.1、=0.05、=0.01=0.025、=0.005、=0.001、给出了F分布的上分位数.,当时n1=2,n2=18时,有,F0.01(2,18)=,6.01,在附表6中所列的值都比较小,当 较大时,可用下面公式,查表时应先找到相应的值的表.,例如,,0.166,F 分布的双侧分位数,称满足条件,见图.,显然,,为F分布的上 分位数;,为F分布的上 分位数;,定理,为正态总体 的样本容量和样本方差;,设 为正态总体 的样本容量和样本方差;,且两个样本相互独立,则统计量,证明,由已知条件知,且相互独立,,由F分布的定义有,