《统计量的分布.ppt》由会员分享,可在线阅读,更多相关《统计量的分布.ppt(52页珍藏版)》请在三一办公上搜索。
1、统计量的分布,随机样本和统计量,统计推断问题:电子产品的寿命个体:组成总体的单元-随机变量总体:研究对象的全体-随机变量的全体-分布函数样本:为同一分布函数F的相互独立的随机变量,称其为从分布函数得到容量为n的简单随机样本,简称样本。,统计量 是样本 的不含任何未知数的函数,它是一个随机变量。,统计量的分布称为抽样分布。,由于正态总体是最常见的总体,因此主要讨论正态总体下的抽样分布。,由于这些抽样分布的论证要用到较多的数学知识,故在本节中,主要给出有关结论。,概率密度函数,定义,设X为一随机变量,若存在非负实函数 f(x),使对任意实数 a b,有,则称X为连续型随机变量,f(x)称为X 的概
2、率密度函数,简称概率密度或密度函数.,Probability density function p.d.f.,分布函数,密度函数在区间上的积分=随机变量在区间上取值的概率,概率密度函数的性质,非负性,规范性,正态分布 Normal Distribution,正态分布的密度函数的性质与图形,关于 x=对称,(-,)升,(,+)降,单调性,对称性,拐点,中间高两边低,,对密度曲线的影响,随机变量的分布函数,设X为一随机变量,则对任意实数x,(Xx)是一个随机事件,称,为随机变量X的分布函数,F(x)是一个普通的函数!,Distribution Function,分布函数的定义,引进分布函数F(x)
3、后,事件的概率都可以用F(x)的函数值来表示。,分布函数表示事件的概率,P(Xb)=F(b),P(aXb)=F(b)F(a),P(Xb)=1 P(Xb)=1-F(b),P(aXb)=P(X b)-P(Xa)=F(b)-F(a),密度函数和分布函数的关系,积分关系,导数关系,正态分布的分布函数,标准正态分布,定义,X N(0,1)分布称为标准正态分布,密度函数,分布函数,Standard Normal distribution,偶函数,标准正态分布的概率计算,分布函数,X,-x,标准正态分布的概率计算,公式,查表,例,一般正态分布的标准化,定理,查标准正态分布表,概率计算,一般正态分布的区间概率
4、,。,。,。,设XN(1,4),求 P(0X1.6),解,例,正态分布的实际应用,分析,然后根据录取率或者分数线确定能否录取,解 成绩X服从,录取率为,可得,得,查表得,解,查表得,.,解得,故,设录取的最低分为,则应有,某人78分,可被录取。,X的取值几乎都落入以为中心,以3为半径的区间内。这是因为:,3准则,是小概率事件,概率分布的分位数(分位点),如图.,PXx=,双侧 分位数或双侧临界值的特例,当X的分布关于y轴对称时,,则称 为X分布的双侧分位数或双侧临界值.,如图.,若存在 使,标准正态分布的分位数,在实际问题中,常取0.1、0.05、0.01.,常用到下面几个临界值:,u0.05
5、=1.645,u0.01=2.326 u0.05/2=1.96,u0.01/2=2.575,数理统计中常用的分布除正态分布外,还有三个非常有用的连续型分布,即,数理统计的三大分布(都是连续型).,它们都与正态分布有密切的联系.,!,在本节中特别要求掌握对正态分布、2分布、t分布、F分布的一些结论的熟练运用.它们是后面各章的基础.,分布,定义 设总体,是 的一个样本,则称统计量 服从自由度为n的 分布,记作,自由度是指独立随机变量的个数,,分布的密度函数为,其图形随自由度的不同而有所改变.,2分布表,分布密度函数的图形,满足,的数 为 2分布的上分位数或上侧临界值,,其几何意义见图所示.,其中f
6、(y)是 2-分布的概率密度.,显然,在自由度n取定以后,的值只与有关.,例如,当n=21,=0.05时,由附表可查得,32.67,即,2分布的上分位数,2分布的双侧分位数,把满足,的数,称为 2分布的双侧分位数,或双侧临界值.,见图.,f(x),x,O,显然,,为 2分布的上 分位数.,为 2分布的上 分位数.,如当n=8,=0.05时,,2.18,17.53,2分布的数学期望与方差,设 2 2(n),则E(2)=n,D(2)=2n.,2分布的可加性,设,则,性质 设(X1,X2,Xn)为取自正态总体XN(,2)的样本,则,证明,由已知,有,XiN(,2)且X1,X2,Xn相互独立,,则,由
7、定义得,定理 设(X1,X2,Xn)为来自正态总体 XN(,2)的样本,则,(1)样本均值 与样本方差S 2相互独立;,(1)式的自由度为什么是n-1?,从表面上看,,但实际上它们不是独立的,,它们之间有一种线性约束关系:,=0,这表明,当这个n个正态随机变量中有n-1个取值给定时,剩下的一个的取值就跟着唯一确定了,故在这n项平方和中只有n-1项是独立的.所以(1)式的自由度是n-1.,定理 设(X1,X2,Xn)为来自正态总体 XN(,2)的样本,则,(1)样本均值 与样本方差S 2相互独立;,与以下补充性质的结论比较:,性质 设(X1,X2,Xn)为取自正态总体XN(,2)的样本,则,t分
8、布,定义:设随机变量XN(0,1),Y 2(n),且X与Y相互独立,则称统计量,服从自由度为n的t分布或学生氏分布,,记作,t分布的概率密度函数为,T t(n).,其形状类似标准正态分布的概率密度的图形.当n较大时,t分布近似于标准正态分布.,当n较大时,t分布近似于标准正态分布.,一般说来,当n30时,t分布与标准正态分布N(0,1)就非常接近.,但对较小的n值,t分布与标准正态分布之间有较大差异.且P|T|t0P|X|t0,其中X N(0,1),即在t分布的尾部比在标准正态分布的尾部有着更大的概率.,t 分布的数学期望与方差,设Tt(n),则E(T)=0,D(T)=,定理2,设(X1,X2
9、,Xn)为来自正态总体 XN(,2)的样本,则统计量,证,由定义得,定理3 设(X1,X2,Xn1)和(Y1,Y2,Yn2)分别是来自正态总体N(1,2)和N(2,2)的样本,且它们相互独立,则统计量,其中,、,分别为两总体的样本方差.,t 分布的上分位数,对于给定的(0 1),称满足条件,的数t(n)为t分布的上分位数或上侧临界值,,其几何意义见图.,t 分布的双侧分位数,由于t分布的对称性,称满足条件,的数t/2(n)为t分布的双侧分位数或双侧临界值,,其几何意义如图所示.,在附表中给出了t分布的临界值表.,例如,当n=15,=0.05时,查t分布表得,,t0.05(15)=t0.05/2
10、(15)=,1.753,2.131,其中t0.05/2(15)由Pt(15)t0.025(15)=0.025查得.,但当n45时,如无详细表格可查,可以用标准正态分布代替t分布查t(n)的值.,即,t(n)u,n45.,一般的t分布临界值表中,详列至n=30,当n30就用标准正态分布N(0,1)来近似.,F分布,服从第一自由度为n1,第二自由度为n2的F分布,,概率密度函数,其中,定义 设随机变量X 2(n1)、Y 2(n2),且与相互独立,则称随机变量,F 分布的上分位数,对于给定的(0 1),称满足条件,的数F(n1,n2)为F分布的上分位数或上侧临界值,,其几何意义如图所示.,其中f(y
11、)是F分布的概率密度.,F 分布的上分位数,F(n1,n2)的值可由F 分布表查得.,附表=0.1、=0.05、=0.01给出了F分布的上分位数.,当时n1=2,n2=18时,有,F0.01(2,18)=,6.01,在附表中所列的值都比较小,当 较大时,可用下面公式,查表时应先找到相应的值的表.,例如,,0.166,F 分布的双侧分位数,称满足条件,见图.,显然,,为F分布的上 分位数;,为F分布的上 分位数;,为正态总体 的样本容量和样本方差;且两个样本相互独立,则统计量,定理 设 为正态总体 的样本容量和样本方差;,证明,由已知条件知,且相互独立,,由F分布的定义有,例1 设总体XN(0,
12、1),X1,X2,Xn为简单随机样本,试问下列统计量各服从什么分布?,解,(1),因为XiN(0,1),i=1,2,n.,所以,X1-X2 N(0,2),,故,t(2).,例1 设总体XN(0,1),X1,X2,Xn为简单随机样本,试问下列统计量各服从什么分布?,续解,(2),因为X1N(0,1),,故,t(n-1).,例1 设总体XN(0,1),X1,X2,Xn为简单随机样本,试问下列统计量各服从什么分布?,续解,(3),因为,所以,F(3,n-3).,例2 若Tt(n),问T2服从什么分布?,解,因为Tt(n),,可以认为,其中UN(0,1),V2(n),,U22(1),,F(1,n).,例3 设总体XN(,42),X1,X2,X10是n=10简单随机样本,S2为样本方差,已知PS2=0.1,求.,解,因为n=10,n-1=9,2=42,,所以,2(9).,又,PS2=,=0.1,,所以,14.684.,故,14.684x,26.105,