随机变量的数字特征与极限定理.ppt

上传人:小飞机 文档编号:6613716 上传时间:2023-11-18 格式:PPT 页数:184 大小:850KB
返回 下载 相关 举报
随机变量的数字特征与极限定理.ppt_第1页
第1页 / 共184页
随机变量的数字特征与极限定理.ppt_第2页
第2页 / 共184页
随机变量的数字特征与极限定理.ppt_第3页
第3页 / 共184页
随机变量的数字特征与极限定理.ppt_第4页
第4页 / 共184页
随机变量的数字特征与极限定理.ppt_第5页
第5页 / 共184页
点击查看更多>>
资源描述

《随机变量的数字特征与极限定理.ppt》由会员分享,可在线阅读,更多相关《随机变量的数字特征与极限定理.ppt(184页珍藏版)》请在三一办公上搜索。

1、1,概率论与数理统计,第五章随机变量的数字特征与极限定理,2,第五章 随机变量的数字特征与极限定理,在前面关于随机变量及其分布的讨论中,我们较仔细地讨论了随机变量的概率分布,我们看到随机变量的概率分布(分布函数或分布列和概率密度)是随机变量的概率性质最完整的刻划,是能够完整地描述随机变量的统计规律的.,但是在许多实际问题中,求概率分布不是一件容易的事;另一方面,有时不需要知道随机变量的概率分布,而只需要知道它的某一方面的性质.,3,例如,考察某种大批生产的元件的寿命,如果知道了它的概率分布,就可以知道寿命在任一指定的界限内的元件的百分率有多少,这对该种元件的寿命状况提供了一幅完整的图景.,下面

2、我们将看到,根据这一分布我们可以算出元件的平均寿命值m,这个数m虽然不能对元件的寿命状况提供一个完整的刻划,但却在一个重要方面,且往往是人们最为关心的一个方面,刻划了元件寿命的状况,因而在应用上有极重要的意义.,类似的情况很多,比如我们在了解某一个行业的经济状况时,我们首先关心的恐怕会是其平均收入,这给了我们一个总的印象;至于收入的分布状况,除非为了特殊的研究目的,倒反而不一定是最重要的了.,4,另一类重要的数字特征,是衡量一个随机变量(或其分布)取值的散布程度.,例如,两个行业工人的平均收入大体相近,但一个行业中工人收入的分配较平均,即大多数工人的收入都在平均值上下不远处,其“散布”小;另一

3、个行业则相反,其收入远离平均值者很多,“散布”较大,这二者的实际意义当然很不同.,又如生产同一种产品的两个工厂,各自的产品平均说来都能达到规格要求,但一个工厂的波动小,较为稳定,另一个工厂则波动大,有时质量超标准,有时则低于标准不少,这二者的实际后果当然也不同.,5,上面提到的平均值和散布程度,是刻划随机变量性质的两类最重要的数字特征.,对于多维随机变量而言,则还有一类刻划各分量之间的关系的数字特征.,在本章中,我们将要介绍的数字特征有:数学期望、方差、协方差、相关系数和矩.,6,引例 考试的平均成绩问题,假设有n名同学参加了某种考试,考试后的成绩是:第一个同学得了a1分,第二个同学得了a2分

4、,第n个同学得了an分,那么他们这种考试的平均成绩,7,引例 考试的平均成绩问题,假设有n名同学参加了某种考试,考试后的成绩是:第一个同学得了a1分,第二个同学得了a2分,第n个同学得了an分.,将他们的成绩进行了汇总,发觉得x1分的人有n1个,得x2分的人有n2个,得xk分的人有nk个,其中n1+n2+nk=n,那么他们这种考试的平均成绩,8,9,第五章 随机变量的数字特征与极限定理,5.1 随机变量的数学期望,离散型随机变量的数学期望,10,定义5.1 设离散型随机变量X的分布列为P(X=xk)=pk,k=1,2,若级数,绝对收敛,即,则称该级数为离散型随机变量X的数学期望或均值,记为EX

5、或E(X),即,11,当,发散时,则称X的数学期望不存在.,定义中的绝对收敛条件是为了保证式,不受求和的次序的改变而影响其和的值.,12,如果把x1,x2,xk,看成是x轴上质点的坐标,而把p1,p2,pk,看成是相应质点的质量,质量总和为,则式,表示质点系的重心坐标.,13,常用的离散型随机变量的数学期望,例1(01分布)设随机变量X的分布列为,求EX.,解 EX=0(1p)+1p=p.,14,由前面可知,事件A的示性函数IA服从01分布:,故EIA=P(A),即任意事件的概率等于它的示性函数的数学期望.,15,例2(二项分布)设随机变量X的分布列为,求EX.,解,16,17,18,例3(泊

6、松分布)设随机变量X的分布列为,求EX.,解,19,由此看出,泊松分布的参数就是相应随机变量X的数学期望.,20,第五章 随机变量的数字特征与极限定理,5.1 随机变量的数学期望,连续型随机变量的数学期望,对以f(x)为概率密度的连续型随机变量X而言,值x和f(x)dx分别相当于离散型随机变量情况下的“xk”和“pk”,故由离散型随机变量的数学期望的定义可知,连续型随机变量的数学期望可定义如下:,21,定义5.2 设连续型随机变量X的概率密度为f(x),若积分,绝对收敛,即,则称该广义积分为连续型随机变量X的数学期望或均值,记为EX或E(X),即,22,EX的物理意义可理解为以f(x)为质量密

7、度的一维连续质点系的重心坐标.,23,常用的连续型随机变量的数学期望,例4(均匀分布)设连续型随机变量X的概率密度为,求EX.,24,解,这个结果是可以预料的,因为X在a,b上服从均匀分布,它取值的平均值当然应该是a,b的中点.,25,例5(指数分布)设连续型随机变量X的概率密度为,其中是正常数,求EX.,26,解,27,例6(正态分布)设连续型随机变量XN(,2),求EX.,解 EX=.正态分布中的参数,表示相应随机变量X的数学期望.,28,29,30,例7(柯西分布)设连续型随机变量X的概率密度为,求EX.,解 由于,故X的数学期望不存在.,31,第五章 随机变量的数字特征与极限定理,5.

8、1 随机变量的数学期望,随机变量函数的数学期望,32,随机变量函数的数学期望,关于一维随机变量函数的数学期望,有下面的定理,定理5.1 设Y=g(X),g(x)是连续函数.()若X是离散型随机变量,分布列为P(X=xk)=pk,k=1,2,,且,则有,33,()若X是连续型的随机变量,概率密度为fX(x),且,则有,根据上面的这个定理5.1可知,当求Y=g(X)的数学期望时,不必知道Y的分布,只需知道X的分布就可以了.,34,例8 设随机变量X的概率密度为,求E(sinX).,当然,我们可以先求出Y=sinX的概率密度fY(y),再由连续型随机变量的数学期望的定义求出 E(sinX).不过,这

9、样计算要麻烦得多.,35,解,36,例9 设在国际市场上每年对我国某种出口商品的需求量是随机变量X(单位为吨),它在2000,4000上服从均匀分布的,又设每售出这种商品一吨,可为国家挣得外汇3万元,但假如销售不出去而囤积于仓库,则每吨需要浪费保养费1万元,问需要组织多少货源,才能使国家的收益最大.,解 设y为预备出口的该种商品的数量,由已知条件X在2000,4000上服从均匀分布可知,这个数量y可以只考虑介于2000与4000之间的情况.,用Z表示国家的收益(单位为万元),则由题设可得,37,下面求EZ,并求使EZ达到最大的y值.,38,故当y=3500时,EZ达到最大值8250.因此,组织

10、3500吨这种商品是最佳的决策.,39,定理5.1还可以推广到二维及二维以上的随机变量函数的情况.以二维随机变量函数Z=g(X,Y)为例,有下面的定理.,定理5.2 设Z=g(X,Y),g(x,y)是连续函数()若(X,Y)是二维离散型随机变量,分布列为pij=P(X=xi,Y=yj),i,j=1,2,且,则有,40,()若(X,Y)是二维连续型随机变量,概率密度为f(x,y),且,则有,41,从式,可以得到由(X,Y)的概率密度f(x,y)求X与Y的数学期望的公式:,42,例10 设随机变量X、Y相互独立,且都服从N(0,2)分布,求,解 由二维随机变量函数的数学期望的公式,有,43,44,

11、45,46,47,例10 设(X,Y)在区域A上服从均匀分布,其中A为x轴、y轴和直线x+y+1=0所围城的区域(图5.1),求EX,E(3X+2Y),E(XY).,图5.1,48,解(X,Y)的概率密度为,于是,49,50,51,随机变量的数学期望的性质,()EC=C,C为常数;,()E(CX)=CEX,C为常数;,()E(X1+X2+Xn)=EX1+EX2+EXn;,()若X1,X2,Xn相互独立,则E(X1X2Xn)=EX1EX2EXn.,在上面的性质中,均假设数学期望是存在的.,证()将C看成一个离散型随机变量,有分布列P(C=C)=1.于是EC=CP(C=C)=C1=C.,52,()

12、设X为连续型随机变量,概率密度为f(x).令Y=g(X)=CEX,则由上面的定理5.1得,故E(CX)=CEX.,离散型随机变量的情况,可类似证明.,53,()对n=2的情况给出证明,一般的情况不难用数学归纳法推得.,先考虑连续型随机变量的情况,设(X,Y)是二维连续型随机变量,概率密度为f(x,y),则由上面的定理5.2立即可得,54,下面考虑离散型随机变量的情况,设(X,Y)是二维离散型随机变量,分布列为 pij=P(X=xi,Y=yj),i,j=1,2,则由上面的定理5.2立即可得,55,()对两个连续型随机变量的情况给出证明,离散型随机变量的情况,可类似证明;一般的情况不难用数学归纳法

13、推得.,设X,Y是两个连续型随机变量,概率密度分别fX(x)和fY(y),于是由X与Y相互独立得(X,Y)的概率密度f(x,y)可由fX(x)和fY(y)的乘积来表达,从而,56,例12 设XB(n,p),求EX.,解 在前面的例2中,我们已经直接用数学期望的定义求得了EX=np.现在利用数学期望的的性质()来作.,设在n重伯努利试验中,成功的次数为Y,而在每次试验成功的概率为p,则Y与X有相同的分布,从而有相同的数学期望.,若设Xi表示在第i次试验成功的次数,i=1,2,n,则Xi的分布列为,57,且,由Xi的分布列得,EXi=p,于是由数学期望的的性质()得到,与例2的作法比较可见,本例的

14、作法要简单得多.,58,例13 设r个人在楼的底层进入电梯,楼上有n层,每个乘客在楼的任一层下电梯的概率是相同的.如果到楼的某一层无乘客下电梯,电梯就不停车,求直到乘客都下完时电梯停车的次数X的数学期望.,解 设Xi表示在第i层电梯停车的次数,i=1,2,n,则,易见,59,下面求Xi的分布列(i=1,2,n),由于每个人在楼的任一层下电梯的概率均为1/n,故他不在楼的某一层下电梯的概率均为,故r个人同时不在第i层下电梯的概率为,即,60,从而,于是,61,因此,在这个例子中,若r=10,n=10,则EX=6.5,即电梯平均停车6.5次.,在上面的例子中,把一个比较复杂的随机变量X拆成n个比较

15、简单的随机变量Xi的和,然后通过这些比较简单的随机变量的数学期望,根据数学期望的性质()求得了X的数学期望,这样的方法是概率论中常采用的方法.,62,例 同时掷四颗匀质的骰子,求所得点数之和的数学期望?,解 设X表示四颗骰子的点数之和,则X是一个离散型的随机变量,它的取值是4,5,24.,设Xi表示第i颗骰子的点数,i=1,2,3,4,,则,63,例13 设N个人进行验血,有两种方案:,(1)对每个人的血液逐个化验,共需进行N次化验;,(2)将采集的每个人的血液分成两份,按k个人一组混合后进行化验(设N为k的倍数),若呈阴性反应,则认为k个人的血都是阴性反应;如果混合后血液呈阳性反应,则需要对

16、k个人的另一份血液逐个进行化验,这时k个人的血总共要化验k+1次.,假设所有人的血液呈阳性反应的概率都是p,且各次的化验结果是相互独立的,试说明适当选取k可使第二个方案减少化验次数.,解 设X表示第二个方案下的总化验次数,64,解 设X表示第二个方案下的总化验次数,Xi为第i个分组的化验次数(i=1,2,N/k),则,EX表示第二个方案下的总的平均化验次数,EXi表示第i个分组的平均化验次数(i=1,2,N/k).,下面先求EXi.,按照第二个方案的规定,Xi可能取两个值:混合血液呈阴性时,Xi=1;血液呈阳性,Xi=k+1.,65,因为“Xi=1”表示“组内k个人的血都是阴性”这个事件,又由

17、于各次的化验结果是相互独立的,所以,于是,66,因此,这就是第二个方案下的总的平均化验次数,由此可知,只要选k使,即,67,就可以使第二个方案减少化验次数.,当q已知时,若选k使,取最小值,就可以使化验次数最少.,例如,当q=0.9时,可以证明,选k=4可以使f(k)最小,这时,故当q=0.9,k=4时,第二个方案的化验次数比第一个方案平均减少40%.,68,例 设XN(4,9),YU0,4,Z=2XY5,求EZ?,解 EZ=E(2XY5)=2EXY5.,若X,Y相互独立,则EZ=E(2XY5)=2EXY5=2EXEY5.,由于XN(4,9),YU0,4,故EZ=E(2XY5)=2EXY5=2

18、EXEY5=11.,69,引例 考试的平均成绩问题,y,O,EX,EY,x,70,第五章 随机变量的数字特征与极限定理,5.2 方差,方差的概念,数学期望反映了随机变量的平均值,它是一个很重要的数字特征.但是,在某些场合下只知道平均值是不够的.,例如研究灯泡的质量时,人们不仅要知道灯泡寿命X的平均值EX的大小,而且还要知道这些灯泡的寿命X离开EX的平均偏离程度如何.,71,如果平均偏离较小,那么说明这批灯泡的寿命大部分接近它的均值,这也说明灯泡厂的生产是稳定的;这时,如果EX比较大,那么灯泡的质量就是比较好的.相反,如果X离开EX的平均偏离较大,那么即使均值较大,生产质量也是有问题的.,再如在

19、打靶比赛中,不但要求射击准确,而且还要求稳定.如果某射手射击10次,虽然有7次正中靶心,但是另外3次却打歪了,弹孔离靶心很远,甚至子弹射到了靶外打伤了人,这也说明此人的射击技术是成问题的.,72,那么,用什么量来衡量这种平均偏离程度呢?,人们自然会想到采用|XEX|的平均值E|XEX|.,但是式E|XEX|带有绝对值号,运算不便,故采用(XEX)2的平均值E(XEX)2来代替E|XEX|.,显然,E(XEX)2的大小完全能够反映X离开EX的平均偏离大小的,这个值就称为X的方差.定义如下:,73,定义5.3 设X是一个随机变量,若E(XEX)2存在,则称E(XEX)2是X的方差,记作DX,即DX

20、=E(XEX)2.,同时,称方差的平方根是X的标准差或根方差,记作X,即,由于X与X具有相同的量纲,故在实际问题中经常被采用.,74,根据一维随机变量函数的数学期望公式,对于离散型和连续型随机变量的方差可以分别得到如下的表达式:,()离散型随机变量的情况,其中P(X=xk)=pk,k=1,2,.,()连续型随机变量的情况,其中fX(x)为随机变量X的概率密度.,75,关于方差的计算,常利用如下的公式 DX=EX2(EX)2.这个公式可用的数学期望的性质来证明.,证,76,常用的离散型、连续型随机变量的方差.,例1(01分布)设随机变量X的分布列为(q=1p),求DX.,解 EX=0(1p)+1

21、p=p EX2=02(1p)+12p=pDX=p2p=p(1p)=pq.,77,例2(二项分布)设随机变量X的分布列为,求DX.,解,78,解,79,80,81,例3(泊松分布)设随机变量的分布列为,求DX.,解,82,83,84,由此看出,泊松分布的参数既是相应随机变量X的数学期望又是它的方差.,85,例4(均匀分布)设XUa,b,求DX.,解 EX=(a+b)/2,而,86,故,由此看出,在a,b上服从均匀分布的随机变量的方差与区间长度的平方成正比.,87,例5(指数分布)设XE(),即连续型随机变量X的概率密度为,其中是正常数,求DX.,解 EX=1/,而,88,89,90,例6(正态分

22、布)设连续型随机变量XN(,2),求EX.,解 EX=,DX=2.正态分布N(,2)中的参数和2分别表示相应随机变量X的数学期望和方差.,91,92,随机变量的方差的性质,()DC=0,C为常数;,()D(CX)=C2DX,C为常数;,()若X1,X2,Xn相互独立,则D(X1+X2+Xn)=DX1+DX2+DXn;,()DX=0的充要条件是X取某一常数值a的概率为1,即 P(X=a)=1,a=EX.,在上面的性质中,均假设方差是存在的.,证()DC=E(CEC)2=E(CC)2.,93,证()DC=E(CEC)2=E(CC)2.,()D(CX)=E(CX)2E(CX)2=C2EX2C2(EX

23、)2=C2EX2C2(EX)2=C2DX,()对n=2的情况给出证明,一般的情况,证法相同,()证明略.,94,又,95,因为X与Y相互独立,故,于是,从而,96,应用方差的性质计算方差,常常能使运算简化,见下例,例6 设 XB(n,p),求DX.,解 设在n重伯努利试验中,成功的次数为Y,而在每次试验成功的概率为p,则Y与X有相同的分布,从而有相同的方差(0p1,q=1p).,设Xi表示在第i次试验成功的次数,i=1,2,n,则Xi的分布列为,97,显然,Y可以用Xi(i=1,2,n)表示为:,由Xi的分布列可知,DXi=pq,i=1,2,n.由于 X1,X2,Xn相互独立,故由方差的性质(

24、)得到,与前面的作法比较可见,本例的作法要简单得多.,98,表5.1 几种常用分布表,99,100,101,102,103,例 设随机变量X1,X2,X3,X4相互独立,均服从(0,1)上的均匀分布,而,求DY?,解,104,105,第五章 随机变量的数字特征与极限定理,5.3 协方差和相关系数、矩,对二维随机变量(X,Y)来说,数字特征EX、EY只反映了X与Y各自的平均值,而DX、DY只反映了X与Y各自离开平均值的偏离程度,它们对X与Y之间的相互联系没有提供任何信息.,自然,我们也希望有一个数字特征能够在一定程度上反映这种相互联系.,106,又,107,在证明方差的性质()若X与Y相互独立,

25、则D(X+Y)=DX+DY,D(XY)=DX+DY时,我们曾得到E(XEX)(YEY)=0.,这说明当E(XEX)(YEY)0时,X与Y肯定不独立.,进一步的研究表明E(XEX)(YEY)的数值,在一定程度上反映了X与Y之间的相互联系,因而引入如下的定义.,108,定义5.4 设(X,Y)是一个二维随机变量,如果E(XEX)(YEY)存在,则称它为X与Y的协方差,记作Cov(X,Y)即Cov(X,Y)=E(XEX)(YEY).,109,由协方差的定义5.4及上节的两个等式D(X+Y)=E(XEX)2+E(YEY)2+2E(XEX)(YEY)与E(XEX)(YEY)=E(XY)EXEY可知,对任

26、意的两个随机变量X与Y,下面的两个式子成立D(X Y)=DX+DY2Cov(X,Y)Cov(X,Y)=E(XY)EXEY.,110,由协方差的定义,可得下面的性质:,()Cov(X,Y)=Cov(Y,X);,()Cov(aX,bY)=abCov(X,Y),a,b为常数;,()Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y).,111,协方差虽然在一定程度上反映了两个随机变量X与Y之间的相互联系,但它有以下两个缺点:,(1)从协方差的性质()Cov(aX,bY)=abCov(X,Y)可见,它的大小依赖于计量单位;,(2)从协方差的定义Cov(X,Y)=E(XEX)(YEY)可见,

27、它的数值不仅与X、Y本身的取值有关,而且还与各随机变量关于它们的偏差有关.,如果随机变量X或Y中的任何一个与其数学期望的偏差很小,那么无论X与Y之间的联系如何密切,它们的协方差也会很小.,112,为了克服以上两个缺点,引入以下的定义.,定义5.5 设(X,Y)是一个二维随机变量,如果X与Y的协方差Cov(X,Y)存在,且DX0、DY0,则称,为X与Y的相关系数,记作XY,即,113,下面研究相关系数XY到底表示X与Y之间的什么联系?,为此,介绍下面的定理.,定理5.3 设是X与Y的相关系数,则,()|1;,()|=1的充分必要条件是P(Y=a+bX)=1,其中a、b为常数.,114,35设X与

28、Y为具有二阶矩的随机变量,且设,求a,b使Q(a,b)达到最小值Qmin,并证明,115,解,116,解方程组,得,此时,117,118,下面研究相关系数XY到底表示X与Y之间的什么联系?,为此,介绍下面的定理.,定理5.3 设是X与Y的相关系数,则,()|1;,()|=1的充分必要条件是P(Y=a+bX)=1,其中a、b为常数.,119,证()为了证明|1,只需证明2Cov(X,Y)24DXDY.,利用初等代数中的典型方法,只要说明以DX、2Cov(X,Y)、DY为系数的二次三项式非负即可.,事实上,对任意的实数t,有t2DX2Cov(X,Y)t+DY=D(tXY)0.,可见,上式左端的二次

29、三项式没有两个相异的实数根,故判别式非正,即 2Cov(X,Y)24DX DYCov(X,Y)2DX DY从而()得证.,120,()|=1,即式2Cov(X,Y)24DXDY 中等号成立的充分必要条件是式t2DX2Cov(X,Y)t+DY=D(tXY)0左端的二次三项式有重根t=b,即存在实数b,使D(bXY)=0.,由方差的性质()知式D(bXY)=0成立的充分必要条件是P(YbX=a)=1,其中a为常数.从而()得证.,121,由定理5.3可知,当|=1时,Y与X之间存在着线性关系,这个事件的概率为1.,由本章的习题35可以看出,的绝对值越接近于1,Y与X之间越近似的有线性关系.,Y与X

30、之间的相关系数是刻画X与Y之间线性相关程度的一个数字特征.,122,定义5.6 若X与Y的相关系数=0,则称X与Y不相关.,定理5.4 随机变量X与Y不相关与下面的每一个结论都是等价的.,()Cov(X,Y)=0;,()D(XY)=DX+DY;,()E(XY)=EXEY.,证明()因为,故=0与Cov(X,Y)=0等价.,123,()由D(XY)=DX+DY2Cov(X,Y)可知Cov(X,Y)=0与D(XY)=DX+DY 是等价的.,()由Cov(X,Y)=E(XY)EXEY可知Cov(X,Y)=0与E(XY)=EXEY 是等价的.,124,注意,随机变量X与Y的不相关和X与Y相互独立是两个

31、不相同的概念.,X与Y的不相关是指X与Y之间不存在线性关系,不是说它们之间不存在其它关系.即由X与Y的不相关,推不出X与Y相互独立.,但是反过来,若X与Y相互独立,则X与Y一定不相关,这是因为由Cov(X,Y)=E(XY)EXEY 可以看出,若X与Y相互独立,则Cov(X,Y)=0 必然成立.,125,例1设连续型随机变量XN(0,1),Y=X2,求X与Y的相关系数XY.,解 因XN(0,1),故EX=0,于是由Cov(X,Y)=E(XY)EXEY得Cov(X,Y)=E(XY)=EX3而EX3=0.故Cov(X,Y)=0即XY=0.,126,127,128,129,在例1中,虽然X与Y是不相关

32、的,但是X与Y并不独立.,事实上,因X21X2=且0P(X21)10P(X2)1故 P(X2,Y1)P(X2)P(Y1)可见,X与Y不相互独立.,130,本节的最后介绍一下矩的概念,它将在数理统计的矩估计法中得到应用.,定义5.7 若EXk(k=1,2,)存在,则称它为随机变量X的k阶原点矩;,若E(XEX)k(k=1,2,)存在,则称它为随机变量X的k阶中心矩.,由矩的定义可知,数学期望为一阶原点矩,方差是二阶中心矩.又一阶中心矩恒为0.,矩的计算可以利用随机变量函数的数学期望公式进行.,131,第五章 随机变量的数字特征与极限定理,5.5 大数定律,在前面的1.5节概率的统计定义中曾经讲过

33、,一个事件A发生的频率具有稳定性,即当试验次数n增大时,频率接近于某个常数(A的概率).,在5.1节随机变量的数学期望中又讲过,随机变量X在n次试验中所取的n个值的平均值也具有稳定性,且被稳定的那个值就是X的数学期望.,132,这里所谓的“稳定性”,或当n很大时“接近一个常数”等等,都是不确切的说法,只是一种直观的描述而已.,初学者常常把它理解为微积分中的变量与极限的关系,这是错误的.,因为事件的频率以及随机变量取的n个值的平均值是随着试验的结果而变的,是随机变量,不是微积分中所描述的变量.,那么究竟如何用确切的数学语言来描述频率与概率、平均值与数学期望之间的关系呢?大数定律回答了这个问题.,

34、为了讲述大数定律,下面先讲一个重要的不等式,它在实际上和理论上都有重要的应用.,133,切比雪夫(Tchebysheff)不等式,定理5.5 对任意随机变量X,若它的方差DX存在,则对任意的0有,成立.,134,证 设X是一个连续型随机变量,概率密度为f(x),则,135,当X是离散型随机变量时,只需在上述的证明中把概率密度换成分布列,把积分好换成求和号即可.,由于,故,与,等价.,136,式,和式,都称为切比雪夫不等式.,切比雪夫不等式给出了在随机变量X的分布未知的情况下,利用EX、DX对X的概率分布进行估计的一种方法.,137,例如,由式,可以断言,不管X的分布是什么,对于任意的正整数k都

35、有,当k=3时,有,138,由3.5节例1知,当XN(,2)时,有,比较上面的两个式子可知,切比雪夫不等式给出的估计比较粗糙;但要注意,切比雪夫不等式只利用了数学期望和方差.,139,例1设EX=2,DX=0.4,试用切比雪夫不等式估计P(1X3)?,解,140,例2设随机变量X、Y的数学期望都是2,方差分别为1和4,而相关系数为0.5,则根据切比雪夫不等式估计,解,141,142,大数定律,定理5.6(伯努利大数定律)设在n重伯努利试验中,成功的次数为Yn,而在每次试验中成功的概率为p(00有,证 由于YnB(n,p)故EYn=np,DYn=npq(q=1p)由此得,143,代入切比雪夫不等

36、式,得,144,故,利用式,显然可得式,的等价形式,145,在式,中,Yn/n是在n重伯努利试验中成功的频率,而p是成功的概率.,因此伯努利大数定律告诉我们:当试验次数n足够大时,成功的频率与成功的概率之差的绝对值不小于任一指定的正数的概率可以小于任何预先指定的正数,这就是频率稳定性的一种较确切的解释.,利用式,可以得到相应的等价解释.,146,根据伯努利大数定律,在实际应用中,当试验次数n很大时,可以用事件的频率来近似代替事件的概率.,定义5.8 称随机变量序列X1,X2,Xn,(或简记为Xn)是相互独立的,如果对任意的n2,X1,X2,Xn是相互独立的.此时,若所有Xi又有相同的分布函数,

37、则称X1,X2,Xn,是独立同分布的随机变量序列.,147,定理5.7(切比雪夫大数定律)设X1,X2,Xn,是相互独立的随机变量序列,若有常数C,使DXiC,i=1,2,,则对任意的0有,或,148,证 因为,由切比雪夫不等式,得,149,令n,则得,若利用式,则可以推得式,150,在概率论中我们称满足式,或式,的随机变量序列X1,X2,Xn,服从大数定律.,151,推论 设X1,X2,Xn,是独立同分布的随机变量序列,具有有限的数学期望和方差,EXi=,DXi=2,i=1,2,,则对任意的0有,或,这是因为,故由切比雪夫大数定律立即可得上面的两个式子.,152,容易验证伯努利大数定律的结论

38、可以由此推论得出.,在上述的推论中,假设所讨论的随机变量的方差是存在的,但实际上,方差存在这个条件并不是必要的,现不加证明地介绍下面的定理.,定理5.8(辛钦Khintchine大数定律)设X1,X2,Xn,是独立同分布的随机变量序列,具有有限的数学期望,EXi=,i=1,2,,则对任意的0有,或,153,在式,中,可以被看作随机变量X在n次重复独立试验中n个观察值的算术平均值,而=EX.,因此,辛钦大数定律告诉我们:当试验次数n足够大时,,154,因此,辛钦大数定律告诉我们:当试验次数n足够大时,平均值,与数学期望之差的绝对值不小于任一指定的正数的概率可以小于任何预先指定的正数,这就是算术平

39、均值稳定性的一种较确切的解释.,所以,在测量中常用多次重复测得的值的算术平均值来作为被测量的近似值.,155,一般地,设Z1,Z2,Zn,是一个随机变量序列,a是一个常数,若对任意的0有,则称随机变量序列Z1,Z2,Zn,依概率收敛于a.记为,156,按照依概率收敛的定义,伯努利大数定律表明了频率Yn/n依概率收敛于p,即,式,所表示的关系为,157,式,所表示的关系为,158,第五章 随机变量的数字特征与极限定理,5.6 中心极限定理,在前面5.5节大数定律中,我们讨论了独立随机变量的平均值,序列的依概率收敛问题,现在我们来讨论独立随机变量和,159,在随机变量的各种分布中,正态分布占有特殊

40、重要的地位.,早在19世纪,德国数学家高斯(Gauss)在研究测量误差时,就引进了正态分布.,其后,人们又发现在实际问题中,许多随机变量都近似服从正态分布.,为什么正态分布如此广泛地存在,从而在概率论中占有如此重要的地位?,数学家从关于独立随机变量和的极限分布的研究中找到了答案.,160,20世纪前半期,概率论研究的中心课题之一,就是寻求独立随机变量和的极限分布是正态分布的条件.因此,把这一方面的定理统称为中心极限定理.,较一般的中心极限定理表明:如果被研究的随机变量是大量的独立随机变量的和,其中每一个别随机变量对于总和只起微小作用,则可以认为这个随机变量近似服从正态分布.,这就揭示了正态分布

41、的重要性.因为现实中许多随机变量都具有上述的性质,例如测量误差、射击弹着点的横坐标或纵坐标、人的身高或体重等都是由大量的随机因素综合影响的结果,因而是近似服从正态分布的.,161,以下叙述一个常用的中心极限定理,定理5.9(独立同分布的中心极限定理)如果随机变量序列X1,X2,Xn,独立同分布,并且具有有限的数学期望和方差,EXi=,DXi=20,i=1,2,,则对一切x,有,证明需要用到随机变量的特征函数,略.,162,从式,可以看出,不管Xi(i=1,2,)服从什么分布,只要n充分大,随机变量,就近似地服从N(0,1),而,163,随机变量,近似地服从N(n,n2).,此时,我们称,渐近地

42、服从N(0,1).,定理5.9又被称为列维林德伯格(LevyLindeberg)中心极限定理.,164,例1 计算机在进行加法时,对每个被加数取整(取为最接近于它的整数),设所有的取整误差是相互独立的,且它们均在(0.5,0.5)上服从均匀分布.若将1500个数相加,问误差总和的绝对值不超过15的概率是多少?,解 设Xi表示第i个被加数的取整误差,i=1,2,1500,则XiU(0.5,0.5)且X1,X2,X1500相互独立,故=EXi=0 2=DXi=1/12.,165,令Z=X1+X2+X1500,由列维林德伯格中心极限定理,得,166,于是,所求的概率为,167,168,定理5.10

43、德莫弗拉普拉斯(De MoivreLaplace)定理 设在n重伯努利试验中,成功的次数为Yn,而在每次试验中成功的概率为p(0p1),q=1p,则对一切x,有,169,证明 设Xi表示在第i次试验成功的次数,i=1,2,n,则Xi的分布列为,且,由于X1,X2,Xn是独立同分布的随机变量序列分布列,且EXi=p,DXi=pq(i=1,2,n)有限,故满足定理5.9(独立同分布的中心极限定理)的条件,,170,于是由式,得,171,定理5.10表明二项分布以正态分布为极限分布,推论 对定理5.10中的n重伯努利试验,n充分大时,有,证 从,由定理5.10(德莫弗拉普拉斯定理)即得结论.,172

44、,由推论可知,当n很大时,二项分布的概率计算问题,可以转化为正态分布来计算,这将使计算量大大减小.,例如,当n很大时,若要计算,工作量是惊人的.但是,用式,只要查一下正态分布函数表就可以轻松地求出它的相当精确的近似值.,173,例2 重复投掷硬币100次,设每次出现正面的概率均为0.5,问“出现正面次数大于50,小于61”的概率是多少?,解 设出现正面的次数为Yn,现在,由式,得,174,175,应该指出:定理5.10及其推论中的Yn是仅取非负整数值0,1,2,n的随机变量,注意到正态分布是连续型的分布,所以在求概率P(Ynm)(m为正整数)时,为了得到较好的近似值,可以用下面的近似公式,17

45、6,例3 以X表示将一枚匀称的硬币重复投掷40次中出现正面次数,试用正态分布求P(X=20)的近似值,再与精确值比较.,解 这里n=40,p=1/2,q=1/2,故,177,而精确解为,当然,求例3这样的概率还有德莫弗拉普拉斯局部极限定理可用,这里就不予以论述了.,178,由前面的讨论可见,对二项分布,当n充分大,以致npq较大时,正态近似是相当好的近似.,进一步的分析表明,当接近于0或1时,用正态近似效果不好,这时就要用到泊松近似了.,由定理2.10(二项概率的泊松逼近定理),当p(或q)很小,而np(或nq)大小适中时,泊松近似是较好的.,在实际中,一般当0.19时,用正态近似;当p0.1

46、(或p0.9)且n10时,用泊松近似.,179,例1 一生产线生产的产品成箱包装,每箱的重量是随机的.假设每箱的平均重量为50千克,标准差为5千克.若用最大载重量为5吨的汽车承运,试利用中心极限定理说明,每辆车最多可以装多少箱,才能保证不超载的概率大于0.977.(2)=0.977,其中(x)是标准正态分布函数.),解 设Xi(i=1,2,n)是装运的第i箱的重量(单位:千克),n是所求的箱数.,由条件可以把X1,X2,Xn视为独立同分布的随机变量,而n箱的总重量Tn=X1+X2+Xn是独立同分布随机变量之和.,180,由条件知,根据列维林德伯格(独立同分布的)中心极限定理,Tn近似服从正态分布N(50n,25n).,箱数n决定于条件,181,由此可见,182,从而n98.02,即每辆车最多可以装98箱,才能保证不超载的概率大于0.977.,183,48某保险公司多年的资料表明,在索赔户中,被盗索赔户占20%,以表示在随机抽查100个索赔户中因被盗而向保险公司索赔的户数,求,解,184,48某保险公司多年的资料表明,在索赔户中,被盗索赔户占20%,以表示在随机抽查100个索赔户中因被盗而向保险公司索赔的户数,求,解,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号