《华东交通大学概率论及数理统计PPT课件第四章.ppt》由会员分享,可在线阅读,更多相关《华东交通大学概率论及数理统计PPT课件第四章.ppt(78页珍藏版)》请在三一办公上搜索。
1、第四章、随机变量的数字特征,第一节:数学期望第二节:方差第三节:协方差及相关系数第四节:矩、协方差矩阵,在前面的课程中,我们讨论了随机变量及其分布,如果知道了随机变量X的概率分布,那么X的全部概率特征也就知道了.,然而,在实际问题中,概率分布一般是较难确定的. 而在一些实际应用中,人们并不需要知道随机变量的一切概率性质,只要知道它的某些数字特征就够了.,例: 在评定某地区粮食产量的水平时,最关心的 是平均产量; 在检查一批棉花的质量时,既需要注意纤维的平均长度,又需要注意纤维长度与平均长度的偏离程度; 考察南宁市居民的家庭收入情况,我们既知 家庭的年平均收入,又要研究贫富之间的差异程度;,因此
2、,在对随机变量的研究中,确定某些数字特征是重要的 .而所谓的数字特征就是用数字表示随机变量的分布特点。,在这些数字特征中,最常用的是,数学期望、方差、协方差和相关系数,第一节 数学期望,离散型随机变量的数学期望连续型随机变量的数学期望随机变量函数的数学期望数学期望的性质小结,引例:某7人的数学成绩为90,85,85,80,80, 75,60,则他们的平均成绩为,以频率为权重的加权平均,一、离散型随机变量的数学期望,定义1 设X是离散型随机变量,它的分布率是: PX=xk=pk , k=1,2,请注意 :离散型随机变量的数学期望是一个绝对收敛的级数的和.数学期望简称期望,又称为均值。,若级数,绝
3、对收敛,,则称级数,即,的和为随机变量X的数学期望,记为 ,例1、(0-1)分布的数学期望,X服从0-1分布,其概率分布为,若X 服从参数为 p 的0-1分布, 则E(X) = p,例2,试比较甲、乙两人的技术那个好,一旅客8:20到车站,求他候车时间的数学期望.,例3 按规定,某车站每天8:009:00,9:0010:00都恰有一辆客车到站,但到站时刻是随机的,且两者到站的时间相互独立。其规律为:,例4,定义2 设X是连续型随机变量,其密度函数为 f (x),如果积分,绝对收敛,则称此积分值为X的数学期望, 即,请注意 : 连续型随机变量的数学期望是一个绝对收敛的积分.,二、连续型随机变量的
4、数学期望,例4,例5,若将这两个电子装置串联连接组成整机,求整机,寿命(以小时计) N 的数学期望.,的分布函数为,三、随机变量函数的数学期望,1. 问题的提出:,设已知随机变量X的分布,我们需要计算的不是X的期望,而是X的某个函数的期望,比如说g(X)的期望. 那么应该如何计算呢?,一种方法是,因为g(X)也是随机变量,故应有概率分布,它的分布可以由已知的X的分布求出来. 一旦我们知道了g(X)的分布,就可以按照期望的定义把Eg(X)计算出来.,那么是否可以不先求g(X)的分布而只根据X的分布求得Eg(X)呢?,下面的定理指出,答案是肯定的.,使用这种方法必须先求出随机变量函数g(X)的分布
5、,一般是比较复杂的 .,(1) 当X为离散型时,它的分布率为P(X= xk)=pk ;,(2) 当X为连续型时,它的密度函数为f(x).若,定理 设Y是随机变量X的函数:Y=g (X) (g是连续函数),该公式的重要性在于: 当我们求Eg(X)时, 不必知道g(X)的分布,而只需知道X的分布就可以了. 这给求随机变量函数的期望带来很大方便.,上述定理还可以推广到两个或两个以上随 机变量的函数的情况。,例6,例 7,解:,设(X,Y)在区域A上服从均匀分布,其中A为x轴,y轴和直线x+y+1=0所围成的区域。求EX,E(-3X+2Y),EXY。,四、数学期望的性质,1. 设C是常数,则E(C)=
6、C;,4. 设X、Y 相互独立,则 E(XY)=E(X)E(Y);,2. 若k是常数,则E(kX)=kE(X);,3. E(X+Y) = E(X)+E(Y);,(诸Xi相互独立时),请注意:由E(XY)=E(X)E(Y)不一定能推出X,Y 独立,五、数学期望性质的应用,例8 求二项分布的数学期望,若 XB(n,p),,则X表示n重贝努里试验中的“成功” 次数.,现在我们来求X的数学期望 .,可见,服从参数为n和p的二项分布的随机变量X的数学期望是 n p.,XB(n,p),若设,则 X= X1+X2+Xn,= np,i=1,2,n,因为 P(Xi =1)= p,P(Xi =0)= 1-p,所以
7、 E(X)=,则X表示n重贝努里试验中的“成功” 次数.,本题是将X分解成数个随机变量之和,然后利用随,机变量和的数学期望等于随机变量数学期望的和来求,数学期望的,此方法具有一定的意义.,六、小结,这一讲,我们介绍了随机变量的数学期望,它反映了随机变量取值的平均水平,是随机变量的一个重要的数字特征.,接下来的一讲中,我们将向大家介绍随机变量另一个重要的数字特征:,方差,第二节 方差,方差的定义方差的计算方差的性质切比雪夫不等式小结,上一节我们介绍了随机变量的数学期望,它体现了随机变量取值的平均水平,是随机变量的一个重要的数字特征.,但是在一些场合,仅仅知道平均值是不够的.,由此可见,研究随机变
8、量与其均值的偏离程度是十分必要的.那么,用怎样的量去度量这个偏离程度呢?容易看到,这个数字特征就是我们这一节要介绍的,方差,能度量随机变量与其均值E(X)的偏离程度. 但由于上式带有绝对值,运算不方便,通常用量,来度量随机变量X与其均值E(X)的偏离程度.,一、方差的定义,记为D(X)或Var(X),即,D(X)=Var(X)=EX-E(X)2,若X的取值比较分散,则方差D(X)较大.,方差刻划了随机变量的取值对于其数学期望的离散程度 .,若X的取值比较集中,则方差D(X)较小;,因此,D(X)是刻画X取值分散程度的一个量,它是衡量X取值分散程度的一个尺度。,X为离散型,分布率PX=xk=pk
9、,由定义知,方差是随机变量 X 的函数 g(X)=X-E(X)2 的数学期望 .,二、方差的计算,X为连续型,X概率密度f(x),计算方差的一个简化公式,D(X)=E(X2)-E(X)2,展开,证:D(X)=EX-E(X)2,=EX2-2XE(X)+E(X)2,=E(X2)-2E(X)2+E(X)2,=E(X2)-E(X)2,利用期望性质,例1,设随机变量X具有(01)分布,其分布率为,求D(X) .,解,由公式,因此,0-1分布,例2,解,X的分布率为,上节已算得,因此,泊松分布,例3,解,因此,均匀分布,例4,设随机变量X服从指数分布,其概率密度为,解,由此可知,指数分布,三、方差的性质,
10、1. 设C 是常数, 则 D(C)=0 ;,2. 若 C 是常数, 则 D(CX)=C2 D(X) ;,3. 设 X 与 Y 是两个随机变量,则 D(X+Y)= D(X)+D(Y)+2EX-E(X)Y-E(Y),4. D(X)=0 PX= C=1 ,这里C=E(X),下面我们证明性质3,证明,若 X,Y 相互独立, 由数学期望的性质4得,此性质可以推广到有限多个相互独立的随机变量之和的情况.,例6 设XB(n,p),求E(X)和D(X).,则 是n次试验中“成功” 的次数,下面我们举例说明方差性质的应用 .,解,XB(n,p),“成功” 次数 .,则X表示n重努里试验中的,于是,i=1,2,n
11、,由于X1,X2, Xn 相互独立,= np(1- p),E(Xi)= p,D(Xi)=,p(1- p) ,例7,解,于是,例如,例8,解,由于,故有,四、切比雪夫不等式,或,由切比雪夫不等式可以看出,若 越小,则事件|X-E(X)| 的概率越大,即随机变量X 集中在期望附近的可能性越大.,证,我们只就连续型随机变量的情况来证明.,当方差已知时,切比雪夫不等式给出了r.v X与它的期望的偏差不小于 的概率的估计式 .,如取,可见,对任给的分布,只要期望和方差 存在, 则 r.v X取值偏离E(X)超过 3 的概率小于0.111 .,例9 已知正常男性成人血液中 ,每一毫升白细胞数平均是7300
12、,均方差是700 . 利用切比雪夫不等式估计每毫升白细胞数在52009400之间的概率 .,解:设每毫升白细胞数为X,依题意,E(X)=7300,D(X)=7002,所求为 P(5200 X 9400),P(5200 X 9400),= P(-2100 X-E(X) 2100),= P |X-E(X)| 2100,由切比雪夫不等式,P |X-E(X)| 2100,即估计每毫升白细胞数在52009400之间的概率不小于8/9 .,六、小结,这一讲,我们介绍了随机变量的方差.,它是刻划随机变量取值在其中心附近离散程度的一个数字特征 .,下一讲,我们将介绍刻划两r.v间线性相关程度的一个重要的数字特
13、征:,协方差、相关系数,第三节 协方差及相关系数,协方差相关系数,小结,前面我们介绍了随机变量的数学期望和方差,对于二维随机变量(X,Y),我们除了讨论X与Y的数学期望和方差以外,还要讨论描述X和Y之间关系的数字特征,这就是本讲要讨论的,协方差和相关系数,量E X-E(X)Y-E(Y) 称为随机变量X和Y的协方差,记为Cov(X,Y) ,即, Cov(X1+X2,Y)= Cov(X1,Y) + Cov(X2,Y), Cov(X,Y)= Cov(Y,X),一、协方差,2.简单性质, Cov(aX,bY) = ab Cov(X,Y) a,b 是常数,Cov(X,Y)=E X-E(X)Y-E(Y)
14、,1.定义,Cov(X,Y)=E(XY) -E(X)E(Y),可见,若X 与 Y 独立, Cov(X,Y)= 0 .,3、计算协方差的一个简单公式,由协方差的定义及期望的性质,可得,Cov(X,Y)=E X-E(X)Y-E(Y) ,=E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y),=E(XY)-E(X)E(Y),即,特别地,D(X+Y)= D(X)+D(Y)+ 2Cov(X,Y),4. 随机变量和的方差与协方差的关系,二、相关系数,为随机变量 X 和 Y 的相关系数 .,在不致引起混淆时,记 为 .,相关系数的性质:,证: 由方差的性质和协方差的定义知,对任意实数 b, 有,
15、0D(Y-bX)= b2D(X)+D(Y)-2b Cov(X,Y ),D(Y- bX)=,2. X和Y独立时, =0,但其逆不真.,由于当X和Y独立时,Cov(X,Y)= 0.,故,= 0,请看下例.,事实上,X的密度函数,例1 设X服从(-1/2, 1/2)内的均匀分布 , 而Y=cos X,不难求得,存在常数 a,b(b0),,使 PY= a + b X=1,,即 X 和 Y 以概率 1 线性相关.,因而 =0,,即X和Y不相关 .,但Y与X有严格的函数关系,,即X和Y不独立 .,相关系数刻划了X和Y间“线性相关”的程度.,但对下述情形,独立与不相关等价,前面,我们已经看到:,若 X 与
16、Y 独立,则X与Y不相关,,但由X与Y不相关,不一定能推出X与Y独立.,4、二维正态分布独立与相关的关系,三、小结,这一节我们介绍了协方差、相关系数、,相关系数是刻划两个变量间线性相关程度的一个重要的数字特征.,注意独立与不相关并不是等价的.,当(X,Y) 服从二维正态分布时,有,第四节 矩、协方差矩阵,原点矩 中心矩协方差矩阵n 元正态分布的概率密度小结,一、 原点矩 中心矩,定义 设X和Y是随机变量,若,存在,称它为X的k阶原点矩,简称 k阶矩,存在,称它为X的k阶中心矩,可见,均值 E(X)是X一阶原点矩,方差D(X),是X的二阶中心矩。,协方差Cov(X,Y)是X和Y的二阶混合中心矩.
17、,称它为 X 和 Y 的 k+L 阶混合(原点)矩.,称它为X 和 Y 的 k+L 阶混合中心矩.,可见,,二、协方差矩阵,将二维随机变量(X1,X2)的四个二阶中心矩,排成矩阵的形式:,称此矩阵为(X1,X2)的协方差矩阵.,类似定义n 维随机变量(X1,X2, ,Xn) 的协方差矩阵.,为(X1,X2, ,Xn) 的协方差矩阵,三、n 元正态分布的概率密度,f (x1,x2, ,xn),则称 X 服从 n 元正态分布.,其中C是(X1,X2, ,Xn) 的协方差矩阵.,|C|是它的行列式, 表示C的逆矩阵,,X 和 是 n 维列向量, 表示X 的转置.,设 =(X1,X2, ,Xn)是一个
18、n维随机向量,若它的概率密度为,n元正态分布的几条重要性质,1. X=(X1,X2, ,Xn)服从n元正态分布,若 X=(X1, X2 , , Xn) 服从 n 元正态分布,,Y1,Y2, ,Yk是Xj(j=1,2,n)的线性函数,,则 (Y1,Y2, ,Yk) 也服从多元正态分布.,2. 正态变量的线性变换不变性.,3. 设(X1,X2, ,Xn)服从n元正态分布,则,“X1,X2, ,Xn相互独立”,等价于,“X1,X2, ,Xn两两不相关”,例 设随机变量X和Y相互独立且XN(1,2), YN(0,1). 试求Z=2X-Y+3的概率密度.,故X 和Y 的联合分布为正态分布,X 和Y 的任意线性组合是正态分布.,解: XN(1,2),YN(0,1),且 X 与Y 独立,D(Z)=4D(X)+D(Y)=8+1=9,E(Z)=2E(X)-E(Y)+3=2+3=5,即 ZN(E(Z), D(Z),ZN(5, 32),四、小结,在这一节中我们学习了随机变量的原点矩和中心矩以及协方差矩阵 .,一般地 , n维随机变量的分布是不知道的 , 或者太复杂 , 以至于在数学上不易处理 , 因此在实际中协方差矩阵就显得重要了 .,