《概率论与数理统计协方差和相关系数.ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计协方差和相关系数.ppt(16页珍藏版)》请在三一办公上搜索。
1、(1)定义:D(X)=,1.设C是常数,则D(C)=0;,2.若k是常数,则D(kX)=k2 D(X);,3.若X1与X2 独立,则D(X1+X2)=D(X1)+D(X2);,复习:方差,(2)计算:,方法2:,方法1:由定义,(3)性质:,一般地:D(X1+X2)=D(X1)+D(X2)+2 EX-E(X)Y-E(Y)。,(3)泊松分布:,(1)(0-1)分布:,D(X)=p(1-p),(2)二项分布:,D(X)=np(1-p),D(X)=,(4)正态分布:,(5)均匀分布:,D(X)=,D(X)=,(6)指数分布,(4)常见分布的方差:,(5)切比雪夫不等式,设r.vX具有均值E(X)=,
2、方差D(X)=2,则对 0,有不等式,证明:根据数学期望与方差的性质:,证明E(Y)=0,D(Y)=1,P99T10:设E(X),D(X)均存在,且D(X)0,通常把由 r.v X 构造r.v Y的过程叫做对r.v X 标准化。注意:更重要的是要知道如何将一个随机变量标准化.,3 协方差和相关系数 Covariance and,correlation coefficient,一、协方差,若X、Y相互独立,说明,对于r.vX,Y,,D(X+Y)=D(X)+D(Y)+2Cov(X,Y),Cov(X,Y)=0,Cov(X,X)=D(X);Cov(X,k)=0.,E(XY)=E(X)E(Y)+Cov(
3、X,Y),对于向量X和Y,期望和方差只反映了变量各自的情况,没有相互之间的关系。,若X、Y相互独立,EX-E(X)Y-E(Y)=0,,因此 EX-E(X)Y-E(Y)在一定程度上反映了X与Y之间的关系,称为X与Y的协方差。,1)用定义式 Cov(X,Y)=EX-E(X)Y-E(Y),2、计算方法,2)用简单公式 Cov(X,Y)=E(XY)-E(X)E(Y),为X与Y的协方差,记作Cov(X,Y),即,设(X,Y)是一随机向量,称EX-E(X)Y-E(Y),Cov(X,Y)=EX-E(X)Y-E(Y),1、定义:,例1 设r.vX和Y的联合分布律为,求Cov(X,Y),解:,用公式 Cov(X
4、,Y)=E(XY)-E(X)E(Y),可求出(X,Y)关于X,Y的边缘分布律,Cov(X,Y)=0-0=0,说明:虽然Cov(X,Y)=0,但,即X与Y不独立。,3、性质)Cov(X,Y)=Cov(Y,X);(对称性)Cov(aX,bY)=abCov(X,Y),a,b是任意常数;)Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y),注:,协方差的大小在一定程度上反映了X和Y相互间的关系,但它还受X与Y本身的系数影响.例如:,Cov(10X,10Y)=100Cov(X,Y),为了克服这一缺点,在计算协方差时,先对X与Y进行标准化.即:,实际上,10X与10Y之间的关系和X与Y之间的
5、关系应一致。,标准化的协方差称为X,Y的相关系数,二、相关系数(correlation coefficient),设(X,Y)是一随机向量,当D(X)0,D(Y)0,则称数值,为X,Y的线性相关系数,简称相关系数.,注:,1、定义:,相关系数是标准化的随机变量X*,Y*的协方差。,XY 没有单位,只与两个r.v有关,能更好地反映X与Y之间的关系。,2、性质:,相关系数刻划了X和Y间“线性相关”的程度.,将e视为关于a,b的二元函数,求驻点:,解得,(*)1)成立。,2)成立。,要使Y与某个a+bX最为接近,就是要找a,b使得误差平方e值最小.,证:,e=EY-(a+bX)2=E(Y2)+b2E
6、(X2)+a2-2bE(XY)+2abE(X)-2aE(Y),对任意的a,b,令,刻画了Y与a+bX的偏离程度,若=0,Y与X无线性关系;,若0|1,=0时,称X和Y不相关。,由(*)式知,XY 的含义,说明:,1)对于随机变量X,Y,下面事实是等价的,2)X与Y相互独立,X与Y不相关,X与Y不相关,只说明X与Y之间没有线性关系,但可以有非线性关系;,但是若二维r.v,E(XY)=E(X)E(Y);,即X与Y不相关,3、重要结论,Cov(X,Y)=0;,X与Y不相关;,则X与Y相互独立,D(X+Y)=D(X)+D(Y).,而X与Y独立是指X,Y之间既无线性关系,也无非线性关系,故“独立”必然不
7、相关,但反之不然。,例2 设随机变量(X,Y)的概率密度函数为,证明:先求边缘概率密度函数,fY(y),同理,所以,f(x,y)fX(x)fY(y),故X与Y不独立,验证X与Y不相关,且不相互独立。,Cov(X,Y)=E(XY)-E(X)E(Y)=0,即X与Y不相关,三、几个常用的数字特征,1、矩(moment):,则称之为X与Y的k+l 阶混合中心矩。,定义:设X与Y是随机变量,,显然,E(X)为一阶原点矩,D(X)是二阶中心矩;Cov(X,Y)是二阶混合中心矩。,2、协方差矩阵(了解),二维r.v(X,Y)有四个二阶中心矩即cov(X,X)、cov(X,Y)、cov(Y,X)、cov(Y,Y),将它们排成矩阵 称为X,Y的协方差矩阵.,n维r.v(X1,X2,.Xn),称为r.v(X1,X2,.Xn)的协方差矩阵。,小结:,这一节我们介绍了协方差和相关系数。,相关系数是刻划两个变量间线性相关程度的一个重要的数字特征.,注意独立与不相关并不是等价的.,当(X,Y)服从二维正态分布时,有,作业:P99 T13,14,15,预习内容:4,