协方差及相关系数课件.pptx

上传人:小飞机 文档编号:1552105 上传时间:2022-12-04 格式:PPTX 页数:39 大小:1.05MB
返回 下载 相关 举报
协方差及相关系数课件.pptx_第1页
第1页 / 共39页
协方差及相关系数课件.pptx_第2页
第2页 / 共39页
协方差及相关系数课件.pptx_第3页
第3页 / 共39页
协方差及相关系数课件.pptx_第4页
第4页 / 共39页
协方差及相关系数课件.pptx_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《协方差及相关系数课件.pptx》由会员分享,可在线阅读,更多相关《协方差及相关系数课件.pptx(39页珍藏版)》请在三一办公上搜索。

1、协方差及相关系数,一、协方差与相关系数的概念及性质,二、相关系数的意义,三、小结,第三节 协方差及相关系数,前面我们学习了随机变量的数学期望与方差,关于多维随机变量,除了其数学期望与方差外,我们还要研究反映各分量之间关系的数字特征,其中最重要的,就是现在要讨论的,协方差与相关系数,1、 问题的提出,一、协方差与相关系数的概念及性质,在讨论这个问题之前,我们先看一个例子。在研究子女与父母的相象程度时,有一项是关于父亲的身高与其成年儿子身高的关系。,这个地方有两个变量,一个是父亲的身高,一个是成年儿子身高、为了研究二者关系,英国统计学家皮尔逊收集了1078个父亲及其成年儿子身高的数据, 画出了一张

2、散点图。,问:父亲及其成年儿子身高存在如何的关系呢?,类似的问题有:,1、吸烟和患肺癌有什么关系?,定义 对两个随机向量(X,Y),若E(X-EX)(Y-EY)存在, 则称 cov(X,Y)=E(X-EX)(Y-EY) 为X与Y的协方差。,特别, 若X=Y,则 cov(X,X)=E(X-EX)2=D(X),因此,方差是协方差的特例,协方差刻画两个随机变量之间的“某种”关系、,能够证明 若(X,Y)服从二维正态分布,即,则,2、 定义,可见,若X与Y独立,则,4、 计算协方差的一个简单公式,Cov(X,Y)= 0 、,Cov(X,Y)=E(XY)-E(X)E(Y),D(X+Y)= D(X)+D(

3、Y)+2Cov(X,Y),3 随机变量与的方差与协方差的关系,(5) Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y),(3) Cov(X,Y)=Cov(Y,X) (对称性),5、简单性质,(4) Cov(aX,bY)=abCov(X,Y) 其中 a、b是常数,下面请大伙儿利用上面所学的知识进行证明。,(1) Cov(X,X)=D(X),(2) Cov(X,c)=0 (c为常数),协方差的数值在一定程度上反映了X与Y相互间的联系,但它受X与Y本身数值大小的影响、如令X*=kX,Y*=kY,这时X*与Y*间的相互联系与X与Y的相互联系应该是一样的,然而,Cov(X*,Y*)=k2

4、Cov(X,Y),为了克服这一缺点,在计算X与Y的协方差之前,先对X与Y进行标准化:,再来计算X*与Y*的协方差,如此就引进了相关系数的概念、,为随机变量X与Y的相关系数 (correlation coefficient)、,1、定义:若D(X)0, D(Y)0,且Cov(X,Y)存在时,称,在不致引起混淆时,记 为 .,二、相关系数,2、 相关系数的性质,注意 |XY| 的大小反映了X,Y之间线性关系的紧密程度: XY=0时, X,Y之间无线性关系; |XY|=1时,X,Y之间具有线性关系、,XY0,X,Y正相关XY0,X,Y负相关,XY 0,X,Y相关XY=0,X,Y不相关,(XY=1,X

5、,Y完全正相关),(XY=-1,X,Y完全负相关),完全正相关 Y=aX+b a0,完全负相关 Y=aX+b a0,x,y,0,完全不相关,正相关,负相关,例:将一枚密度均匀硬币抛n次,分别以X与Y记作正反面出现的次数,则X与Y的相关系数为,A:0 B:1 C:-1 D:1或-1,解:因为XYn,即PY=-X+n=1,因此X与Y完全负相关,故,从而选C。,注:若,例2 (X,Y)的联合分布为:,求相关系数XY,并判断X,Y是否相关,是否独立、,解:,例2 (X,Y)的联合分布为:,求相关系数XY,并判断X,Y是否相关,是否独立、,解:,从而:,另一方面:,P(X=-1,Y=-1)=1/8P(X

6、=-1)P(Y=-1)=(3/8)(3/8),因此X与Y不独立、,这里可以利用相关系数的定义和微积分的知识可得 即 为X和Y的相关系数,,结论,例3,解,X , Y 不相关,X ,Y 相互独立,X , Y 不相关,若 ( X , Y ) 服从二维正态分布,X , Y 相互独立,X , Y 不相关,不相关与相互独立,解,例4,这一讲我们主要介绍了协方差与相关系数,相关系数是刻划两个随机变量间线性相关程度的重要的数字特征,它取值在-1到1之间、,假如两个变量之间存在强相关,则已知一个变量的值对预测另一个变量的值将特别有帮助,如前面几个引例。,小 结,1、定义,2、 协方差矩阵,例 设随机变量X与Y

7、相互独立且XN(1,2), YN(0,1)、 试求Z=2X-Y+3的概率密度、,故X 与Y 的联合分布为正态分布,X 与Y 的任意线性组合是正态分布、,解: XN(1,2),YN(0,1),且 X 与Y 独立,D(Z)=4D(X)+D(Y)=8+1=9,E(Z)=2E(X)-E(Y)+3=2+3=5,即 ZN(E(Z), D(Z),故 Z 的概率密度是,ZN(5, 32),契比雪夫不等式,证明,取连续型随机变量的情况来证明、,切比雪夫不等式,得,切比雪夫不等式只利用随机变量的数学期望及方差就可对的概率分布进行估计。 从切比雪夫不等式还能够看出, 关于给定的 0, 当方差越小时,事件|X-E(X

8、)|发生的概率也越小,即X的取值越集中在E(X)附近、这进一步说明方差确实是一个描述随机变量与其期望值离散程度的一个变量、 当D(X)已知时,切贝雪夫不等式给出了X与E(X)的偏差小于 的概率的估计值、,切比雪夫不等式的用途: (1)证明大数定律;(2)估计事件的概率。,例1 已知正常男性成人血液中 ,每一毫升白细胞数平均是7300,均方差是700 、 利用切比雪夫不等式估计每毫升白细胞数在52009400之间的概率 、,解:设每毫升白细胞数为X,依题意,E(X)=7300,D(X)=7002,所求为 P(5200 X 9400),P(5200 X 9400),= P(-2100 X-E(X) 2100),= P |X-E(X)| 2100,由切比雪夫不等式,P |X-E(X)| 2100,即估计每毫升白细胞数在52009400之间的概率不小于8/9 、,例2 设电站供电网有10000盏电灯,夜晚每盏灯开灯的概率均为0、7,假定灯的开、关是相互立的,使用切贝雪夫不等式估计夜晚同时开着的灯数在6800到7200盏之间的概率。 解 令X表示在夜晚同时开着的灯数目,则X服从n=10000,p=0、7的二项分布,这时,由切贝雪夫不等式可得:,感谢您的聆听!,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号