《第32章-随机变量数字特征课件.ppt》由会员分享,可在线阅读,更多相关《第32章-随机变量数字特征课件.ppt(99页珍藏版)》请在三一办公上搜索。
1、主要内容,数学期望分位数与众数方差、协方差和相关系数大数定理与中心极限定理,一、数学期望,例.将一枚骰子随机地投掷102次,记录每次出现的点数:x1,x2,x102.求其平均出现点数?解:用X表示投骰子出现的结果,X的分布为:,平均出现点数,计算方法:X的所有可能取值和相应的概率之积的累加。注:这里的概率指的是权重系数。,平均出现点数为3.5:说明每次投掷骰子,可以期望得到的点数为3.5。,1、离散型数学期望的定义,定义:设离散型随机变量X的分布律为:,如果级数 是一个有限值,则称该级数为X的数学期望,记作,例.甲、乙两制药工人在一天生产中出现废品的概率分别是:,设两人的日产量相等,问谁的技术
2、更好?,解:E(X1)=00.4+10.3+20.2+30.1=1 E(X2)=00.3+10.5+20.2+30=0.9 可见甲平均废品数比乙多10%,因此乙的技术好。,2、连续型数学期望的定义,收敛时,称此积分的值为随机变量X的数学期望,记作,定义:设连续型随机变量X的概率密度为 则当积分,例.设随机变量X服从指数分布,其概率密度为求E(X).,分部积分公式,解:,注:可类似地定义随机变量函数的期望定义。,3、数学期望的性质,(1).常数的数学期望等于它自己.设C为常数,则E(C)=C(2).常数因子可以从数学期望符号下提出。设X为一个随机变量,C为常数,则E(CX)=CE(X),(3).
3、两个随机变量的和的数学期望等于它们各自的数学期望之和.E(X+Y)=E(X)+E(Y)一般情形,n个随机变量的和的数学期望等于它们各自的数学期望的和.E(X1+X2+Xn)=E(X1)+E(X2)+E(Xn),(4).随机变量的线性函数的数学期望等于这个随机变量的数学期望的同一线性函数 E(kX+b)=kE(X)+b,(5).两个相互独立的随机变量的积的数学期望等于它们各自的数学期望之积.E(XY)=E(X)E(Y)一般情形,n个相互独立的随机变量的积的数学期望等于它们各自的数学期望的积.E(X1X2Xn)=E(X1)E(X2)E(Xn),4、常见随机变量的数学期望,(1).二点分布(0-1分
4、布),E(X)=0 q+1 p=p,(2).二项分布:,因为X为n次独立实验中事件A发生的次数,且在每次实验中A发生的概率为p.引入随机变量X1,X2,Xn,其中,在第i次实验时事件A发生在第i次实验时事件A不发生,则X1,X2,Xn独立,且Xi服从两点分布.而X=X1+X2+Xn服从二项分布,从而 E(X)=E(X1+X2+Xn)=E(X1)+E(X2)+E(Xn)=p+p+p=np,(3).Poisson分布:,(4).正态分布:,二、分位数和众数,分位数的定义:对于任意类型的随机变量X,如果能找到数,使得下列二式同时成立则称 为随机变量X的100 百分位,记作.,分位数,分位数包括:中位
5、数和百分位数,1、中位数的由来,平均分,(一)中位数,这便是提出中位数的原因,算术平均数是最常用的数学方法之一.但是用算术平均数来作为代表数,有2个缺点:一是容易受异常值的影响;二是计算比较复杂,不能一眼看出。,2、中位数的定义,设有n个数据,将它们从小到大依次排列为x1,x2,xn如果n是奇数,则 是中位数;如果n是偶数,则 是中位数。,3、中位数的严格数学定义,定义1:对于任意类型的随机变量X,如果能找到数x,使得下列二式同时成立则称x为随机变量X的中位数,记作Me.,例.设随机变量X可能取值0和1,且求X的中位数.,例.设随机变量X可能取值0和1,且求X的中位数.,注:对于连续型随机变量
6、,中位数是把随机变量的概率分布划分为2个相等部分的数,即:,例.设随机变量X的概率密度为求X的中位数.,百分位数的定义:对于任意类型的随机变量X,如果能找到数x,使得下列二式同时成立则称x为随机变量X的100 百分位,记作.,(二)百分位数,四分位数:将所有数值按大小顺序排列并分成四等份,处于三个分割点位置的得分就是四分位数。最小的四分位数称为下四分位数,所有数值中,有四分之一小于下四分位数,四分之三大于下四分位数。中点位置的四分位数就是中位数。最大的四分位数称为上四分位数,所有数值中,有四分之三小于上四分位数,四分之一大于上四分位数。也有叫第25百分位数、第75百分位数的。,1、四分位数的计
7、算,例.求7,9,4,4,6,6,6,8,8,11的四分位数.4,4,6,6,6,7,8,8,9,11,2、上侧 分位数,对于任意类型的随机变量X,如果能找到数x,使得则称x为随机变量X的上侧 分位数,记作.,3、双侧 分位数:分布对称时,对于任意类型的随机变量X,如果能找到数x,使得则称x为随机变量X的双侧 分位数,记作.,例.已知XN(0,1),求(1).上侧分位数u0.05 标准正态分布函数表 正态分布的双侧临界值表(2).双侧分位数u0.01 标准正态分布函数表 正态分布的双侧临界值表,(三)众数,定义:设离散型随机变量X的概率函数为 P(X=xi)=pi,i=1,2,并且x1,x2,
8、按大小顺序排列,如果能找到xk,使得下列二式同时成立:pk pk-1,pk pk+1则称xk为随机变量X的众数,记作Mo.,众数即数据中重复出现次数最多的数据,例.求7,9,4,4,6,6,6,8,8,11 的众数.例.众数是否唯一?,注:,某厂职工的月工资数统计表,平均数中位数众数,平均数、中位数和众数关系,三、方差、协方差和相关系数,例.两个班级学生的考试成绩.,E(甲)=73,E(乙)=73,如何区分这两种情况?,甲班学生成绩比较整齐,学生的分数都围绕在其平均值附近,散布的程度较小。乙班则反之,其分数的两极分化较大。这时,需要引入一个指标来刻画这种离散的程度。,偏离平均?,偏离均方?,1
9、、方差的定义,设X是一个随机变量,若E(X-E(X)2存在,则称E(X-E(X)2为X的方差,记作V(X),即 V(X)=E(X-E(X)2,定义1:,(一)方 差,2、方差的计算,离散型随机变量连续型随机变量,注:方差计算的常用公式,3、随机变量方差的性质,(1).常数的方差等于0。设C为常数,则:V(C)=0(2).常数与随机变量之积的方差等于常数的平方和随机变量的方差之积.设X为一个随机变量,C为常数,则:V(CX)=C2V(X),(3).两个相互独立的随机变量之和的方差等于它们各自方差之和.V(X+Y)=V(X)+V(Y)一般地,n个相互独立的随机变量之和的方差等于它们各自方差之和.V
10、(X1+X2+Xn)=V(X1)+V(X2)+V(Xn),例.设随机变量X服从指数分布,其概率密度为求V(X).,解:,注:常见随机变量的方差,1、二项分布:2、Poisson分布:3、正态分布:,(二)协方差,记随机变量X、Y的期望分别是 E(X)=m1,E(Y)=m2X的方差是(X-m1)与(X-m1)的乘积的期望,即V(X)=E(X-m1)(X-m1)数学期望E(X-EX)(Y-EY)称为随机变量X与Y的协方差,记做:COV(X)。,(三)标准差,X以厘米为单位,则V(X)是以厘米2为单位.为了保持量纲上的一致,,(四)变异系数,例.假定正常青年男子身高的均数为170cm,标准差为6cm
11、.体重的均数为60kg,标准差为7kg.CV(身高)0.035,CV(体重)0.117,(五)相关系数,当比较两个随机变量的离散程度时常用相关系数.注:相关系数是刻划线性相关的程度.,第 八 节 大 数 定 理 与 中 心 极 限 定 理,大数定律的定义,Def.,一、大数定律,定理(契比雪夫大数定律),契比雪夫,注解,证明,由契比雪夫不等式可得,证毕,关于定理的说明:,(这个接近是概率意义下的接近),即在定理条件下,n个随机变量的算术平均,当n无限增加时,几乎变成一个常数.,定理的另一种叙述:,证明,引入随机变量,伯努利,定理(伯努利大数定律),显然,根据定理有,证毕,关于贝努利定理的说明:
12、,故而当n很大时,事件发生的频率与概率有较大偏差的可能性很小.在实际应用中,当试验次数很大时,便可以用事件发生的频率来代替事件的概率.,关于辛钦定理的说明:,(1)不要求方差存在;,(2)贝努利定理是辛钦定理的特殊情况.,辛钦资料,定理(辛钦定律),三、典型例题,解,独立性依题意可知,检验是否具有数学期望?,例1,说明每一个随机变量都有数学期望,检验是否具有有限方差?,说明离散型随机变量有有限方差,故满足契比雪夫定理的条件.,解,由辛钦定理知,例2,例3,伯努利资料,Jacob Bernoulli,Born:27 Dec 1654 in Basel,SwitzerlandDied:16 Aug
13、 1705 in Basel,Switzerland,契比雪夫资料,Pafnuty Chebyshev,Born:16 May 1821 in Okatovo,RussiaDied:8 Dec 1894 in St Petersburg,Russia,辛钦资料,Aleksandr Yakovlevich Khinchin,Born:19 July 1894 in Kondrovo,Kaluzhskaya guberniya,RussiaDied:18 Nov 1959 in Moscow,USSR,二、中心极限定理,定理(林德贝格-列维中心极限定理),定理表明:,李雅普诺夫,定理(李雅普诺夫定
14、理),则随机变量之和的标准化变量,定理表明:,证明,德莫佛,拉普拉斯,定理(德莫佛拉普拉斯定理),令,根据(林-列)定理得,定理表明:,正态分布是二项分布的极限分布,当n充分大时,可以利用该定理来计算二项分布的概率.,下面的图形表明:正态分布是二项分布的逼近.,中心极限定理的意义,在后面的课程中,我们还将经常用到中心极限定理.,中心极限定理是概率论中最著名的结果之一,它不仅提供了计算独立随机变量之和的近似概率的简单方法,而且有助于解释为什么很多自然群体的经验频率呈现出钟形曲线这一值得注意的事实.,三、典型例题,解,由定理4.6,随机变量Z近似服从正态分布N(0,1),例1,其中,一船舶在某海区
15、航行,已知每遭受一次海浪的冲击,纵摇角大于 3 的概率为1/3,若船舶遭受了90000次波浪冲击,问其中有2950030500次纵摇角大于 3 的概率是多少?,解,将船舶每遭受一次海浪的冲击看作一次试验,并假设各次试验是独立的,在90000次波浪冲击中纵摇角大于 3 的次数为X,则X是一个随机变量,例2,所求概率为,分布律为,直接计算很麻烦,利用德莫佛拉普拉斯定理,李雅普诺夫资料,Aleksandr Mikhailovich Lyapunov,Born:6 June 1857 in Yaroslavl,RussiaDied:3 Nov 1918 in Odessa,Russia,德莫佛资料,Abraham de Moivre,Born:26 May 1667 in Vitry(near Paris),FranceDied:27 Nov 1754 in London,England,拉普拉斯资料,Pierre-Simon Laplace,Born:23 March 1749 in Beaumont-en-Auge,Normandy,FranceDied:5 March 1827 in Paris,France,