《随机变量的分布与数字特征.ppt》由会员分享,可在线阅读,更多相关《随机变量的分布与数字特征.ppt(127页珍藏版)》请在三一办公上搜索。
1、第二章 随机变量的分布及其数字特征,2.1 随机变量及其分布,一.随机变量的概念,为了全面地研究随机试验的结果,揭示客观存在着的统计规律性,我们将随机试验的结果与实数对应起来,将随机试验的结果数量化,引入随机变量的概念.,引入随机变量后,就可以用随机变量X描述事件.一般对于任意的实数集合L,X L表示事件|X()L.,通常,我们用大写字母X、Y、Z等表示随机变量.,二.离散型随机变量的概率分布,分布律还可以简单地表示为:,分布律具有以下性质:,上表称为随机变量X的概率分布表。,例:设一汽车在开往目的地的道路上需经过四个信号灯,每个信号灯以1/2的概率允许或禁止汽车通过.以X表示汽车首次停下时,
2、它已通过的信号灯数(设各信号灯的工作是相互独立的),求X的分布律.,解 以p表示每个信号灯禁止汽车通过的概率,易知X的分布律为,或写成PX=k=(1-p)kp,k=0,1,2,3;PX=4=(1-p)4.,以p=1/2代入得,.,(2),从而,从上面的例子可知,若已知离散型随机变量的概率分布p(xi),则对任意区间I,三.分布函数,分布函数的性质,例:设随机变量X的分布律为,求X的分布函数,并求PX1/2,P3/2X 5/2,P2 X 3.,解:由概率的有限可加性得,即,PX1/2=F(1/2)=1/4,P3/2X 5/2=F(5/2)-F(3/2)=3/4-1/4=1/2,P2 X 3=F(
3、3)-F(2)+PX=2=1-1/4+1/2=3/4,-1,1,2,3,0.25,0.5,1,x,F(x),F(x)的示意图,四、离散型随机变量的分布函数,设离散型随机变量分布律为PX=xk=pk,k=1,2,由概率的可列可加性得X的分布函数为F(x)=PXx=PX=xk=pk 这里和式是对于所有满足xkx的k求和.,解,(1),(2),五、连续型随机变量及其概率密度,综上所述,如果令,则有,连续型随机变量的定义,由微积分学知识可知,连续型随机变量的分布函数是一个连续函数.,设X为连续型随机变量,则对任意的实数ab,即X落在区间的概率为密度函数y=f(t)与直线t=a,t=b及t轴所围面积.,
4、因此,X取任意单点值a的概率,从而,密度函数的性质,连续型随机变量的密度函数有如下性质:,注:若某一函数满足以上性质1,2,则它可以作为某个连续型随机变量的分布函数。,解,f(x)的图形如图,从而得,例:试确定常数a,使,为某个随机变量X的概率密度,且计算事件1.5X 2的概率.,解 因,所以a=2.,故,从而,作业P44,4,5,6,9,11,2.2 随机变量的数字特征,我们知道,随机变量的分布列或概率密度,全面地描述了随机变量的统计规律.但在许多实际问题中,这样的描述并不使人感到方便.,设一只母鸡的年产蛋量是一个随机变量,如果要比较两个品种的母鸡的年产蛋量,通常只要比较这两个品种的母鸡的年
5、产蛋量的平均值就可以了.平均值大就意味着这个品种的母鸡的产蛋量高.如果不去比较它们的平均值,而只看它们的分布列,虽然全面,却使人不得要领,既难以掌握,又难以迅速地作出判断.,1.随机变量的数学期望,1.1 离散型随机变量的数学期望,例:有A,B两射手,他们的射击技术如表所示,试问哪一个射手本领较好?,则抽查到的100只手表的平均日走时误差为,即,例:某手表厂在出厂产品中,抽查了N=100只手表的日走时误差,其数据如表:,如果另外再抽验100只手表,每作一次这样的检验,就得到一组不同的频率,也就有不同的日走时误差的平均值.由关于频率和概率关系的讨论知,理论上应该用概率去代替上述和式的频率,这时得
6、到的平均值才是理论上(也是真正)的平均值.,这样我们就引出了随机变量的数学期望的概念.,如果,则称随机变量X的数学期望不存在.,注:要求,是因为离散型随机变量的取值,可以按不同顺序排列,而改变顺序时,数学期望的取值不应改变。而 能保证不管离散型随机变量的顺序如何,的值都一样。,所以A的射击技术较B的好.,例:有A,B两射手,他们的射击技术如表所示,试问哪一个射手本领较好?,解 A射击平均击中环数为,B射击平均击中环数为,解 分布律为:,平均废品数为:,1.2 连续型随机变量的数学期望,我们已知离散型随机变量X的数学期望为,E(X)=,自然要问连续型随机变量的数学期望是什么?,设p(x)是连续型
7、随机变量X的密度函数,取分点,x0 x1xn+1,则随机变量X落在xi=(xi,xi+1)中的概率为,与X近似的随机变量Y的数学期望为,由微积分知识自然想到X的数学期望为,为连续型随机变量X的数学期望,记为E(X).,定义:设连续型随机变量X的密度函数为p(x),若,则称,如果,则称连续型随机变量X的数学期望不存在.,例:设随机变量X的概率密度函数为,试求X的数学期望,解,例:若随机变量X的概率密度函数为,问随机变量X的数学期望E(X)是否存在.,解,所以E(X)不存在.但,1.3 随机变量函数的数学期望,定理:设Y是随机变量X的函数:Y=f(X)(f是连续函数).,(1)设离散型随机变量X的
8、概率分布为PX=xk=pk,k=1,2,.,(2)设连续型随机变量X的密度函数为p(x),若,若,则,则有,证明:这里仅对离散型随机变量的情形予以证明。,由数学期望定义有,X,-1 0 1 2,P,0.1 0.3 0.4 0.2,Y=2X-3,-5-3-1 1,P,0.1 0.3 0.4 0.2,0 1 4,P,0.3 0.5 0.2,1.4 数学期望的性质,1.若aXb,则E(X)存在,且有aE(X)b.特别,若C是常数,则E(C)=C.,证明(1)设离散型随机向量X分布列为,X=xi=pi,i=1,2,则,(2)设连续型随机变量X的概率密度为p(x),则,(3)因为PX=C=1,故E(C)
9、=E(X)=C1=C,下面给出第一条性质的证明。其他请同学们完成。,例:若EX,EX2都存在,试证明,证明 E(X-EX)2=EX-E(X)2=EX2-2XE(X)+E(X)2=E(X2)-2E(X)E(X)+E(X)2=E(X2)-E(X)2,1.5 随机变量的方差,例:A,B两种手表的日走时误差分别具有如下的分布律:,易知E(XA)=E(XB)=0.由数学期望无法判别两种手表的优劣.但直觉告诉我们A优于B,怎么样用数学的方法把这种直觉表达出来呢?,分析原因:,A手表之所以优于B手表,是因为A手表的日走时较B手表稳定.其日走时与其日平均误差的偏离程度小.,研究随机变量与其均值的偏离程度是有必
10、要的.,怎么样去度量这个偏离程度呢?,(1)xk-E(X)表示xk与E(X)之间的偏差;,(2)EX-E(X)不能反映X与E(X)之间的整体偏差;,(3)E|X-E(X)|可以度量X与E(X)之间的整体偏差,但运算不方便;,(4)EX-E(X)2可以度量X与E(X)之间的整体偏差,且运算也较方便.,定义:设X是一个随机变量,若EX-E(X)2存在,则称EX-E(X)2为X的方差.记为D(X)或Var(X),即,D(X)=Var(X)=EX-E(X)2,称为X的标准差,定理:,方差实际上是随机变量X的函数f(X)=X-E(X)2的数学期望.于是,(1)对于离散型随机变量X,若PX=xk=pk,k
11、=1,2,则,(2)对于连续型随机变量X,若其概率密度为p(x),则,例:A,B两种手表的日走时误差分别具有如下表的分布律.问哪种手表质量好些?,解 易知E(XA)=E(XB)=0.所以,由于D(XA)D(XB),因此A手表较B手表的质量好.,例:设随机变量X概率密度为p(x),求D(X).,解,于是,D(X)=E(X2)-E(X)2=1/6,例:X为一随机变量,方差存在,令,证明:当且仅当C=EX时,l(C)达到最小值,最小值为DX.,证明:,显然,当且仅当C=EX时,l(C)达到最小值,最小值为DX.,这个例子表明,若用常数C来预测X,X的实际取值与C存在偏差X-C,平均意义下的偏差程度用
12、均方误差E(X-C)2来衡量,则最好的误差应使得E(X-C)2最小,C=EX做到这一点。,1.6 随机变量的矩与切比雪夫不等式,定义:若EXk(k=1,2,)存在(E|X|k小于正无穷),则称它为X的k阶原点矩,简称k阶矩,E|X|k为X的k阶绝对矩.,定理2.2 随机变量X的t阶矩存在,则其s(0st)阶矩存在。,证明 设X为连续型随机变量,其密度函数为f(x).,推论:设k为正整数,C为常数,如果 存在则 也存在,特别地 也存在,定义 若 EXk(k=1,2,)存在,则称 为X的k阶中心矩.为X的k阶绝对中心矩。,注:数学期望是X的一阶原点矩,方差是X的二阶中心矩。由以上定理,若EX2存在
13、,则数学期望和方差都存在。,定理2.3 设h(x)是非负函数,X是一个随机变量,且Eh(X)存在,则对任意,有,证明:设X的密度函数为f(x),则,推论1(马尔可夫不等式)设X的k阶矩存在,则对任意,有,推论2(切比雪夫不等式)设X的方差存在,则对任意,推论3 随机变量的方差为0当且仅当存在一个常数a,使得PX=a=1.,证明 充分性显然,下证必然性。,首先注意到,从而有,由切比雪夫不等式,有,EX,EX-,EX+,x,作业 P55,2,5,2.3 常用的离散型分布,1.退化分布,一个随机变量X以概率1取某一常数,即PX=a=1,则称X服从a处的退化分布。,2.两点分布(0-1分布),显然,E
14、X=a,DX=0.,此时,称X服从参数为p的两点分布(0-1分布),或称X是参数为p的伯努利随机变量。显然,EX=p,DX=p(1-p),注:在实际中,服从两点分布的随机变量通常根据实验中某一事件A的发生与否构造出来。例如,设P(A)=p,P()=1-p,则随机变量,参数为p的两点分布。这个随机变量也相当于表示A发生的次数的随机变量。,例:在100件产品中,有95件正品,5件次品.现从中随机地取一件,假如取到每件产品的机会都相等.,若定义随机变量X为,则有 PX=0=0.05,PX=1=0.95,X服从(0-1)分布,3、n个点上的均匀分布,特殊的随机变量取n个值,等可能,即:称X服从n个点上
15、的均匀分布.其期望与方差分别为:,4.二项分布,在n重伯努利试验中,每次试验中事件A发生的概率为p,(0p1).记X表示n次试验中事件A发生的次数,则根据伯努利概型,,此时,称X服从参数为n,p的二项分布,记作Xb(n,p).二项分布b(1,p)就是参数为p的0-1分布。,数学期望,方差,由于,从而,X的概率分布表如下:,例:在初三的一个班中,有1/4的学生成绩优秀.如果从班中随机地找出5名学生,那么其中“成绩优秀的学生数”X服从二项分布XB(5,1/4).,即 PX=k=C5k 0.25k(1-0.25)5-k k=0,1,5,5.几何分布,在独立重复试验中,事件A发生的概率为p.设X表示直
16、到A发生为止进行的试验次数,则X的概率分布为(几何数列),数学期望,类似地,可以得到,从而,几何分布的无记忆性,设X服从几何分布,则对任何两个正整数m,n,有,证明,由于,这表明,几何分布对过去m次失败的信息忘记了。事实上还可以证明,一个具有正整数值的随机变量,如果具有无记忆性,则一定服从几何分布。,6.超几何分布,一袋子中有N个球,N1个白球,N2个黑球,N=N1+N2,从中不放回地取n个球,X表示取到白球的数量,那么X的分布为,这个随机变量X成为服从超几何分布。,注:当N,N1,N2与n相比充分大时,近似地把这个试验看成是有放回地摸球,从而用二项分布来近似超几何分布,即,数学期望与方差,7
17、.泊松分布,易知,方差,数学期望,二项分布的泊松逼近,作业 P62,1,3,6,8,2.4 常用的连续型分布,1 均匀分布,XUa,b时,分布函数为,与x的取值无关.,方差,数学期望,例:设电阻值R是一个随机变量,均匀分布在900欧至1100欧.求R的概率密度及R落在950欧至1050欧的概率.,解 R的概率密度为,故有,2 指数分布,指数分布的分布函数为,指数分布在在实际中有广泛的应用,如电子元件的”寿命”,随机服务系统的服务时间等都服从指数分布.,方差,数学期望,解(1),(2),(3),注:与几何分布类似,具有无记忆性的连续型随机变量必定服从指数分布。所以是充要条件,只不过充分性证明超过
18、了本书的范围.例2.22,3.正态分布,正态分布是一种最常见的随机变量,正态分布的一些性质与特点使其在概率论与数理统计理论中有特别重要的地位.,3.1 正态分布的概念,正态分布的密度函数图形为(以0为例):,x,y,0,x,y,0,根据积分,,容易验证,证毕,x,2.标准正态分布函数表附表2的使用方法,0,x,-x,作业 P69,5,9,2.5 随机变量函数的分布,1.如果已知随机变量X的分布,另一随机变量Y=g(X)是X的函数,如何求Y的分布(2.90).,2.离散型随机变量函数的分布,例:设随机变量X的分布律如下表,试求Y=(X-1)2的分布律.,解 Y所有可能取的值为0,1,4.由PY=
19、0=P(X-1)2=0=PX=1=0.1,PY=1=P(X-1)2=1=PX=0+X=2=PX=0+PX=2=0.7,PY=4=P(X-1)2=4=PX=-1=0.2即得Y的分布律为,3.连续型随机变量函数的分布,在许多实际问题中,常需要考虑随机变量函数的分布.如在一些试验中,所关心的随机变量往往不能直接测量得到,而是某个能直接测量的随机变量的函数.在本节中,我们将讨论如何由已知的随机变量X的分布去求它的函数Y=f(X)分布.,例2.29:设随机变量X具有概率密度pX(x),-x求Y=X2的概率密度.,解 先求Y 的分布函数 FY(y)由于Y=X2,故当y0时 FY(y)=0,当y0时有,于是得Y的概率密度为,由上例,若X服从标准正态分布,则Y=X2的概率密度函数为,例2.30对数正态分布 如果随机变量Y=lnX服从正态分布,,则称X服从参数为,的对数正态分布。试求,对数正态分布的密度函数。,解 由于Y=lnX服从正态分布,所以,于是,当x0时,FX(x)=0;,所以,X的密度函数为,作业P73,3,4,9,