《随机变量与分布函数.ppt》由会员分享,可在线阅读,更多相关《随机变量与分布函数.ppt(153页珍藏版)》请在三一办公上搜索。
1、第三章 随机变量与分布函数,3.1随机变量及其分布,一、随机变量的定义,(1)掷一颗骰子,出现的点数 1,2,6.(2)n个产品中的不合格品个数0,1,2,n(3)某商场一天内来的顾客数0,1,2,(4)某种型号电视机的寿命:0,+),(1)掷一颗骰子,出现的点数 1,2,6.(2)n个产品中的不合格品个数0,1,2,n(3)某商场一天内来的顾客数0,1,2,(4)某种型号电视机的寿命:0,+),随机变量的定义,定义 设=为某随机现象的样本空间,是定义于概率空间(,F,P)上的单值实函数,如果对直线上任何一个博雷尔点集B,有 F则称 为随机变量,而 称为随机变量 的概率分布。.,注 意 点,(
2、2)若 为随机变量,则 均为随机事件.,即,若随机变量 可能取值的个数为有限个或 可列个,则称 为离散型随机变量.若随机变量 的可能取值充满某个区间 a,b,则称 为连续型随机变量.前例中的,为离散型随机变量;而 为连续型随机变量.,两类随机变量,定义 设 为一个随机变量,对任意实数 x,称 F(x)=P x 为 的分布函数.(distribution function)记为,随机变量的分布函数,二、分布函数的性质,定理3.1.1 分布函数F(x)具有下列基本性质:(1)F(x)单调不降;(2)有界:0F(x)1,F()=0,F(+)=1;(3)左连续:F(x-0)=F(x).,注 意 点,注
3、意以下一些表达式:,三、离散型随机变量,设离散随机变量 的可能取值为:x1,x2,xn,称 pi=P(=xi),i=1,2,为 的分布列.分布列也可用表格形式表示:,x1 x2 xn,P p1 p2 pn,分布列的基本性质,(1)pi 0,(2),(正则性),(非负性),注 意 点,对离散随机变量的分布函数应注意:,(1)F(x)是递增的阶梯函数;,(2)其间断点均为左连续的;,(3)其间断点即为的可能取值点;,(4)其间断点的跳跃高度是对应的概率值.,一般,设离散型r.v.的分布律为:,则X的分布函数 F(x)=Px=,例,已知 的分布列如下:,X 0 1 2,P 1/3 1/6 1/2,求
4、 的分布函数.,常见离散型分布,1、退化分布(单点分布)2、伯努利分布(两点分布)B(1,p)3、二项分布 B(n,p)4、超几何分布5、泊松分布 P()6、几何分布7、巴斯卡分布,常用离散分布,1 二项分布 记为 B(n,p).为n重伯努里试验中“成功”的次数,当n=1时,称 b(1,p)为 0-1分布.,例 设 b(2,p),b(4,p),已知 P(1)=8/9,求 P(1).,解:由 P(1)=8/9,知 P(=0)=1/9.,由此得:P(1)=1 P(=0),所以 1/9=P(=0)=(1p)2,,从而解得:p=2/3.,=1-(1p)4=80/81.,若随机变量 的概率分布为,则称
5、服从参数为 的泊松分布,记为 P().,泊松分布,超几何分布对应于不返回抽样模型:,N 个产品中有 M 个不合格品,,从中抽取n个,不合格品的个数为X.,超几何分布,X 为独立重复的伯努里试验中,“首次成功”时的试验次数.,几何分布具有无记忆性,即:,P(m+n|m)=P(n),几何分布,巴斯卡分布(负二项分布),巴斯卡分布与几何分布的关系:,为独立重复的伯努里试验中,“第 r 次成功”时的试验次数.,为从第 i-1 次成功后算起,“首次成功”时的试验次数.,四、连续型随机变量,连续随机变量的可能取值充满某个区间(a,b).因为对连续随机变量,有P(=x)=0,所以无法仿离散随机变量用 P(=
6、x)来描述连续随机变量的分布.注意离散随机变量与连续随机变量的差别.,定义,设随机变量的分布函数为F(x),则称 为连续随机变量,,若存在非负可积函数 p(x),满足:,称 p(x)为分布密度函数,(density function).,密度函数的基本性质,满足(1)(2)的函数都可以看成某个连续随机变量的分布密度函数.,(非负性),(正则性),注意点,(1),(2)F(x)是(,+)上的连续函数;(3)P(=x)=F(x+0)F(x)=0;,注意点,(1),(2)F(x)是(,+)上的连续函数;(3)P(=x)=F(x+0)F(x)=0;,(4)Pab=Pa b=Pa b=Pa b=F(b)
7、F(a).,(5)当F(x)在x点可导时,f(x)=,所以,概率为零的事件不一定是不可能事件!,连续型,密度函数 f(x)(不唯一),2.,4.P(=a)=0,离散型,分布列:pn=P(=xn)(唯一),2.F(x)=,3.F(a+0)=F(a);P(a b)=F(b)F(a).,4.点点计较,5.F(x)为阶梯函数。,5.F(x)为连续函数。,F(a+0)=F(a).,F(a+0)F(a).,例,设,求(1)常数 k.(2)F(x).,常见连续性随机变量,1、均匀分布2、正态分布3、指数分布4、埃尔兰分布5、分布,(一)均匀分布 U(a,b),实际背景:随机变量 X 仅在一个有限区间(a,b
8、)上取值;随机变量 X在其内取值具有“等可能”性,则 U(a,b)。,“等可能”表现在:若acc+l b,则 Pcc+l 与位置无关,只与长度有关,设具有概率密度:则称在区间(a,b)上服从均匀分布,记为 U(a,b)。,例1:设电阻值R是一个随机变量,均匀分布在9001100,求R的概率密度及R落在9501050的概率。,解:按题意,R的概率密度为:,U(2,5).现在对 进行三次独立观测,试求至少有两次观测值大于 3 的概率.,解:,记 A=3,则 P(A)=P(3)=2/3,设 Y 表示三次独立观测中 A 出现的次数,则 Y B(3,2/3),所求概率为,P(Y2)=,P(Y=2)+P(
9、Y=3),=20/27,例2,记为 N(,2),其中 0,是任意实数.,是位置参数.,是尺度参数.,(二)正态分布(normal distribution),y,x,O,正态分布的性质,(1)p(x)关于 是对称的.,p(x),x,0,在 点 p(x)取得最大值.,(2)若 固定,改变,(3)若 固定,改变,大,p(x)左右移动,形状保持不变.,越大曲线越平坦;,越小曲线越陡峭.,p(x),x,0,x,x,标准正态分布N(0,1),密度函数记为(x),分布函数记为(x).,(x)的计算,(1)x 0 时,查标准正态分布函数表.,(2)x 0时,用,若 N(0,1),则(1)P(a)=(a);(
10、2)P(a)=1(a);(3)P(ab)=(b)(a);(4)若a 0,则 P(|a)=P(aa)=(a)(a)=(a)1(a)=2(a)1,例 设 N(0,1),求 P(1.96),P(|1.96),=1(1.96),=1(1(1.96),=0.975(查表得),=2(1.96)1,=0.95,=(1.96),解:P(1.96),P(|1.96),=2 0.9751,设 N(0,1),P(b)=0.9515,P(a)=0.04947,求 a,b.,解:(b)=0.9515 1/2,所以 b 0,反查表得:(1.66)=0.9515,故 b=1.66,而(a)=0.0495 1/2,所以 a
11、0,(a)=0.9505,反查表得:(1.65)=0.9505,故 a=1.65,例,一般正态分布的标准化,结论1 设 N(,2),则 N(0,1).,结论2:,若 N(,2),则,若 N(,2),则 P(a)=,设 N(10,4),求 P(1013),P(|10|2).,解:P(1013)=(1.5)(0),=0.9332 0.5,P(|10|2)=,P(812),=2(1)1,=0.6826,=0.4332,例,设 N(,2),P(5)=0.045,P(3)=0.618,求 及.,例,=1.76=4,解:,已知 N(3,22),且 Pk=Pk,则 k=().,3,课堂练习(1),设 N(,
12、42),N(,52),记 p1=P 4,p2=P+5,则()对任意的,都有 p1=p2 对任意的,都有 p1 p2,课堂练习(2),设 N(,2),则随 的增大,概率 P|()单调增大 单调减少 保持不变 增减不定,课堂练习(3),例 假设在设计公共汽车车门的高度时,要求男子的碰头机会在1%以下,设男子的身高(cm)服从正态分布,N(170,36),问车门高度至少应为多高?,实际背景:如果一个随机现象是由大量微小的相互独立的因素共同构成,那么描述这种随机现象的随机变量通常被认为服从或近似服从正态分布,在自然现象和社会现象中,大量随机变量都服从或近似服从正态分布。如:测量误差;在稳定条件下产品的
13、各种指标;某地区人的身高、体重;大面积考试的分数等,思考:上述随机变量实际取值范围并不是(-,+),但正态分布取值范围是(-,+),矛盾吗?,正态分布的 3 原则,设 N(,2),则,P(|)=0.6828.,P(|2)=0.9545.,P(|3)=0.9973.,(三)指数分布,实际背景:在实践中,如果 表示某一随机事件发生所需等待的时间,则一般 服从指数分布。如:随机服务系统中的服务时间;在某邮局等候服务的等候时间;某电子元件直到损坏所需的时间(即寿命),指数分布,记为 Exp(),其中 0.,指数分布具有无记忆性:,如果X是某一元件的寿命,已知元件已使用了 s小时,它还能继续使用至少 t
14、小时的条件概率,与从开始时算起至少能使用 t 小时的概率相等。即元件对它已使用过s小时无记忆。,例1 机器里安装的某种元件,已知这种元件的使用寿命(年)服从参数为1/5的指数分布,1)计算一个元件使用8年后仍能正常工作的概率;2)一个元件已经使用了3年,求它还能再使用8年的概率。,(四)埃尔兰分布(略),3.2随机向量,随机变量的独立性,定义 若1,2是两个定义在同一个样本空间上的 随机变量,则称(1,2)是两维随机变量.同理可定义 n 维随机变量(随机向量).,一、随机向量及其分布,定义,联合分布函数,F(x,y)=P(1 x,2 y),为(1,2)的联合分布函数.,(以下仅讨论两维随机变量
15、),任对实数 x 和 y,称,注意:,F(x,y)为(1,2)落在点(x,y)的左下区域的概率.,1,2,x1,x2,(x1,x2),联合分布函数的基本性质,(1)F(x,y)关于 x 和 y 分别单调增.,(2)0 F(x,y)1,且,F(,y)=F(x,)=0,,F(+,+)=1.,(3)F(x,y)关于 x 和 y 分别左连续.,(4)当ab,cd 时,有,F(b,d)F(b,c)F(a,d)+F(a,c)0.,注意:上式左边=P(a1b,c2 d).,(单调性),(有界性),(左连续性),(非负性),二维离散随机向量,联合分布列,若(1,2)的可能取值为有限对、或可列对,则称(1,2)
16、为二维离散随机变量.,二维离散分布的联合分布列,称,pij=P(1=xi,2=yj),i,j=1,2,.,为(1,2)的联合分布列,,其表格形式如下:,2,1,y1 y2 yj,x1x2xi,p11 p12 p1j p21 p22 p2j pi1 pi2 pi j,联合分布列的基本性质,(1)pij 0,i,j=1,2,(2)pij=1.,(非负性),(正则性),确定联合分布列的方法,(1)确定随机变量(1,2)的所有取值数对.,(2)计算取每个数值对的概率.,(3)列出表格.,例 将一枚均匀的硬币抛掷4次,1表示正面向上的次数,2表示反面朝上次数。求(1,2)的联合分布列.,1 20 41
17、3 2 2 3 14 0,P(1=0,2=4)=,P(1=2,2=2)=,=1/4,=6/16,P(1=3,2=1)=,=1/4,P(1=4,2=0)=0.54=1/16,P(1=1,2=3)=,0.54=1/16,解:概率非零的(1,2)可能取值对为:,其对应的概率分别为:,1 01234,2 0 1 2 3 4,列表为:,0 0 0 0 1/16 0 0 0 1/4 0 0 0 6/16 0 0 0 1/4 0 0 01/16 0 0 0 0,例 设随机变量 N(0,1),解:(1,2)的可能取值数对及相应的概率如下:,P(1=0,2=0)=P(|1,|2),=P(|2),=2 2(2)=
18、0.0455,P(1=0,2=1)=P(|1,|2),=P(1|2),=2(2)(1),=0.2719,P(1=1,2=0)=P(|1,|2)=0,P(1=1,2=1)=P(|1,|2),=P(|1),=0.6826,求,的联合分布列.,列表为:,1 0 1,2 0 1,0.0455 0.2719 0 0.6826,课堂练习,设随机变量 在 1,2,3,4 四个整数中等可能地取值,另一个随机变量 在 1到X 中等可能地取一整数值。试求(,)的联合分布列.,设二维随机变量(,)的分布函数为 F(x,y),若存在非负可积函数 p(x,y),使得,(联合)密度函数,则称(,)为二维连续型随机变量。,
19、称p(x,y)为(联合)密度函数。,联合密度函数的基本性质,(1)p(x,y)0.(非负性),(2),注意:,(正则性),一、多项分布,常用多维分布,若每次试验有r 种结果:A1,A2,Ar,记 P(Ai)=pi,i=1,2,r,记 i 为 n 次独立重复试验中 Ai 出现的次数.,则(1,2,r)的联合分布列为:,二、多元超几何分布,从中任取 n 只,,记 i 为取出的n 只球中,第i 种球的只数.,口袋中有 N 只球,分成 r 类。,第 i 种球有 Ni 只,N1+N2+Nr=N.,则(1,2,r)的联合分布列为:,三、二维均匀分布,若二维连续随机变量(,)的联合密度为:,则称(,)服从
20、D 上的均匀分布,,记为(,)U(D).,其中SD为D的面积.,四、二维正态分布,若二维连续随机变量(,)的联合密度为:,则称(,)服从二维正态分布,,记为(,)N().,例,若(,),试求常数 A.,解:,所以,A=6,=A/6,例,若(,),试求 P 2,1.,解:P 2,1,2,1,x2,y1,例,若(,),试求 P(,)D,其中D为 2x+3y6.,3,2,2x+3y=6,解:,二、边际分布,问题:已知二维随机变量(,)的分布,,如何求出 和 各自的分布?,边际分布函数,巳知(,)的联合分布函数为 F(x,y),,则,F2(y)=F(+,y).,F1(x)=F(x,+),边际分布列,巳
21、知(,)的联合分布列为 pij,,则,的分布列为:,的分布列为:,例:袋中有2个白球,3个黑球,从袋中(1)有放回地;(2)无放回地;取两次球,每次取一个,令,解:(1)有放回地取球,(2)无放回地取球,边际分布密度函数,巳知(,)的联合密度函数为 p(x,y),,则,的密度函数为:,的密度函数为:,例 设(,)服从区域 D=(x,y),x2+y2 1 上的均匀分布,求 的边际密度p1(x).,解:由题意得,-1,1,当|x|1时,p(x,y)=0,所以 p1(x)=0,当|x|1时,不是均匀分布,例、设(,)N().求的边际分布密度函数,二维正态分布的边际分布是一维正态:若(,)N(),,注
22、 意 点,则 N(),,N().,二维均匀分布的边际分布不一定是一维均匀分布.,三、条件分布,对二维随机变量(,),在给定取某个值的条件下,的分布;在给定取某个值的条件下,的分布.,已知一个r.v.取定的条件下,另一个r.v.的分布,-在=x 条件下 的条件分布函数,二、离散型:条件分布律,定义:若,若,1.P=xi|=yj 0;2.,证:,性质:非负性、规范性,例:袋中有2个白球,3个黑球,从袋中(1)有放回地;(2)无放回地;取二次球,每次取一个,令,解:(1)有放回地取球,(2)无放回地取球,2、求给定 条件下,的条件分布列,例题,定义 当,-在=x 条件下 的条件概率密度,三、连续型:
23、条件概率密度,例,分布,求,例、设二维连续型随机变量的联合密度函数为,求条件概率(1),(2),若满足以下之一:i)F(x,y)=F1(x)F2(y)ii)p(xi,yj)=p1(xi)p2(yj)iii)p(x,y)=p1(x)p2(y)则称 与 是独立的,,四、随机变量的独立性,例,(,)的联合分布列为:,问 与 是否独立?,解:边际分布列分别为:,0 1P 0.7 0.3,0 1P 0.5 0.5,因为,所以不独立,例:袋中有2个白球,3个黑球,从袋中(1)有放回地;(2)无放回地;取二次球,每次取一个,令,解:(1)有放回地取球,(2)无放回地取球,例,已知(,)的联合密度为,问 与
24、是否独立?,所以 与 独立。,注意:p(x,y)可分离变量.,解:边际分布密度分别为:,所以 与 独立。,注意:p(x,y)可分离变量.,所以 与 不独立。,注意:p(x,y)不可分离变量.,注 意 点,(2)若联合密度 p(x,y)可分离变量,即 p(x,y)=g(x)h(y)则 与 独立。,(3)若(,)服从二元正态 N()则 与 独立的充要条件是 r=0.,(1)联合密度 p(x,y)的表达式中,若 x 的取值与 y 的 取值有关系,则 与 不独立.,3.3 随机变量的函数及其分布,问题2:已知二维随机变量(,)的分布,,如何求出=g(,)的分布?,问题1:已知一维随机变量 的分布,,如
25、何求出=g()的分布?,一、Borel函数与随机变量的函数,定义3.3.1 设y=g(x)是R到R上的一个映射,若对于一切R中的Borel 点集B1均有x:g(x)B1 B1则称g(x)是一元Borel可测函数。,注:我们感兴趣的函数一般是Borel可测函数,多维离散随机变量函数的分布是容易求的:,i)对(1,2,n)的各种可能取值对,写出 相应的取值.,ii)对的 相同的取值,合并其对应的概率.,=g(1,2,n),如果g(xk)中有一些是相同的,把它们作适当并项即可.,一般,若是离散型 r.v,的分布律为,例,设,则=2+3的分布列为:,则=2 的分布律为:,例、设(,)的联合分布律为,求
26、,Z1=,Z2=min(,)的分布律,(一)、离散的情形,=a0br+a1br-1+arb0,由独立性,此即离散型卷积公式,r=0,1,2,例 若、独立,P(=k)=ak,k=0,1,2,P(=k)=bk,k=0,1,2,求=+的分布律.,解:,二、单个随机变量函数的分布,解:设的分布函数为 F(y),,F(y)=P y=P(2+8 y),=P=F(),于是 的密度函数,例2,先求的分布函数,结论:设,例 设随机变量服从,求=a+b(a0)也服从正态分布.,这个结论很重要!说明正态分布对线性变换具有不变性,所以,YN(a+b,a22),例,设XN(20,32),则Y=-2X-10,N(-50,
27、62),例、XN(0,32),则-XN(0,32),注意:X与-X是不同随机变量,,但他们分布相同,即同分布。,课堂练习 设随机变量在(0,1)上服从均匀分布,求=-2ln的概率密度.,求=sin的概率密度.,课堂练习 设随机变量的概率密度为,例,设 具有概率密度,求=2的概率密度.,求导可得,当 y0 时,注意到=2 0,故当 y 0时,,解:设和的分布函数分别为 和,,例 已知随机变量的分布函数F(x)是严格单调的连续函数,证明=F()服从0,1上的均匀分布.,本例的结论在计算机模拟中有重要的应用.,三、随机向量的函数的分布律,我们先讨论两个随机变量的函数的分布问题,然后将其推广到多个随机
28、变量的情形.,当随机变量1,2,n的联合分布已知时,如何求出它们的函数 i=gi(1,2,n),i=1,2,m的联合分布?,四、随机向量的变换,1、M=max(,)及N=min(,)的分布,设,是两个相互独立的随机变量,它们的分布函数分别为F(x)和F(y),我们来求M=max(,)及N=min(,)的分布函数.,连续的情形,又由于和 相互独立,于是得到M=max(,)的分布函数为:,即有 FM(z)=F(z)F(z),FM(z)=P(Mz),=P(z)P(z),=P(z,z),由于M=max(,)不大于z等价于和都不大于z,故有,分析:,P(Mz)=P(z,z),类似地,可得N=min(,)
29、的分布函数是,下面进行推广,即有 FN(z)=1-1-F(z)1-F(z),=1-P(z,z),FN(z)=P(Nz),=1-P(Nz),=1-P(z)P(z),设1,n是n个相互独立的随机变量,它们的分布函数分别为,我们来求 M=max(1,n)和N=min(1,n)的分布函数.,(i=0,1,,n),用与二维时完全类似的方法,可得,特别,当1,n相互独立且具有相同分布函数F(x)时,有,N=min(1,n)的分布函数是,M=max(1,n)的分布函数为:,FM(z)=F(z)nFN(z)=1-1-F(z)n,需要指出的是,当1,n相互独立且具有相同分布函数F(x)时,常称,M=max(1,
30、n),N=min(1,n),为极值.,由于一些灾害性的自然现象,如地震、洪水等等都是极值,研究极值分布具有重要的意义和实用价值.,如图所示.设系统L由两个相互独立的子系统L1,L2联接而成,联接的方式分别为:(1)串联.(2)并联.,例,解:,设L1,L2的寿命分别为,.其概率密度函数分别为:,其中 0,0,且.分别对以上两种联接方式写出L的寿命Z的概率密度函数.,先求,的分布函数:,(1)串联.Z=min,FZ(z)=1-1-F(z)1-F(z),(2)并联.Z=Max,FZ(z)=F(z)F(z),设和的联合密度为 p(x,y),求Z=+的密度.,解:Z=+的分布函数是:FZ(z)=P(Z
31、z)=P(+z),这里积分区域D=(x,y):x+y z是直线x+y=z 左下方的半平面.,2、两个随机变量和的分布,化成累次积分,得,固定z和y,对方括号内的积分作变量代换,令x=u-y,得,变量代换,交换积分次序,由概率密度与分布函数的关系,即得Z=+的概率密度为:,由和的对称性,pZ(z)又可写成,以上两式即是两个随机变量和的概率密度的一般公式.,特别,当和独立,设(,)关于,的边际密度分别为p(x),p(y),则上述两式化为:,这两个公式称为卷积公式,或褶积公式,例,设,是两个相互独立的随机变量,它们都服从N(0,1)分布,其概率密度为:,求Z=+的概率密度。,解:由卷积公式:,即Z服
32、从N(0,2)分布。,用类似的方法可以证明:,若和 独立,若和 独立,具有相同的分布N(0,1),则Z=+服从正态分布N(0,2).,若 相互独立,两个独立的同类型随机变量和的分布还是同类型分布,称为再生性,为确定积分限,先找出使被积函数不为0的区域,解:由卷积公式,也即,为确定积分限,先找出使被积函数不为0的区域,如图示:,也即,于是,例 设 X 与 Y 独立,XU(0,1),YExp(1).试求 Z=X+Y 的密度函数.,解:,被积函数的非零区域为:,00,用卷积公式:,(见下图),x,z,1,z=x,因此有,(1)z 0 时,pZ(z)=0;,(2)0 z 1 时,pZ(z)=,(3)1
33、 z 时,pZ(z)=,1,3、二维随机变量两个函数的联合分布,变量变换法,求(U,V)的分布.,已知 的分布,的函数,变量变换法,已知 的分布,的函数,变量变换法的具体步骤,有连续偏导、存在反函数,则(U,V)的联合密度为,若,其中J为变换的雅可比行列式:,增补变量法,可增补一个变量V=g2(,),,若要求 U=g1(,)的密度 pU(u),,先用变量变换法求出(U,V)的联合密度pUV(u,v),,用此方法可以求出卷积公式、积的公式、商的公式,然后再由联合密度pUV(u,v),去求出边际密度pU(u),例、设和独立同分布,都服从N(,2),求(U,V)的联合密度函数q(u,v),例:若和相互独立,分别服从G(,r1),G(,r2),即密度函数分别为,求 U和V的联合密度函数q(u,v),五、随机变量的函数的独立性(略),