第2章随机变量的概率分布与数字特征.ppt

上传人:李司机 文档编号:6617727 上传时间:2023-11-18 格式:PPT 页数:63 大小:1.01MB
返回 下载 相关 举报
第2章随机变量的概率分布与数字特征.ppt_第1页
第1页 / 共63页
第2章随机变量的概率分布与数字特征.ppt_第2页
第2页 / 共63页
第2章随机变量的概率分布与数字特征.ppt_第3页
第3页 / 共63页
第2章随机变量的概率分布与数字特征.ppt_第4页
第4页 / 共63页
第2章随机变量的概率分布与数字特征.ppt_第5页
第5页 / 共63页
点击查看更多>>
资源描述

《第2章随机变量的概率分布与数字特征.ppt》由会员分享,可在线阅读,更多相关《第2章随机变量的概率分布与数字特征.ppt(63页珍藏版)》请在三一办公上搜索。

1、第二章 随机变量的概率分布 与数字特征,第一节 离散型随机变量及其概率分布第二节 连续型随机变量及其概率分布第三节 随机变量的数字特征第四节 三种重要分布的渐近关系第五节 大数定律及中心极限定理,一、随机变量的概念,在第一章,我们介绍了随机事件及其概率,可以看到很多事件都可采取数值标识。如抽检产品时出现的废品个数;掷骰子出现的点数等。对那些非数值标识的事件,实际上也可人为地加以数值标识。例如,对新生儿的性别,可用0表示女,1表示男;对生化检验的结果,可用0表示阴性,1表示阳性;对生产的产品,可用2表示优质品,1表示次品,0表示废品等。,因此,随机试验的结果可用一个变量来表示,这种随试验结果不同

2、取不同数值的变量称为随机变量。,二、离散型随机变量及其概率分布,1、定义:按一定概率取有限个或可列个值的随机变量,称为离散型随机变量。,设X所有可能取值为,(i=1,2,),称为离散型随机变量X的概率函数或分布律。,也可用表格来表示(称为概率分布表或分布列),2、概率函数(分布律),X,性质:(1)(2),(i=1,2,),例 设随机变量X的分布律为(k=1,2,3,4,5),求:(1)P(X=1或X=2)(2),解(1)P(X=1或X=2)=P(X=1)+P(X=2),=1/15+2/15=1/5,(2)=P(X=1)+P(X=2)+P(X=3),=1/15+2/15+3/15=2/5,三、

3、离散型变量的几种常见分布,1、伯努利概型,试验只有两种可能结果:A 及,把这个试验独立重复n次,就构成了n重伯努利试验,简称伯努利试验。设P(A)=p=1p=q(其中0p1),,例1 某药治某病的治愈率为p,现用此药治该病 5例,问治愈3例的概率是多少?,例2 袋中装有白球20个和黑球10个,每次抽一个:(1)作有放回抽取5次,求抽到白球3次的概率;(2)作无放回抽取5次,求抽到白球3次的概率。,解 治5例病人,看成做5次独立的试验。每次试验只有A=治愈 和=未治愈两个结果。且P(A)=p,则这个试验是5重的伯努利试验,设B=治愈3例=A出现3次,所以,解(1)有放回抽球,可看成每次试验是独立

4、的,属于伯努利试验,令A=抽到白球且P(A)=2/3,故,(2)无放回抽球,说明每次试验间不独立,因此不属伯努利试验,应看成古典概型。,无放回抽5次,可看成一次抽5个球,由古典公式得,2、二项分布,(1)若随机变量X的概率函数为,(k=0,1,n),q=1-p,(2)性质,则称X服从二项分布,记为,由于各概率函数值 正好是二项式 展开式中的对应各项,故名二项分布。,例3 设,求P(X=4),P(2X6)。,解 因为,所以X的概率函数为,k=0,1,20,故,用查表法计算较简便,=0.793920.19579=0.59813,遇到二项分布中概率p0.5时,不能直接查表但可以转化为其对立事件的概率

5、计算。,设X代表A出现次数,Y代表 出现次数,则X+Y=n且,例4 XB(10,0.7),求,解,(3)二项分布的最可能值:使P(X=k)取最大值 的k值。即n重伯努利试验中事件A最可能 出现的次数。,例5 有10%的人对某药有肠道反应,为考察此药的质量,现随机选5人服用此药,试求:(1)其中k(k=0,1,5)个人有反应的概率;(2)不多于2人有反应的概率;(3)有人有反应的概率。,解:随机选5人服药,各人间对药物的反应具有独立性,且每人服药后有反应的概率均为视为0.1,这相当于做5次独立重复试验,即p=0.1,n=5的伯努利试验。因而反应的人数XB(5,0.1),概率分布表如下,(2)不多

6、于2人有反应的概率为,(3)有人有反应的概率为,3、泊松分布(稀有事件模型),在很多实际问题中,n重伯努利试验中的n往往很大,p很小,则试验结果A出现的次数X,可看成泊松分布。,正是因为结果A在n次试验中出现的次数非常少,故A可看作稀有事件。,(k=0,1,2.)其中参数,(1)概率函数,(2)性质,服从泊松分布的随机变量在实际中是很多的,例如三胞胎出生次数,癌症发病人数,放射的粒子个数,特大洪水发生的年数,抽检大量产品中出现次品的件数,等等。,(3)泊松定理 在n重伯努利试验中,事件A在一次试验中出现的概率为p。若,np也较小,则令=np有(k=0,1,2,),从定理也可看出,事件A发生的次

7、数X若服从参数为 的泊松分布,则 表示A在大量试验中发生的平均次数。,例6 已知某厂生产的针剂的废品率为0.01,400支针剂中,废品至少有5支以上的概率是多少?,解:设400支针剂中废品数为X,检查400支针剂看成做400次独立重复试验,即n=400;每次试验结果为废品或正品,抽到废品的概率即p=0.01,则XB(400,0.01),可近似看成泊松分布,例7 某人在一次试验中遇到危险的概率是1%,如果他在一年里每天都要独立重复做一次这样的试验,那么他在一年中至少遇到一次危险的概率是多少?,解:此人做的试验可看成伯努利试验,n=365,每次试验遇到危险的概率p=0.01,设他在一年中遇到危险的

8、次数为X,则XB(365,0.01),因为n很大,p较小,可近似看成泊松分布,4、两点分布(01分布),(k=0,1),可以看出,两点分布即为二项分布中n=1的特殊情况。,例8 一批产品共100件,其中有95件正品,5件废品,从中任取一件,观察产品质量.若其结果用随机变量X来描述,求X的概率函数。,解:设抽到正品,X=1;抽到废品,X=0,则X的分布律为,5、几何分布,(k=1,2,),引例 进行重复独立实验,设每次成功的概率为p,将实验进行到出现一次成功为止,以X表示所需实验的总次数,求X的分布律。,6、超几何分布,引例 设有N件产品,其中有M件正品,现任取n件,求n件中恰有k件正品的概率。

9、(以X表示n件中的正品数),k=0,1,2,l,其中l=Min(M,n),四、分布函数,1、定义:设X是一随机变量,x为任意实数,则称函数 为X的分布函数。,2、性质,F(x)在间断点处右连续,即,F(x)单调不减,3、常用公式,由此看出,已知X的分布函数就可知X在任一范围内取值的概率,这说明分布函数全面地描述了随机变量的分布情况。,4、离散型随机变量的分布函数,例 设某药检所从送检的药品中先后抽3件,如果送检的10件中有2件失效,试列出检得次品数的概率分布表,并求出分布函数。,(分段函数),解 检得次品数为随机变量,设为X,则X的可取值为0,1,2,由古典概率计算得,X的分布函数为,当x0时

10、,,当 时,,当 时,,当 时,,即,如果取X的值于横轴,的值于纵轴,便得到X的概率函数图,它由几条函数组成,每条线长的值等于该点上的概率。,取X的值于横轴,F(x)的值于纵轴,便得到X的分布函数图。,此例中X是离散型随机变量,由此可见离散型随机变量的分布函数是台阶形,在分段点右连续。,一、连续型随机变量概念,可取某个区间上所有值的变量。,3、连续型随机变量的分布函数,4、分布函数与密度函数之间的互化,重要公式:,例1 设X的分布函数为,求 常数A、B及相应的密度函数。,解:由F(x)的性质,有,而,由上述方程解得,所以,例2,已知X的密度函数为,(1)求相应的分布函数F(x);(2)求 及,

11、解,当 时,,当 时,,(1),当 时,,当x2时,,=1,(2),或,或,二、连续型随机变量的几种常见分布,1、正态分布,(1)分布形式,(2)图形与性质,特点是“两头小,中间大,左右对称”.,正态分布的密度曲线是一条关于 对称的钟形曲线.x轴是f(x)的渐近线,可见 决定了图形的中心位置,称为位置参数;决定了图形中峰的陡峭程度,称为形状参数.,左图 不变,右图 不变,(3)标准正态分布,标准正态分布函数,重要公式:,若,则,XN(0,1),例1 设XN(0,1),求:(1);(2)(3),解(1),查表得0.02275,(2),=0.02275,(3),例2 设XN(2,4),求:(1)f

12、(5)(2)P(-4X2),解 由已知得,,(1),(2),例3 设,求,(1),(2),解(1),(2),这个结果说明在一次试验中,服从正态分布的随机变量X落在区间 内的概率相当大,即X几乎必然落在上述区间内,这就是通常所说的“”原理。,2、均匀分布,XUa,b,这说明X落在子区间的概率只与子区间的长度有关,与子区间的位置无关。,(1)形式,设(c,c+l)是a,b上的一个子区间,则,(2)分布函数,3、对数正态分布,若,则称X服从对数正态分布。,4、韦布尔分布、指数分布,5、分布,一、均数(数学期望),引例 设有一批药材是由三个等级的药材组成,现观察它的等级X。若有放回地抽取10件,其中有

13、5件1等、3件2等、2件3等,则所取的10件产品的平均等级是多少?,解 X的所有取值为1,2,3,10件产品的平均等级为,将上式改写成,这种把每个等级与相应的频率乘积的和,称为1,2,3分别以5/10,3/10,2/10为权的加权平均。,我们知道,如果再抽取10件,平均等级就不一定是1.7等了,可见由于抽样不同,抽样的平均等级也不同,它是一个随机变量。但是,随着试验(抽取药材)的次数增大,出现1,2,3等品的频率就会逐渐稳定在稳定在各自的概率附近。,设 表示第i(i=1,2,3)等药材出现的概率,则整批药材的平均等级为,我们称这种加权平均值为均数,也叫数学期望。,1、离散型随机变量的均数,设离

14、散型随机变量X的概率函数为,(i=1,2,3,),则规定X的均数,均数是反映随机变量取值的集中趋势的一个数字特征。,解:,2、连续型随机变量的均数,设连续型随机变量X的概率密度为f(x),则规定X的均数为,例2 求在a,b上服从均匀分布的随机变量X的均数EX。,解 依题意有,由定义得,3、常见分布的均数,(2)若XB(n,p),则EX=np,(3)若,则,(4)若XUa,b,则,(5)若,则,(1)若X两点分布,则EX=p,4、均数的性质,(1)E(c)=c(c为常数),(2),(k为常数),(3),(k,b为常数),(4),(X与Y独立),解,二、方差,均数反映了随机变量取值的平均情况,它是

15、随机变量的一个重要数字特征,但只看均数是不够的,还应知道随机变量的取值对均数的偏离程度。,引例 设有甲、乙两台制丸机生产同一种药丸的直径(mm)的概率分布表如下,如果药丸的标准直径为7mm,问哪台机器的性能更好?,解 易算出EX=EY=7,可见两台机器都是按标准生产的。但是从分布可见,甲机器比乙机器生产的丸径稳定,也就是甲生产的丸径与标准丸径的偏差小。因此,甲机器的生产性能比乙好。,最终,我们选用 来刻画随机变量X的取值对均数EX的平均偏离程度(波动程度)。,1、方差定义,称为X的标准差。,方差反映了随机变量取值对均数的平均偏离程度。,(1)离散型,(2)连续型,其中(i=1,2,),其中f(

16、x)是X的概率密度函数,为了便于计算,可由定义式推出实用计算公式为,即,3、方差的性质,(1)D(C)=0(C为常数)(2)(k为常数)(3)(k、b为常数)(4)(X与Y独立,可推广到任意有限个相互独立随机变量的情况),解 D(2X+3)=4DX=,由X的分布列得,则,而由例1知EX=,所以,三、变异系数标准差相对于均数的变化率,变异系数用来比较两个均数相差很大或者量纲不同的随机变量取值的波动程度。,例5 据调查,某地18岁男子身高均数为165.08cm,标准差为4.98cm,体重均数为51.6kg,标准差为5.01kg,试比较该地男子的身高和体重波动程度哪个大?,解 因为身高和体重单位不同

17、,直接用标准差比较波动程度不合适,应用变异系数来比较,身高,体重,可见,体重的相对波动程度大于身高的相对波动程度。,离散型变量的二项分布、泊松分布和连续型变量的正态分布,是三种最基本也是最重要的分布,它们之间有着密切的联系,即,当 时,二项分布以泊松分布为极限分布;当 时,二项分布以正态分布为极限分布;当 时,泊松分布以正态分布为极限分布,以上第一种渐近分布在第一节中已经介绍过,这里不再重复。以下介绍后两种渐近分布。,二项分布的正态近似,当 时,,有了二项分布的两个近似运算,现总结二项分布问题中的计算方法的选择:(1)当n为一个较小的数,可直接用二项分布公式(2)当n是一个大的数,p很小,np

18、较小,则用泊松分布近似计算;(3)当n是一个大的数,np较大时,则用正态分布近似计算,例1 某车间送检一批针剂,其中次品的概率是0.01,问抽检500支针剂,有5支次品的概率是多少?,解 设抽检的500支针剂中次品数为X,则XB(500,0.01),其中n很大,np=5较小,因此化为泊松分布P(5)近似计算,例2 对一癌症高发病地区进行普查,患病率为0.005,现有这地区一万人的乡村,试求:(1)此乡有70人患癌症的概率;(2)有3050人患病的概率;,解 设一万人的乡村中患癌症的人数为X,则XB(10000,0.005),此时n很大,但np=50较大,故用正态分布来计算,(1),(2),当

19、时,,泊松分布的正态近似,例3 某药厂大批量生产外用药,平均每个月的废品数为35件,试估计下个月内出现废品数少于40件的概率。,解 设此药厂每月生产的废品数为X,出现废品属于伯努利试验之稀有事件,则XP(35),可用正态分布近似计算,则XN(35,35),所谓极限定理,就是采用极限的方法得出随机变量分布的一系列定理。一般可以分为两类:第一类是阐述若干个随机变量的均数的极限定理,统称为大数定律;第二类是阐述在怎样的条件下,当n不断增大时,n个独立随机变量之和的极限分布为正态分布,统称为中心极限定理。,1、切比雪夫不等式(Chebyshev),设随机变量X有期望EX和方差DX,则对于,有,一、大数

20、定律,或,切比雪夫不等式只用均数和方差就描述了随机变量大概的概率分布情况,无需知道X的分布,因此它在理论研究及实际应用中很有价值。,例1 某地区调查10000名某疾病患者,该病需住院治疗的概率为0.7,试用切比雪夫不等式估计10000名患者中同时需要住院的人数在68007200之间的概率。,解 设X表示同时住院的病人数,则XB(10000,0.7),若要精确计算,应用正态分布近似计算,即,XN(7000,2100),现用切比雪夫不等式来估计,EX=np=7000,DX=npq=2100,虽然有10000名患者,但只要预备7200张病床就能以相当大的概率保证病床够用。,2、切比雪夫大数定律,设,

21、是相互独立的随机变量且,则对 有,这个定理表明,当n充分大时,独立随机变量 的算术平均数近似等于均数 的算术平均数。,推论 若,独立同分布,且,则对,有,上式说明,只要n足够大,样本平均值以很大的概率接近于总体平均数。这也应证了生活中常用的“平均数原理”,我们测量一医学指标,在不变的条件下,重复测量多次,最后取算术平均值作为真值的近似值。,3、伯努利大数定律,设X是n次伯努利试验中事件A发生的次数,P(A)=p,则对,有,该定律证明了频率的稳定性。只要试验次数n足够大,事件A出现的频率f(A)就会稳定在p(A)附近。因此,在统计实践中,经常用频率作为概率的估计值。,二、中心极限定理,1、客观背景,观察表明,如果一个量是由大量相互独立的随机因素的影响所造成,而单个因素在总影响中所起的作用不大,则这种量一般都服从或近似服从正态分布.,设X1,X2,是独立同分布的随机变量序列,且EXi=,DXi=,i=1,2,,则对任意实数x,有,2、中心极限定理,其中,例2 1片药片的重量是个随机变量,其均数为1g,标准差为0.1g,求1瓶(100片)药片重量大于102g的概率。,解 设药片重量为X,瓶中第i片药片的重量为(i=1,2,100)且 相互独立,由中心极限定理结论中的第三个公式得,100片药片重量可表示为,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号