概率论与数理统计第二章.ppt

上传人:sccc 文档编号:5136166 上传时间:2023-06-07 格式:PPT 页数:113 大小:4.57MB
返回 下载 相关 举报
概率论与数理统计第二章.ppt_第1页
第1页 / 共113页
概率论与数理统计第二章.ppt_第2页
第2页 / 共113页
概率论与数理统计第二章.ppt_第3页
第3页 / 共113页
概率论与数理统计第二章.ppt_第4页
第4页 / 共113页
概率论与数理统计第二章.ppt_第5页
第5页 / 共113页
点击查看更多>>
资源描述

《概率论与数理统计第二章.ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计第二章.ppt(113页珍藏版)》请在三一办公上搜索。

1、,湖南商学院信息系 数学教研室,第二章 随机变量及其分布,第二章 随机变量及其分布,第一节 随机变量的定义第二节 离散型随机变量第三节 连续型随机变量第四节 随机变量函数的分布,湖南商学院信息系 数学教研室,第二章 随机变量及其分布第一节 随机变量的定义,一、随机变量概念的产生,在实际问题中,随机试验的结果可以用数量来表示,由此就产生了随机变量的概念.,1、有些试验结果本身与数值有关(本身就是一个数).,例如,掷一颗骰子面上出现的点数;,七月份郑州的最高温度;,每天从郑州下火车的人数;,昆虫的产卵数;,2、在有些试验中,试验结果看来与数值无关,但我们可以引进一个变量来表示它的各种结果.也就是说

2、,把试验结果数值化.,正如裁判员在运动场上不叫运动员的名字而叫号码一样,二者建立了一种对应关系.,这种对应关系在数学上理解为定义了一种实值函数.,e.,X(e),R,这种实值函数与在高等数学中大家接触到的函数一样吗?,(1)它随试验结果的不同而取不同的值,因而在试验之前只知道它可能取值的范围,而不能预先肯定它将取哪个值.,(2)由于试验结果的出现具有一定的概率,于是这种实值函数取每个值和每个确定范围内的值也有一定的概率.,称这种定义在样本空间上的实值函数为,随,量,机,变,简记为 r.v.(random variable),而表示随机变量所取的值时,一般采用小写字母x,y,z等.,例如,从某一

3、学校随机选一学生,测量他的身高.,我们可以把可能的身高看作随机变量X,然后我们可以提出关于X的各种问题.,如 P(X1.7)=?P(X1.5)=?,P(1.5X1.7)=?,有了随机变量,随机试验中的各种事件,就可以通过随机变量的关系式表达出来.,二、引入随机变量的意义,如:单位时间内某电话交换台收到的呼叫次数用X表示,它是一个随机变量.,事件收到不少于1次呼叫 X 1,没有收到呼叫 X=0,随机变量概念的产生是概率论发展史上的重大事件.引入随机变量后,对随机现象统计规律的研究,就由对事件及事件概率的研究扩大为对随机变量及其取值规律的研究.,事件及事件概率,随机变量及其取值规律,四、随机变量的

4、分类,通常分为两类:,如“取到次品的个数”,“收到的呼叫数”等.,随机变量,离散型随机变量,连续型随机变量,例如,“电视机的寿命”,实际中常遇到的“测量误差”等.,这两种类型的随机变量因为都是随机变量,自然有很多相同或相似之处;但因其取值方式不同,又有其各自的特点.,学习时请注意它们各自的特点和描述方法.,设X是一个离散型随机变量,它可能取的值是 x1,x2,.,为了描述随机变量 X,我们不仅需要知道随机变量X的取值,而且还应知道X取每个值的概率.,第二章 第二节 离散型随机变量,这样,我们就掌握了X这个随机变量取值的概率规律.,从中任取3 个球,取到的白球数X是一个随机变量,X可能取的值是0

5、,1,2,取每个值的概率为,例1,且,其中(k=1,2,)满足:,(2),用这两条性质判断一个函数是否是概率分布,一、离散型随机变量概率分布的定义,解:依据概率分布的性质:,a0,从中解得,欲使上述函数为概率分布,应有,二、表示方法,(1)列表法:,(2)公式法,X,三、举例,例3.某篮球运动员投中篮圈概率是0.9,求他两次独立投篮投中次数X的概率分布.,解:X可取0、1、2为值,P(X=0)=(0.1)(0.1)=0.01,P(X=1)=2(0.9)(0.1)=0.18,P(X=2)=(0.9)(0.9)=0.81,且 P(X=0)+P(X=1)+P(X=2)=1,常常表示为:,这就是X的概

6、率分布.,例 4,如上图所示.电子线路中装有两个并联的继电器.假设这两个继电器是否接通具有随机性,且彼此独立.已知每个电器接通的概率为0.8,记X为线路中接通的继电器的个数.求:(1)X的分布律.(2)线路接通的概率.,解:,(1).记Ai=第i个继电器接通,i=1,2.两个继电器是否接通是相互独立的,A1和A2相互独立,另外P(A1)=P(A2)=0.8.下面求X的分布律.首先:X可能取0,1,2,三个值.PX=0=P表示两个继电器都没接通,转下页,PX=1=P恰有一个继电器接通,PX=2=P两个继电器都接通,X的分布律为,2)是并联电路 P(线路接通)=P(只要一个继电器接通)=PX1=P

7、X=1+PX=2=0.32+0.64=0.96.,(二)常见的离散型随机变量的概率分布,(I)两点分布,(,设E是一个只有两种可能结果的随机试验,用=1,2表示其样本空间.P(1)=p,P(2)=1-p,来源,X()=,1,=10,=2,200件产品中,有196件是正品,4件是次品,今从中随机地抽取一件,若规定,例 5,X()=,1,取到合格品0,取到不合格品,则 PX=1=196/200=0.98,PX=0=4/200=0.02 故 X服从参数为0.98的两点分布.即 X B(1,0.98).,例6 设生男孩的概率为p,生女孩的概率为q=1-p,令X表示随机抽查出生的4个婴儿中“男孩”的个数

8、.,(II),我们来求X的概率分布.,X的概率分布是:,男,女,X表示随机抽查的4个婴儿中男孩的个数,生男孩的概率为 p.,X可取值0,1,2,3,4.,例7 将一枚均匀骰子抛掷3次,令X 表示3次中出现“4”点的次数,X的概率分布是:,不难求得,,掷骰子:“掷出4点”,“未掷出4点”,一般地,设在一次试验中我们只考虑两个互逆的结果:A或,或者形象地把两个互逆结果叫做“成功”和“失败”.,新生儿:“是男孩”,“是女孩”,抽验产品:“是正品”,“是次品”,再设我们重复地进行n次独立试验(“重复”是指这次试验中各次试验条件相同),这样的n次独立重复试验称作n重贝努里试验,简称贝努里试验或贝努里概型

9、.,每次试验成功的概率都是p,失败的概率都是q=1-p.,用X表示n重贝努里试验中事件A(成功)出现的次数,则,称r.v.X服从参数为n和p的二项分布,记作,XB(n,p),注:贝努里概型对试验结果没有等可能的要求,但有下述要求:,(1)每次试验条件相同;,二项分布描述的是n重贝努里试验中出现“成功”次数X的概率分布.,(2)每次试验只考虑两个互逆结果A或,,且P(A)=p,;,(3)各次试验相互独立.,例8 某类灯泡使用时数在2000小时以上视为正品.已知有一大批这类的灯泡,其次品率是0.2.随机抽出20只灯泡做寿命试验,求这20只灯泡中恰有3只是次品的概率.,解:设X为20只灯泡中次品的个

10、数,则.,X B(20,0.2),,(见新版书上P34,旧版书P36表),下面我们研究二项分布B(n,p)和两点分布B(1,p)之间的一个重要关系.,说明,设试验E只有两个结果:A和.记p=P(A),则P()=1-p,0p1,我们把试验E在相同条件下,相互独立地进行n次,且记X为n次独立试验中结果A出现的次数.把描述第i次实验的随机变量记作Xi 则 Xi B(1,p),且X1,X2,Xn也是相互独立的(随机变量相互独立的严格定义第三章再讲).则有,X=X1+X2+Xn,一、泊松分布的定义及图形特点,设随机变量X所有可能取的值为0,1,2,且概率分布为:,其中 0 是常数,则称 X 服从参数为

11、的泊松分布,记作XP().,(III)泊松分布,易见,例9,某一无线寻呼台,每分钟收到寻呼的次数X服从参数=3的泊松分布.求:(1)一分钟内恰好收到3次寻的概率.(2)一分钟内收到2至5次寻呼的概率.,解:,(1)PX=3=p(3;3)=(33/3!)e-30.2240(2)P2X5=PX=2+PX=3+PX=4+PX=5=(32/2!)+(33/3!)+(34/4!)+(35/5!)e-3 0.7169,解:,例 10,某一城市每天发生火灾的次数X服从参数为0.8的泊松分布.求:该城市一天内发生3次以上火灾的概率.,PX3=1-PX3=1-PX=0+PX=1+PX=2=1-(0.8 0/0!

12、)+(0.81/1!)+(0.82/2!)e-0.80.0474,请看演示,泊松分布,历史上,泊松分布是作为二项分布的近似,于1837年由法国数学家泊松引入的.,二、二项分布与泊松分布,命题,对于二项分布B(n,p),当n充分大,p又很小时,则对任意固定的非负整数k,有近似公式,由泊松定理,n重贝努里试验中稀有事件出现的次数近似地服从泊松分布.,我们把在每次试验中出现概率很小的事件称作稀有事件.如地震、火山爆发、特大洪水、意外事故等等,解:,例11,某出租汽车公司共有出租车400辆,设每天每辆出租车出现故障的概率为0.02,求:一天内没有出租车出现故障的概率.,将观察一辆车一天内是否出现故障看

13、成一次试验E.因为每辆车是否出现故障与其它车无关,于是观察400辆出租车是否出现故障就是做400次伯努利试验,设X表示一天内出现故障的出租车数,则:X B(400,0.02).令=np=4000.02=8 于是:P一天内没有出租车出现故障=PX=0=b(0;400,0.02)(80/0!)e-8=0.0003355,对于离散型随机变量,如果知道了它的概率分布,也就知道了该随机变量取值的概率规律.在这个意义上,我们说,这一讲,我们介绍了离散型随机变量及其概率分布.,离散型随机变量由它的概率分布唯一确定.,两点分布、二项分布、泊松分布 及其关系,湖南商学院信息系 数学教研室,第二章 第三节 连续型

14、随机变量,连续型随机变量X所有可能取值充满一个区间,对这种类型的随机变量,不能象离散型随机变量那样,以指定它取每个值概率的方式,去给出其概率分布,而是通过给出所谓“概率密度函数”的方式.,下面我们就来介绍对连续型随机变量的描述方法.,第二章 第三节 连续型随机变量,请看演示:,怎样画直方图,直方图与概率密度,(I)直方图,(一)概率密度函数,(II)连续型r.v.及其概率密度函数的定义,1 o,2 o,这两条性质是判定一个函数 f(x)是否为某r.vX的概率密度函数的充要条件.,故 X的密度 f(x)在 x 这一点的值,恰好是X落在区间 上的概率与区间长度 之比的极限.这里,如果把概率理解为质

15、量,f(x)相当于线密度.,3.对 f(x)的进一步理解:,要注意的是,密度函数 f(x)在某点处a的高度,并不反映X取值的概率.但是,这个高度越大,则X取a附近的值的概率就越大.也可以说,在某点密度曲线的高度反映了概率集中在该点附近的程度.,若不计高阶无穷小,有:,它表示随机变量 X 取值于 的概率近似等于.,4.连续型r.v取任一指定值的概率为0.,即:,a为任一指定值,这是因为,由此得,,1)对连续型 r.v X,有,2)由P(X=a)=0 可推知,而 X=a 并非不可能事件,可见,,由P(A)=0,不能推出,并非必然事件,由P(B)=1,不能推出 B=,(二)、随机变量的分布函数,设X

16、()是一个随机变量.称函数 F(x):=PXx,-x 为随机变量X的分布函数.,分布函数的性质,(1)ab,总有F(a)F(b)(单调非减性)(2)F(x)是一个右连续的函数(3)xR1,总有0F(x)1(有界性),且,定义,证明:仅证(1),aa=Xb-Xa,而XaXb.PaXb=PXb-PXa=F(b)-F(a).又PaXb0,F(a)F(b).,上述证明中我们得到一个重要公式:PaXb=F(b)-F(a).它表明随机变量落在区间(a,b上的概 率可以通过它的分布函数来计算.,注意,设离散型随机变量X的分布律为 pk:=PX=xk,k=1,2,X的分布函数,离散型随机变量的分布函数,分布函

17、数F(x)是一个右连续的函数,在x=xk(k=1,2)处有跳跃值 pk=PX=xk,如下图(图2.2.1)所示,P29,例2.2.1 X的分布函数,F(x)=,0 x00.04 0X10.36 1X21 2X,连续型 r.v.的分布函数,即分布函数是密度函数的可变上限的定积分.,由上式可得,在 f(x)的连续点,,下面我们来求一个连续型 r.v 的分布函数.,F(x)=P(X x)=,解:,对x-1,F(x)=0,对,对 x1,F(x)=1,即,(三)常见的连续型随机变量,正态分布、均匀分布、指数分布,正态分布是应用最广泛的一种连续型分布.,正态分布在十九世纪前叶由 高斯(Gauss)加以推广

18、,所以通常称为高斯分布.,德莫佛,德莫佛(De Moivre)最早发现了二项分布的一个近似公式,这一公式被认为是正态分布的首次露面.,一、正态分布,你们是否见过街头的一种赌博游戏?用一个钉板作赌具。,下面我们在计算机上模拟这个游戏:,街头赌博,高尔顿钉板试验,高尔顿钉板试验,这条曲线就近似我们将要介绍的正态分布的密度曲线。,(I)、正态分布的定义,若r.v.X 的概率密度为,记作,f(x)所确定的曲线叫作正态曲线.,其中 和 都是常数,任意,0,则称X服从参数为 和 的正态分布.,(Normal),(II)、正态分布 的图形特点,正态分布的密度曲线是一条关于 对称的钟形曲线.,特点是“两头小,

19、中间大,左右对称”.,决定了图形的中心位置,决定了图形中峰的陡峭程度.,正态分布 的图形特点,故f(x)以为对称轴,并在x=处达到最大值:,令x=+c,x=-c(c0),分别代入f(x),可得,f(+c)=f(-c),且 f(+c)f(),f(-c)f(),这说明曲线 f(x)向左右伸展时,越来越贴近x轴。即f(x)以x轴为渐近线。,当x 时,f(x)0,用求导的方法可以证明,,为f(x)的两个拐点的横坐标。,x=,这是高等数学的内容,如果忘记了,课下再复习一下。,实例 年降雨量问题,我们用上海99年年降雨量的数据画出了频率直方图。,从直方图,我们可以初步看出,年降雨量近似服从正态分布。,下面

20、是我们用某大学大学生的身高的数据画出的频率直方图。,红线是拟合的正态密度曲线,可见,某大学大学生的身高应服从正态分布。,人的身高高低不等,但中等身材的占大多数,特高和特矮的只是少数,而且较高和较矮的人数大致相近,这从一个方面反映了服从正态分布的随机变量的特点。,除了我们在前面遇到过的年降雨量和身高外,在正常条件下各种产品的质量指标,如零件的尺寸;纤维的强度和张力;农作物的产量,小麦的穗长、株高;测量误差,射击目标的水平或垂直偏差;信号噪声等等,都服从或近似服从正态分布.,(IV)、标准正态分布,的正态分布称为标准正态分布.,其密度函数和分布函数常用 和 表示:,它的依据是下面的定理:,标准正态

21、分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.,根据定理1,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题.,定理1,书末附有标准正态分布函数数值表,有了它,可以解决一般正态分布的概率计算查表.,(V)、正态分布表,表中给的是x0时,(x)的值.,当-x0时,若,N(0,1),若 XN(0,1),由标准正态分布的查表计算可以求得,,这说明,X的取值几乎全部集中在-3,3区间内,超出这个范围的可能性仅占不到0.3%.,当XN(0,1)时,,P(|X|1)=2(1)-1=0.6826,P(|X|2)=2(2)-1=0.9544,P(|X|3

22、)=2(3)-1=0.9974,(VI)、3 准则,将上述结论推广到一般的正态分布,时,,这在统计学上称作“3 准则”(三倍标准差原则).,例1(1)假设某地区成年男性的身高(单位:cm)XN(170,7.692),求该地区成年男性的身高超过175cm的概率。,解:(1)根据假设XN(170,7.692),则,故事件X175的概率为,P X175=,=0.2578,解:(2)设车门高度为h cm,按设计要求,P(X h)0.01,或 P(X h)0.99,,下面我们来求满足上式的最小的 h.,(2)公共汽车车门的高度是按成年男性与车门顶头碰头机会在0.01以下来设计的,问车门高度应如何确定?,

23、因为XN(170,7.692),故 P(X h)=,0.99,查表得(2.33)=0.99010.99,所以=2.33,即 h=170+17.92 188,设计车门高度为188厘米时,可使男子与车门碰头机会不超过0.01.,若 r.v.X的概率密度为:,则称X服从区间(a,b)上的均匀分布,记作:,X Ua,b,二、均匀分布(Uniform),(注:X U(a,b),均匀分布常见于下列情形:,如在数值计算中,由于四舍五 入,小数点后某一位小数引入的误差,例如对小数点后第一位进行四舍五 入时,那么一般认为误差服从(-0.5,0.5)上的均匀分布。,则称 X 服从参数为 的指数分布.,指数分布常用

24、于可靠性统计研究中,如元件的寿命.,三、指数分布:若 r.v X具有概率密度,常简记为 XE().,这一讲,我们介绍了连续型随机变量、概率密度函数及性质。还介绍了正态分布,它的应用极为广泛,在本课程中我们一直要和它打交道.,后面第五章中,我们还将介绍为什么这么多随机现象都近似服从正态分布;还要给出德莫佛极限定理的证明.,另外我们简单介绍了均匀分布和指数分布,一、问题的提出,在实际中,人们常常对随机变量的函数更感兴趣.例如,已知圆轴截面直径 d 的分布,,求截面面积 A=的分布.,第二章第四节 随机变量函数的分布,又如:已知t=t0 时刻噪声电压 V的分布,,求功率 W=V2/R(R为电阻)的分

25、布等.,一般地、设随机变量X 的分布已知,Y=g(X)(设g是连续函数),如何由 X 的分布求出 Y 的分布?,这个问题无论在实践中还是在理论上都是重要的.,二、离散型随机变量函数的分布,解:当 X 取值 1,2,5 时,Y 取对应值 5,7,13,,而且X取某值与Y取其对应值是两个同时发生的事件,两者具有相同的概率.,故,如果g(xk)中有一些是相同的,把它们作适当并项即可.,一般,若X是离散型 r.v,X的概率函数为,则 Y=X2 的概率函数为:,三、连续型随机变量函数的分布,解:设Y的分布函数为 FY(y),,FY(y)=P Y y=P(2X+8 y),=P X=FX(),于是Y 的密度

26、函数,故,注意到 0 x 4 时,,即 8 y 16 时,,此时,Y=2X+8,求导可得,当 y0 时,注意到 Y=X2 0,故当 y 0时,,解:设Y和X的分布函数分别为 和,,若,则 Y=X2 的概率密度为:,从上述两例中可以看到,在求P(Yy)的过程中,关键的一步是设法从 g(X)y 中解出X,从而得到与 g(X)y 等价的X的不等式.,用 代替 X2 y,这样做是为了利用已知的 X的分布,从而求出相应的概率.,这是求r.v的函数的分布的一种常用方法.,例4 设随机变量X的概率密度为,求Y=sinX的概率密度.,当 y 0时,当 y 1时,故,解:注意到,=P(0 X arcsiny)+

27、P(-arcsiny X),当0y1时,而,求导得:,例5 已知随机变量X的分布函数F(x)是严格单调的连续函数,证明Y=F(X)服从0,1上的均匀分布.,又由于X的分布函数F是严格递增的连续函数,其反函数 F-1 存在且严格递增.,证明:设Y的分布函数是G(y),于是,对y1,G(y)=1;,对y0,G(y)=0;,由于,对0y1,G(y)=P(Y y),=P(F(X)y),=P(X(y),=F(y)=y,即Y的分布函数是,求导得Y的密度函数,可见,Y 服从0,1上的均匀分布.,本例的结论在计算机模拟中有重要的应用.,下面给出一个定理,在满足定理条件时可直接用它求出随机变量函数的概率密度.,

28、其中,,此定理的证明与前面的解题思路类似.,x=h(y)是y=g(x)的反函数,定理 设 X是一个取值于区间a,b,具有概率密度 f(x)的连续型r.v,又设y=g(x)处处可导,且对于任意x,恒有 或恒有,则Y=g(X)是一个连续型r.v,它的概率密度为,例6 设随机变量X在(0,1)上服从均匀分布,求Y=-2lnX的概率密度.,解:,在区间(0,1)上,函数lnx0,故 y=-2lnx0,于是 y在区间(0,1)上单调下降,有反函数,由前述定理得,注意取绝对值,已知X在(0,1)上服从均匀分布,,代入 的表达式中,得,即Y服从参数为1/2的指数分布.,对于连续型随机变量,在求Y=g(X)的分布时,关键的一步是把事件 g(X)y 转化为X在一定范围内取值的形式,从而可以利用 X 的分布来求 P g(X)y.,这一讲我们介绍了随机变量函数的分布.,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号