《第6章概率分布.ppt》由会员分享,可在线阅读,更多相关《第6章概率分布.ppt(54页珍藏版)》请在三一办公上搜索。
1、第6章 概率分布,概率,61 概率,随机现象与随机试验随机事件随机事件的概率概率的基本性质,返回,随机现象与随机试验,在一定条件下,可能出现这种结果,也可能出现那种结果的现象,也即不能预先断定会出现哪种结果的现象,称为随机现象。在一定条件下,对随机现象进行观察或科学实验的过程称为,返回,随机试验,随机试验必须符合以下条件:(1)它可以在相同条件下重复进行;(2)试验的所有可能结果是事先已知的,并且不止一个;(3)每次试验只出现这些可能结果中的一个,但不能预先断定 会出现哪种结果,随机事件,随机试验的每一个可能的结果称为基本事件。有两个或两个以上基本事件组成的集合称为复合事件。无论基本事件还是复
2、合事件,它们在随机试验中发生与否,都带有随机性,所以都称为随机事件。如果某一事件在每次试验中一定出现,我们就把它称为必然事件。如果某一事件在每次试验中都不出现,我们就把它称为不可能事件。,返回,随机事件的概率,概率是对随机事件在随机试验中发生的可能性大小的一种测定。随机事件A发生的可能性的大小称为事件A发生的概率,记为P(A)。事件A的概率是一个介于0和1之间的一个值当实验次数很多时,概率P(A)可以所观察到的事件A发生次数(频数)的比例来逼近在相同条件下,重复进行n次实验,事件A发生了m次,则事件A发生的概率可以写为:P(A)=m/n=p,返回,概率的基本性质,1、0P(A)12、P()=1
3、,P()=0,即必然事件的概率为1,不可能事件的概率为零。3、设A、B为任意两个事件,则 P(AB)=P(A)+P(B)P(AB)4、若A与B是两个互斥事件,则 P(AB)=P(A)+P(B)5、设事件A包含事件B,则 P(AB)=P(A)P(B)P(A)P(B),返回,62 随机变量及其概率分布,随机变量的概念随机变量的概率分布随机变量的数字特征,返回,随机变量的概念,随机变量是随机试验结果即随机事件的定量描述。随机变量常用大写字母X、Y、Z等表示,它们的具体取值常用小写字母x、y、z来表示。随机变量具有两个特点:一是取值的随机性,即事先不能确定取哪个值;二是取值的统计规律性,即随机变量取值
4、的可能性大小(概率)是完全可以确定的。随机变量按其取值情况可以分为 和 两类。,返回,离散型随机变量,连续型随机变量,离散型随机变量,随机变量X取有限个值或所有取值都可以逐个列举出来以确定的概率取这些不同的值例子,返回,连续型随机变量,可以取一个或多个区间中任何值所有可能取值不可能逐个列出来例子,返回,随机变量的概率分布,随机变量X的所有可能取值与其对应的概率P(X)构成的概率分布规律,称为随机变量的概率分布。由概率的性质可知,任一概率分布都必须满足以下两个条件:1、0 pk 1 k=1,2,3,2、pk=1概率分布的重要作用是,知道概率分布就可以求得随机试验中任一事件的概率。,返回,离散型随
5、机变量的概率分布,设离散型随机变量X的可能取值为k(k=1,2,3,),取这些值的概率分别为pk(k=1,2,3,),则P(X=k)=pk,k=1,2,3,称为离散型随机变量X的概率分布或分布列。通常用下面的表格来表示,返回,离散型随机变量的概率分布(举例),【例】投掷一颗骰子后出现的点数是一个离散型随机变量。写出 掷一枚骰字出现点数的概率分布。概率分布,由于连续型随机变量的取值是某个区间,无法一一列举,因此不能用分布列来描述这类随机变量的统计规律。通常我们用数学函数的形式或分布函数的形式来描述。设X为一连续型随机变量,x为任意实数,X的概率密度函数记为f(x),它满足下列两个条件:f(x)0
6、,即概率密度曲线在x轴的上方;f(x)dx=1,即曲线与x轴之间的面积为1。则称f(x)为连续型随机变量X的概率密度函数。,连续型随机变量的概率分布,注意:,f(x)不是概率,它表示X所有取值x及其频数f(x),返回,概率密度函数,在平面直角坐标系中画出f(x)的图形,则对于任何实数x1x2,P(x1Xx2)是该曲线下从x1到x2的面积,分布函数,对密度函数f(x)的积分(-x+)称为连续型随机变量X的分布函数。易见,分布函数的性质:1、0F(x)1;2、F(x)为非降函数;3、4、,随机变量的数字特征,随机变量的数学期望随机变量的方差,返回,随机变量的数学期望,随机变量的数学期望也叫均值,一
7、般用E(X)或来表示。1、离散型随机变量的数学期望定义为:2、连续型随机变量的数学期望定义为:.,返回,数学期望具有下述性质,(1)设C为常数,则E(C)=C;(2)设K为常数,X为随机变量,则 E(KX)=KE(X)(3)设X、Y为两个随机变量,则 E(X+Y)=E(X)+E(Y),随机变量的方差,随机变量的方差是每一个随机变量取值与其期望值的离差平方的期望值。一般用D(X)或2表示,方差的平方根叫标准差,一般用表示。其计算公式为:D(X)=EXE(X)2 常用的简化公式为:D(X)=E(X2)E(X)2 1、当随机变量为离散型时,2、当随机变量为连续型时,,返回,方差具有以下几个重要性质,
8、(1)设C为常数,则D(C)=0;(2)设C是常数,X是随机变量,则 D(CX)=C2D(X);(3)设X、Y为两个独立的随机变量,则有 D(X+Y)=D(X)+D(Y),计算期望值的例子:以掷骰子的试验为例,它的期望值为:,计算方差的例子:以掷骰子的试验为例,它的方差为:,计算举例,63几种重要的离散型概率分布,两点分布二项分布泊松分布超几何分布,返回,两点分布,一个离散型随机变量X只取0和1两个可能的值它们的概率分布为 P(X=1)=p P(X=0)=1-p=q也称0-1分布它的数学期望和方差分别为:=p 和 2=pq,返回,两点分布(举例),【例】已知一批产品的次品率为p=0.04,合格
9、率为q=1-p=0.96。并指定废品用1表示,合格品用0表示。则任取一件为废品或合格品这一离散型随机变量,其概率分布为,二项分布,二项分布与贝努里试验有关贝努里试验满足下列条件 一次实验只有两个可能结果,即“成功”和“失败”一次实验“成功”的概率为p,“失败”的概率为1-p=q,且概率p对每次实验都是相同的 实验是相互独立的,并可以重复进行n次 在n次实验中,“成功”的次数对应一个离散型随机变量X它的可能取值是0,1,2,n。,二项分布,可以求出随机变量X的分布列为:k=1,2,3,n。这种概率分布便称为二项分布。记作XB(n,p)。二项分布的数学期望和方差分别为:=np 和 2=npq当n=
10、1时,二项分布可化简为 x=0,1,返回,二项分布(举例),【例】某种商品的不合格率为0.3,一顾客从商店买了6件这种商品,试求下列事件的概率:(1)恰有4件商品不合格;(2)不合格件数不超过一半;(3)至少有一件不合格品。,二项分布(举例),解:设不合格商品数为X,显然随机变量XB(6,0.3)。根据二项分布的计算公式,有:(1)(2)(3),泊松分布,若随机变量X具有如下分布列:k=1,2,3,(其中0,e=2.7 1 8 3 是个常数)则称X服从参数为泊松分布。记为:XP()泊松分布的数学期望和方差分别为:=和 2=,泊松分布(作为二项分布的近似),当n很大,p很小,=np是一个不太大的
11、常数时,可以用泊松分布作为二项分布的近似,即:其中=np,通常当n20,p0.05时,就可采用该近似公式。,返回,泊松分布(举例),【例】假定某航空公司预顶票处平均每小时接到42次定票电话,那么10分钟内恰好接到6次电话的概率是多少?解:设X=10分钟内航空公司预定票处接到的电话次数,例如:已知某批集成电路的次品率为1.5%,随机抽取1000块集成电路进行检验,求次品数为2件的概率。解:把集成电路的次品数看成随机变量X,显然 XB(1000,0.0015),根据二项分布的计算公式直接计算相当复杂,考虑用泊松分布计算。因为n比较大,p比较小,因此可以用泊松分布近似计算。根据泊松分布的公式=np=
12、1.5 利用该公式计算,可以使用小型计算器,也可以通过查泊松分布表求得,计算过程比二项分布更容易。,泊松分布(举例),超几何分布,设一批产品共N件,其中有M件不合格,从中任意取出n件,其中不格品数X是一个随机变量,它的可能取值是0,1,2,min(n,N),可以导出X的分布列为:k=1,2,3,min(n,N)这种概率分布称为超几何分布。超几何分布的数学期望和方差分别为:=np 和 当N很大,n相对较小时,超几何分布近似于二项分布。,返回,超几何分布(举例),【例】假定有10支股票,其中有3支购买后可以获利,另外7支购买后将会亏损.如果你打算从10支股票中选择4支购买,但你并不知道哪3支是获利
13、的,哪7支是亏损的.求:(1)有3支能获利的股票都被你选中的概率有多大?(2)3支能获利的股票中有2支被你选中的概率有多大?解:设N=10,M=3,n=4,64 几种重要的连续型概率分布,正态分布2(卡方)分布t 分布,返回,正态分布,如果连续随机变量X的概率密度函数为:(x+)其中0,则称X服从参数为,2的正态分布,记作:XN(,2),其中为随机变量的均值,2为随机变量的方差。,正态分布(标准正态分布),特别当=0,=1时,称随机变量X服从标准正态分布,记为:N(0,1)。此时X的密度函数记为,即(x+),正态分布密度函数的性质,1、以直线=为对称轴;2、以直线y=0(x轴)为渐近线;3、当
14、=时,f(x)有极大值;4、曲线与轴的面积为1,即,正态分布的分布函数,设XN(,2),其密度函数为f(x),则X的分布函数为(x+),标准正态分布,设N(0,1),则其分布函数为:(x+)根据正态分布的数学性质,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布。设XN(,2),则 Z=(X)/N(0,1),正态分布的性质,(1)若X服从正态分布,则对任意常数a(a0),b,Z=a+bX也服从正态分布;(2)若X、Y皆服从正态分布,且相互独立,则对任意的常数a、b(a、b不全为0),则Z=aX+bY也服从正态分布。,正态分布的概率计算,对于标准正态分布,即ZN(0,1),有对于负的Z
15、,可由 得到将一般正态分布转化为标准正态分布后,通过查表,就可以解决正态分布的概率计算问题。一般设XN(,2),ab则有:,返回,正态分布(举例),【例】某电冰箱厂生产某种型号的电冰箱,其电冰箱压缩机使用寿命服从均值为10年,标准差为2年的正态分布。(1)求整批电冰箱压缩机的寿命大于9年的概率(2)求整批电冰箱压缩机寿介于911年的概率解:XN(10,22),则(1),正态分布(举例),(2)思考:如果该厂为了提高产品竞争力,提出其电冰箱压缩机在保险期限年遇有故障可免费换新,该厂预计免费换新的比重为1%,请确定该厂电冰箱压缩机免费换新的保用年限。,二项分布的正态逼近,二项分布B(n,p),当n
16、很大,p和q都不太小时,不能用泊松分布近似计算。理论研究表明,当n很大,而0p1是一个定值时,二项分布的随机变量近似地服从正态分布N(np,npq)。对于一个二项随机变量X,当n很大时,X取某一特定值的概率可以用正态分布近似为,二项分布的正态逼近(例题分析),【例】100台车床彼此独立地工作着,每台车床的实际工作时间占全部工作时间的8%,求任一时刻有70台到86台车床在工作的概率。解:设X为100台车床中工作着的车床台数,则,XB(100,0.8),现在用正态分布近似计算,np=80,pq=16思考:如何计算任一时刻有80台以上车床在工作的概率,返回,2(卡方)分布,设随机变量X1,X2,Xn
17、 皆服从N(0,1)分布,且相互独立,则随机变量X=Xk2 所服从的分布称为2分布,并记为X 2(n)。其中参数n称为自由度,它表示X=Xk2 中独立随机变量的个数。2(n)分布的数学期望和方差分别为:=n 和 2=2n,返回,t 分布,设随机变量 XN(0,1),Y2(n),且X,Y 相互独立,则随机变量 的分布称为自由度为n 的t 分布,记为Tt(n)。t分布的数学期望和方差分别为:=0 2=n/(n-2),返回,65 大数定律和中心极限定理,大数定律中心极限定理,返回,大数定律切贝雪夫大数定律,设随机变量X1,X2,相互独立,且服从同一分布,它们的数学期望E(Xk)=,方差D(Xk)=2
18、(k=1,),则对任意正数,有:即在试验次数无限增多的情况下,算术平均数与有较大偏差的可能性是很小的。将该定律用于抽样推断就有如下结论:随着样本单位数的增加,样本平均数将有接近总体平均数的趋势,大数定律(切贝雪夫大数定律),设n次独立试验中,事件A发生的次数为m,事件A在每次试验中发生的概率为P,则对于任意的正数,有:即当试验次数足够多时,“事件A发生的频率与事件A的概率之差,就其绝对值来说,可以充分小”的概率趋于1;也就是说,当试验次数很多时,事件A发生的频率与概率有较大偏差的可能性很小。将该定律用于抽样推断就有如下结论:随着样本单位数的增加,样本成数(比率)将有接近总体成数(比率)的趋势。
19、,返回,中心极限定理(辛钦中心极限定理),如果随机变量X1,X2,Xn相互独立,且服从同一分布,且有有限的数学期望和方差 2,则随机变量X=Xk/n,在n无限大时,服从参数为和2/n 的正态分布,即n趋于无穷大时,XN(,2/n)将该定理用于抽样推断就有如下结论:不管总体是什么分布,只要其均值和方差存在,当样本单位数足够大(一般要大于30个)时,样本平均数的分布就趋于数学期望为,方差为2/n 的正态分布。,中心极限定理(德莫佛拉普拉斯中心极限定理),设n是n次独立试验中事件A发生的次数,且事件A在每次试验中发生的概率为p,则当n无限大时,频率 n/的分布就趋于数学期望为p,方差为pq/n的正态分布。将该定理用于抽样推断就有如下结论:不管总体是什么分布,只要样本单位数n足够大(一般要大于30个),那么样本的频率(成数)分布就趋于数学期望为p,方差为pq/n的正态分布。,返回,