统计培训教材概率与概率分布.ppt

上传人:牧羊曲112 文档编号:6332761 上传时间:2023-10-17 格式:PPT 页数:53 大小:707KB
返回 下载 相关 举报
统计培训教材概率与概率分布.ppt_第1页
第1页 / 共53页
统计培训教材概率与概率分布.ppt_第2页
第2页 / 共53页
统计培训教材概率与概率分布.ppt_第3页
第3页 / 共53页
统计培训教材概率与概率分布.ppt_第4页
第4页 / 共53页
统计培训教材概率与概率分布.ppt_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《统计培训教材概率与概率分布.ppt》由会员分享,可在线阅读,更多相关《统计培训教材概率与概率分布.ppt(53页珍藏版)》请在三一办公上搜索。

1、概率与概率分布,在对随机现象的研究和各种决策中,常需用样本(数据)提供的信息去推断总体的数量规律性,即作出有关总体的某种结论.推断统计学是建立在概率与概率分布基础的理论基础上的统计方法,因而有必要了其有关知识,一、概率基础,-随机实验,样本空间,随机事件-概率:古典概率,几何概率,公理化定义-条件概率-随机变量-常用随机变量的分布:二项、泊松、均匀、指数、正态-数学期望、方差,在一定条件下,并不总是出现相同结果的现象称为随机现象。对随机现象进行观察和试验称为随机试验。在随机试验中可能发生也可能不发生的事件称为随机事件(A、B)。在随机试验中所有可能出现的结果组成的集合称为样本空间(S)。集合表

2、示:例:抛一枚均匀骰子。事件A表示“大”即“4、5、6点”,如果结果出现5点,则事件A发生了。,1、随机实验,样本空间,随机事件,2、事件的关系与运算,S,A,B,A,B,S,S,S,A,A,A-B,B,A,B,B=A,S,S,S,A,B,B,A-B,例,抛一骰子。A表示“偶数点”,B表示“4,5,6”,则事件A与B至少有一个发生为事件A与B都发生事件A发生而B不发生事件A与B都不发生,事件的运算法则,交换律:AB=BA AB=BA结合律:A(BC)=(AB)C A(BC)=(AB)C 分配律:A(BC)=ABAC A(BC)=(AB)(AC)对偶律:,集合的运算法则都适用,常用的有,3、概率

3、的定义,物理学家吴大猷:误用概率的笑话 一个病人去看病,医生检查后告诉病人说他要动手术。病人问这种手术死亡率高不高,医生说这种手术100个人有50个要死的。稍后医生又安慰病人说,到今天已经有50人死去了,所以你不用害怕。,估计概率方法,一)概率的古典定义 1、定义:古典方法是在经验事实的基础上对被考察事件 发生可能性进行符合逻辑的分析后得出该事件的概率.如果试验E满足(1)它的结果只有有限种.(2)且每种结果发生的可能性相同.(3)假如被考察事件A含有k个结果,总体事件含有n个结果。则事件A发生的概率为:P(A)=k/n,2、古典概率模型中事件的概率求法 试验A的结果只有有限种,即样本点是有限

4、个:1,2,n,=12 n i,i=1,2,n是基本事件,而他们发生的概率都相等,这样 1=P()=P(12 n)=P(1)+P(2)+P(n)=n P(i),i=1,2,n P(i)=1/n i=1,2,因此若事件A包含k个基本事件,于是 P(A)=k(1/n)=k/n,3、古典概率模型的例子例1 掷一颗均匀骰子.设:A表示所掷结果为“四点或五点”.B表示所掷结果为“偶数点”.求:P(A)和P(B)解:n=6,kA=2 P(A)=2/6=1/3 kB=3 P(B)=3/6=1/2,例2 货架上有外观相同的商品15件,其中12件来自产地甲,3件来自地乙.现从15件商品中随机地抽取两件,求这两件

5、商品来自一同产地的概率.解:从15件商品中取出2商品,共有=105 种取法,且每种取法都是等可能的.n=105令A=两件商品都来自产地甲 kA=66 令B=两件商品都来自产地乙 kB=3 而事件两件商品来自同一产地=AB,且A与B互斥。它包含基本事件数=66+3=69 所求概率=69/105=23/35,例3:有外观相同的三极管6只,按其电流放大系数分类,4只属甲类,2只属乙类.按下列两种方案抽取三极管两只,(1)每次抽取一个只,测试后放回,然后再抽取下一只(放回抽样).(2)每次抽取一只,测试后不放回,然后在剩下的三极管中再抽取下一只(不放回抽样)设A=抽到两只甲类三极管,B=抽到两只同类三

6、极管,C=至少抽到一只甲类三极管,D=抽到两只不同类三极管.求:P(A),P(B),P(C),P(D),解:(1)由于每次抽测后放回,因此,每次都是在6只三极管中抽取.第一次从6只中取一只,共有6种可能的取法.第二次还是从6只中取一只,还是有6种可能的取法.取两只三极管共有66=36种可能的取法.注意:这种分析方法使用的是中学学过的 乘法原理,即n=36且每个基本事件发生的可能性相同.第一次取一只甲类三极管共有4种可能的取法,第二次再取一只甲类三极管还是有4种可能的取法.取两只甲类三极管共有44=16种可能的取法,即:kA=16 P(A)=16/36=4/9 令E=抽到两只乙类三极管,kE=2

7、2=4 P(E)=4/36=1/9 而C是E的对立事件,P(C)=1-P(E)=8/9;B=AE,且A与E互斥,P(B)=P(A)+P(E)=5/9;D是B的对立事件,P(D)=1-P(B)=4/9,(2)由于第一次抽测后不放回,因此,第一次从6只中取一只,共有6种可能的取法,第二次是从剩余的5只中取一只,有5种可能的取法.由乘法原理取两只三极管共有n=65=30种可能的取法.再由乘法原理:kA=43=12 P(A)=12/30=2/5 kE=21=2 P(E)=2/30=1/15 C是E的对立事件,P(C)=1-P(E)=14/15 B=AE,且A与E互斥 P(B)=P(A)+P(E)=7/

8、15 D是B的对立事件,P(D)=1-P(B)=8/15,例4:设N件产品中有K件是次品,N-K件是正品,KN.现从N件中每次任意抽取1件产品,在检查过它是正品或是次品后再放回,这样共抽取了n次.求:事件A=所取的n件产品中恰有k件次品的概率,k=0,1,2,n.,解:假定N件产品是有编号的,从中任意取出一件,每次都有N种取法.由乘法原理,n次共有Nn种取法,所以基本事件总数为Nn。当所取的n件产品中恰有k件次品时,由于取到这k件次品的次序的不同,因此从次序考虑共有Cnk种情况。,这Cnk种情况确定以后,现在考虑次序,首先从K件次品中取出k件,共有Kk种取法.从N-K件正品中取n-k件,共有(

9、N-K)n-k种取法.由乘法原理,共有Cnk Kk(N-K)n-k种取法,A中基本事件个数为Cnk Kk(N-K)n-k.,在不放回抽样中,从N件产品种选取n件产品的抽取方法共有CNn(这里不考虑产品的选取次序);从K件次品中选取k件次品的选择方法有CKk;从N-K件正品中选取nk件正品的选择方法有CN-Kn-k;抽取n件产品共有k件次品的选择方法有 CKk CN-Kn-k;所以抽取n件产品共有k件次品的概率P(A)为:P(A)=CKk CN-Kn-k/CNn 这种分布称为超几何分布,上式为超几何分布概率公式。,二)概率的统计定义(频率估计法)1、频率:设A是一个事件.在相同的条件下,进行n

10、次试验,在这n次试验中,事件A发生了m次.则称m为事件A在n次试验中发生的次数,称m与n的比值m/n为事件A在n次试验中发生的频率,记为fn(A).,2、频率的稳定性:在充分多次试验中,事件的频率总在一个定值附近摆动,而且,试验次数越多,一般来说摆动越小.这个性质叫做频率的稳定性.例如抛硬币、掷骰子等,考虑在相同条件下进行的S 轮试验.,事件A在各轮试验中频率形成一个数列,我们来说明频率稳定性的含义.,频率的稳定性指的是:当各轮试验次数n1,n2,ns 充分大时,在各轮试验中事件A出现的频率之间、或者它们与某个平均值相差甚微.即,,这种稳定性为用统计方法求概率的数值开拓了道路.在实际中,当概率

11、不易求出时,人们常取实验次数很大时事件的频率作为概率的估计值,称此概率为统计概率这种确定概率的方法称为频率方法.,例如,若我们希望知道某射手中靶的概率,应对这个射手在同样条件下大量射击情况进行观察记录.若他射击n发,中靶 m发,当n很大时,可用频率m/n作为他中靶概率的估计.,3、频率与概率的区别与联系,频率在一定程度上反映了事件发生的可能性大小.尽管每进行一连串(n次)试验,所得到的频率可以各不相同,但只要 n相当大,频率就会非常接近一个值-概率.频率是样本的表现,而概率是总体所具有的特征。因此,概率是可以通过频率来“测量”的,频率是概率的一个近似.,设E是随机试验,是它的样本空间,对于中的

12、每一个事件A,赋予一个实数,记为P(A),称为事件A的概率,如果集合函数 P(A)满足下述三条公理:,公理2 P()=1(2),公理3 若事件A1,A2,两两互不相容,则有(3)这里事件个数可以是有限或无限的(必须是可列的).,公理1 0P(A)1(1),一)概率的公理定义,概率的的性质与运算法则,二)概率的性质,1.P()=0 即不可能事件的概率为零.2.概率的加法定理 若事件A1,A2,An两两互斥,则有:P(A1A2An)=P(A1)+P(An)即互斥事件之和的概率等于它们各自的概率之和.(有限可加性)概率的加法定理3.对两个事件A和B,若AB,则有:P(B-A)=P(B)-P(A),P

13、(B)P(A).4.对任一事件A,均有,概率的的性质与运算法则,又因 再由性质 3便得(8).,性质5对任意两个事件A、B,有,(8),条件概率,设某电子元件能使用20年以上的概率为0.8,能用25年以上的概率为0.4,如果某件元件已经使用了20年,问它能用25年以上的概率?这是条件概率,概率的乘法定理:故P(AB)=P(A)P(B|A)=P(B)P(A|B)此外还有全概率公式、贝叶斯公式,独立概率,设有2个事件A和B,假如其中一个事件的发生不影响另一个事件发生的概率,则称事件A与B相互独立。假如A与B相互独立,则A与B同时发生的概率假如A与B相互独立,则在事件B发生的前提下,事件 A发生的概

14、率,1.5 随机变量及其分布,离散:(Discrete)二项分布 B(n,p)(Binomial)超几何分布(Hyper-geometric)泊松分布(Poisson)连续:(Continuous)均匀分布(Uniform)正态分布(Normal)指数分布(Exponential Distribution),二项分布B(n,p),贝努利试验:-进行n次试验(1)各次试验结果相互独立(2)各次试验只有两个结果:“成功”和“失败”(3)在每次试验中“成功”的概率都是p。,在n次贝努利试验中,随机变量X表示“成功”的次数,则“成功”k 次的概率为数学期望=np方差=2=np(1-p),例,买六合彩1

15、00次,中3次射击50次,命中30次生了3个小孩,有一个是男孩抽查10个产品,有一个次品今天碰到6个人,有2人在星期六出生,例,已知100个人中有16人近视。现班中有10个人,问其中有k个人近视的概率?最简单的方法是用 Minitab 来计算:CalcProbability DistributionsBinomial function(n=10,p=0.16),近视人数 概率10.33314520.28555330.14504340.04834850.01105160.00175470.00019180.00001490.000001100.000000,超几何分布(Hypergeometri

16、c),N个元素分成两类,有N1 个属于第一类,有N2 个属于第二类。从中不重复抽取 n 个,令 X 表示这 n 个元素中属于第一类的个数,则 X 的分布称为超几何分布。,泊松分布(Poisson),泊松是十九世纪法国著名数学家,是“一个熟谙在行事处世方面不失高贵风度的人”。泊松分布最初只是作为二项分布的近似来使用,后来逐渐成为一种重要的概率模型,被誉为随机现象的“基本粒子”。观察如下现象:-单位时间内走进候车室的人数-单位时间内打进的电话数-某段时间内机场降落的飞机数-单位时间内细胞分裂的个数-某段时间内发生车祸的次数-每个产品发现的疵瑕数,(x=0,1,2.,&0)数学期望和方差都是。,泊松

17、分布(Poisson),泊松分布(Poisson),泊松分布表:一般教科书都列出泊松分布的概率:当 n 很大时,二项分布的概率将很难计算。泊松定理:当 n 很大,p 很小时,二项分布可用泊松分布来近似,即 其中,例1:历史资料显示,某市每月有5人自杀。问下个月自杀 人数小于3人的概率?因均值=5P(小于3)=P(X=0)+P(X=1)+P(X=2)=,例2:某出租汽车公司共有出租车400辆,设每天每辆出租车出现故障的 概率为0.02,求:一天内没有出租车出现故障的概率.,解:将观察一辆车一天内是否出现故障看成一次试验E.因为每辆车是否出现故障与其它车无关,于是观察400辆出租车是否出现故障就是

18、做400次伯努利试验,设X表示一天内出现故障的出租车数,则:X B(400,0.02).令=np=4000.02=8 于是:P一天内没有出租车出现故障=PX=0=b(0;400,0.02)(80/0!)e-8=0.0003355,分布的近似,连续型随机变量,均匀分布(Uniform Distribution)正态分布(Normal Distribution)指数分布(Exponential Distribution),连续型随机变量:密度函数,均匀分布(Uniform Distribution),均匀分布的概率密度函数是,a,b,x,f(x),1/(b-a),0,0,,其他,例题:设电阻值R是

19、一个随机变量,均匀分布在900-1100欧姆之间。求R的概率密度及落在950-1050欧姆之间的概率。,正态分布(Normal Distribution),总体均值 总体方差如果=0,2=1,则称为标准正态分布,常记为 Z。设 X 服从参数为,2 的正态分布,则它可通过如下变换化为标准正态分布,概率密度,分布函数,数学期望,方差,正态的标准化,特性,(1)利用标准正态分布表求如下概率:(a)P(Z 1.25)=1-0.8944=0.1056(b)P(Z 1.25)或 P(Z 74),正态概率图(Normal Probability Plots),正态概率图可用于检验数据是否为正态分布 如果正态

20、概率图近似于一条直线,则可认为是正态分布。正态概率图可由 Minitab 容易地得到:打开数据文件 Distskew.mtw 选择:Graph Probability Plot(或)Stat Basic Stats Normality Test,随机服务系统的服务时间,消耗性产品(如电子元件)的寿命等,都通常假定为指数分布。假设产品的失效率为,则参数为的指数分布的密度函数为指数分布的均值为 1/,方差为1/2产品在 t 时间失效的分布函数为产品的可靠度为,指数分布(Exponential Distribution),当x0,=0,当x0,例,某元件的寿命服从指数分布,其平均寿命为1000小时。问3个这样的元件使用1000小时后都没有损坏的概率是多少?解:一个元件使用1000小时都不坏的概率 3个这样的元件使用1000小时后都没有损坏的概率是,常用分布的应用,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号