《应用统计学概率与概率分布ppt课件.ppt》由会员分享,可在线阅读,更多相关《应用统计学概率与概率分布ppt课件.ppt(100页珍藏版)》请在三一办公上搜索。
1、第五章 概率与概率分布,第五章 概率与概率分布,第一节 概率基础第二节 随机变量及其分布,学习目标,1.了解随机事件的概念、事件的关系和运算2.理解概率的定义,掌握概率的性质和运算法则理解随机变量及其分布,计算各种分布的概率用Excel计算分布的概率,第一节 概率基础,一. 随机事件及其概率二. 概率的性质与运算法则,随机事件的几个基本概念,试 验,在相同条件下,对事物或现象所进行的观察例如:掷一枚骰子,观察其出现的点数试验具有以下特点可以在相同的条件下重复进行每次试验的可能结果可能不止一个,但试验的所有可能结果在试验之前是确切知道的在试验结束之前,不能确定该次试验的确切结果,事件的概念,事件
2、:随机试验的每一个可能结果(任何样本点集合)例如:掷一枚骰子出现的点数为3随机事件:每次试验可能出现也可能不出现的事件例如:掷一枚骰子可能出现的点数必然事件:每次试验一定出现的事件,用表示例如:掷一枚骰子出现的点数小于7不可能事件:每次试验一定不出现的事件,用表示例如:掷一枚骰子出现的点数大于6,事件与样本空间,基本事件一个不可能再分的随机事件例如:掷一枚骰子出现的点数样本空间一个试验中所有基本事件的集合,用表示例如:在掷枚骰子的试验中,1,2,3,4,5,6在投掷硬币的试验中,正面,反面,事件的关系和运算(事件的包含), 若事件A发生必然导致事件B发生, 则称事件B包含事件A,或事件A包含于
3、事件B,记作或 A B或 B A,事件的关系和运算(事件的并或和), 事件A和事件B中至少有一个发生的事件称为事件A与事件B 的并。它是由属于事件A或事件B的所有的样本点组成的集合,记为AB或A+B,事件的关系和运算(事件的交或积), 事件A与事件B同时发生的事件称为事件A与事件B的交,它是由属于事件A也属于事件B的所有公共样本点所组成的集合,记为BA 或AB,事件的关系和运算(互斥事件), 事件A与事件B中,若有一个发生,另一个必定不发生, 则称事件A与事件B是互斥的,否则称两个事件是相容的。显然,事件A与事件B互斥的充分必要条件是事件A与事件B没有公共的样本点,事件的关系和运算(事件的逆)
4、, 一个事件B与事件A互斥,且它与事件A的并是整个样本空间,则称事件B是事件A的逆事件。它是由样本空间中所有不属于事件A的样本点所组成的集合,记为A,事件的关系和运算(事件的差), 事件A发生但事件B不发生的事件称为事件A与事件B的差,它是由属于事件A而不属于事件B的那些样本点构成的集合,记为A-B,事件的关系和运算(事件的性质), 设A、B、C为三个事件,则有交换律:AB=BA AB=BA结合律:A(BC)=(AB)C A(BC) =(AB) C分配律:A(BC)=(AB)(AC) A(BC)=(AB)(AC),事件的概率,事件的概率,事件A的概率是对事件A在试验中出现的可能性大小的一种度量
5、表示事件A出现可能性大小的数值事件A的概率表示为P(A)概率的定义有:古典定义、统计定义和主观概率定义,事件的概率,例如,投掷一枚硬币,出现正面和反面的频率,随着投掷次数 n 的增大,出现正面和反面的频率稳定在1/2左右,概率的古典定义, 如果某一随机试验的结果有限,而且各个结果在每次试验中出现的可能性相同,则事件A发生的概率为该事件所包含的基本事件个数 m 与样本空间中所包含的基本事件个数 n 的比值,记为,概率的古典定义(实例),【例】某钢铁公司所属三个工厂的职工人数如下表。从 该公司中随机抽取1人,问: (1)该职工为男性的概率 (2)该职工为炼钢厂职工的概率,概率的古典定义(计算结果)
6、,解:(1)用A 表示“抽中的职工为男性”这一事件;A为全公司男职工的集合;基本空间为全公司职工的集合。则,(2) 用B 表示“抽中的职工为炼钢厂职工”;B为炼钢厂 全体职工的集合;基本空间为全体职工的集合。则,概率的统计定义, 在相同条件下进行n次随机试验,事件A出现 m 次,则比值 m/n 称为事件A发生的频率。随着n的增大,该频率围绕某一常数P上下摆动,且波动的幅度逐渐减小,取向于稳定,这个频率的稳定值即为事件A的概率,记为,概率的统计定义 (实例),【例】:某工厂为节约用电,规定每天的用电量指标为1000度。按照上个月的用电记录,30天中有12天的用电量超过规定指标,若第二个月仍没有具
7、体的节电措施,试问该厂第一天用电量超过指标的概率。 解:上个月30天的记录可以看作是重复进行了30次试验,试验A表示用电超过指标出现了12次。根据概率的统计定义有,主观概率定义,对一些无法重复的试验,确定其结果的概率只能根据以往的经验人为确定概率是一个决策者对某事件是否发生,根据个人掌握的信息对该事件发生可能性的判断例如,我认为2001年的中国股市是一个盘整年,概率的性质与运算法则,概率的性质,非负性对任意事件A,有 0 P 1规范性必然事件的概率为1;不可能事件的概率为0。即P ( ) = 1; P ( ) = 0可加性若A与B互斥,则P ( AB ) = P ( A ) + P ( B )
8、推广到多个两两互斥事件A1,A2,An,有 P ( A1A2 An) = P ( A1 ) + P (A2 ) + + P (An ),概率的加法法则, 法则一两个互斥事件之和的概率,等于两个事件概率之和。设A和B为两个互斥事件,则 P ( AB ) = P ( A ) + P ( B )事件A1,A2,An两两互斥,则有 P ( A1A2 An) = P ( A1 ) + P (A2 ) + + P (An ),概率的加法法则(实例),【例】根据钢铁公司职工的例子,随机抽取一名职工,计算该职工为炼钢厂或轧钢厂职工的概率 解:用A表示“抽中的为炼钢厂职工”这一事件;B表示“抽中的为轧钢厂职工”
9、这一事件。随机抽取一人为炼钢厂或轧钢厂职工的事件为互斥事件A与B 的和,其发生的概率为,概率的加法法则, 法则二 对任意两个随机事件A和B,它们和的概率为两个事件分别概率的和减去两个事件交的概率,即 P ( AB ) = P ( A ) + P ( B ) - P ( AB ),概率的加法法则(实例),【例】设某地有甲、乙两种报纸,该地成年人中有20%读甲报纸,16%读乙报纸,8%两种报纸都读。问成年人中有百分之几至少读一种报纸。 解:设A读甲报纸,B读乙报纸,C至少读一种报纸。则 P ( C ) =P ( AB ) = P ( A ) + P ( B ) - P ( AB ) =0.2 +
10、0.16 - 0.08 = 0.28,条件概率与独立事件,条件概率, 在事件B已经发生的条件下,求事件A发生的概率,称这种概率为事件B发生条件下事件A发生的条件概率,记为,条件概率的图示,概率的乘法公式,用来计算两事件交的概率以条件概率的定义为基础设A、B为两个事件,若P(B)0,则P(AB)=P(B)P(A|B),或P(AB)=P(A)P(B|A),概率的乘法公式(实例),【例】设有1000中产品,其中850件是正品,150件是次品,从中依次抽取2件,两件都是次品的概率是多少? 解:设 Ai 表示“第 i 次抽到的是次品”(i=1,2),所求概率为P(A1A2),事件的独立性,一个事件的发生
11、与否并不影响另一个事件发生的概率,则称两个事件独立若事件A与B独立,则P(B|A)=P(B), P(A|B)=P(A) 此时概率的乘法公式可简化为 P(AB)=P(B)P(B)推广到n个独立事件,有 P(A1 A2 An)=P(A1)P(A2) P(An),事件的独立性(实例),【例】某工人同时看管三台机床,每单位时间(如30分钟)内机床不需要看管的概率:甲机床为0.9,乙机床为0.8,丙机床为0.85。若机床是自动且独立地工作,求 (1)在30分钟内三台机床都不需要看管的概率 (2)在30分钟内甲、乙机床不需要看管,且丙机床需要看管的概率 解:设 A1,A2,A3为甲、乙、丙三台机床不需要看
12、管的事件, A3 为丙机床需要看管的事件,依题意有 (1) P(A1A2A3)= P(A1) P(A2) P(A3)=0.90.80.85=0.612 (2) P(A1A2A3)= P(A1) P(A2) P(A3) = 0.90.8(1-0.85)=0.108,全概公式, 设事件A1,A2,An 两两互斥, A1+A2+ An=(满足这两个条件的事件组称为一个完备事件组),且P(Ai)0(i=1,2, ,n),则对任意事件B,有,我们把事件A1,A2,An 看作是引起事件B发生的所有可能原因,事件B 能且只能在原有A1,A2,An 之一发生的条件下发生,求事件B 的概率就是上面的全概公式,全
13、概公式(实例),【例】某车间用甲、乙、丙三台机床进行生产,各种机床的次品率分别为5%、4%、2%,它们各自的产品分别占总产量的25%、35%、40%,将它们的产品组合在一起,求任取一个是次品的概率。 解:设 A1表示“产品来自甲台机床”, A2表示“产品来自乙台机床”, A3表示“产品来自丙台机床”, B表示“取到次品”。根据全概公式有,贝叶斯公式(逆概公式),与全概公式解决的问题相反,贝叶斯公式是建立在条件概率的基础上寻找事件发生的原因设n个事件A1,A2,An 两两互斥, A1+A2+ An= (满足这两个条件的事件组称为一个完备事件组),且P(Ai)0(i=1,2, ,n),则,贝叶斯公
14、式(实例),【例】某车间用甲、乙、丙三台机床进行生产,各种机床的次品率分别为5%、4%、2%,它们各自的产品分别占总产量的25%、35%、40%,将它们的产品组合在一起,如果取到的一件产品是次品,分别求这一产品是甲、乙、丙生产的概率 解:设 A1表示“产品来自甲台机床”, A2表示“产品来自乙台机床”, A3表示“产品来自丙台机床”, B表示“取到次品”。根据贝叶斯公式有:,第二节 随机变量及其分布,一. 随机变量的概念离散型随机变量的概率分布连续型随机变量的概率分布,随机变量的概念,随机变量的概念,一次试验的结果的数值性描述一般用 X、Y、Z 来表示例如: 投掷两枚硬币出现正面的数量根据取值
15、情况的不同分为离散型随机变量和连续型随机变量,离散型随机变量,随机变量 X 取有限个值或所有取值都可以逐个列举出来 X1 , X2,以确定的概率取这些不同的值离散型随机变量的一些例子,连续型随机变量,随机变量 X 取无限个值所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点连续型随机变量的一些例子,离散型随机变量的概率分布,离散型随机变量的概率分布,列出离散型随机变量X的所有可能取值列出随机变量取这些值的概率通常用下面的表格来表示,P(X =xi)=pi称为离散型随机变量的概率函数pi00,离散型随机变量的概率分布(实例),【例】如规定打靶中域得3分,中域得2分,中域得1分,中域外
16、得0分。今某射手每100次射击,平均有30次中域,55次中域,10次中,5次中域外。则考察每次射击得分为0,1,2,3这一离散型随机变量,其概率分布为,离散型随机变量的概率分布(01分布),一个离散型随机变量X只取两个可能的值例如,男性用 1表示,女性用0表示;合格品用 1 表示,不合格品用0表示列出随机变量取这两个值的概率,离散型随机变量的概率分布(01分布实例),【例】已知一批产品的次品率为p0.05,合格率为q=1-p=1-0.5=0.95。并指定废品用1表示,合格品用0表示。则任取一件为废品或合格品这一离散型随机变量,其概率分布为,离散型随机变量的概率分布(均匀分布),一个离散型随机变
17、量取各个值的概率相同列出随机变量取值及其取值的概率例如,投掷一枚骰子,出现的点数及其出现各点的概率,离散型随机变量的概率分布(均匀分布实例),【例】投掷一枚骰子,出现的点数是个离散型随机变量,其概率分布为,离散型随机变量的数学期望和方差,离散型随机变量的数学期望,在离散型随机变量X的一切可能取值的完备组中,各可能取值xi与其取相对应的概率pi乘积之和描述离散型随机变量取值的集中程度计算公式为,离散型随机变量的方差,随机变量X的每一个取值与期望值的离差平方和的数学期望,记为D(X)描述离散型随机变量取值的分散程度计算公式为,离散型随机变量的方差(实例),【例】投掷一枚骰子,出现的点数是个离散型随
18、机变量,其概率分布为如下。计算数学期望和方差,解:数学期望为:,方差为:,几种常见的离散型概率分布,常见的离散型概率分布,二项试验(贝努里试验),二项分布与贝努里试验有关贝努里试验具有如下属性试验包含了n 个相同的试验每次试验只有两个可能的结果,即“成功”和“失败”出现“成功”的概率 p 对每次试验结果是相同的;“失败”的概率 q 也相同,且 p + q = 1试验是相互独立的试验“成功”或“失败”可以计数,二项分布,进行 n 次重复试验,出现“成功”的次数的概率分布称为二项分布设X为 n 次重复试验中事件A出现的次数,X 取 x 的概率为,二项分布,显然, 对于PX=x 0, x =1,2,
19、n,有同样有当 n = 1 时,二项分布化简为,二项分布的数学期望和方差,二项分布的数学期望为 E ( X ) np方差为 D ( X ) npq,二项分布(实例),【例】已知100件产品中有5件次品,现从中任取一件,有放回地抽取3次。求在所抽取的3件产品中恰好有2件次品的概率 解:设 X 为所抽取的3件产品中的次品数,则XB ( 3 , 0.05),根据二项分布公式有,泊松分布,用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布泊松分布的例子一个城市在一个月内发生的交通事故次数消费者协会一个星期内收到的消费者投诉次数人寿保险公司每天收到的死亡声明的人数,泊松概率分
20、布函数, 给定的时间间隔、长度、面积、体积内“成功”的平均数e = 2.71828 x 给定的时间间隔、长度、面积、体积内“成功”的次数,泊松概率分布的期望和方差,泊松分布的数学期望为 E ( X ) = 方差为 D ( X ) = ,泊松分布(实例),【例】假定某企业的职工中在周一请假的人数X服从泊松分布,且设周一请事假的平均人数为2.5人。求 (1)X 的均值及标准差 (2)在给定的某周一正好请事假是5人的概率 解:(1) E(X)=2.5;D(X) = 2.5=1.581 (2),泊松分布(作为二项分布的近似),当试验的次数 n 很大,成功的概率 p 很小时,可用泊松分布来近似地计算二项
21、分布的概率,即,实际应用中,当 P0.25,n20,np5时,近似效果良好,连续型随机变量的概率分布,连续型随机变量的概率分布,连续型随机变量的概率分布,连续型随机变量可以取某一区间或整个实数轴上的任意一个值它取任何一个特定的值的概率都等于0不能列出每一个值及其相应的概率通常研究它取某一区间值的概率用数学函数的形式和分布函数的形式来描述,概率密度函数,设X为一连续型随机变量,x 为任意实数,X的概率密度函数记为f(x),它满足条件,f(x)不是概率,概率密度函数, 密度函数 f(x)表示X 的所有取值 x 及其频数f(x),概率密度函数, 在平面直角坐标系中画出f(x)的图形,则对于任何实数
22、x1 x2,P(x1 X x2)是该曲线下从x1 到 x2的面积,概率是曲线下的面积,分布函数,连续型随机变量的概率也可以用分布函数F(x)来表示分布函数定义为,根据分布函数,P(aXb)可以写为,分布函数与密度函数的图示,密度函数曲线下的面积等于1分布函数是曲线下小于 x0 的面积,连续型随机变量的期望和方差,连续型随机变量的数学期望为方差为,均匀分布,均匀分布,若随机变量X的概率密度函数为 称X在区间a ,b上均匀分布数学期望和方差分别为,正态分布,正态分布的重要性,1.描述连续型随机变量的最重要的分布2.可用于近似离散型随机变量的分布例如: 二项分布3.经典统计推断的基础,概率密度函数,
23、f(x) = 随机变量 X 的频数 = 总体方差 =3.14159; e = 2.71828x = 随机变量的取值 (- x ) = 总体均值,正态分布函数的性质,概率密度函数在x 的上方,即f (x)0正态曲线的最高点在均值,它也是分布的中位数和众数正态分布是一个分布族,每一特定正态分布通过均值的标准差来区分。 决定曲线的高度,决定曲线的平缓程度,即宽度曲线f(x)相对于均值对称,尾端向两个方向无限延伸,且理论上永远不会与横轴相交正态曲线下的总面积等于1随机变量的概率由曲线下的面积给出, 和 对正态曲线的影响,正态分布的概率,概率是曲线下的面积!,标准正态分布的重要性,一般的正态分布取决于均
24、值和标准差 计算概率时 ,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表,标准正态分布函数,标准正态分布的概率密度函数,任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布,标准正态分布的分布函数,标准正态分布,标准正态分布表的使用,将一个一般的转换为标准正态分布计算概率时 ,查标准正态概率分布表对于负的 x ,可由 (-x) x得到对于标准正态分布,即XN(0,1),有P (a X b) b aP (|X| a) 2 a 1对于一般正态分布,即XN( , ),有,标准化的例子 P(5 X 6.2),标准
25、化的例子P(2.9 X 7.1),一般正态分布,正态分布(实例),【例】设XN(0,1),求以下概率: (1) P(X 2); (3) P(-12)=1- P(2 X)=1-0.9973=0.0227 (3) P(-1X 3)= P(X 3)- P(X -1) = (3)- (-1)= (3) 1-(1) = 0.9987-(1-0.8413)=0.8354 (4) P(| X | 2) = P(-2 X | 2)= (2)- (-2) = (2)- 1-(2)=2 (2)- 1=0.9545,正态分布(实例),【例】设XN(5,32),求以下概率 (1) P(X 10) ; (2) P(2X
26、 10) 解: (1),(2),二项分布的正态近似,二项分布的正态近似,当n 很大时,二项随机变量X近似服从正态分布Nnp , np(1-p)对于一个二项随机变量X,当n很大时,求 P(x1Xx2)时可用正态分布近似为,为什么概率是近似的,增加的部分与减少的部分不一定相等,二项分布的正态近似(实例),【例】100台机床彼此独立地工作,每台机床的实际工作时间占全部工作时间的80%。求 (1)任一时刻有7080台机床在工作的概率 (2)任一时刻有80台以上机床在工作的概率 解:设X表示100机床中工作着的机床数,则XB(100,0.8)。现用正态分布近似计算,np=80,npq=16 (1),(2),本章小结,定义试验、结果、事件、样本空间、概率描述和使用概率的运算法则定义和解释随机变量及其分布计算随机变量的数学期望和方差计算离散型随机变量的概率和概率分布计算连续型随机变量的概率用正态分布近似二项分布用Excel计算分布的概率,结 束,