统计学6两种常用的概率分布.ppt

上传人:sccc 文档编号:5382945 上传时间:2023-07-01 格式:PPT 页数:49 大小:333.51KB
返回 下载 相关 举报
统计学6两种常用的概率分布.ppt_第1页
第1页 / 共49页
统计学6两种常用的概率分布.ppt_第2页
第2页 / 共49页
统计学6两种常用的概率分布.ppt_第3页
第3页 / 共49页
统计学6两种常用的概率分布.ppt_第4页
第4页 / 共49页
统计学6两种常用的概率分布.ppt_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《统计学6两种常用的概率分布.ppt》由会员分享,可在线阅读,更多相关《统计学6两种常用的概率分布.ppt(49页珍藏版)》请在三一办公上搜索。

1、第六章 两种常用的概率分布,第一节 概率第二节 二项分布第三节 正态分布,第一节 概率,一、事件及其概率(一)随机事件 概率论:是从量的方面研究随机现象的统计规律的科学。随机现象:是指在相同条件下反复进行观察或实验,其结果无法事先预定的现象。如:掷硬币,其结果有两个,正面或反面。在随机现象中出现的各种可能结果,称为随机事件,简称事件。,在每次试验中一定发生的事件,称为必然事件;而一定不会发生的事件,称为不可能事件。如纯水在标准大气压下零度结冰等。(二)事件的概率 1、频率:对于随机事件A,如果在N次试验中出现a次,则A发生的频率记作,(6.1),频率满足不等式0F(A)1。若A是必然事件,则F

2、(A)=1,若A是不可能事件,则F(A)=0。2、经验概率 计数某事件在一系列试验中发生的次数,然后计算发生次数与试验总次数的比值得到频率。试验次数越多,某事件发生的频率会在某个常数上下波动。当试验次数无穷时该事件发生的频率会与一常数相等,把这一常数称为某事件的概率。(统计定义),3、先验概率 试验满足:试验中各种可能结果(基本事件)是有限的,并且每种结果发生的可能性是不变时,则某事件发生的概率等于该事件包含的基本事件数(K)除以试验中可能发生的基本事件总件数(N)之商。,6.2,经验概率是由计算事件发生的频率而得,先验概率是在实践之前利用有关事实确定的。前者给出了概率的操作性定义,后者提供了

3、概率的理论上的基本定义。4、概率的性质(1)对任一事件A,有0P(A)1。(2)不可能事件的概率等于零。(3)必然事件的概率等于1。5、小概率事件 在统计推断中,将一次试验中发生的概率小于0.05的事件,称为小概率事件。认为它是一次试验中几乎不可能发生的事件。,二、概率的两个基本法则,(一)概率的加法法则两个互不相容(或互斥)事件A、B之和的概率等于两个事件分别发生的概率,即P(A+B)=P(A)+P(B)在一次试验中不可能同时出现的事件称为互不相容事件。例1 在9道题中,有6道选择题,2道是非题,1道填空题,随机抽出一题,求抽出的为是非或选择题的概率是多少?,解:高抽出是非题为事件A,抽出选

4、择题为事件B,随机抽一题,只能是抽取三类题中的一题,所以A,B为互不相容事件。“抽出的为是非或选择题”意思是无论抽得两种题中的哪一种都表示该事件发生了,因此是求两个事件之和的概率P(A+B)。P(A)=2/9,P(B)=6/9所以P(A+B)=P(A)+P(B)=8/9,(二)概率的乘法法则,两个相互独立事件A、B之积的概率等于两个事件分别发生的概率的积,即P(AB)=P(A)P(B)两个相互独立事件就是指一个事件发生的概率与另一个事件的发生无关,两个事件的积就是指两个事件同时发生的事件。例2 两道四选一题,凭猜测做对一题的概率是多少?,解:设第一题做对为事件A,做错为事件,第二题做对为事件B

5、,做错为事件,做对第一题的概率为P(A),做对第二题的概率为P(B),所以做对任意一题的概率为,P(A)+,P(B)=P(A)P()+,P()P(B),=1/4*3/4+3/4*1/4=3/8,第二节 二项分布,(一)二项分布的概念 所谓分布的指随机变量的概率分布。如果一次试验中只会发生两种结果,非A即B,A和B就是对立事件。发生A和B的概率分别为p和q,显然P(A)+P(B)=p+q=1。而且 重复多次试验时,各次试验结果之间互不影响,各次试验,结果之间是相互独立事件,则在n次试验中,A事件可能出现的次数k(k=0,1,n)是随机的,也就是有n+1个概率值。A事件出现各种可能结果这一随机变量

6、的概率分布就叫二项分布。二项分布中A事件出现的k次的概率与二项展开式的各项相对应。,二项式定理:,二项分布中A事件出现k次的概率与上式中各项对应,通式为,(6.5),(6.6),例3 凭猜测做五道是非题,答对的概率p=1/2,答错的概率q=1/2,问五题中答对k(k=0,1,2,3,4,5)题的概率各是多少?,解:根据二项式定理,答对5题的概率1/32,答对4题的概率5/32,答对3题的概率10/32,答对0题的概率1/32,5题中答对各种可能结果的概率之和为1。所以在二项分布中,n+1项的概率之和为1。若p=q,则概率分布呈对称性,与两端等距的项的概率相等。若pq,n较小时,概率分布不对称,

7、当n较大时(大于等于30或50),概率分布逐步对称。,(二)二项分布的平均数与标准差(对随机变量k进行计算)平均数:=np标准差:=,二、二项分布的应用,例4 某个学生一次测验回答20道是非题,每题1分,他得了18分,问(1)凭猜测得18分的概率是多少?(2)他的成绩若在18分以上,是否是凭猜测得到的?解:(1)p=0.5,q=0.5,n=20,k=18,代入公式(6.6)得,即凭猜测得18分的可能性只有十万分之十八。,(2)依题意应首先求该学生得18分,19分、20分三种分数的概率之和是多少,然后从这个概率的大小判断他是否是凭猜测得到这个分数。,同样P(19)=0.000019 P(20)=

8、0.000000095 三者之和为0.000201,即凭猜测得18分以上的概率只有万分之二,可以断定,他得18分以上不是凭猜测得到的。,第三节 正态分布,一、正态分布的概念 正态分布是指在一个概率分布中,中间频数多,两端频数相对称地减少,形成一种“钟”形对称的理论概率分布。,图6-1 正态分布,在二项分布中,当p=q,当均数np=5,n=10时,二项分布可看作正态分布的近似形。,图6-2 平均数、标准差相同的二项分布直条图和正态分布图,(二)正态分布曲线,图6-1为正态分布曲线,其方程为,其中,Y为正态分布曲线的高度,表示随机变量的概率的大小或观测值出现的相对次数,X为观测值,即随机变量的可能

9、取值;、分别为X的平均数和标准差,e=2.71828,=3.1416。,(6.9),从式6.9可看出,Y的值与离差|X-|的绝对值有关,它是以X=这一点的纵线为对称轴的轴对称图形。它的位置和形状由平均数和标准差决定。在同一直角坐标系中,平均数的大小决定图形的位置左移或右移,当较小时,图形向左移;当较大时,图形向右移。见图6-3(a),=0=1,=5=1,图6-3(a),标准差的大小决定图形的陡峭平缓程度,即决定纵线高度的最大值。当标准差较大时,概率分布的离中趋势较大,观测值分散在较大范围内,纵线高度的最大值较小,正态分布曲线形状较平缓;当标准差较小时,概率分布的离中趋势较小,观测值分散在较小范

10、围内,纵线高度的最大值较大,正态分布曲线形状较陡峭。如图6-3(b),图6-3(b),=0.5,=1,=1.6,在无数条正态分布曲线中有一条曲线=0,=1,这条曲线称为标准正态曲线,见图6-3(a)中左侧的一条曲线。其方程简化为,二、标准正态分布曲线的特点,1、曲线最高点为Z=0,Y=0.3989,曲线下的总面积即概率总和为1,对称轴左右各0.5。2、曲线是以过Z=0的纵线为对称轴呈钟形的轴对称图形。3、标准正态分布的平均数、中位数、众数三点重合在Z=0这一点上。,4、曲线与对称轴交点处Y值最大,即此处观测值的相对次数最大,概率最大;曲线向两侧先快后慢地下降,在Z=1处有两个拐点;横轴是标准正

11、态曲线的水平渐近线,曲线向两侧逐渐接近横轴,但永不相交。,三、正态分布表,(一)正态分布表的结构(P240)它是通过公式(6.10)计算得到的。表中第一列给出了从0到3.99的Z值,第二列给出了与Z对应的过点Z的纵线的高度Y值,第三列给出了曲线下面积P值是过Z=0人纵线与过表中某Z点人纵线所夹图形的面积比率,即相应区间的随机变量的概率。,(二)正态分布表的使用,已知Z值查出对应的P值和Y值;已知P值查出对应的Z值和Y值。1、已知Z值,求P值。例5 在正态分布表中:(1)求Z=-1与Z=1之间的面积比率。解:查表,当Z=1时,P1=0.34134,由它的对称性,当Z=-1时,P2=0.34134

12、,所以所求的面积比率为:P1+P2=0.68268。,(2)求 Z=-2.58与Z=2.58之间的面积比率.解:查表,当Z=2.58时,P1=0.49506,由它的对称性,当Z=-2.58时,P2=0.49506,所以所求的面积比率为:P1+P2=0.99012。,例6 利用正态分布表求:(1)正态曲线下Z=1.34处左侧的面积。(2)正态曲线下Z=2.16处右侧的面积。(3)正态曲线下Z=-1.64处左侧的面积。(4)正态曲线下Z=-1.5处右侧的面积。,解:(1)查表得,Z=1.34,P=0.40988,由于正态曲线对称轴左侧的面积为0.5,所以所求面积为:0.5+0.40988=0.90

13、988.(2)z=2.16,p=0.48461,由于对称轴右侧的面积为0.5,故所求面积为:0.5-0.48461=0.01539.,(3)查表得,Z=1.64时,P=0.44950,所以Z=-1.64时,P=0.44950,即它与Z=0所夹面积为P=0.44950,故所求面积为:0.5-P=0.0505.(4)当Z=1.5时,P=0.43319,所以当Z=-1.5时,P=0.43319,故所求面积为:0.5+P=0.93319.,2、已知P值,求Z值。,例7 利用正态分布表,求:(1)求中央50%的面积操作的下限Z值和上限Z值。(2)求正态曲线下右尾20%的面积的下限Z值。(3)求正态曲线下

14、左侧30%的面积的上限Z值。,解:(1)由于正态曲线的对称性,中央50%的面积为对称轴左右两侧各25%的面积的和。所以P=0.25,查附表,表中没有恰等于0.25的P值,可以用误差最小的近似值0.24857作为P的近似值,对应的Z=0.67,故Z的下限为-0.67,Z的上限为0.67。(2)所要求的Z值是表中P=0.5-0.2=0.3,处对应的Z值,取最近似的值P=0.29955,其对应的Z值为0.84,故所求的下限Z值为0.84。(3)对称轴与过Z值点纵线所夹面积为P=0.5-0.3=0.2,表中最近的P值为0.19847,其对应的Z=0.52,它的对称点为Z=-0.52,为所求。,四、正态

15、曲线下面积的应用,(一)推求考试成绩中特定区间的人数例8 已知某年级200名学生考试成绩呈正态分布,平均分为85分,标准差为10分,学生甲的成绩为70分,问全年级成绩比学生甲低的学生人数是多少?解:属于已知Z值求P值问题。,一般分3步完成:a)计算甲生成绩的标准分数;b)根据Z值查表求得对称轴与过Z值纵线所夹的面积;再计算出Z值左侧的曲线面积;c)将面积比率乘以总人数,即可得比甲生分数低的学生的实际人数。甲的标准分数:=(70-85)/10=-1.5 查表,Z=1.5时,P=0.43319,故Z=-1.5左侧的面积为:0.5-0.43319=0.06681。200*0.06681=13(人),

16、所以全年级成绩比学生甲低的学生人数是13人。,例9 某次升学考试,学生成绩符合正态分布,1000名考生英语平均60分,标准差15分,试求:(1)70-80分之间有多少人?(2)90分以上有多少人?,解:已知学生的分数,求某分数区间的实际人数。属于Z-P问题。(1)Z1=(70-60)/15=0.67 Z2=(80-60)/15=1.33,根据Z1,Z2查表,得P1=0.24857,P2=0.40824,P=p2-P1=0.15967,即分数在70-80之间的人数占总人数的15.967%,即1000*0.15967=160人。,(2)Z3=(90-60)/15=2 查表得P=0.47725,90

17、分以上人数比率为:0.5-0.47725=0.02275。即1000*0.02275=23(人)。,(二)推求考试成绩中某一特定人数比率的分数界限,例10 某次招生考试,学生成绩符号正态分布,学生成绩的平均分为80分,标准差为10分,要择优录取25%学生进入高一级学校学习,问最低分数线是多少分?,解:它属于P-Z问题。根据录取率可算出曲线下对应的面积,查正态分布表,可得录取分数线对应的Z值,再根据平均分,标准差,算出录取分数线,的原始分数X值。由于录取率为25%,则正态曲线下对称轴与过最低录取线分数的纵线所夹面积为0.5-0.25=0.25,查表,最近的P=0.24857,对应的Z=0.67。

18、因为,得X=80+0.67*10=86.7,因此这次考试的最低录取分数线为86.7分。,例11 某次数学竞赛,学生成绩呈正态分布,参赛学生200人,平均分66.78分,标准差为9.19分,(1)若表扬前20名竞赛优胜者,其最低分应是多少?(2)某生得80分,他在参赛中排第几名?,解:(1)已知优胜者人数为20人,总人数为200人,可求出优胜者人数比率:20/200=0.1,下面属于P-Z问题。正态曲线下右侧面积比率为0.10,表中P值应为0.5-0.1=0.4,查表,最近的P值为P=0.39973,对应的Z值为1.28,所以=78.54,所以优胜者最低分数应是78.54 分。,(2)求某生在参

19、赛中排列的名次,就是求成绩等于和高于他的人数占总人数的比率,进而求实际人数。属于Z-P问题。,先求该生成绩的标准分数,查正态分布表得,P1=0.42507,成绩等于和高于该生的人数比率即曲线下右侧面积,P2=0.5-P1=0.07493。即 200*0.07493=15(人)所以该生在参赛者中应排在第15名。,(三)确定按能力或成绩等级分组的各组人数,假设学生成绩呈正态分布,学生能力也呈正态分布,按成绩等级或能力进行分组,各组的人数不应是均等的,而应是中等能力、中等等级的人数多高能力与低能力组,高成绩与低成绩等级组的人数少。可以利用正态分布理论解决此类问题。,例12 某年级进行数学能力测验后,

20、拟按数学能力将学生分成五个组。该次测验参加人数为300人,平均分为60分,标准差为13.2分,问各组人数及原始分数区间都是怎样的?,解:在正态分布下,99.73%的数据在3之间,全距为6。若分成五个等级组,按各组距相等,应为6/5=1.2,两端组可延至正负无穷,因此各组测验成绩的标准分数区间界限依次为:-1.8以下(第一组),-1.80.6(第二组),-0.6-0.6(第三组),0.6-1.8(第四组),1.8以上(第五组)。,由标准分数查表得各等级对应的正态曲线下面积比率分别为:0.03593,0.23832,0.4515,0.23832,0.03593。,根据正态分布的轴对称性,第一组与第

21、五组人数相等,应为:300*0.03593=11(人)。第二组与第四组人数相等:应为:300*0,23832=71(人)。第三组人数为:300*0.4515=136(人)。,由标准分数计算原始分数界限,得 X1=60+13.2*(-1.8)=36.24 X2=60+13.2*(-0.6)=52.08,X3=60+13.2*0.6=67.92 X4=60+13.2*1.8=83.76 第一组至第五组原始分数区间依次是:36.24以下,36.24-52.08,52.08-67.92,67.92-83.76,83.76以上。,(四)将等级评定结果转化为连续变量型分数 由于学生学习成绩或能力是服从正态

22、分布的,如果要将等级评定结果转化为连续变量型分数,可以利用正态分布模型将等级成绩转换为标准分数,再进行线性转换,转换为类似于百分制评分中的连续变量型分数。,例13 某教师评全班50人的作文,有8人被评为优秀,17人评为良,20人评为中,5人被评为及格。求各等级作文的标准分数和线性转换后的连续变量型分数。,解:先求出老师评定的各等级人数比率,再求出各等级比率的中点值,计算出正态分布表中相应的面积比率,通过查表得出标准分数,再转换为连续型分数。教师评定的各等级人数比率为优 8/50=0.16良 17/50=0.34,中 20/50=0.40及格 5/50=0.10 各等级人数比率的中点值为:优0.

23、08,良0.17,中0,20,及格0.05。,四个等级人数比率中点值对应的正态分布表中的P值(即Z=0到各等级标准分数之间的面积比率)为 优 P1=0.5-0.08=0.42 良 P2=0.5-(0.16+0.17)=0.17 中 P3=0.5-(1-0.16-0.34-0.20)=0.5-0.3=0.2 及格 P4=0.5-0.05=0.45,查正态分布表得各级的标准分数为 Z1=1.41,Z2=0.44,Z3=-0.52,Z4=-1.64 如果把标准分数按照平均数为80,标准差为10进行线性转换,则四个等级的标准分数分别可转换为连续型分数。优=80+10*1.41=94.1 良 X2=80+10*0,44=84.4 中 X3=80+10*(-0.52)=74.8 及格 X4=80+10*(-1.64)=63.6,作业,1、某次招聘考试,856人应聘,考试成绩呈正态分布,平均92分,标准差22分,准备录用100人,最低录取线应是多少分?2、已知某化学竞赛成绩呈近似正态分布,参赛300人,平均分65分,标准差19分,问60分以下,80分以上各是多少人?,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号