《概率论与数理统计第五章.ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计第五章.ppt(43页珍藏版)》请在三一办公上搜索。
1、第五章 大数定律和 中心极限定理,湖南商学院信息系 数学教研室,第五章 大数定律和中心极限定理,第一节 大 数 定 律第二节 中心极限定理,概率论与数理统计是研究随机现象统计规律性的学科.随机现象的规律性只有在相同的条件下进行大量重复试验时才会呈现出来.也就是说,要从随机现象中去寻求必然的法则,应该研究大量随机现象.,研究大量的随机现象,常常采用极限形式,由此导致对极限定理进行研究.极限定理的内容很广泛,其中最重要的有两种:,下面我们先介绍大数定律,大量的随机现象中平均结果的稳定性,大数定律的客观背景,大量抛掷硬币正面出现频率,字母使用频率,生产过程中的废品率,几个常见的大数定律,定理1(切比
2、雪夫大数定律),设 X1,X2,是相互独立的随机变量序列,它们都有有限的方差,并且方差有共同的上界,即 Var(Xi)K,i=1,2,,,切比雪夫,则对任意的0,,切比雪夫大数定律给出了平均值稳定性的科学描述,证明切比雪夫大数定律主要的数学工具是切比雪夫不等式.,作为切比雪夫大数定律的特殊情况,有下面的定理.,定理2(独立同分布下的大数定律),设X1,X2,是独立同分布的随机变量序列,且E(Xi)=,Var(Xi)=,i=1,2,则对任给 0,下面给出的贝努里大数定律,是定理2的一种特例.,贝努里,设Sn是n重贝努里试验中事件A发生的次数,p是事件A发生的概率,,引入,i=1,2,n,则,是事
3、件A发生的频率,于是有下面的定理:,设Sn是n重贝努里试验中事件A发生的 次数,p是事件A发生的概率,则对任给的 0,,定理3(贝努里大数定律),或,贝努里,贝努里大数定律表明,当重复试验次数n充分大时,事件A发生的频率Sn/n与事件A的概率p有较大偏差的概率很小.,贝努里大数定律提供了通过试验来确定事件概率的方法.,任给0,,贝努里大数定律,请看演示,下面给出的独立同分布下的大数定律,不要求随机变量的方差存在.,设随机变量序列X1,X2,独立同分布,具有有限的数学期E(Xi)=,i=1,2,,则对任给 0,,定理3(辛钦大数定律),辛钦大数定律,辛钦,请看演示,例如要估计某地区的平均亩产量,
4、要收割某些有代表性的地块,例如n 块.计算其平均亩产量,则当n 较大时,可用它作为整个地区平均亩产量的一个估计.,这一讲我们介绍了大数定律,大数定律以严格的数学形式表达了随机现象最根本的性质之一:,它是随机现象统计规律的具体表现.,大数定律在理论和实际中都有广泛的应用.,平均结果的稳定性,休息片刻继续下一讲,第五章第二节 中心极限定理,中心极限定理的客观背景,在实际问题中,常常需要考虑许多随机因素所产生总影响.,例如:炮弹射击的落点与目标的偏差,就受着许多随机因素的影响.,空气阻力所产生的误差,,对我们来说重要的是这些随机因素的总影响.,如瞄准时的误差,,炮弹或炮身结构所引起的误差等等.,观察
5、表明,如果一个量是由大量相互独立的随机因素的影响所造成,而每一个别因素在总影响中所起的作用不大.则这种量一般都服从或近似服从正态分布.,自从高斯指出测量误差服从正态分布之后,人们发现,正态分布在自然界中极为常见.,现在我们就来研究独立随机变量之和所特有的规律性问题.,当n无限增大时,这个和的极限分布是什么呢?,在什么条件下极限分布会是正态的呢?,由于无穷个随机变量之和可能趋于,故我们不研究n个随机变量之和本身而考虑它的标准化的随机变量,的分布函数的极限.,的分布函数的极限.,可以证明,满足一定的条件,上述极限分布是标准正态分布.,考虑,中心极限定理,在概率论中,习惯于把和的分布收敛于正态分布这
6、一类定理都叫做中心极限定理.,我们只讨论几种简单情形.,下面给出的独立同分布随机变量序列的中心极限定理,也称列维一林德伯格(LevyLindberg)定理.,定理1(独立同分布下的中心极限定理),它表明,当n充分大时,n个具有期望和方差的独立同分布的r.v之和近似服从正态分布.,设X1,X2,是独立同分布的随机变量序列,且E(Xi)=Var(Xi)=,i=1,2,,则,定理(棣莫佛拉普拉斯定理),设随机变量 服从参数n,p(0p1)的二项分布,则对任意x,有,定理表明,当n很大,0p1是一个定值时(或者说,np(1-p)也不太小时),二项变量 的分布近似正态分布 N(np,np(1-p).,请
7、看演示,中心极限定理的直观演示,下面我们举例说明中心极限定理的应用,从演示不难看到中心极限定理的客观背景,设一批产品的强度服从期望为14,方差为4的分布.每箱中装有这种产品100件.求:(1).每箱产品的平均强度超过14.5的概率是多少.(2).每箱产品的平均强度超过期望14的概率是多少.,n=100,设Xi是第i件产品的强度.E(Xi)=14,Var(Xi)=4 i=1,2,100.每箱产品的平均强度为,解:,例1,根据定理5.2.1,近似N(0,1)于是,计算机在进行数字计算时遵从四舍五入原则.为使我们此题简单考虑,我们假定对小数点后面的第一位进行四舍五入运算.则误差X这个随机变量可以认为
8、服从-0.5,0.5上的均匀分布.现若在一项计算中一共进行了100次数字计算.,例2,解:,n=100,设Xi是第i次运算的误差.误差服从-0.5,0.5上的均匀分布 E(Xi)=(-0.5+0.5)/2=0 Var(Xi)=0.5-(-0.5)2/12=1/12 i=1,2,100.平均误差为,根据中心极限定理,近似N(0,1)于是,某单位有200部电话分机,每部电话约有5%的时间要使用外线通话.设每部电话是否使用外线通话是相互独立的.求:该单位总机至少需要安装多少条外线才能以90%以上的概率保证每部电话需要使用外线时可以打通?,解:,例3,Xi b(1,p).X1,X2,X200相互独立.
9、设该单位总机安装k条外线,则:,P每部电话需要使用外线时可以打通=P使用外线的电话数目k=PX1+X2+X200 k,求最小的k,使P每部电话需要使用外线时可以打通90%求最小的k,使PX1+X2+X200 k90%求最小的k,使,该单位总机至少需要安装14条外线.,某市保险公司开办一年人身保险业务.被保险人每年需交付保险费160元.若一年内发生重大人身事故,其本人或家属可获2万元赔金.己知该市人员一年内发生重大人身事故的概率为0.005.现有5000人参加此项保险.求:保险公司一年内从此项业务所得到的总收益在20万元到40万元之间的概率.,解:,例4,Xi b(1,p).P=0.005 X1
10、,X2,X200相互独立.则:,P20万元总收益 40万元=P20万元0.016万元保险费参保人数-2万 元赔金一年内发生重大人身事故的人数40万元=P200.0165000-2(X1+X2+X5000)40,np=25 np(1-p)=250.995,总收益在20万元到40万元之间的概率为 0.6826.,不知大家是否还记得街头赌博的演示?,现在我们用中心极限定理来揭穿这个赌博中的奥秘.,请看演示:,高尔顿钉板试验的理论解释,街头赌博,再看演示请点击,如图,钉板有n=16层,可以求出标准差,n次碰钉后小球的位置Yn近似服从正态分布N(0,n).E(Yn)=0,Var(Yn)=n.,如图钉板有n=16层,可以求出标准差,根据正态分布的查表计算知道,落在2 以内即中线左右8颗钉子以内的概率近似为95.6%,即是说,落在这以外的概率只有4%左右.,现在你知道为什么摆摊的人敢于在上面放那么值钱的东西了吧!,这一讲我们介绍了中心极限定理,在后面的课程中,我们还将经常用到中心极限定理.,中心极限定理是概率论中最著名的结果之一,它不仅提供了计算独立随机变量之和的近似概率的简单方法,而且有助于解释为什么很多自然群体的经验频率呈现出钟形曲线这一值得注意的事实.,