《正态分布的若干理论及其应用本科毕业论文.doc》由会员分享,可在线阅读,更多相关《正态分布的若干理论及其应用本科毕业论文.doc(38页珍藏版)》请在三一办公上搜索。
1、 摘 要大量的实践经验和理论分析表明,自然界与工程技术中服从正态分布的随机变量是最常见的.诸如机械加工中零件的几何尺寸(直径、长度、宽度、高度)、强度、重量、使用寿命;随机测量误差;人的身高、体重;农作物的收获量;健康人的红血球数目;纤维的强力;炼铁厂每炉铁水的含碳量;学生考试分数;机床维修保养时间;某地区酌年降雨量;炮弹弹落点的分布等等,都可以看作是服从或近似服从的正态分布.数学和经验都证明:受大量、独立、均匀小效应影响的随机变量服从正态分布.在数理统计中用于统计推断的许多统计量,不管资料的原分布是什么,只要样本容量充分地大,它都近似于正态分布某些统计量即使偏离了正态分布,只要偏离量不大,也
2、可以按正态分布处理.因此,正态分布的应用是十分广阔的.关 键 字 正态分布;概率密度函数;标准差;误差目 录引言:11正态分布概念12.正态曲线的特性23.参数 m 和 s 的意义34.标准正态分布及正态分布表44.1.标准正态分布44.2.标准正态分布的分布函数和正态分布表44.3.正态分布表的几种形式55.正态随机变量落在区间(x1,x2)内的概率计算75.1.当值机变量N(0,1)时的概率计算85.2.当随机变量 N(m,s) 时的概率计算95.2.1.服从一般正态分布的随机变量N(m,s )的分布函数95.2.2.概率计算106正态分布在几个领域内的应用实例126.1已知m, s求某条
3、件下的概率8126.2已知某条件下的概率,求参数和 s ?146.3已知 m,s 和区问(a,b)内的变量数,求总变量数156.4已知m,s及各范围内的概率,求某范围的上、下限166.5. 用标堆差确定所需测量次教17参考文献19致谢20正态分布的若干理论及其应用数学系2004级1班 王文瑞 数学与应用数学 04104141指导老师 李海增引言:正态分布是一种最常见的连续型随机变量的分布,它在概率论和数理统计中无论在理论研究还是实际应用上都占有头等重要的地位,这是因为它在误差理论、无线电噪声理论、自动控制、产品检验、质量控制、质量管理等领域都有广泛应用,数理统计中许多重要问题的解决都是以正态分
4、布为基础的.正态分布也具有许多良好的性质,因此在理论研究中正态分布十分重要.1正态分布概念设连续型随机变量的密度函数(也叫分布密度,概率密度,概率密度函数)为: (1.1) (其中是常数,且 ,为正态总体的平均值,为正态总体的标准差,为正态总体中随机抽取得的样本值).则称随机变量服从参数为的正态分布,记作,式(1.1)是德国著名数学家高斯在找误差分布时于1795年推导发现的,因此正态分布又称高斯分布、误差分布或常态分布.正态分布密度函数的图形如图1所示,这条曲线称“正态分布密度函数曲线”或“正态分布曲线”,简称“正态曲线”,由于它的形状象只钟,又称“钟形曲线”,为纪念高斯又称“高斯曲线”1.2
5、.正态曲线的特性对式(1.1)进行数学处理,可得正态曲线特性.对式(1.1)求导,有 (2.1)令,则有,即当时, 有极大值对式(2.1)求导有: (2.2)令,则有 ,即曲线在:处有两个拐点.将正态曲线的特性列入表1.表1 正态曲线特性0-0-0 曲线凹拐点凸极大值凸拐点凹由表1和图1可知正态曲线有以下特性:1) 曲线以为对称轴,且在时取得极大值,曲线由起向左右延伸时,不断降低,呈现中间高,两头低的钟的形状.2) 曲线在对称轴两侧 处有两个拐点.3) 的取值范围为整个轴,离越远, 越小,当时,曲线以轴为渐进线.4) 曲线总在轴上方,它于轴所围面积等于l,对称轴两边曲线下的面积相等各为0.5.
6、机械加工得到的尺寸是服从正态分布的,如在机床上加工100件中的轴,则这100件轴的尺寸有以下统计规律.1) 100个尺寸中,在10附近的占的数量最多、这是正态分布的单峰性.2) 在这100个尺寸中,约有50个左右大于10,有50个左右小于10,这是正态分布的对称性.3) 在这100个尺寸中,大于10.03的个数和小于9.97个数都很少,这是正态分布的有界性.4) 这100个尺寸与标准尺寸10的差的平均值趋与零,这是正态分布的抵偿性.上述四条规律,零件数量越多就越准确2.3.参数 m 和 s 的意义和是正态分布的两个参数,当和确定后,正态曲线就完全确定了.和 不同,正态曲线的位置和形状则不同.是
7、位置参数,它的大小决定曲线在轴上的位置,是形状参数,它的大小决定曲线的高矮胖瘦.若不变只让变,则曲线形状不变,仅在轴上平行移动如图2所示;若不变只让变,则曲线在轴上的位置不变,仅形状发生变化,越小则曲线越显的高瘦陡峭;越大则曲线越显得矮胖平缓,如图3所示:从几何角度看,是正态曲线极大值的横坐标、是曲线拐点的横坐标到之间的距离,或者说是凸、凹曲线连接点的横坐标;从物理角度看,是正态曲线与轴之间的平面图形重心的横坐标.在数理统计中,是正态分布的数学期望或叫均值,是标准偏差.在计量学中,是被测量的真值,是表征测量值分散特性的一个度量指标.越大,观测值落在附近的概率越小,即观测值分散,测量精度低;越小
8、,观测值落在附近的概率越大,即观测值集中,测量精度高.总之,表明了观测值的集中趋势,反映了观测值的分散程度.显然我们希望越小越好3.4.标准正态分布及正态分布表4.1.标准正态分布称的正态分布为标准正态分布,将代入(1.1)式有: (4.1.1)式(4.1.1)为标准正态分布的密度函数,服从标准正态分布的随机变量1.4.2.标准正态分布的分布函数和正态分布表概率论告诉我们,随机变量的分布函数等于密度函数在无穷区间 上的广义积分,于是标准正态分布的分布函数(也叫概率分布函数)为: (4.2.1)通常用表示标准正态分布的分布函数,即: (4.2.2)取不同的的值,由式(4.2.2)可得不同的的数值
9、,这就得到“标准正态分布函数数值表”简称“标准正态分布表”或“正态分布表”.有些文献也叫“正态概率曲线下的面积”、“概率积分函数表”、“正态分布积分值”、“误差函数表”、“正态曲线下的面积函数表”、“拉普拉斯函数的值”等不同的名称.式(4.2.2)的几何意义是在区间内正态曲线与轴之间所围曲边梯形的面积,如图(4)所示,这也是将“正态分布表”称作“正态概率曲线下的面积”的道理.由于密度函数可以在整个轴上取值,由密度函数性质得: 即正态曲线性质4:曲线与轴所围面积为l4.4.3.正态分布表的几种形式式(4.2.2)通常称概率积分由于积分的上下限不同,可得到以下几种不同形式的正态分布表. (4.3.
10、1) () (4.3.2) (4.3.3) (4.3.4) (4.3.5) (4.3.6) 均有现成表可查.一种文献只附有一种形式的正态分布表.这六种不同形式的正态分布表,形式虽异,但实质相同,对同一问题,无论用那种形式的表都会得到同一结果.这六种表中,其较为常见而则出现较少5.式(4.3.2)的几何意义如图5所示,式(4.3.3)式(4.3.4)和式(4.3.5)的几何意义如图6,式(4.3.6)的几何意义如图7.只有弄清了这六种表的含义,工作中无论碰到哪种形式的表,都可以运用自如.对式(4.3.1)、式(4.3.2)所定义的这两种形式的正态分布表,由正态曲线的对称性和曲线与横轴所围面积为l
11、可知:当,则有,即:当则有,即:当且均为正值时有:当为的相反数时有:当时,有:令,由各相应正态分布表查得:,可以看出: ,这从图5、图7及曲线性质4(对称轴两边面积各为0.5)容易得出.由正态曲线的对称性和曲线与轴所围面积为1还可以得到以下关系式: (4.3.7) (4.3.8)式(4.3.7)式(4.3.8)的几何意义如图8,如图9所示 其实由的几何意义可直接得出式(4.3.7)和式(4.3.8) 4. 5.正态随机变量落在区间(x1,x2)内的概率计算概率统计指出,连续随机变量落在区间内的概率等于它的密度函数在该区间上的定积分,即: 对有: (5.1)对有: ()式(5.1)的几何意义如图
12、10所示.x1x2有了正态分布表,计算上面两个积分就十分容易了 对服从标准正态分布的随机变量,可直接查正态分布表,对服从一般正态分布的随机变量,通过变量置换也可以直接查正态分布表.5.1.当值机变量N(0,1)时的概率计算若 ,则 落在区间内的概率由式(5.1)和式(4.2.2)得: (5.1.1) 可由式(4.2.2)所定义的正态分布表查得.以后若无特别指明,文中的正态分布表均指式(4.2.2)定义的那种形式的正态分布表.倒1设 ,求:;解: 由式(5.1.1)得:由正态分布表查得:,故有: 由式(4.2.2)得: 由式(4.3.7)和式(4.2.2)得:显见: 因为在整个轴上取值,故概率必
13、1.这也证明了正态曲线与轴所围面积为15.5.2.当随机变量 N(m,s) 时的概率计算若,则落在区间()内的概率,原则上讲只要对它的密度函数在区间()上积分即可求得.但是实际上这个积分的计算是比较麻烦的,并且由于它有两个参数,也不可能对不同的和 一一造表备查.于是设法将服从一般正态分布的随机变量化为服从标准正态分布,利用已有的“正态分布表”,以解决所有正态分布的概率计算问题6.5.2.1.服从一般正态分布的随机变量N(m,s )的分布函数由分布函数的定义可知,服从一般正态分布的随机变量的分布函数为:作变量置换,令由上式化为: (5.2.1.1)上式说明通过变量置换可将对服从一般正态分布的随机
14、变量的密度函数的积分化为对服从标准正态分布的密度函数的积分.这为利用“标准正态分布表”打开了大门1.5.2.2.概率计算 设,则落在区间内的概率为: (5.2.2.1)这里,可由正态分布表查得.仿式(4.3.7)对一般正态分布有: (5.2.2.2)例2设 ,求:; .解:这里, ; 由式(5.2.2.1)得: 由式(5.2.2.2)和式(5.2.1.1)得:例3. 设,求?解: =当,=2=0.6826当=0.9545当=当= 上例说明,随机变量1落在区间内的概率为0.6826,或者说在范围内的曲边梯形面积占正态曲线下总面积的68.26;落在区间内的概率为0.9545;落在区间内的概率为0.
15、9973;落在区间内的概率为0.99994.由于落在范围内观测值为所有观测值的99.3 ,几乎包括了所有观测值,因此将作为一个界限范围,这就是常说的“3原则”,它在质量管理和质量控制等领域有广泛应用.在误差理论中,称为极限误差.因为随机测量误差落在范围内的概率为99.76%超出该范围的仅占0.27.即一万次测量中,极限误差在范围内的有9973次,超出该范围的仅有27次,这相当于370次测量中约有1次的测量误差有可能超出范围(0.27 =2710000=1370).若取为极限误差,那么在15788次测量中才约有1次误差的绝对值超出范围(0 006334=6.334100000 115788) 而
16、一般的测量,次数最多也不过几十次,因此可以认为,在任何情况下都不会出现绝对值大于的随机误差,故称为极限误差这就是随机误差有界性的道理.也有些国家将作为极限误差.在不确定度评定中,K称为包含因子(覆盖因子),它常取2或3,扩展不确定度U为合成标准不确定度的K倍.例3的计算结果可用图l1表示用例3的计算方法,取不同的K值,将得到的一些特定的概率值列入表2.表2 不同K的概率7KPKPKP0.67450.51.960.952.810.99510.682620.954530.99751150.752.32620.983.090.99816450.902.5760.993.290.9996正态分布在几个
17、领域内的应用实例6.1已知m, s求某条件下的概率8例4:一种螺纹量规平均可使用5年,其标准差为0.8年.假设螺纹量规的使用寿命服从正态分布,试求以下概率:1)使用期不到4年;2)使用期超过6年.解:设量规使用期为随机变量,由题意知,本题求1) 根据式(5.2.1.1)有:或由式(5.2.2.1)可得:2) 根据式(5.2.2.2)和式(5.2.1.1)有:例5:某车间加工一批轴,其直径服从正态分布,平均直径=l0,标准差=0.015.规定直径在(100.03) 范围内为合格品.求:1)不合格品的概率;2)合格品的概率.解:设这批轴的直径为随机变量,由题意知.和为不合格品.1) 2) 或 例6
18、:某城市平均季降雨量为476,标准差为165,假定该市季降雨量服从正态分布,预测雨量在381到635之间50年内舍有多少年8?解:先求降雨量在381-635的概率故降雨量在该范围内50年中的年数为:500.5505=27.52528(年)2.例7:测量某目标的距离时发生的误差(以米)具有概率密度,求在三次测量中至少有一次误差的绝对值不大干30的概率.解:由题意.在一次测量中误差绝对值小于等于30的概率为:一次测量中误差绝对值大干30的概率为: 三次测量中误差绝对值大干30的概率为: 三次测量中误差绝对值不大干30的概率(即三次测量中至少有一次误差绝对值不大干30的概率)为: 由于三次测量可以看
19、作三次独立试验,于是此题也可按二项分布计算.本题所求概率包括:1)三次测量中有一次的误差不大干30;2)三次测量中有二次的误差不大干30;3)三次的测量均不大干30.这里:=0.4931(上面计算),于是有: 可见按正态分布和按二项分布计算结果相同.例8:设显像管平均寿命为10年,标准差为3.5年,一年内损坏的可免费掉换.每出售100台电视机(1台有1只显像管),可以预料有多少显像管要免费掉换?解:设显像管寿命为 ,则 ,显像管寿命小于1年的概率为:故100台中需要掉换的台数为1000.01=l(台) 9.6.2已知某条件下的概率,求参数m 和s ?例9:有一群男子,4的身高在以下,有52在到
20、之间.若身高成正态分布,求这一分布的平均值和标准差10?解:由题意得:由概率值0.04和0.56反查正态分布表得: 化为: 解得: 即这群男子平均身高为,标准差为.例10:某电子产品的寿命(以小时计)服从参数=160,的正态分布,若要求,问允许的的最大值为多少?解:由题意:即: 反查正态分布表得:故得 例11:滚珠直径成正态分布,已知4的滚珠直径大于,求这一分布的平均值.解: 即: 反查正态分布表得: 解得: 6.3已知 m,s 和区问(a,b)内的变量数,求总变量数例12:某正态分布的,在40与90之间有220个变量值,求整个分布有多少变量值?解:先求变量值在4090范围内的概率故总变量为:
21、 例13:某天中午一餐厅所有顾客吃饭用的钱服从正态分布,平均数为8.74元,标准差为1.2元.这天中午有420人吃午饭用了8.5元或更多,问一共来了多少顾客?解: 故总顾客数为: (人)6.4已知m,s及各范围内的概率,求某范围的上、下限例14:某水果重量成正态分布,现进行分级,20为小的,55为中等,15为大的,10为特大.所有水果平均重量为241.5,标准差为60,求中等水果的下限与上限的重量.解:由题意知,中等水果下限以下的概率为0.20,上限为以下的概率为(0.20+0.55)=0.75,于是有: 反查正态分布表得: 即中等水果下限重量为191,上限为2822.例15:某公司对职工进行
22、基本理论考试,决定给14 的人以优.由以往经验知考试成绩成正态分布,平均分数为80分,标准差为14分,问职工至少考多少分方能得优?解:设至少考分方能得优,由题意:反查正态分布表得: 故 (分)即考生至少得95分方能得优.例16:用某量具测量(5.26d)这一尺寸.已知测量值平均数为5.26,标准差为0.02,测量值服从正态分布.要使测量值的95都在公差范围内,问值应定为多少6?解:本题是求概率为0.95的尺寸范围.设测得的值为随机变量,则.由题意得即 反查正态分布表得: 故有 本例也可以这样解:由表2可知,的概率为0.95,于是5.26=5.26 从而 6.5. 用标堆差确定所需测量次教若某测
23、量器具单次测量的标准差为,则多次测量的算术平均值的标准差为.将作为经验值,用以判断实际工作中用此器具测量一次是否能满足精度要求.若允许的测量极限误差,那么测量一次就够了,若,则要进行多次测量,这就要满足: (6.5.1)从而: (6.5.2)或 (6.5.3)式中,所需测量次数,单次测量标准差,算术平均值的标准差,允许测量误差8.例179:用某仪器测一尺寸L,已知该仪器标准差 ,谈尺寸允许的测量极限误差,问测量一次能否达到要求?解:因=1.43=3,故测量一次达不到精度要求,应进行多次测量,由式(6.5.2) 可见,至少要测量5次.例l810:某仪器标准差,现要求测量结果的精度问应测多少次?解
24、:由式(6.5.3)得: 可见,至少应测量4次.参考文献1 陈希孺.概率与数理统计教程M. 第3版.北京:中国科学技术出版社,2007.2 2 魏宗舒.概率与数理统计教程M. 北京:高等教育出版社,2004.4 3 刘宗鹤等译.概率与统计入门.北京:农业出版社,19864 上海交大应用数学系.概率论与数理统计初步.上海:上海交太出版社,1989.15 沈恒范.概率论讲义M. 第2版.北京:人民教育出版社,1983.4 6 盛骤等.概率论与数理统计M. 第3版.北京:高等教育出版社,2001.12 7 范金城等.概率论与数理统计M西安:西安交大出版社,2001.10月8 周富臣等.机械制造计量检
25、测技术手册J.北京:机槭工业出版社. 2000.109 冯师颜.误差理论与实验数据处理J. 北京:科学出版社,1964.6月10 张世箕.测量误差与数据处理M. 北京:科学出版社,1979.7月Some Theory of Normal Distribution and Its ApplicationsWANG Wen-rui 04104141 Mathematics and Applied MathematicsInstructor LI Hai-zengAbstract:A lot of experiments and theoretical analyses have shown tha
26、t it is the most common for random variables in the natural word and engineering technology to conform to normal distribution. For example: machined components geometric size (diameter, length, width, height), strength, weight ,life; random measurement error; persons height and weight; crops harvest
27、; the number of red blood cells of a healthy person; fiber strength; the carbon content of per ton liquid iron-making workshop; students test scores; machines maintenance durations; a years rainfall in a certain area; The distribution of shells falling points, all the above can be seen as obeying or
28、 nearing to obey normal distribution. Mathematics and experience have proved that random variables which stand influences from plentiful, independent, even small effects conform to normal distribution. In mathematical static of inferring many statistics, it is nearing normal distribution as long as
29、the sample size is adequate, regardless of informations original distribution. Even though some statistics deviate from the normal distribution, if the deviation amount is not large, they can also be dealt with according to normal distribution. Therefore, the application of the normal distribution i
30、s very broad.Keywords:Normal distribution; Probability density function; Standard deviation; Error致 谢感谢我的指导老师冯潞强,他严谨细致、一丝不苟的作风一直是我工作、学习中的榜样;他循循善诱的教导和不拘一格的思路给予我无尽的启迪,这篇论文的每个细节和每个数据,都离不开他的细心指导,而他开朗的个性和宽容的态度,帮助我能够很快的完成了我的论文.感谢李海增老师对我的论文给予一定指导与关心.感谢我的室友们,从遥远的家来到这个陌生的城市里,是他们和我共同维系着彼此之间兄弟般的感情,维系着寝室那份家的融洽.
31、学习上我们更是互利互助,感谢他们的帮助和各方面的意见,使我的论文得以完善.但愿南下的他们平平安安,也希望挥师北上的我们顺顺利利,用我们学到的知识回报祖国和人民.感谢我的爸爸妈妈,焉得谖草,言树之背,养育之恩,无以回报,你们永远健康快乐是我最大的心愿.在论文即将完成之际,我的心情无法平静,从开始进入课题到论文的顺利完成,有多少可敬的师长、同学、朋友给了我无言的帮助,在这里请接受我诚挚的谢意!探析正态分布的应用摘要:正态分布是概率论与数理统计中最重要的一个分布,并且在生物,物理及工程管理领域都有着十分广泛的应用。本文讨论了正态分布在解决概率论与数理统计中一些复杂问题中的应用,并通过具体例子说明正态
32、分布也是一个解决现实应用问题的有效手段。关键词:正态分布 性质 应用Analyze application ofnormal distributionAbstract: Normal distribution is the most important distribution of probabilitytheory and mathematicalstatistic, and has a very wide range of applications in biology, physics and engineering. This paper discussed the normal d
33、istribution solving some complex probability and mathematical statistics and real-life problems.Keywords: normal distribution; property; application正态分布又称高斯分布或是误差分布,它是自然界中最常见的一种概率分布,在数学、生物、物理及工程管理等领域都有着十分广泛的应用,比如在相同的生产条件下,产品的抗磨损度、抗拉强度、抗压强度等指标;一个生态系统内物种丰富度、物种分布密度等指标;同一种类种子的发芽率、充实饱满度等。中心极限定理表明:假如一个随机变
34、量是由大量微小的、独立的随机因素构成的叠加结果,那么这个变量一定是正态随机变量。1.正态分布密度函数性质的应用如果随机变量X的概率密度为,其中为常数且,则称服从参数的正态分布,记为,称为正态变量,为正态分布密度函数,如图1.图1正态分布密度函数1.1对称性的应用正态分布密度函数曲线关于直线对称,因此对任意的,有;,即.由可以看出在关于的对称区间上取值的概率是相等的;由可以看出在直线x=的两边的面积相等,且都等于.例1.设,求.解:因为,所以其概率密度曲线关于对称。则在以 为中心的对称区间和上取值的概率是相等的,所以有.从以上的例子中我们可以看出巧妙地利用正态分布密度函数的对称性能够快速解答问题
35、。例2.随机变量的密度函数为,求;若,求C的值。解:将随机变量的密度函数转化为正态密度函数,则,所以得到.设随机变量的分布函数为.因为所以的值为3,则 .因为正态密度曲线关于对称,根据对称性得.由以上一个例子,我们可以将一般概率密度函数改写为正态概率密度函数,以便利用正态概率密度的性质快速解答问题。1.2最值性质的应用正态分布密度函数的曲线为单峰曲线,在处达到最大值,其最大值为.例3.设随机变量,如果,则恒有. A. B. C. D.解:当时,它的密度函数在处有最大值.A,B两项中,则显然有.当时, 的最大值为,所以有,即A,B两项正确。而在C,D两项中的值并不固定,不能保证,所以不正确。所以
36、本题的答案是A,B.从本题我们可以看出恰当地利用正态分布密度函数最值性质可以很简便地解决问题。2.正态分布规则的应用设,则=0.6826,=0.9544,=0.9973.以上的三个式子在概率论与数理统计中会经常见到,将它们表示为图2. 0.68260.95440.9973图2正态分布的规则在图2中我们可以看到的取值大部分都落到了区间上,有0.6826,而落在区间之外的只有不到0.003.从理论上讲,服从正态分布的随机变量的取值范围为,但是在实际上,随机变量 在区间以外取值的可能性是非常小的。因此常常把区间称为3倍标准差区间,也把这个性质叫规则。规则与正态分布的数学期望和标准差大小无关,其数学期
37、望和标准差仅是满足的关系。例4.随机变量,则随着的增大,概率的大小. A.单调增大 B.单调减小C.增减不定 D.保持不变解:是个定值,其值为0.6826,并不随的变化而变化,所以本题选D.我们知道服从正态分布的随机变量和它的数学期望的差值小于其标准差的概率是个定值,利用这个特性可以快速解答题目。3.正态分布随机变量线性函数性质的应用正态分布随机变量线性函数有以下性质:假如,则;假如,则;假如,则的线性函数服从正态分布,并且有;假如随机变量相互独立,且,则对任意不全为零的两实数有.因而,=,=.有限个相互独立的正态随机变量的线性组合仍是正态随机变量,并且这个正态变量的数学期望和方差也都是各个正
38、态随机变量的相同线性组合,其中方差的组合系数是组合系数的平方。特别的,有限个相互独立且同分布的正态随机变量之和仍是正态随机变量,而且其系数是相应系数之和。例5.设两个相互独立的随机变量分别服从正态分布和,求随机变量的数学期望和方差。解1:因为,所以,则.所以服从正态分布,则的数学期望为5,方差为9.解2:因为为相互独立的的正态随机变量,所以也是正态随机变量。而为其线性函数,则服从正态分布。所以的数学期望和方差为:,.我们可以看出解法二比解法一的要简便一些,计算量也较少。我们对于同一问题从不同度进行分析,利用不同性质,得到较简便方法。4.正态分布在现实生活中的应用正态分布不仅是概率论与数理统计的
39、一种基本研究工具,也可以将它应用到解决一些现实生活问题当中。医学遗传分析、考试成绩与学生综合素质研究以及质量管理和控制等诸多领域都可以利用正态分布进行研究。例6.某乳制品厂生产净含量为1千克的罐装奶粉,该厂的数据研究人员从自动包装线上统计了大量数据,经研究发现每罐奶粉的净含量服从标准差为0.1千克的正态分布。为了保证奶粉质量符合标准,要使净含量少于1千克的产品不多于总量的,从而要调节包装线控制的期望。应该把期望调节到什么数值上才能达到标准?该乳制品厂准备购买一条新的自动包装线,经市场调研发现新包装线价格是10万元,其包装的奶粉的净含量服从标准差为0.025千克的正态分布,如果使用新自动包装线包
40、装奶粉,则应该把包装线的期望调节到什么数值才能达到标准?该乳制品厂是否应该购买新的自动包装线?解:设原自动包装线上包装的一罐奶粉的净含量为,则.为了使净含量少于1千克的奶粉所占的比例不多于10%,应把自动包装线的期望控制在比1千克大的位置上,而且期望应该满足概率方程,也就是指,,通过查标准正态分布函数表得=1.128.即把自动包装线的期望调节到1.128的位置上,才能保证净含量少于1千克的奶粉不多于.即表示要保证净含量少于1千克的奶粉不多于总量的,则平均每罐要多装0.128千克奶粉。设新自动包装线上每罐奶粉的净含量为,则,为了使净含量少于1千克的奶粉所占的比例不多于,应把自动包装线的期望控制在
41、比1千克大的位置上,其中必须满足概率方程,即,则=1-=0.9,所以=1.032.即把自动包装线的期望调节到1.032千克的位置上就能保证净含量少于1千克的奶粉不多于.这样平均每罐即可节约奶粉0.096千克。假设该乳制品厂每日可生产5000罐奶粉,则每日就可节约50000.096=480千克奶粉。如果每千克奶粉的成本是50元,则工厂每日可增加利润24000元,5天就能赚回购买新机器的成本。所以该乳制品厂应该购买新的自动包装线。在企业生产控制的过程中,产品的质量规格对企业效益有着非常重大的影响,而产品的质量分布可以近似成正态分布,因此正态分布的期望反映了生产控制的设定值,而方差反映了生产控制的精
42、度,它影响到了生产产品的质量,紧密关联着企业的利润收入。因此,在对产品规格要求较高的生产质量控制过程中,比起调节期望,更重要的是要控制方差的大小。例7.某公司通过招聘考试招收300名职员,其中正式职员270名,临时职员30名,报考的人数是1660人,考试满分是400分。考试后经公司统计分析:考试的平均成绩为166分,而考试分数在360分以上的有32人。小李在这次考试中得到257分,他能否被录取?能否被聘为正式职员? 解:因为有1660人参加考试,而且他们的考试成绩是相互独立的,所以可以将考试成绩X的分布近似为正态分布,且平均分即考试成绩的数学期望=166分,则.由题意得=1-=0.019,利用标准正态分布函数表得到=2.08,即,所以.则有=1-=1-0.8365=0.1635.因此考试分数大于257的人数为0.16351660271,所以小李排在第272位。小李可以被录取,但只是临时职员。通过以上分析,我们可以看出正态分布拥有很多良好的性质,很多概率分布都可以用它来近似,还有一些概率分布是由它直接推导而来的。因此正态分布的有关性质在很多方面都可以当做解决问题的工具,帮助我们更加简便地、有效地解决问题。参考文献:1陈希儒著.机会的数学M.北京:清华大学出版社;广州:暨南大学出版社,2005.2孙荣恒著.应用概率论M.北京:科学出版社,1