《可靠性工程与风险评估数学基础.ppt》由会员分享,可在线阅读,更多相关《可靠性工程与风险评估数学基础.ppt(68页珍藏版)》请在三一办公上搜索。
1、第二章 概率统计基础,第一节 随机变量的数字特征,数学期望简称期望或称为均值。,如果随机变量x是离散型,它的分布律为,若级数 绝对收敛,则称级数 为,的数学期望,记为。,(2-1),对于概率密度函数为 的连续型随机变量x,若积分,(2-2),绝对收敛,则称此积分为x的数学期望,记为,如果y是随机变量x的函数yg(x)(f是连续实函数),且x是离散型随机变量,它的分布律为,若 绝对收敛,,则有,(2-3),若x是连续型随机变量,它的概率密度函数为,且 绝对收敛,则有,二、方差是用来度量随机变量与其数学期望的偏离程度的。对于离散型随机变量X,若其分布律为,则方差的表达式为,(2-4),(2-5),
2、式中,如果X是具有概率密度函数为 的连续型随机变量,则方差的表达式为,方差的平方根称为随机变量的标准差或均方差。它是与随机变量X具有相同量纲的量,记为 有,(2-6),(2-7),(2-8),衡量随机变量离散程度的另一参量是变异系数,定义为:,它是无量纲系数。,描述随机变量概率分布对称程度用歪扭系数。定义为:,(2-9),(2-10),式中 随机变量x的三次中心矩。对于离散型随机变量X,可表示为:,(2-11),对于连续型随机变量x,三次中心矩为:,(2-12),图2l示出歪扭系数值为零、为正和为负时的概率密度函数曲线。,正态分布是应用最为广泛的一种分布。许多自然现象可用正态分布来描述。当研究
3、对象的随机性,是由很多互不相干的随机因素之和所引起的,每一个随机因素又都不是控制因素,这类问题一般都服从正态分布。例如,在可靠性分析中,材料的强度、零部件的加工尺寸和寿命常服从正态分布。,正态分布的概率密度函数可用下式表示,X为连续型随机变量。,第二节 常用的概率分布,一、正态分布,(2-20),累积概率分布函数为:,式中,x随机变量,均值,标准差,,正态分布可记为。数值的大小表征分布曲线中心线距离坐标基准点的位置,而 数值的大小则表征随机变量离散的程度、或者分布曲线的陡坦程度。参阅图22。,(2-21),图22 正态分布概率密度函数,当 时,称X服从标准正态分布。,记为N(0,1)。概率密度
4、函数和累积分布函数分,标准正态分布,别用 和 表示,即,(2-22),(2-23),二.对数正态分布,随机变量的正态分布具有对称性。但在许多工程实,设连续性随机变量X的自然对数呈正态分布,则称X,函数分别为:,服从对数正态分布。它的概率密度函数和累积概率分布,时间等随机变量常常采用的分布。,是描述材料强度、疲劳寿命、结构几何尺寸和工程完成,正态分布是许多不对称概率分布中最为重要的一种。它,际问题中,事件的随机变量分布往往是不对称的。对数,式中,的均值;,的标准差,(2-26),(2-27),对数正态分布概率密度函数的图形示如图:,对数正态分布的统计参量可求之如下。,令:随机变量X的均值由式(2
5、-2)求得:,上式中 括号内为正态概率分布函数,的总和,其值为1。因而有:,(2-28),式(228)表示的均值、随机变量X的均值 与 的方差 之间的关系。,根据式(26),有,故,由此得,(2-29),式中 为变异系数,见式(29)。如果,则因而得:,(2-30),伽玛分布常用于结构承受风、雪载荷、活载荷以及某些焊接热影响区表面裂纹尺寸分布等。,随机变量X具有如下的概率密度函数时称为伽玛分布。,(2-34),式中的和k是两个参数;。当为正整数时,,三、伽玛分布,累积概率分布函数为:,伽玛分布的统计参量可求之如下:,(2-36),(2-37),该图为伽玛分布的概率密度函数曲线图:,四、威布尔分
6、布,1.三参数威布尔分布:概率密度函数为,累积概率分布函数:,式中 形状参数;,()尺度参数:可记为 特征参数;,位置参数。,在疲劳强度试验中,威布尔分布函数中的时间t用,疲劳寿命N(循环数)代替。这是威布尔分布函数,可以写成如下形式。,式中,最小寿命,循环数;,特征寿命,循环数。,2.二参数威布尔分布,在疲劳强度试验中,,下图为威布尔分布的概率密度函数:,时间t,形状参数 对威布尔分布概率密度函数的影响。,求得不同的值,就可以判断引起失效的控制过程。,情况,反映耗损寿命期、即老化衰竭现象。根据试验,失效过程;,曲线表示失效随时间增加而递增的,特征;时,曲线表示了失效率为常量,描述偶然,效随时
7、间增加而减少的情况,亦即反映了早期失效的,率 的影响示如图27,当,这时曲线表示失,这里 取值为零。形状参数对可靠度 和失效,时间,a.威布尔可靠度函数,b.威布尔失效率,时间,五、指数分布 设备最佳工作期称为偶然失效期,其失效率与时间无关、保持为定值。在这期间,没有一种失效因素对失效起主导作用,失效纯属偶然。,根据方程(18),当 常量时,有:,(2-51),式(251)表示指数分布的概率函数。图28为指数分布概率密度函数图。,指数分布中随机变量的数学期望(均值)和方差如下:,(2-52),指数分布概率密度函数,六、极值分布 极值分布是一种特殊的分布,适用于寿命分析和应力分析。当装置或零部件
8、中存在有缺陷或杂质时,如果正是这些缺陷或杂质决定了装置或零部件的寿命,则具有最大杂质或缺陷的部分就决定了装置或零部件的寿命。除此以外,可能施加在装置或零部件上的应力,如最大冲击、最大风裁荷等决定其寿命者,亦属极值分布。,极大值、极小值分布在许多实际问题中,起着重要的作用。,假设 是独立随机变它们有相同的分布函数。,极大值(M)分布函数为:,如果 相应的概率密度函数为,则 相应,(2-54),的概率密度函数为:,极小值(N)分布函数为:,故,(2-55),(2-56),(2-57),极值型最小值的累积概率分布函数为:,概率密度函数为:,Gumbel研究了极大值、极小值分布的性质,从理论上得出了极
9、值分布的三种类型:极值型、极值型、极值型。,极值型最大值的累积概率分布函数为:,上式中,a、k是参量。,(2-59),(2-60),(2-58),式中,a、k的是参量。,极值型中随机变量的数学期望(均值)和方差为:,(2-61),(2-62),极值型、最大值型的累积概率分布函数为:,(2-63),随机变量的数学期望(均值)和方差为:,(2-64),(2-65),极值型、最小值的累积概率分布函数为:,式中的a、k是参量。,随机变量的数学期望(均值)和方差为:,(2-66),(2-67),(2-68),第三节统计推断 客观世界的总体一般多可以用随机变量来模拟。而这种随机现象的数量规律是从大量实际事
10、件中总结出来的。要得到这一规律,人们不可能从随机现象的全部事件进行观测和分析,只能对它们作有限数量的观测和分析。从局部的观测来估计和分析整体的随机规律性,要用统计推断的方法。统计推断法是根据对子样的观测来推断母体的情况。它是一种推测性判断的方法。,所谓母体,指的是研究对象的全体。譬如,我们研究某种材料的断裂韧性,那么它就是一个母体。又如我们研究的是零部件加工尺寸的误差,那么这个零部件某个尺寸的所有误差就是一个母体。因此,母体可以是尺寸、寿命、时间等表征研究对象某种性质的数量的全体。,从母体中抽取一个个体做试验或者进行观察,这个抽出的个体称为样品、或者子样。,设 是从母体中抽取n个样品,它称为容
11、量等于n的一个子样。子样含有母体的各种信息,它是十分宝贵的。为了充分地利用子样所含有的各种信息,常常把子样表示成一个或m个函数:,这些函数一般是连续函数,并且不含有未知参数。这种不含未知参数的子样函数称为统计量。,常用的统汁量有:,子样均值,子样均值,的正平方根称为子样的标准差或子样的均方差。,子样的K阶矩,子样的K阶中心矩,何为置信度,既然统计推断法是一种推测性判断的方法,所以,结果可以信任程度的标志。,人为给定,如0.1,0.05等。置信度就是衡量推测判断,显著水平或称风险度系数。它的数值根据要求的精度,中称之为置信度。常用(1-a)表示置信度,其中。a称为,的把握,因而这里存在可信赖程度
12、问题。在数理统计,对于这种方法所获得的结果就不可能有百分之百正确,按照可靠性工程分析的需要,本节拟择统计推断有关内容作简要叙述。,一、分布适应性检验,系统、装置或零部件往往需要从它们失效数据中提供适当的分布函数,亦即,对失效分布作出假设,然后再对这种假设的正确性作出检验。,1 检验法,设母体的分布函数为,利用从此母体中抽取的子样,检验假设,即:,其中为某已知分布函数。为寻找检验的统计量,首先将母体X的取值范围分成m个区间,要求 是分布函数 的连续点。令 表示母体X的子样,落入第i个区间的概率,记作,如果子样的容量为n,则 是随机变量X落入 区间的理论频数。倘若n个观察值中落入此区间的实际频数为
13、,则当成立时,应是较小的值。因而这些量的和可以用来检验是否成立。,皮尔逊定理。如 成立,当 时,有,它是自由度为m-1的分布,此值越小表示理论计算值对观测值的适应性越好。,2柯尔莫哥洛夫一斯米尔洛夫检验法,假设,其中 是连续型分布的已知函数。检验此假设是否为真,所用的统计量是,其中 是容量为的子样的经验分布函数,是一个阶梯形函数。令 是子样 按数值大小次序排列的统计量。则,K-S 检验法是在子样的每个次序统计量 上,求子祥经验分布函数和分布函数之间的偏差中大的一个。即求,这是由于 和 都是 的单调非降函数,所以式(280a)表示的偏差上确界可在个点处寻求。求得n个 中最大的一个就是K-S检验统
14、计量 的取值。,从图29可以看出,当 较小时,与 适放性较好当 较大时,与 适应性不好。K-S检验法的检验标准如下:,式中 为在给定显著性水平和子样容量n下的KS检验临界值或记作。参阅附表4。,图29 K-S检验法中函数的拟合,二、概率分布中的参数估计 在可靠性分析中,除了分布面数的适应性外,还必须对母体分布的参数进行估计。对于参数估计,经常遇到三种情况:随机变量X的母体分布函数 未知,需要求它的数学期望 和方差;随机变量X的母体分布函数的形式已知,但含有未知参数,譬如式(252)中指数分布的概率密度函数,其中未知参数,要求确定 值;随机变量x的分布形式已知,但是其数字特征值均不知道,如产品的
15、某项指标服从正态分布,而都是未知的,需要进行估计。,根据实际问题的需要,解决参数估计问题有两种方法:点估计与区间估计。,对于点估计的要求是,无偏性、一致性和有效性。而区间估计则要求得到未知参数的估计值与此参数真值的差包在一定范围的概率之内。,设是未知参数,它可以是分布中的参数成各种可靠性指标。设 是容量为n的一个子样,取子样的一个函数 作为未知参数的估计值,称之为点估计值。这是因为 当一定时,是一个数、或点。点估计值将表示未知参数大致是多少给出明确的数量概念。但是,由于这种估计值不能反映所得结果的可信程度。因此,往往引用参数值所在的区间去补偿仅仅一点的估计值。这种区间称之为置信区间这种方法称为
16、区间估计法。,下面叙述几种主要的参数估计方法。,使用各种分布的概率坐标纸可以对有关分布的参数进行图解估计。常用的概率坐标纸有正态概率坐标纸,对数正态概率坐标纸,威布尔概率坐标纸和极值概率坐标纸等。概率坐标纸的横坐标一般取子样的观测值,纵坐标则取对应子样观测值的累积概率分布因数,图解法的优点在于简便,但准确度不够,可能有一定误差。倘若对参数估计的要求较高,往往将图解法与参数的统计估结合起采,这样可以达到较好的效果。图解祛具体内容详见资料2。,1图解法,2矩法 矩法就是用子样的各阶矩或中心矩去估计母体的各阶矩或中心矩。,母体X的k次方的数学期望 称为母体的k阶矩,母体X对其数学期望 的偏差的次方的
17、数学期望称为母体的k阶中心矩。显然,母体的一阶矩就是母体的数学期望,母体的二阶中心矩就是母体的方差。,设是来自某母体的一个子样,则子样的k阶矩 和k阶中心矩 可以定义为:,显然,子样的各种矩反映了母体各种矩的特征。,3最小二乘法(具体见书中例题),4最大似然法 点估计最常用的方法是最大似然法。这种方法可以直接提供获得参数的点估计值,且具有较小的偏差。,当母体的分布类型巳知时,设分布函数的待定参数为,它可以取很多值,在这些诸多可能值中选出一个使子样观察结果出现的概率值为最大,作为 的估计量,用符号 表示之,称 为的最大似然估计。,设母体为离散型分布。随机变量X取值为x的概率(母体分布列)按下列形
18、式表示:,其中 为未知参数。,令 代表从该母体中抽得子样的观察值,如果子样是独立的,这一观测结果出现的概率应是:,称为似然函数。对于不同的,这个函数值不一样,即概率值不同。如欲寻找一个 值,使 达到极大值,显然,这就是求似然函数 的最大值问题。在关于为可微时,有:,这个方程称为似然方程。因为似然函数往往是多函数相乘,因此用对数似然函数求最大值较为方便。由于与在同一处取值,所以,也可以从下式求得:,5区间估计 上面叙述了点估计值的计算方法。由于它们不能满足所得值的精确度,因此,往往使用区间估计来弥补。本段拟根据不同情况将区间估计内容作简要介绍。,(二)概率分布中的参数估计,下面叙述几种主要的参数估计方法:,1图解法2矩法3最小二乘法4最大似然法5区间估计,第四节 回归与相关,在可靠性分折中,往往需要寻求变量之间的关系,以及判断所寻求的这个关系的精确度。这就是本节所要讨论的内容。,一、回归分析,回归分析的目的在于确定某一自变量或多个自变量(或称回归自变量)与因变量(或称回归因变量)之间的关系。回归分析一般可以分为线性回归分析与非线性回归分析两大类,它们又可以分为一元或多元回归分析。,二、相关,相关的量度是相关系数。它是衡量变量,设n维随机变量为。定义下式为相,之间相互关系彼此接近程度的尺度。,关系数,为 与 的协方差。,分别 为 与的方差。,分别 为 与的均值。,