《可靠性工程师手册简明读本.docx》由会员分享,可在线阅读,更多相关《可靠性工程师手册简明读本.docx(52页珍藏版)》请在三一办公上搜索。
1、目录第一章国家提出实施可靠性提升工程1.1 可靠性提升工程的提出(1)1.2 可靠性提升工程的解读(2)1.3 可靠性提升工程提出的意义(3)第二章可靠性基本概念2.1 可靠性工程的起源(5)2.2 可靠性工程的发展(6)2.3 可靠性工程(7)2.4 质量的理解(9)2.5 At=O.t0.t0合格水平保持能力的高可靠性转型。第二章可靠性基本概念2.1 可靠性工程的起源可靠性工程起源于第二次世界大战。日本的齐藤三郎在漫谈可靠性一书中有一段简要的说明:在第二次世界大战正处于高潮的时候,美国在南方布置了很多远东战略军用飞机,最初近半数飞机难以飞行。经过多次检查才搞清楚,原来是电子管发生了故障。用
2、到的电子管半数以上出现了故障,无法继续使用,这种电子管是安装在飞机的重要部件上的。这对美国政府来说是很严重的问题,随后他们采取了紧急措施。从生产开始,严格按图纸要求,加强了对制造过程的控制,最后终于制造出完全符合图纸要求的电子管。这种合格的电子管运往远东并安装后,仍然不断地发生故障,尝试了多次,其结果都是一样。为什么在工厂里检查是合格的电子管,一使用就出现故障呢?这使人们联想到,是否还有一种超越现有制造技术或检验能力的别的“因素”在起作用。这种“因素”是什么呢?它是制止电子管发生故障的一种特性,人们把这种特性称为“可靠性”。只有在图纸设计时就预先考虑到它,再按图生产,才能制造出合格的产品。后来
3、经过实践证明,这种可靠性很好的电子管,在使用时就很少发生故障。于是,电子管的故障就成了可靠性的开端和可靠性的由来。2.2 可靠性工程的发展可靠性工程自1957年问世以来,经历了50多年的发展,这种发展在杨为民主编的可靠性、维修性、保障性总论中做了很好的总结。20世纪60年代是可靠性工程全面发展的阶段,也是美国武器系统研制全面贯彻可靠性大纲的年代。20世纪70年代是可靠性发展步入成熟的阶段。20世纪80年代以来,可靠性工程向更深、更广的方向发展。在近半个世纪中,可靠性的发展大致经历了如下重大的变化和发展:(1)从重视武器装备性能、轻视可靠性,转变为树立可靠性与性能、费用及进度同等重要的观念,实现
4、了观念转变。(2)从分散的部门管理、部门负责到统一领导,成立由副司令、副总裁直接领导的可靠性机构,完善了管理体系。(3)从电子管的失效机理研究到开发超高速集成电路,使电子元器件可靠性每年平均以20%的速度提高。(4)从电子设备的可靠性研究开始,发展到重视机械设备、光电设备及其他非电子设备的可靠性研究,全面提高武器装备的可靠性。(5)从硬件可靠性研究到重视软件可靠性研究,确保大型复杂系统的可靠性。(6)从宏观统计估算到微观分析计算,更准确地确定产品的故障模式、可靠性及寿命。(7)从手工定性的可靠性分析设计到计算机辅助可靠性分析设计,达到提高分析设计精度、缩短分析设计时间的目的。(8)从重视可靠性
5、统计试验到强调可靠性工程试验,通过环境应力筛选及可靠性增长试验来暴露产品故障,并通过采取纠正措施达到提高产品可靠性的目的。(9)从单个可靠性参数和指标发展到多个参数和指标,建立完善的可靠性参数和指标体系。(10)从固有值作为武器系统的可靠性指标到强调以使用值作为指标,确保投入使用的武器装备具有规定的可靠性水平。1.3 可靠性工程可靠性工程是一门研究产品缺陷或故障的发生和发展的规律,进而解决缺陷或故障的预防和纠正从而使缺陷或故障不发生或尽可能少发生的学科。有学者说可靠性工程是一门与故障做斗争的学科。产品的可靠性不是算出来的,不是试出来的,而是设计出来、制造出来和管理出来的,是在产品的全生命周期中
6、坚持与缺陷和故障斗争出来的。与故障做斗争决不能理解为除了故障才斗争、才纠正,我们很多企业忙于售后服务到处“救火”,这是消极的斗争、低效的斗争。斗争必须首先从预防故障或缺陷入手。继而若存在薄弱环节或隐患,能早发现,发现后能及时进行纠正,采取纠正措施。措施采取后就要进行验证并对可靠性指标进行验证,这种过程可用图1表示。下面分别对预防、发现、纠正、验证做一说明。重视预防故障和缺陷是斗争的最重要的一步,是可靠性工程的核心,也充分体现了质量管理大师克劳士比提出的第一次就把事情做正确的思想。可靠性工程经过50多年的发展,已经形成了一套比较完整的故障与缺陷的预防控制技术和方法。GJB450A-2004装备可
7、靠性工作通用要求中规定的预防故障的可靠性设计分析技术有13种。尽早发现缺陷和故障是可靠性工程的又一个重要组成部分。第二章可靠性基本概念尽早发现缺陷或故障非常重要,发现得越早损失越小。在可靠性工程的发展中也形成了诸多尽早发现缺陷和故障的技术和方法。例如,故障模式、影响及危害性分析,故障树分析,可靠性评审,环境应力筛选,可靠性研制试验,可靠性增长试验等。及时纠正缺陷和故障是实现产品研发过程可靠性增长的重要手段,也是可靠性工程的又一重要组成部分。可靠性工程在纠正故障的过程中也形成了一些方法,最典型的就是建立故障报告、分析和纠正措施系统,也有人称之为建立故障报告、分析和纠正措施制度。还有“故障或问题双
8、归零”管理等。有效验证纠正措施和产品的可靠性、维修性指标是可靠性工程的另一重要组成部分。可靠性工程中关于可靠性指标的验证已经有许多成熟的方法,如可靠性鉴定试验、可靠性验收试验、加速寿命试验等。在实施与产品的缺陷和故障做斗争中形成的“预防、发现、纠正和验证”一系列技术方法的过程中离不开可靠性管理,缺少系统有效的管理,很多技术活动是难以有效开展的。有人把可靠性技术与管理形容为一部车子的两个轮子,缺一不可。1.4 对质量的理解质量”一词的权威定义:一组固有特性满足要求的程度。产品的一组固有特性,包括产品专用质量特性和通用质量特性两部分。专用质量特性是指产品的功能和性能,如飞机的飞行高度、飞行速度和续
9、航距离,卡车的载重量、乘员数量和油耗,导弹的射程、威力和精度等。通用质量特性是指保证产品各种功能和性能等专用质量特性有效发挥的一组共有的技术特性,如:可靠性、维修性、测试性、保障性、安全性、环境适应性、电磁兼容性等。产品的专用质量特性和通用质量特性如车的两个轮子、人的双腿,缺一不可。产品因其具有具体且明确的专用质量特性而成产品,然而如果通用质量特性不好,故障频发,维修费用高昂,这肯定不是好的产品,不是顾客满意的产品。这说明包括可靠性维修性等通用特性是非常重要。图2专用和通用质量特性关系示意图1.5 从t=0、t0xtVO的质量看质量与可靠性为了更直观地理解产品的质量,我们可以按产品的生命周期的
10、不同阶段来讨论产品的质量及管理,即把产品的生命周期分成三个阶段:产品研发阶段、量产的生产制造阶段和使用至报废退役的阶段,于是也就对应着研发过程的设计质量、生产过程的制造质量和顾客使用产品过程中表现出来的使用质量,如图3所示。I雳包理帕关注儡点整把产品的生命期作为横坐标,用时间表示,以产品的合格水平作为纵坐标,于是就有t=0的质量、t0的质量和tvo的质量。在传统质量管理中,t=0的质量一般都用合格品率进行度量,用百分比表示,合格品率越高,说明内部质量损失越小。t0的质量体现在产品在用户使用过程中其合格水平的保持能力,其本质上就是产品可靠性,即合格产品在规定的条件下在规定的时间内完成规定功能的能
11、力。因此,可靠性关注的是产品合格水平随着时间的保持能力,在图3中,A产品显然比B产品的合格水平保持能力更强,也就是A产品比B产品更可靠。tVO的设计质量非常重要,它决定了t=0的质量和t0的质量。tV0的制造过程质量管理决定着t=0的质量,可以减少企业的内部质量损失,可以给企业带来“直接”的效益:而tvo的研发过程的设计质量,即可靠性设计分析、试验与评价、监督与控制等工作直接决定着t0的质量。合格产品的合格水平保持能力,即可靠性,是顾客最关心的质量,是企业减少外部质量损失和售后服务,将企业的产值最大限度地变成企业的利润,也是取得顾客满意的最重要的条件。传统质量管理关注的焦点是t=0时刻的合格品
12、率,为了提高合格品率,质量管理工作重点是保证制造过程的一致性和稳定性。可靠性关注的焦点是合格的产品在t0后为什么会变成“不合格”,即为什么会发生故障,而工作的重点是研发过程中的质量设计,在研发设计时就事先考虑产品在未来用户使用过程中可能发生的故障或缺陷,并在设计时采取预防措施加以解决,这也就是质量管理大师克劳土比所说的质量是免费的道理所在。1.6 可靠性定义及分类可靠性的定义是产品在规定的条件下和规定的时间内,完成规定功能的能力。可靠性的概率度量称为可靠度。产品是一个非限定性的术语,泛指任何元器件、零部件、组件、设备、分系统或系统,也可以指硬件、软件或两者的结合。产品按发生故障后是否能维修,分
13、为可修复产品和不可修复产品(也称为一次性使用产品)。可修复产品是指发生故障后可以通过修复性维修恢复到规定状态并值得修复的产品,否则称为不可修复产品,如汽车、坦克、飞机等为可修复产品,而弹药、日光灯等为不可修复产品。理解可靠性定义要抓住“三个规定”。在规定产品可靠性指标要求时,一定要对规定条件、规定时间和规定功能予以详细具体的描述和规定,如果规定不明确、不具体,仅仅给出一个可靠性指标要求是难以验证的,或在验证中产品研制方和订购方会因各自利益和理解的不同而发生争议。“能力”是产品本身的固有特性,是指产品在规定条件下和规定时间内完成规定功能的水平。由于产品在规定条件下和规定时间内完成规定功能的能力不
14、是一个确定值,而是一个随机变量,所以在定量表述时,要用概率来度量。产品可靠性可分为固有可靠性和使用可靠性。固有可靠性是通过设计和制造赋予产品的,并在理想的使用和保障条件下所具有的可靠性,是产品的一种固有属性,也是产品开发者可以控制的。使用可靠性则是产品在实际使用条件下所表现出的可靠性,它反映产品设计制造、使用、维修、环境等因素的综合影响。固有可靠性水平肯定比使用可靠性水平要高。产品可靠性还可分为基本可靠性和任务可靠性。基本可靠性是产品在规定条件下和规定时间内无故障工作的能力,它反映产品对维修资源的要求。任务可靠性是产品在规定的任务剖面内完成规定功能的能力。评定产品任务可靠性时,仅考虑在任务期间
15、发生的影响任务完成的故障。1.7 故障(失效)及其分类故障(失效)在可靠性工程中是一个极为重要的概念。在工程中要提高产品可靠性,就要与故障做斗争。耍评价产品可靠性,就要明确故障的定义及其分类。故障是指产品不能执行规定功能的状态,通常指功能故障。失效是指产品丧失完成规定功能的能力的事件。故障模式是指故障的表现形式,如短路、开路、断裂、过度耗损、漏油等。故障机理是指引起故障的物理的、化学的和生物的或其他的过程,如轴的断裂是材料强度的物理特性不够所导致的。故障原因是指引起故障的设计、制造、使用和维修等有关的因素。故障的分类有多种,不同的分类就是要从不同的方面来揭示故障的不同侧面的规律,以便为预防故障
16、、发现故隙、分析故障、纠正故障和评价产品可靠性提供支持。单点故障是指会引起系统故障的,而且没有冗余或替代的操作程序作为补救的产品故障。间歇故障是指产品发生故障后,不经修理而在有限时间内或适当条件下能够自行恢复功能的故隙。渐变故障是指产品性能随时间的推移逐渐变化而产生的故障。这种故障一般可以通过事前的检测或监控来预测,有时可通过预防性维修加以避免。机械产品的渐变故障有很多利I,如磨损故障、腐蚀故障、疲劳断裂等。独立故障与从属故障:独立故障是指不是由于另一产品故障引起的故障,亦称原发故障。从属故障是指由于另一产品故障引起的故障,亦称诱发故障。系统性故障与偶然故障:系统性故障是指由某一固有因素引起、
17、以特定形式出现的故障。它只能通过修改设计、制造工艺、操作程序或其他关联因素来消除。偶然故障是指产品由于偶然因素引起的故障,只能通过概率或统计方法来预测。早期故障和耗损故障:早期故障是指产品在寿命的早期因设计、制造、装配的缺陷等原因发生的故障,其故障率随着寿命单位数的增加而降低。耗损故障是指产品因疲劳、磨损、老化等原因引起的故障,其故障率随寿命率单位数的增加而增加。关联故障与非关联故障:非关联故障是指已经证实未按规定的条件使用而引起的故障,或已经证实仅属某项将不采用的设计所引起的故障,否则即称为关联故障。责任故障与非责任故障:非责任故障是指非关联故障或事先已经规定不属于某个特定组织提供的产品的故
18、障,否则称为责任故障。灾难故障与严重故障:灾难故障是指导致人员伤亡、系统毁坏、重大财产损失的故障,亦称灾难性故障。严重故障是指导致产品不能完成规定任务使命的故障,亦称致命性故障。1.8 可靠度、累积故障和故障密度分布函数产品可靠度是产品在规定条件下和规定时间内完成规定功能的概率,描述的是产品功能性能随时间保持的概率。因此,产品可靠度是时间的函数,一般用R(t)表示,产品可靠度函数的定义为:R(t)=P(Tt)式中,T为产品发生故障(失效)的时间;t为规定的时间。因此,产品在规定条件下和规定的时间内,不能完成规定功能的概率,也是时间的函数,一般用F(t)表示,F(t)称为累积故障分布函数,即F(
19、t)=P(TWt)产品发生故障和不发生故障是两个对立的事件,因此R(t)+F(t)=l累积故障分布函数和可靠度函数可以通过大量产品的试验分析得到。故障密度分布函数f(t)是累积故障分布函数F(t)的导数。它可以看成在t时刻后的一个单位时间内发生故障的概率,即f(t)三或F(t)=f(u)du或R(t)三f(u)du因此,累积故障分布函数f(t),可靠度函数R(t)和故障密度分布函数f(t)三者之间的关系可表示为图4。产品的累积故障分布完全可以通过大量样品的试验获得。一旦知道了分布规律,就可以应用概率统计理论来研究产品的可靠性规律。产品故障密度函数可以是指数分布、威布尔分布或对数正态分布等,但最
20、简单的分布是指数分布。在可靠性工程中经常使用分布的概念,指的就是故障密度分布函数f(t)。1.9 可靠性常用度量参数1 .可靠度产品在规定的条件下和规定的时间内,完成规定功能的概率称为可靠度,一般用R(t)表示。若产品的总数为No,工作到t时刻产品发生故障数为r(t),则产品在t时刻的可靠度的观测值为:R(t)=N0-r(t)N02 .故障率工作到某时刻尚未发生故障(失效)的产品,在该时刻后单位时间内发生故障(失效)的概率,称为产品的故障(失效)率。故障率一般用入(t)表示。在工程实践中,(t)一般用下式进行计算:式中,At为所取时间间隔;Ar(t)为t时刻后;At时间内发生故障的产品数;N.
21、(t)为在t时刻没有发生故障的产品数。当产品的故障服从指数分布时,故障率为常数,此时可靠度为:R(t)=et3 .平均失效前时间平均失效前时间(MTTF)是表示不可修复产品可靠性的一种基本参数。其度量方法为:在规定的条件下和规定的时间内产品寿命单位总数与失效产品总数之比。由于对不可修复的产品,失效时间就是产品的寿命,故MTTF即为产品平均寿命。4 .平均故障间隔时间平均故障间隔时间(MTBF)是表示可修复产品可靠性的一种基第二章可靠性基本概念本参数。其度量方法为:在规定的条件下和规定的时间内产品的寿命单位总数与故障次数之比。当产品的寿命服从指数分布时,产品的故障率为常数,则MTBF=I/上式在
22、可靠性工程中也是很常用的公式,特别是在可靠性预计和分配中会经常用到。5 .平均严重故障间隔时间在规定的一系列任务剖面中,产品任务总时间与严重故障总数之比称为平均严重故障间隔时间(MTBCF)。这里的严重故障在以前的标准或书籍中曾称为致命故障,意思是故障使产品的任务使命不能完成。6 .可靠寿命可靠寿命是指给定的可靠度所对应的寿命单位,如图5所示。当可靠度等于Rl时,对应的寿命是1;当可靠度为Rz时,对应的寿命是t2。可靠寿命不能理解为寿命是可靠的寿命。可靠度要求高,对应的寿命就短,反之则相反。7 .储存寿命产品在规定的储存条件下能够满足规定要求的储存期限称为储存寿命。储存寿命在武器装备中是一个重
23、要的可靠性参数,因为武器装备都需要长期储存,以备战争发生时使用,但在民用产品中一般较少使用。8 .使用寿命产品使用到无论从技术上还是经济上考虑都不宜再使用,而必须大修或报废时的寿命单位数称为使用寿命。度量使用寿命时需要规定允许的故障率,允许故障率越高,使用寿命就越长。如果没有允许故障率的要求和规定,对可修产品而言,使用寿命是难以评定的。9 .首次大修期限在规定条件下,产品从开始使用到首次大修的寿命单位数称为首次大修期限,也称首次翻修期限。2.10浴盆曲线大多数产品的故障率随时间的变化曲线形似浴盆,如图6中曲线(1)所示,故将故障率曲线称为浴盆曲线。虽然产品的故障机第二章可靠性基本概念理不同,但
24、产品的故障率随时间的变化大致可以分为以下三个图6产品典型的故障率曲线1 .早期故障期在产品投入使用的初期,产乩的故障率较高,且具有迅速下降的特征。这一阶段产品的故障主要是设计与制造中的缺陷,如设计不当、材料缺陷、加工缺陷、安装调整不当等,产品投入使用后很容易较快地暴露出来。可以通过加强质量管理及采用环境应力筛选等方法来减少甚至消除早期故障。2 .偶然故障期在产品投入使用一段时间后,产品的故障率可降到一个较低的水平,且基本处于平稳状态,可以近似认为故障率为常数,这一阶段就是偶然故障期。在这个时期产品的故障主要是由偶然因素引起的,偶然故障期是产品的主要工作期间。3 .耗损故障期在产品投入使用相当长
25、的时间后,就会进入耗损故障期,其特点是产品的故障率随时间迅速上升,很快出现产品故障大量增加直至最后报废。这一阶段产品的故障主要是由老化、疲劳、磨损、腐蚀等耗损性因素引起的。通过对产品试验数据进行分析,可以确定耗损阶段的起始点,在耗损起始点到来之前停止使用并进行预防性维修,这样可以延长产品的使用寿命。值得注意的是,并非所有产品的故障率曲线都会有明显的三个阶段。对于高质量等级的电子产品,其故障率曲线在其寿命期内基本是一条平稳的直线。而质量低劣的产品可能存在大量的早期故障或很快进入耗损故障阶段。产品故障率表现出的三段式的浴盆曲线并不是顾客希望的,也是顾客不满意或抱怨的根源。因此可靠性工作说到底就是为
26、了改变这条浴盆曲线,即尽量减少并消除早期故障,尽可能延长偶然故障期并尽量降低偶然故障率,同时通过完善预防性维修,尽量延缓故障率的增加,也就是说把浴盆曲线图6中的曲线(1)改造成一条近似直线形状且故障率尽量低的理想曲线(2)。可靠性工程的所有方法都是围绕改造浴盆曲线形成的,例如,一是要采取各种措施,例如环境应力筛选以降低早期故障率,使产品到用户手中即进入偶然故障期;二是采取预防性维修或使用长寿命的元器件和零部件以及各种耐久性设计,使耗损故障期尽量延后;三是应用各种可靠性设计分析技术使产品的偶然故障率尽可能降低,这是可靠性工作的重点。第三章可靠性设计与分析3.1 概述产品的可靠性是设计出来的,制造
27、出来的,管理出来的,但首先是设计出来的。在产品研发过程开展系统化的可靠性设计与分析非常重要,抓住设计中的可靠性设计就是落实“预防为主”质量管理思想。产品可靠性设计与分析一定要根据产品的不同特点,再结合可靠性设计与分析的具体方法进行。产品开展产品设计与分析的方法很多,在GJB450-2004装备可靠性工作通用要求中规定了可靠性设计与分析工作有13项工作项目,即建立可靠性模型,可靠性分配,可靠性预计,故障模式、影响及危害性分析(FMECA),故障树分析(FTA),潜在电路分析(SCA),电路容差分析,制定可靠性设计准则,元器件零部件和原材料选择与控制,确定可靠性关键产品I,制定功能测试、包装、贮存
28、、装卸、运输和维修对产品可靠性的影响,有限元分析(FEA)和耐久性分析。下面对其中几项工作项目作简要说明。3.2 可靠性建模、分配和预计3. 2.1可靠性建模可靠性模型是对系统及其组成单元之间的可靠性/故障逻辑关系的描述。可靠性模型包括可靠性框图及其相应的数学模型。根据用途,可靠性模型可分为基本可靠性模型和任务可靠性模型。建立可靠性模型的主要目的是: 明确各单元之间的可靠性逻辑关系及其数学模型; 利用模型进行可靠性定量分配和预计,发现设计中的薄弱环节,以改进设计; 对不同的设计方案进行比较,为设计决策提供依据。可靠性模型常用的有串联模型和并联模型。3. 2.2可靠性分配可靠性分配是将产品可靠性
29、的定量要求合理分配到分系统、设备、组件、元器件等单元上的分解过程。通过分配使单元的可靠性定量耍求得到明确,使产品整体和单元的可靠性要求协调一致。这是一个由整体到局部、由上到下的分解过程。可靠性分配的目的是: 明确各单元的可靠性定量要求; 发现设计中的薄弱环节,明确系统中对各单元控制的重点; 对不同的设计方案进行比较,为设计决策提供依据; 作为可靠性试验与评估的依据之一。可靠性分配方法有很多种,不同的产品、不同的研制阶段应采第三章可品性设计与分析用不同的可靠性分配方法。在工程上常用的分配方法有评分分配法、比例组合法、AGREE法等。这些方法的区别在于可获得的单元信息和分配精度不同。3. 2.3可
30、靠性预计可靠性预计是为了估计产品在给定的工作条件下的可靠性而进行的工作。它根据组成产品的单元可靠性来推算产品是否满足规定的可靠性要求。这是一个由局部到整体、由下到上的综合过程。可靠性预计的主要目的如下: 将预计结果与要求的可靠性指标相比较,判断是否能够达到用户的要求; 在方案阶段,通过对不同方案预计值的相对比较,选择优化方案; 在研制阶段,通过预计,发现设计中的薄弱环节,以便加以改进; 为可靠性增长试验、验证试验及费用核算等提供数据: 通过预计为可靠性分配的合理性提供对照依据。可靠性预计方法有很多种,不同的产品、不同的研制阶段应使用不同的可靠性预计方法。在工程上常用的预计方法有评分预计法、元器
31、件计数法、应力分析法和相似产品法等。3.3故障模式、影响及危害性分析(FMECA)故障模式、影响及危害性分析是分析产品中所有潜在的故障模式及其对产品所造成的所有可能影响,并按每一个故障模式的严酷度及其发生概率予以分类的一种自下而上进行归纳的分析方法。FMECA由“故障模式及影响分析(FMEA)和“危害性分析”(CA)组成。CA是FMEA的补充和扩展,只有进行FMEA,才能进行CAoFMECA是产品可靠性分析的一个重要工作项目,也是开展维修性分析、安全性分析、测试性分析和保障性分析的基础。FMECA分为设计的DFMECA和过程或工艺的PFMECA两大类,设计FMECA包括功能FMECA、硬件FM
32、ECA、嵌入式软件FMECA。功能及硬件FMECA的主要步骤如图7所示。败阵模式及影啊分析UMIA)析a义系定 分对定统义故”模式分析故障原因分析故障影响及尸A度分析一使用补!a插I分析故障楼M方法分析危害性分析3 FMt CA图7FMECA的一般步骤3. 4故障树分析(FTA)故障树是一种特殊的倒立树状的逻辑因果关系图。故障树分析是以一个不希望发生的产品故障事件或灾难性危险事件即顶事件作为分析的对象,通过由上向下的严格按层次的故障因果逻辑分析,逐层找出故障事件的必要而充分的直接原因(包括硬件、软件、环境、人为因素等),画出故障树,最终找出导致顶事件发生的所有可能原因和原因组合,在有基础数据时
33、可计算出顶事件发第三章可靠性设计与分析生的概率和底事件重要度等。FTA是产品安全性和可靠性分析的重要工具之一。FMECA是采用自下而上的逻辑归纳法,从最基本的零部件故障分析到最终产品故障,从故障的原因分析到故障的后果。FTA是采用自上而下的逻辑演绎法,从最终的故障分析到基本零部件的故障,从故障的后果分析到故障的原因。FMECA本质上说是一种单因素分析法,方法比较简单,它针对单个故障进行分析,在反映环境条件对系统可靠性的影响方面有局限性。FTA却能克服这些不足,与FMECA相结合,能够较完善地进行系统的故障分析。FMECA是FTA必不可少的基础工作,只有认真完成了FMECA,将所有基本的故障模式
34、都分析清楚之后,进行FTA时,底事件才不会出现重大遗漏。3.5 制定实施可靠性设计准则产品可靠性是与故障作斗争的结果。在企业中与故障作斗争的经验和教训是极为重要的。企业一定要加强这方面的知识管理,把国内外同行业与故障作斗争的经验教训、把企业自己与故障作斗争的经验教训、再把标准规定的方法等与研发新产品的特点结合,组织有经验的设计师制定详细的可靠性设计准则,例如:简化设计准则,尽可能以最少的元器件、零部件来满足产品功能要求,包括优先选用标准件,采用模块化设计,最大限度压缩和控制原材料、元器件、零部件的种类牌号和数量。优先选用经过验证的技术成熟的设计方案;降额设计准则,对电子、电气和机电元器件根据标
35、准规定进行降额;电路的容差设计准则;放瞬态过应力设计准则;防止单点故障导致任务中断或人员损伤的设计准则。耐环境设计准则;应用人类工程学的可靠性设计准则:电子产品的热设计准则等。3.6 元器件、零部件和原材料的选择和控制产品的可靠性很大程度决定于元器件、零部件和原材料本身的可靠性。因此应制定控制其可靠性的要求、标准化要求、优选目录要求、应用指南,包括降额和安全系数要求、试验和筛选的要求等。3.7 确定和控制可靠性关键产品可靠性关键产品是进行可靠性设计分析、可靠性增长试验、可靠性鉴定试验的主要对象,必须认真加以确定和重点控制。应专门规定可靠性关键产品的控制方法和试验要求,如过应力试验、工艺过程控制
36、,特殊检测程序,确保一些有关人员了解这些产品的重要性和关键性。第四章可靠性试验3.8 概述可靠性试验是可靠性工程中的一个重要部分。试验的主要目的和作用在于:(D发现产品在设计、元器件、零部件、原材料和工艺方面的各种缺陷和故障;(2)验证研发和生产的产品是否符合可靠性要求:(3)为评估和改进产品可靠性提供信息。可靠性试验一般可分为工程试验与统计试验。工程试验的目的是暴露产品在设计、工艺、元器件、原材料等方面存在的缺陷、薄弱环节和故障,为提高产品可靠性提供信息。统计试验的目的是验证产品是否达到了规定的可靠性或寿命要求。按试验场地,可靠性试验又可分为实验室试验和现场试验两大类。实验室可靠性试验是一种
37、在实验室中模拟产品实际使用、环境条件,或实施预先规定的工作应力与环境应力的试验。现场可靠性试验是产品直接在使用现场进行的可靠性试验。可靠性工程试验和统计试验还可进一步细分,如图8所示。可奉性试较图8可靠性试验方法分类3.9 环境应力筛选环境应力筛选是通过向电子产品施加合理的环境应力和电应力,将其内部的潜在缺陷激发成为故障,并通过检测发现和排除的过程,既是一种工艺手段,也是一种试验。环境应力筛选的目的是发现和排除不良元器件、制造工艺和其他原因引入的缺陷所造成的早期故障。这种早期故障通常用常规的方法如目视检查或测试等是无法发现的。环境应力筛选效果主要取决于施加的环境应力、电应力水平和检测仪表的能力
38、。施加应力的大小决定了能否将潜在缺陷激发为故障;检测能力的大小决定了能否将已被应力激发成故障的潜在缺陷检测出来。环境应力筛选使用的应力主要用于激发故障,不模拟使用环境。通常仅使用几种典型应力进行筛选。常用的应力及其强度、费用和效果如表2所示。表1各种试验工作的目的、适用对象和适用时机试验类型试验目的适用对象适用时机环境应力筛选为研发和生产的产品建立并实施环境应力筛选程序,以发现和排除不良元器件、制造工艺和其他原因引入的缺陷而造成的早期故障。主要适用于电子产品,也可用于电气、机电、光电和电化学产品。产品的研发阶段、生产阶段。可靠性研制试验通过对产品施加适当的环境应力、1:作载荷,寻找产品中的设计
39、缺陷,以改进设计,提高产品的固有可靠性水平。适用于电子、电气、机电、光电和电化学产品以及机械产品。产品的研发阶段的早期和中期。可靠性增长试验通过对产品施加模拟实际使用环境的综合环境应力,暴露产品中的潜在缺陷并采取纠正措施,使产品的可匏性达到规定的要求。适用于电/、电气、机电、光电和电化学产品以及机械产品。产品的研发阶段中期,产品的技术状态大部分已经确定。可靠性鉴定试验验证所开发的产品是否达到规定的可靠性要求。主要适用于电子、电气、机电、光电和电化学产品以及成败型产品。产品设计确认阶段,产品通过环境应力筛选、环境鉴定试验之后,产品的技术状态已经固化。可靠性验收试验验证批量生产的产品是否达到规定的
40、可靠性要求。主要适用于电子、电气、机电、光电和电化学产品以及成败型产品。产品批量生产阶段。寿命试验验证产品在规定条件下的使用寿命、储存寿命是否达到规定的要求。适用于有使用寿命、储存寿命要求的各类产品。产品设计定型阶段。产品通过环境鉴定试验之后,产品的技术状态已经固化。表2常用的应力及其强度、费用和效果环境应力应力类型应力强度费用筛选效果温度恒定高温低低对元器件较好温度循环慢速温变较高较低不显著快速温变高高好温度冲击较高适中较好振动扫频正弦较低适中不显著随机振动高同好综合温度循环与随机振动高很高很好从上表可知,应力强度最高的是随机振动、快速温变率的温度循环及其两者的组合,它们效果很好,但费用较高。