《正交试验设计(内容详尽).ppt》由会员分享,可在线阅读,更多相关《正交试验设计(内容详尽).ppt(184页珍藏版)》请在三一办公上搜索。
1、本章学习内容,7.1 试验设计概述,试验与试验设计,试验,所谓试验,一般指用于发现新的现象、新的事物、新的规律,以肯定或否定先前的调查研究结论、发现新规律而进行的有计划活动。试验的实质:是一种用以测定过程或系统某些特定性能的有目的的测试。,试验设计(DOE,Design of Experiment),试验设计是数理统计学领域的一个分支。它是以概率论、数理统计、线性代数等为理论基础,科学地设计试验方案,正确合理地分析试验结果,以较少的试验工作量和较低的成本获取足够、可靠的有用信息。,试验设计的主要研究内容:哪个因素对特性值影响较大?如何影响?如何设置各因素的水平,使特性值接近预期的期望值?如何设
2、置各因素的水平,使特性值的方差(波动)最小?如何设置可控因素的水平,使非可控因素的影响最小?,试验设计的发展历史,试验设计的基本思想和方法是英国统计学家、工程师费歇尔(,18901962)于20世纪20年代创立的,他是试验设计的奠基人并对其后的发展做出了卓越的贡献。,试验设计与分析的发展大致可划分为三个历史阶段。,早期、传统试验设计阶段(约1920s1950s),费歇尔在农场进行田间试验的过程中,对高产小麦品种遗传进行研究。为减少偶然因素对试验的影响,他对各种试验因素的每一水平组合进行了试验,并通过方差分析评价指标的优劣(用于排除偶然因素的影响),使小麦大幅度增产。,1925年,费歇尔在研究工
3、作中的统计方法一书中首次提出了“实验设计”的概念;1935年,费歇尔出版了著名的试验设计法一书;40年代前后,英、美、苏等国家将试验设计逐渐应用于工业生产领域及军工生产领域;劳尼于40年代提出的多因素试验的部分实施方法后来成为现代试验设计理论的基础。,中期发展阶段(约1950s1970s,以正交试验设计、回归试验设计为代表),40年代末、50年代初,以田口玄一(Genichi Taguchi)为代表的日本电讯研究所(EOL)的研究人员在研究电话通讯设备质量时从英、美引进了试验设计技术,提出了“正交试验设计法”;,1924,该所的产品线形弹簧继电器,有几十个特性值和两千多个试验因素,经7年研制成
4、功,其性能比美国的同一产品更优。虽然其成本仅几美元,研究费用却用了几百万美元,创造的经济效益高达几十亿美元!同时挤垮了美国的企业。,50年代初,创立了“回归试验设计法”;1957年,田口玄一又提出了“信噪比(S/N)试验设计”;二战后日本经济迅速发展的原因之一就是在工业领域普遍推广和应用正交试验设计和产品三次设计,因此在日本把正交试验设计技术称为“国宝”。1959年,G.E.博克斯和J.S.亨特尔提出了调优操作(EVOP),也称为调优试验设计法;70年代中期,田口玄一提出了“产品三次设计”。,现代试验设计阶段(1970s),自70年代开始,S/N试验设计及产品三次设计开始了实质性的应用;80年
5、代,我国学者方开泰(南开大学)创立了“均匀试验设计”;,80年代开始,田口提出走质量工程学的道路,编著了质量工程学丛书,将质量管理、质量控制与试验设计结合起来,使试验设计发展到了一个新的水平。,试验设计发展的三个里程碑:费歇尔创立了早期、传统的试验设计理论、方法;正交表的开发及正交实验设计的应用;信噪比试验设计和产品三次设计的应用。,我国试验设计的发展情况:50年代开始研究;60年代提出观点;70年代开始实质应用;80年代提出均匀试验设计理论。,正交试验设计(Orthogonal Design)是于二十世纪50年代初期,由日本质量管理专家田口玄一(Tachugi)博士提出的在多因素试验设计方法
6、的基础上,进一步研究开发出来的一种试验设计技术。,正交试验设计法使用一种规范化的表格(正交表)进行试验设计,可以用较少的试验次数,取得较为准确、可靠的优选结论。正交试验设计主要可以完成:,确定出各因素对试验指标的影响规律,得知哪些因素的影响是主要的、哪些因素的影响是次要的、哪些因素之间存在相互影响;选出各因素的一个水平组合来确定最佳生产条件。,正交试验设计的基础是正交表。,人、机器、实验条件等资源的组合。,过程或系统,输入可理解为试验开始时过程或系统的初始状态、特征。在一些可控因素和一些不可控因素的影响下,产生一定的输出(响应),该输出(响应)就是试验结果。,基本概念,例:在弹簧生产中,为提高
7、弹性、防止弹簧断裂,要进行回火工艺试验。试验中选取回火温度(A)、保温时间(B)、工件重量(C)三个试验因素,每个因素取1、2、3三个水平进行试验,希望通过试验确定出最佳的生产条件(工艺条件)。,几个术语,特性值,事物与现象的各种性质、状态称为事物的特性,表征特性的数值称为特性值。,前例中,弹簧弹性可用弹性模量E来表征,E的数值就是弹簧弹性的一种特性值。,试验过程中所选取的特性值应具有单调性、可测性,应该能够正确反映试验的目的。,特性值可以从不同角度进行分类。,按特性值的性质分 计量特性值:连续变化的特性值(如重量、成本、寿命等)。计数特性值:离散变化的特性值(如废品件数、疵点数等)。0、1数
8、据:只有两种取值的特性值(如合格与否、电路的通与断等)。按特性值的变化趋势分 望目特性值:存在固定目标值的特性值(如尺寸、稳定电压等)。望小特性值:希望其值越小越好的特性值(如尺寸误差、粗糙度、磨损等)。望大特性值:希望其值越大越好的特性值(如强度、寿命等)。按特性值的状态分 静态特性值:不随时间变化的特性值。动态特性值:随时间变化的特性值(如汽车转弯时的转弯半径、自动调节量等)。,试验指标(简称指标),根据试验目的所选定的、用来考察试验结果的特性值。,按指标的性质分 数值指标:用数值表示特性值的指标(如重量、强度、精度、寿命、成本等)。非数值指标:不能用数值表示特性值的指标(如光泽、颜色、味
9、道、手感等)。按试验指标的数量分 单指标:试验指标只有一个。多指标:试验指标只有多个。,注意:每个指标唯一表示一种特性,某一试验过程中不能用多个指标重复表示同一种特性。试验指标应尽可能采用计量特性值。,试验因素(简称因素),对试验结果(特性值)可能有影响的原因或要素。,可控因素:人可以控制、调节的因素(如加热温度、切削速度等)。不可控因素:人不可控制、调节的因素(如机床的随机振动、试验中的随机误差等)。,注意:试验设计中主要考虑可控因素,不可控因素的影响通过数据处理来处理。,其他:,标示因素,区组因素,信号因素,误差因素,因素的水平,试验中因素变化的状态和条件称为因素的水平或位数,简称水平。水
10、平用数字(1,2,3)表示。试验中设计过程中水平的选取原则是:宜选用三水平,以有利于实验结果的分析;水平通常取等间隔,特殊情况下取对数间隔;水平应该具体。水平应该是可控的,其变化对试验指标有影响。,试验设计的作用,通过合理、科学的试验设计,可以显著提高产品的设计、开发质量,找出最佳的工艺条件,从而提高产品最终的质量。田口认为,设计质量(包括产品设计和工艺设计)对整个产品质量的贡献约为60%70%。,试验的主要步骤(阶段),试验设计阶段选题、设计试验方案、准备试验材料及设备、安排试验环境等;试验实施阶段按计划进行试验(包括试验操作、收集试验数据等);试验分析阶段核查试验数据、进行统计分析、解释试
11、验结果、获取试验结论等。,试验设计的基本原则(费歇尔三原则),重复原则利用重复观测减小试验误差,提高试验精度;随机化原则目的是为了消除或减小人为因素引起的系统误差的影响;局部控制原则该原则也称为区组控制原则,指的是把比较的水平设置在差异较小的区组内,其目的也是为了消除或减小试验中系统误差的影响。例如,按机器设备、班次、原料批号、操作人员划分区组。,试验设计方法的种类,按试验中试验因素的多少分 单因素试验 多因素试验 按所要控制的误差因素的多少分 单方向控制 两方向控制 多方向控制,具体的试验设计方法主要有:,单因素试验黄金分割法(0.618法)、分数法、平行线法、交替法、调优法等。多因素试验正
12、交试验设计、信噪比(S/N)试验设计、产品三次设计、回归试验设计、完全随机化试验设计、随机区组试验设计、拉丁方试验设计、正交拉丁方试验设计、均匀试验设计等。,7.2 试验设计的统计学基础,常用统计量,极差,极差指的是一组数据中的最大值与最小值之差,也称为变异幅。,极差反映了一组数据的最大离散程度。,和与平均值,设有n个观测值 构成的一组数据,定义,和,平均值,偏差有以下两种表示方法:,观测值与平均值 之差,由于期望值通常是未知的,因此试验中常使用后者,前者只用于理论分析中。,偏差(离差),观测值与期望值 之差,偏差平方和与自由度,偏差平方和用来表示一组数据的离散程度,通常用 表示。,不存在期望
13、值时:,存在期望值时:,自由度指的是关系式中独立数据的个数,通常用 f 表示。,例如,在计算偏差平方和的过程中,若表达式中使用的是期望值,则;若表达式中使用的是平均值,则因为存在约束条件 而使独立数据的个数少了一个,因此。,方差与均方差,方差也称为平均偏差平方和,表示单位自由度所对应的偏差大小,通常用 V 表示:,均方差也称为准偏差或标准差,定义为方差的平方根,通常用 表示,即,存在期望值时:,不存在期望值时:,存在期望值时:,不存在期望值时:,样本及其分布,总体、个体与样本,总体(population):被研究对象的全体。个体(individual):组成总体的每个单元。,个体有限的总体称为
14、有限总体;个体无限的总体称为无限总体。,例如:研究灯泡的寿命(总体),则每只灯泡的寿命就是总体(灯泡寿命)中的一个个体。研究晶体管的直流放大倍数(总体),则每只晶体管的直流放大倍数就是总体中的一个个体。,任何总体中的个体都是按一定的规律分布的,因此可将总体视为随机变量,用大写字母X、Y、Z等表示(确切地说,是总体中的个体的分布)。,样本(sample):用一定方法从总体中抽取的一组个体称为总体的一个样本。样本也是随机变量。,与样本有关的几个术语:,抽样(采样,取样):从总体抽取样本的过程。随机样本:个体是随机抽取的样本(无特指均认为是随机样本)。样本容量:样本中所包含的个体数目。容量30的样本
15、称为小样本,30的样本称为大样本。,总体的样本用带下标的大写字母表示,例如 表示总体 的一个样本。,样本观测值:一次抽样所得到样本的观测结果,如()。,样本空间:样本观测值的所有可能取值的范围。简单样本:若样本中的个体的分布规律与相应总体中的个体的分布规律相同,则称这样的样本为简单样本。一般地,按随机化原则进行试验所得到的样本均可视为简单样本。,注意:由于试验要受到各种条件的限制,通常无法对总体进行研究,而是对某个或某些样本的性质进行研究,通过样本来推断总体的特征。总体是随机变量,总体的样本也是随机变量。科学实验中的抽样一般要求是完全独立、随机的,且应使每组样本的观测值之间互不影响,以最大限度
16、使样本具有与总体相同的分布规律。,样本的分布函数与样本的统计量,样本分布函数,设总体X的分布函数为F(x),为其n个独立的观测值,它们组成一个容量为n的简单样本。将n个观测值按从小到大的次序排列,若,则相当于在n次重复独立试验中,事件 的频率为,称为样本分布函数。,可以证明,当样本容量n很大时,样本分布函数 将近似等于总体分布函数 由样本推断总体的依据。,样本统计量,对于给定的一个样本实现,可以计算其数字特征,并冠以“样本”二字,以示和总体数字特征的区别。例如:,样本的k阶原点矩,样本的k阶中心矩,样本的均值,样本的方差,样本的统计量、分别为下列总体(均为随机变量)的观测值:,数理统计中关于统
17、计量的定义是:,设 为总体X的一个样本,为一个连续函数,如果 g 中不包含任何未知参数,则称 为一个统计量。,如果 是 的一组观测值,则 是统计量 的一个观测值。,显然,、都是统计量,其中 和 是两个特别重要的统计量。统计量都是随机变量,如果总体的分布已知,那么统计量的分布是可以求得的。,可以证明,当样本容量n很大时,样本分布函数 将近似等于总体分布函数 由样本推断总体的依据。,样本统计量,对于给定的一个样本实现,可以计算其数字特征,并冠以“样本”二字,以示和总体数字特征的区别。例如:,样本的k阶原点矩,样本的k阶中心矩,样本的均值,样本的方差,连续型随机变量的分布及数字特征,正态分布,设连续
18、型随机变量X的概率密度函数为,则称X服从参数为 的正态分布,记为。参数、分别称为X的数学期望(均值)和方差(称为标准偏差)。,正态分布的概率分布函数为,当、时,称X服从标准正态分布。若令(即观测值对均值的偏差为 的z倍),则可将一般正态分布化为标准正态分布,其分布函数变为,及,推论1:设,是它的一个样本,则 也服从正态分布,并且其数学期望和方差分别为、,即,推论2:设总体,总体,且两个总体相互独立,则样本均值差 也服从正态分布,式中、分别为总体X、Y的样本的样本容量。,7.3 正交与正交表,正交的概念,在数学上,两个向量 和 若满足,即两向量的内积等于零,则称向量 与向量 正交。,由于在构造正
19、交表的过程中使用了上述原理,因此将相应的试验设计法称为正交试验设计。,正交表,完全有序元素对(完全对),设有两组元素 与,它们可构成如下的元素对:,称这些元素对为由元素 与 构成的“完全有序元素对”,简称“元素对”。若元素为数字,则称为“完全有序数字对”。,例:由数字(1,2,3,4)和(1,2,3)构成的完全有序数字对为:,若在一个矩阵的任意两列中,由两列中的对应元素所构成的数字对是完全对且每对出现的次数相等,则称这两列是均衡搭配,否则就是不均衡搭配。例如:,第I列 第II列 第III列,第I列与第II列中的对应元素构成8个数字对:,它们是由元素(1,2)和元素(1,2)构成的完全数字对,每
20、对各出现两次,因此称这两列为均衡搭配。,而第I列与第III列、第II列与第III列,由于每对出现的次数不相同,因此均为不均衡搭配。,正交表的定义与格式,定义:设A是一个 的矩阵(n行k列),其中第 j列元素由元素 构成,若A的任意两列均衡搭配,则称A是一张正交表。例如:,L4(23)正交表,L8(424)正交表,正交表用符号 表示,其中,正交表的代号,是Latin Square(拉丁方格)的首字母;,正交表的列数,每一列对应着一个试验因素;,正交表的行数,表示试验的次数;,第 j 列中元素的个数,表示试验中第 j个因素所取的水平数。若某些列中的元素个数相同,可以写成指数的形式。,例如:,任意列
21、中各水平重复出现的次数相等。第 j 列中各水平重复出现的次数:,任意两列所构成的水平对是完全有序数字对,各水平对重复出现的次数相等(均衡搭配)。第 i 列与第 j 列所构成的水平对重复出现的次数:,正交表的性质,根据正交表的上述两个性质,可得到正交表的三种初等变换:列间置换:正交表中任意两列可以相互交换;行间置换:正交表中任意两行可以相互交换;水平置换:正交表中任意一列中的水平数字可以相互交换(例如“3”“4”)。(经过上述初等变换后的表仍为正交表,称变换后的正交表为原正交表的等价表),说明:若用关于零对称的数字表示不同水平(例如二水平用-1、1表示;三水平用-1、0、1表示;四水平用-2、-
22、1、1、2表示),则任意两列元素的内积为零(正交表由此得名)。,用正交表设计出来的试验方案之所以合理,是因为具有如下两个重要的特征:均衡搭配正交性 可以用较少的试验次数替代全部可能试验组合中好的、中等的、不好的搭配组合,使选出的较少的搭配组合具有均衡的代表性。综合可比数据分析的依据 可把复杂的多因素试验数据处理问题转化成单因素试验数据处理。通过试验数据的适当组合,可发现各组试验数据以及各因素影响之间的某种可比性。,水平数相同的正交表(m水平正交表),此类正交表中,因此通常简记为,如 等。此类正交表又分为两种:,标准型正交表(最常用):水平数为素数或素数整数幂的正交表。例如:,非标准型正交表:标
23、准型之外的水平数相同的正交表。,水平数不同的正交表,此类正交表中,某两列(或多列)之间的水平数不等。例如:,正交表的种类,7.4 正交试验设计的极差分析(直观分析),直观分析是通过简单地计算各因素水平对试验结果的影响,并用图表形式将这些影响表示出来,再通过极差分析(找出最大值、最小值),最终确定出优化的水平搭配方案(生产方案),或找出因素对试验结果的影响程度。根据所考查的试验指标的多少,正交试验设计可分为单指标正交试验设计和多指标正交试验设计两种。本节仅讨论单指标正交试验设计的直观分析。,示例,例:某工厂一零件的镗孔工序质量不稳定,经常出现内径偏差较大的质量问题。为了提高本工序的加工质量,拟通
24、过正交试验确定影响内径偏差的各因素的主次顺序,以探求较好的工艺条件来改进工艺操作规程。,试验方案设计,设计试验方案时,首先要明确试验要解决的问题(内径偏差过大),即明确试验指标内径偏差(越小越好);然后明确影响试验指标的主要因素,选取适当的因素水平。,明确试验指标和影响因素,制定因素水平表,影响因素:,试验指标:内径偏差,根据以往的生产经验和正交试验设计的特点,每个因素各选取三个水平进行试验,如下:,选择正交表,设计表头,根据因素及水平的多少,选择四因素、三水平的正交表 L9(34),如下:,根据正交表确定试验方案,按正交表L9(34)的内容及所设计的表头,将试验方案填入正交表中。,7.4.3
25、 按设计的试验方案进行试验,严格按试验方案进行试验,将孔径偏差的试验结果填入表格中。,7.4.4 试验结果的计算与分析,试验结果的计算与分析主要解决以下三个问题(试验的目的):,分清各因素对试验指标影响的主次顺序;找出(确定出)优化生产方案,即确定出采用什么样的因素水平组合才能使试验指标达到最优;分析试验因素对试验指标的影响趋势;为进一步试验指明方向。,直接分析,由试验数据可以直接看出,在#8号试验(A3B2C1D3)的工艺条件下,镗出来的孔孔径偏差最小(0.05mm)。,计算分析,通过对原始试验数据的简单计算,确定各因素水平的影响程度,最终找出最佳生产条件。,但这种条件是否就是因素水平的最佳
26、搭配呢?在9种方案之外还有没有更好的水平搭配呢?这需要通过进一步的计算、分析得到最佳的生产条件。,T=2.465,计算同一水平下的偏差之和(本例中)。,计算同一水平下各偏差的平均值(本例中)。,计算极差。,验算。若T为9次试验的偏差之和,则。,画出试验因素与试验指标关系的趋势图(以各因素的水平为横坐标,以相应水平下的 为纵坐标;定量因素用实线表示,定性因素用虚线表示)。,根据正交表的综合可比性,由上述计算及趋势图可分析得出以下结论:,刀具数量以4把刀(A3)时为最好(还可进一步对刀具更多的情况进行试验);切削速度以38r/min(B2)时为最好;走刀量为0.7mm/r(C2)时为最好;刀具类型
27、以II型刀(D3)为最好。,最佳水平组合:A3B2C2D3,为使孔径偏差最小:,分析主次因素,按极差计算结果确定主次因素(极差越大,影响越主要),(主)BDAC(次),观察趋势图确定主次因素(点子升、降的幅度越大,影响越主要),(主)BDAC(次),直接分析结果与计算分析结果的比较,直接分析的结果:,A3B2C1D3,计算分析的结果:,A3B2C2D3,直接分析的结果反映的是正交表中9次试验中的最优水平搭配,但不一定是所有可能的水平搭配(34=81种)中最优的。,为了展望或寻求更好的搭配,可使用计算分析,通过对趋势的观察,可以找出比直接分析结果更好的水平搭配。,计算分析的结果有时也可能不如直接
28、分析合理,其主要原因可能是:试验误差过大;存在其它影响因素而未加以考虑;因素水平选取不当。,7.4.5 多指标正交试验设计,实际工作中存在着大量的多指标工业试验。在这类试验的设计中,设计与分析较单指标要复杂,各指标之间可能会出现一些矛盾,如何兼顾这些指标呢?,多指标试验设计常用的方法主要有两种:综合平衡法 综合评分法,例:油泵柱塞组合件收口强度稳定性试验,综合平衡法,某厂生产的油泵柱塞组合件是经过机械加工、组合收口、去应力等工序制成的。试验前产品的拉脱力波动较大,且拉脱力与转角两指标往往相互矛盾。本试验的目的是通过对产品结构尺寸的优化来达到提高产品质量的目的。为此,确定三个试验指标:拉脱力(望
29、大);轴向游隙(望小);转角(望大)。,例:某厂生产的油泵柱塞组合件是经过机械加工、组合收口、去应力等工序制成的。试验前产品的拉脱力波动较大,且拉脱力与转角两指标往往相互矛盾。本试验的目的是通过对产品结构尺寸的优化来达到提高产品质量的目的。为此,确定三个试验指标:拉脱力(望大);轴向游隙(望小);转角(望大)。,明确试验目的,确定试验指标,拉脱力(,望大),轴向游隙(,望小),转角(,望大),确定试验因素,选择因素水平,由实践经验得知,柱塞头的外径D、高度L、倒角以及收口压力p四个因素对试验指标产生主要影响,故考查这四个因素,每个因素取三水平。,选择正交表,设计表头,本试验属四因素、三水平试验
30、,故选用正交表L9(34),表头见后。,根据正交表设计试验方案,进行试验,收集试验数据,为提高试验精度,减小试验误差的影响,对每种水平搭配进行7次重复试验,然后分别取、的7次平均值作为试验分析的数据。为简化计算,还对原始数据进行了适当的转换。,对各指标的试验数据分别进行计算(同单指标),并进行直接分析和计算分析,拉脱力F,计算指标拉脱力F对应于同一因素水平的。,计算指标拉脱力F对应于同一因素水平的。,计算指标拉脱力F对应于同一因素水平的。,依次计算指标轴向游隙 和转角 对应于同一因素水平的、。,画出趋势图,按极差大小排出主次因素。,(主)BDCA(次),拉脱力,(主)BDCA(次),轴向游隙,
31、(主)BCDA(次),转角,结果:,由于转角 对应于因素C、D的极差相差不大,故综合考虑将二者的次序调换,将影响整个组件三个指标的主次顺序认定为,(主)BDCA(次),初选最优生产条件。,按、(或、)及趋势图确定出各因素水平的最优组合.,对于拉脱力:(望大),A3B2C1D3,A1B1C1D3,对于轴向游隙:(望小),对于转角:(望大),A1B1C1D2,综合平衡,选取最优生产条件。,因素C:,因素B:,因素D:,因素A:,对三个指标来说均是C1最好,故选C1;,对三个指标来说B均为主要因素(极差最大),一般情况下倾向于选B1,但因F是该部件的主要参数,故实际选用B2;,对转角来说,D是较次要
32、因素,故D2将改选为D3,综合平衡后选D3;,对三个指标来说A皆为次要因素,按多数倾向选取A1。,综上所述,试验后确定出如下的优化生产条件:,A1 B2 C1 D3,柱塞头上口外径,柱塞头高度,柱塞头上口倒角,收口压力,综合评分法,对多指标一一进行测试后,按照具体情况确定评分标准,对这些指标进行综合评分,将多指标问题转化为单指标问题,进而得到多指标试验的结论。综合评分方法主要有:,排队综合评分法 加权综合评分法 公式综合评分法,7.4.6 水平数不同的正交试验设计(混合型正交试验设计),某些试验,由于受设备、原材料等试验及生产条件的限制,某些因素的水平的选择只能取某些特定的值,造成各因素水平的
33、不同。此外,有时为重点考察试验中的某个因素,通常要对该因素多取几个水平。因此,在试验设计中经常遇到水平数不同的多因素试验设计问题。,对于水平数不同的试验设计,主要使用以下两种方法。,使用混合型正交表,例:某钢厂生产的某种牌号的钛合金,在冷加工工艺中需进行一次退火热处理,以降低硬度,便于校直、冷拉。要求根据冷加工变形量,在该合金的技术要求的范围内,硬度越低越好。,试验指标:合金的洛氏硬度(HRC),试验目的:寻找降低硬度的退火工艺参数,试验因素及水平:见下表。,本试验有一个四水平因素和两个二水平因素,故选用正交表L8(4124)。,试验方案及试验结果的计算分析:,两点注意:,同水平试验结果平均值
34、 的计算,因素A的水平重复数为2,而因素B、C的水平重复数为4。,由于水平数不同,因此因素A需计算四个 及,而因素B、C则只需计算两个 及。,极差的计算,当水平数完全相同时,因素的主次顺序完全取决于极差。但当水平数不同时,考虑到水平数多的因素极差可能大些,因此通常要对极差 进行合理的修正再做比较。修正后的极差 为,r 水平的重复次数;d 折算系数。,本例中,对应于因素A、B、C修正后的极差分别为:,(水平数为4,重复次数为2),(水平数为2,重复次数为4),(水平数为2,重复次数为4),结论:,各因素对试验指标的影响次序是:(主)BCA(次),直接分析得出的最优生产条件是:,计算分析得出的最优
35、生产条件是:,经实践验证,生产条件为(退火温度为760、保温时间为2h、冷却介质为空气)时效果最好,即硬度较低。,使用拟水平法,若在混合型正交表中找不到合适的,或能找到但试验次数较多,此时可使用拟水平法,即为水平数较少的因素虚拟出若干水平,使之能安排在水平数相等的正交表中进行试验设计。,例:为提高某产品的转化率,除考虑温度(因素A)、时间(因素B)、和用碱量(因素C)外,还要考虑搅拌速度(因素D)的影响。试验中对前三个因素拟选用三水平,但由于搅拌机只有快、慢两档速度,因此因素D只能选取二水平。虽然可选正交表,但需做18次试验。为减少试验次数,选用正交表。但因素D只有两个水平,为此为其凑了一个水
36、平3(快速),该水平就称为“拟水平”,因素D所在的列称为“拟水平列”。,因素D的K1为水平1和水平3的6个试验数据之和,最优生产条件:A3B2C2D2,因素影响的主次顺序:(主)ACBD(次),7.4.7 关于因素的交互作用,在许多试验中,不仅因素对试验指标单独产生影响,某些因素之间还会联合搭配起来对试验指标产生影响。因素对试验指标的总影响等于各因素单独对试验指标的影响与因素搭配对试验指标的影响之和。因素之间的联合搭配作用称为对试验指标的交互作用。,有交互作用时的正交试验设计应注意:交互作用作为单独的一列来处理,但不是一个因素,是两因素的联合搭配。要尽量避免交互作用与因素作用的混杂。交互作用只
37、用于试验结果分析,此时把交互作用作为一个因素来对待。有时因素的作用不明显,但因素与其他因素的交互作用对试验指标的影响却非常大(此时应特别注意优化水平的确定,否则将对试验指标产生重大的影响)。,7.5 正交试验设计的方差分析,正交试验设计的直观分析的优点是简单易行、直观易懂,但极差分析不能把试验过程中的试验条件的改变(因素水平的改变)所引起的数据波动与试验误差所引起的数据波动区分开来,也无法对因素影响的重要程度(显著性)给出精确的定量估计。为弥补直观分析的不足,可使用方差分析。,方差分析的指导思想,利用试验数据总偏差的可分解性,将各个因素偏差与试验误差分解开来,计算比较它们的平均偏差平方和,以确
38、定各因素对试验结果的影响程度和相对大小,从而找出对试验结果起决定性影响的因素。此外,利用方差分析还可检验各因素对试验结果的影响的显著性。,方差分析的种类,7.5.1 单因素试验的方差分析,在某项试验中,若只有一个因素的水平在改变,其它因素的水平保持固定不变,则称这样的试验为单因素试验。,单因素试验的方差分析仅研究分析一种试验条件对试验结果有无显著影响。在多因素试验中,若已知某一因素的影响最主要、需进一步细致地研究其深入的情况时,或研究其他因素的最大影响时,可以使用单因素方差分析。,单因素方差分析要求在同一水平下进行多次重复试验(通常重复数在36之间)。,示例,某产品要考察反应温度对收率的影响,
39、为此通过试验对两个反应温度水平A1=30、A2=40下的收率进行分析比较(该试验即为单因素试验,试验因素为反应温度A,试验指标为收率)。,不能根据某次试验的结果(如第1号试验,8975)判断水平的好坏。即使是平均值也仍然含有误差,也不能根据80.071.4就说比好。,原因:试验结果中既受水平变化的影响,也受试验误差的影响。,一般情况下,某次试验结果可表示成:,试验结果=总平均+水平效应+试验误差,试验误差:因试验材料、设备、人员、环境等随机因素的影响而使试验结果产生的差异。条件误差(水平效应或水平误差):因试验中因素水平的改变而使试验结果产生的差异。总误差:试验结果中数据之间的总差异,即试验误
40、差与水平误差之和。,为了考察某个因素对试验指标的影响,将总误差分解为条件误差和试验误差,并对两类误差进行比较(统计检验),作后作出因素对指标的影响是否显著的判断。这种分析方法就是方差分析法。,方差分析的关键:误差分解、显著性检验(常用F检验)。,方差分析的有关术语,设单因素试验中的因素共有m个水平,每个水平下重复进行n次试验,则试验共有mn个试验数据xij(I=1,2,m;j=1,2,n)。,组内平均值,某一因素水平Ai下所有试验数据的平均值。,组内平均值用作该水平下试验结果真值的估计值,因此水平Ai所对应的组内偏差可表示成,组内偏差反映的是第i个水平条件下的试验误差。,总平均值,所有水平下的
41、全部试验数据的平均值。,本例中,。,偏差平方和,为表征试验误差、条件误差,引入以下几种偏差平方和。,组内偏差平方和S2,将各水平下的偏差平方并求和,最后再将各水平下的偏差平方和相加后所得到的结果。,本例中,。,组内偏差平方和反映了试验误差的大小,是试验误差的定量估计。,组间偏差平方和S1,将各组(各水平下)的组内平均值对总平均值的偏差平方并求和后再乘以n,所得到的结果。,本例中,,组间偏差平方和反映了条件误差的大小,是条件误差的定量估计。,总的偏差平方和ST,全部试验数据对总平均值的偏差的平方和。,本例中,。,三个偏差平方和之间的关系:,上式表明,总的偏差平方和可以分解为组间偏差平方和与组内偏
42、差平方和之和。前者表征了由于因素水平的改变而引起的数据波动,后者则表征了由于试验存在随机误差而引起的数据波动。,方差 V,偏差平方和虽然可用来表征条件误差、试验误差的大小,但由于其中包括了求和项数(自由度)的影响,因此还不能直接用它们进行大小的比较。为此,引入了方差。,组内方差V2,组内偏差平方和除以其自由度所得到的结果。,组间方差V1,组间偏差平方和除以其自由度所得到的结果。,(有一个总平均值的约束),组内偏差平方和的自由度,组间偏差平方和的自由度,总的偏差平方和的自由度,(每组有 个独立数据,共m组),因此有,(有一个总平均值的约束),本例中,,显著性,为分析条件误差的显著性,常使用F检验
43、。试验的F值,根据F值的大小及给定的显著度,就可判断因素对试验指标的影响相对于试验误差对试验指标的影响是否显著。F值越大,因素的影响越显著。,根据自由度、及显著水平,可从F分布表中查得在这些条件下的临界F值。若实际的F值大于此临界值,则可认为有 的把握说因素对试验指标有显著影响。,F分布表(临界值 表),F分布表(临界值 表),F分布表(临界值 表),F分布表(临界值 表),本例中,,若取,根据、可查得,由于,因此因素水平的变化对试验指标无显著影响,试验数据的波动主要是由试验误差所引起。,单因素试验方差分析小结(一般步骤),列数据计算表,单因素A有m个水平A1Am,每个水平下重复试验k次,试验
44、中第i个水平下的第j次重复试验的结果为xij。,计算表中的数据按以下公式计算:,总的试验数据个数,偏差平方和分解,根据偏差平方和的定义,可如下进行计算:,总的偏差平方和,组内偏差平方和,组间偏差平方和,实际分析计算过程中,常先计算出 和,然后根据 计算出。,偏差平方和的分解也可采用下面的简便计算方法:,令,则,此外,当 的数值较大时,可对全部数据进行相同的加、减、乘、除运算,从而将它们转换成较小的,这样可以简化计算而不影响方差分析的结果。,方差(平均偏差平方和)计算,组内偏差平方和的自由度,组间偏差平方和的自由度,总的偏差平方和的自由度,三者关系:,因此,组内方差(组内平均偏差平方和),组间方
45、差(组间平均偏差平方和),总 方 差(总的平均偏差平方和),显著性检验,可以证明,、分别是自由度为、的 变量,是第一自由度为、第二自由度为 的F变量。根据上述基础可确定显著性检验的步骤如下:,计算试验的实际F值:,根据给定的显著性水平 及自由度、查F分布表,确定F的临界值。,(常取0.01、0.05、0.10、0.25),将试验得到的实际F值与各种 下的临界值 进行比较,得到因素水平变化对试验结果影响的显著性结论。,若,表示试验因素水平的改变对试验指标的影响特别显著,称“该因素高度显著”,记作“*”;,若,表示试验因素水平的改变对试验指标的影响显著,称“该因素显著”,记作“*”;,若,表示试验
46、因素水平的改变对试验指标的影响比较显著,称“该因素较显著”,记作“(*)”;,若,表示试验因素水平的改变对试验指标的影响比较小,称“该因素不显著但有影响”,记作“*”;,若,表示试验因素水平的改变对试验指标基本无影响,称“该因素无影响”,不作标记。,进行方差分析时,可制订如下的方差分析表:,7.5.2 同水平正交试验设计的方差分析,分析思路,设正交试验共有A、B、C、D、等实验因素(其中可能包括交互作用),试验共进行n次,因此有n个试验结果,记为。,求出总的偏差平方和、各因素偏差平方和 以及误差偏差平方和 之后,根据它们各自的自由度、以及,求出方差、以及,然后计算相对于 的F值,再分别与各自的
47、F临界值 等进行比较,对各因素影响的显著性进行分析、判断。,计算,设试验因素为A、B、,总的试验次数为n,每个因素的水平数相同均为m,水平的重复次数为r,试验结果为 或表示成(其中 为水平序号,为重复序号,为总的试验次数)。,总的偏差平方和ST,其中,所有n个数据的平方和,校正系数,总和,各因素的偏差平方和(组内,各列)SA、SB,其中,注意:计算 等时虽用同一公式,但括号中的 依据不同的因素而不同(参见后面的示例)。,试验误差的偏差平方和 Se(与正交表中的空列相对应),一般根据关系 反求得到:,注意:若试验存在因素的交互作用(例如),则将这种交互作用视为一个因素,在数据计算表中单独占据一列
48、并计算(计算方法见后),则有,反求Se时也必须将 考虑进去,估计显著性时也要对其做相应的考虑。,自由度,总的自由度,误差的自由度,若存在交互作用(例如),那么交互作用的自由度,则有,方差及F值,第一自由度为各因素(及交互作用)的自由度,第二自由度为试验误差的自由度。,查F分布表确定临界F值,判断各因素的显著性,根据自由度查得相应的 值进行显著性判断,判断方法同单因素试验。,举例,为提高某农药的收率进行正交试验,由经验知影响收率的有A、B、C、D四个因素(见水平表)且因素A、B之间存在交互作用AB。因素水平表如下。,选正交表、确定试验方案、进行试验、填数据、初始计算,这是一个四因素、二水平的试验
49、,但由于存在交互作用AB,同时要保留空列用于分析试验误差,因此选用正交表L8(27)。试验方案及试验结果如下。,计算,注意:,或,或,自由度,方差,或,各因素的F值,本例中各因素的自由度均为1,误差的自由度为2,故可查得各置信水平对应的临界F值为:,结果分析,主次顺序为(根据F值的大小来判断),(主)CABBAD(次),最优生产条件,因素C和交互作用AB对收率有显著影响,因此应寻求C的最佳水平及A、B的最佳搭配。,由计算结果可知,K14=-9、K24=13,由于试验指标(收率)为望大指标,故取C2。,进一步比较A1、A2、B1、B2的四种搭配对试验指标的影响(根据两次搭配情况下试验指标的平均值
50、),可确定最佳搭配为A2B1。,显然D取D2时的收率较高。,综上所述,最优生产条件为,A2 B1 C2 D2,7.5.3 不同水平正交试验设计的方差分析,不同水平正交试验设计的方差分析方法与同水平正交试验设计的方差分析方法基本相同,只是在计算偏差平方和时应注意各列中以下参数的不同:水平数、水平重复数、自由度。,以L8(4124)为例:,7.5.4 重复试验和重复取样的方差分析,为提高试验、分析的精确度和可靠性,有时还采取重复试验和重复取样。,重复试验:在安排试验时,将同一号试验重复做若干次得到在同一水平组合下的若干个数据。重复取样:在一个试验中,同时抽取若干个样品进行试验。,重复试验的方差分析