《试验设计与建模》-ppt课件.ppt

上传人:小飞机 文档编号:1567939 上传时间:2022-12-06 格式:PPT 页数:66 大小:1.24MB
返回 下载 相关 举报
《试验设计与建模》-ppt课件.ppt_第1页
第1页 / 共66页
《试验设计与建模》-ppt课件.ppt_第2页
第2页 / 共66页
《试验设计与建模》-ppt课件.ppt_第3页
第3页 / 共66页
《试验设计与建模》-ppt课件.ppt_第4页
第4页 / 共66页
《试验设计与建模》-ppt课件.ppt_第5页
第5页 / 共66页
点击查看更多>>
资源描述

《《试验设计与建模》-ppt课件.ppt》由会员分享,可在线阅读,更多相关《《试验设计与建模》-ppt课件.ppt(66页珍藏版)》请在三一办公上搜索。

1、试验设计和建模,周永道四川大学数学学院,试验设计和分析,教材: 方开泰、刘民千、周永道(2011),试验设计 和建模。,期末最终成绩构成: 期末考试: 70% 作业: 10% 随堂测试: 10% 小课题: 10%,软件: MATLAB, SPSS,参考书,方开泰、马长兴,正交与均勻试验设计,科学出版社,2001.Douglas C. Montgomery. Design and Analysis of Experiments, 6th Edition,中国邮电出版社, 2007.Hamada, M. and Wu, Jeff C.F., Experiments: Planning, Analy

2、sis, and Parameter Design Optimization , Wiley, 2000.Cornell, J.A. Experiments with Mixtures, 3nd Ed., Wiley, 2002.Fang, K.T., Li, R. and Sudjianto, A. Design and Modeling for Computer Experiments, Chapman & Hall/CRC Press, London, 2005.,第一章,试验设计的基本概念,1.1 科学试验,1.1.1 试验的重要性科学试验是人们认识自然、了解自然的重要手段。许多重要的

3、科学规律都通过科学试验发现和证实。随着科学和技术的发展,试验涉及的因素越来越多,它们之间的关系更加复杂,光凭经验已不能达到预期要求,于是产生了试验设计这门学科。设计一个试验涉及到试验目的、试验方案、技术保证、分析数据以及有关组织管理等。这些环节有的是属于管理科学,有的是需要数学和统计学的方法来设计试验方案,后者称为统计试验设计, 它是统计学的一个重要分支。,统计试验设计,是统计学的重要分支,它能大量节省试验的次数。能将试验数据从随机误差的烟幕中去伪存真,抓住事物的规律。 所以一个精心设计的试验是认识世界的有效方法 (Atkinson and Donev (1992)。,奠定了现代遗传理论的基础

4、,例1.1孟德尔豌豆实验,例1.2化工试验,在某化工产品的合成工艺中,考虑反应温度(A)、压力(B) 和催化剂用量(C),并选择了试验范围分别为:,温度(A): 80oC120oC;压力(B): 46 大气压;催化剂用量(C): 0.5%1.5%;,我们需要选择这三个因素的最佳组合,以达到高产的目的。,许多产品都是混合多种成分在一起形成的。,面粉,水,糖,蔬菜汁,椰子汁,盐,发酵粉,乳酸,钙,咖啡粉,香料,色素,面包,怎样确定各种成分的比例呢?,经验,试验,混料试验,例1.3 加工面包试验,例1.4环保试验,在水及食物中的某些化学元素,吃多了对人体是有害的,为了研究这些元素对人体健康的影响。,

5、48,275,138,试验设计的目的,增加产量提高质量降低成本缩短研究时间,科学试验是人类了解自然的手段,通过试验来了解因素和指标(响应)之间的关系,希望,一个好的试验设计是用最少的试验次数获得最多的有用信息。,试验设计的目的,水平组合的比较建模参数估计证实猜想优化筛选发现规律等等,Experiments are performed by investigators in virtually all fields of inquiry, usually to discover something about a particular process or system.,Scientific

6、experiments are of essential importance in peoplessurviving and exploring of nature.,A well designed experiment is an efficient method of learning about the world,Make it your motto day and night.,Experiment!,And it will lead you to the light.,Experiment!,The Usefulness of Experimental Design,多因素,统计

7、模型未知,响应曲面多峰,当代科学试验的复杂性,非线性,响应曲面无解析表达,多峰非线性模型,瞎子摸象,1.1.2 试验的重要元素,让我们首先通过一个例子来介绍一些重要元素,例 在一个化工试验中, 试验者希望通过如下 的可控变量来增加产量: x1:原料品种m1, m2, m3x2:加酸量 (ml) 10,28x3:反应时间 (时) 0.5, 3.5,因素(因子),在试验中可控的并用于考察对试验结果(y)的变量称为 因素 或 因子 (factor)。如反应温度、压力、催化剂品种、施化肥量、水稻品种等。,因素可以是 定量 的, 也可以是 定性 的。,水平 (level),因素变化的范围称为试验区域,

8、在本例中,试验区域为: m1, m2, m3 x 10,28 x 0.5,3.5.,原料品种:m1, m2, m3加酸量:10,19,28反应时间:0.5, 1.5, 2.5, 3.5,水平组合,因素诸水平的组合称为 水平组合 (level-combination), 如 m2, 10, 2.5, m1, 28, 0.5 。水平组合在文献中又称为 处理组合 。 一个因子设计 (Factorial design) 是一组水平组合。,处理, 响应,在试验环境下对确定的水平组合所作的试验称为一个 处理 (trial 或 run) 。,试验的结果称为 响应 (response), 响应可以是定性的,

9、也可是定量的。,不可控的诸微小因素之总和, 称为 随机误差。 同样条件下的两次试验结果可能不同。随机误差存在于一切试验之中。,随机误差 (random error),随机误差,随机误差可假定遵从 正态分布 。 方差给出随机误差大之度量 。,令 为重复试验之响应值,这里, 为真值,独立同分布,遵从 。,和 的无偏估计为,A,A1,A2,y,均值 = 190.5/6 = 31.75,自由度 : 5,NOISE,随机误差:,部份因子设计,设有 s 个因素, 它们分别取个水平。则全部水平组合有,一个 水平组合 可视为 s 维空间的一个点, 称为试验点 。,个。,例如, 一个六因素, 五水平的全面试验至

10、少需要 次试验。,全面试验,若所有的水平组合都作相同重复数的试验, 称为全面试验 。,在农业、生物等试验中,很难做到试验条件完全一样。区组的概念成为古典试验设计中非常有用的工具,同一区组的试验有十分近似的试验环境。区组设计可以避免或减少系统误差的干扰,从而大大提高试验结论的可靠性。在体育比赛中,区组及有关设计已在普遍使用。,区组,试验的环境随着时间的推移,可能有趋势型的变化,如室温渐高、湿度渐小、电压波动加剧等。为了使试验的结论更加可靠,随机化是用来减少试验误差的重要手段。常用的是对试验次序随机化,哪个试验先做,哪个试验后做,随机决定。若试验有区组,要根据试验的具体情形采取所有试验的完全随机化

11、,或仅区组内的试验随机化。,随机化,同一个试验重复两次或多次是减少试验误差干扰的一种方法,在传统的计算方法中经常使用。若 y1, ym 是同一个试验条件下的响应,且 yi 独立同分布,方差为 ,则均值 均值的方差,重复,传统试验的三个基本原则: 重复性、随机化、分区组,针对不同的试验,试验者要选择合适的试验方法,建立相应的统计模型,统计模型,试验的组织和管理,一支专业队伍明确的试验目标科学的试验方案试验中,处理可控与不可控因素,A. 试验实现方式:,1.1.3 试验的类型,传统的试验实验室试验工业试验计算机试验计算机模拟计算寻找近似模型,B. 因素约束条件,无约束试验 诸因素可以自由的选择试验

12、的值,不受其它因素约束,试验区域是一个超矩形 混料试验 因素之间的取值会相互影响,例如,或,单因素试验水平数可以适当多取,而且可以考虑做重复试验多因素试验各因素的水平数一般不能取得很大二水平试验多水平试验,C. 因素个数,D. 响应个数,单响应试验每次试验只观察一个响应值。如产量多响应试验每次试验观察多个响应值。如鞋子橡胶底的试验响应:强度、弹性和最大弯曲次数等等多媒体试验试验有无穷多个的响应。例如,响应是人的指纹、化学或生物中指纹曲线、声音的曲线、图像的颜色及深浅,等等,E. 试验轮次,单一试验一次试验达到要求序贯试验优选法响应曲面分析均匀序贯试验,单区组试验每次试验在相同或十分近似的条件下

13、进行区组试验目的是使得组内的差异比组间差异小常见的区组有以日、月、年、批次、双胞胎,等等,F. 试验分组,例1.5. (自由落体运动) 若不计空气阻力,自由落体运动的初始速度为零,记下落时间为x (秒)(s),下落距离y (米)(m),人们发现它们之间有如下规律 g 为重力加速度。设想试验者对关系(1.3) 一无所知,希望通过试验来揭示y 和x 之间的关系,1.2 统计模型,(1.3),试验结果,可用二次回归模型拟合,试验设计的统计模型,方差分析模型 因子设计,正交设计参数回归模型 最优设计非参数回归模型 均匀设计稳健回归模型,例1.6:威布尔生长曲线,方差分析模型,在0,10中取若干个点作试

14、验,设 x1, , xq 为试验点,n1, , nq 为其重复数,其统计模型为,用统计方法估计 1, , q 或 , a1, , aq, 以及 2,二水平试验在西方被广泛推荐,二水平不足以揭示非线性关系,多水平试验值得推荐,二水平试验的不足,试验范围对,但水平不合适,试验范围及水平都对,但不能揭示A和Y之间更复杂的关系,试验范围错,只能预报四个水平处的响应值,进一步采用回归模型是有益的。,因子设计,试验设计的统计模型,方差分析模型 因子设计,正交设计参数回归模型 最优设计非参数回归模型 均匀设计稳健回归模型,根据专业知识, 可选用适当的回归模型, 比如用二次模型,回归模型,其中函数 f1, f

15、m已知, 但参数 b1, bm未知。,或三次模型,更一般地,给定试验次数 n,希望能获得最精确的回归系数 b0, b1, 的估计。缺点:对模型的变化缺乏稳健性。Kiefer, J.C. (1958), Ann Math.Stat.Kiefer, J.C. (1959), JRSS, B, with discussionAtkinson, A.C. and Donev, A.N. (1992), Optimal Experimental Designs, Clavendon Press, Oxford,最优设计,三次回归模型的D-最优设计及其拟合,如果采用4次多项式模型,效果会显著地改进。,试验

16、设计的统计模型,方差分析模型 因子设计,正交设计参数回归模型 最优设计非参数回归模型 均匀设计稳健回归模型,式中函数形式 g(x)未知。希望通过试验求得g(x)一个近似模型。这时,一个自然的想法是将试验点在0,2上均匀散布,即均匀设计。,若试验者对模型未知,这时将面对非参数回归模型,非参数回归模型,均匀设计及其拟合多项式回归,均匀设计是一种试验设计方法。它可以用较少的试验次数,安排多因素、多水平的析因试验,当试验者对析因试验的统计模型未知时,均匀设计是最好的设计方法。均匀设计也是仿真试验设计和稳健设计的重要方法。,均匀设计,试验设计的统计模型,方差分析模型 因子设计,正交设计参数回归模型 最优

17、设计非参数回归模型 均匀设计稳健回归模型,稳健回归模型常用于部分模型已知的情形,此时,可用一些 稳健设计 或 均匀设计.,其中 f(x) 为已知函数,h(x) 为 偏离真实函数 的部分。,稳健回归模型,即 f(x) 为参数 的线性函数。,回归模型:yi, xi1, xi2, , xi,p-1, i = 1, , ny = b0 + b1x1 + b2x2 + + b p-1 x p-1 + eE(e) = 0,Var(e) = s2 未知或 yi = b0 + b1xi1 + b2xi2 + + b p-1 xi, p-1 + ei ei,en i.i.d. E(ei) = 0, Var(ei

18、) = s2.或更一般的, yi= b1 g1(xi) + b2 g2(xi) + + b p gp(xi) + ei ei,en i.i.d. E(ei) = 0, Var(ei) = s2.xi=( xi1, xi2, , xi,p-1), i=1, , n,1.3 回归分析简介,一般回归模型的矩阵表示:y = Gb + eE(e) = 0,Cov(e) = s2In其中 y : n1, G : np, b : p1, e : n1 其元素 i.i.d.,(1.14),线性模型 (1.14) 包括很多有用的模型:,线性模型通过原点的线性模型二次模型中心化二次模型,y = b0 + b1x1

19、 + b2x2 + + b p-1 x p-1 + e,y = b1x1 + b2x2 + + b p-1 x p-1 + e,(1.16),对于模型 (1.14) (a) 估计,模型 (1.14) 的最小二乘估计为 性质:,其中 M=GG 为 信息矩阵, 或有时称 M=GG/n 为信息矩阵.,s 2 的估计的矩阵表达形式,E(y) = XbCov(y) = s2In,0,为无偏估计.,对于线性模型 (1.16), 在实际中常检验下面的假设: (k=p-1),A. 检验模型是否有意义. H0: b1 = = bk = 0 VS H1: 某 bj 0, 1 j k,B. 检验某个变量 xj 是否

20、对模型有显著贡献. H0: bj = 0 VS H1: bj 0,(b) 假设检验,C. 更一般的假设 H0: Cb = f VS H1: Cb f,情形 A 和 B 都是情形 C 的特殊情形,y = Xb + e, e Nn (0,s2 In)Ab = c, A: q p (q p), c: q 1. Rank(A) = q,在某些限制 Ab = c 下的估计;没有限制下的估计.,定理 1 在有限制的模型下, 我们可得(i)(ii) 其中,假设检验理论:,定理 2 记 如定理 1 所示. 则对于情形 C, 我们有以下结论:(i)(ii)(iii) 当 H0 为真, 检验统计量为,证明可参 S

21、eber (1977).,假设检验理论(续):,情形 A H0: b1 = = bk = 0 VS H1: 某 bj 0, 1 j k,记 A = (0, Ip), c = 0, 则:,从定理 2 可得, 检验统计量为:,情形 A (续) H0: b1 = = bk = 0 VS H1: 某 bj 0, 1 j k 其检验常分解为 ANOVA 表:,情形 A (续) ANOVA 表: ( k = p - 1),情形 B H0: bj = 0 VS H1: bj 0记 A = (0,0,1,0,0) ej+1, 其中 1 位于第 j +1 个位置, c = 0. 则,记(GG)-1 = C = (cij)A (GG) -1A -1 = cj+1,j+1-1,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号