基于遗传算法优化理论变异函数的方法及应用1.doc

上传人:sccc 文档编号:5201472 上传时间:2023-06-13 格式:DOC 页数:7 大小:212KB
返回 下载 相关 举报
基于遗传算法优化理论变异函数的方法及应用1.doc_第1页
第1页 / 共7页
基于遗传算法优化理论变异函数的方法及应用1.doc_第2页
第2页 / 共7页
基于遗传算法优化理论变异函数的方法及应用1.doc_第3页
第3页 / 共7页
基于遗传算法优化理论变异函数的方法及应用1.doc_第4页
第4页 / 共7页
基于遗传算法优化理论变异函数的方法及应用1.doc_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《基于遗传算法优化理论变异函数的方法及应用1.doc》由会员分享,可在线阅读,更多相关《基于遗传算法优化理论变异函数的方法及应用1.doc(7页珍藏版)》请在三一办公上搜索。

1、精品论文大集合基于遗传算法优化理论变异函数的方法及应用1徐英 1,陈亚新 2,钱晓晴 3,周明耀 11扬州大学水利科学与工程学院,扬州(225009)2. 内蒙古农业大学 水资源与水土工程研究所,内蒙古呼和浩特(010018)3扬州大学环境科学与工程学院,扬州(225009)E-mail: xuying摘 要:结合变差函数拟合的特点,在遗传算法的基础上,提出了一种优化理论变异函数参数的新方法,并给出了应用实例。该方法不仅考虑了参与拟合的实验变差点的数目及各点对 理论变异函数的影响大小,而且可适用于各种线性、非线性及套合模型,计算精度、效率高,且比传统计算方法更有利于自动化的实现。关键词:地质统

2、计学;变异函数;遗传算法;参数估计;优化 中图分类号:S152.7文献标识码:A地质统计学作为分析空间变异数据的强有力的工具,长期以来在地质、地球化学、地球 信息科学、生态学等许多领域发挥着重要的作用。特别是,自上世纪 80 年代被引入土壤科 学领域后,在土壤调查、土地的精确管理等方面起到了不容忽视的推动作用,随着精确农业 技术的不断深化,它已经成为人们定量分析影响作物生长环境的空间变量信息的基本方法。 因而,如何获得可靠的地质统计学基本工具变异函数模型就至关重要,自然受到了许多 学者的重视。实践中人们可以得到的仅是由下式定义的实验变差函数点:i =1N (h )- 7 -1 2(1) (h

3、) =2 N (h ) Z (x i ) Z (x i + h )式中 (h ) 实验变异函数( (h ) 理论变异函数); x 采样位置; Z (x )采样点 x 处区域化变量的实测值;N (h) 间隔为 h 的点对数目;h 信息点之间的间隔(或距离),称为滞后距。以 h 为横坐标, (h ) 为纵坐标就可得到实验变异函数。用于分析空间变量变异特点和插值计算的理论变异函数须由实验变异函数点拟合而得。常用的理论变差函数模型有球状模型、指数模型、高斯模型、幂函数模型、对数函数模型、纯块金效应 和空穴效应模型等。由于这些理论变差函数常常为非连续可导,且参数较多,给参数模拟带 来困难,至今仍未有一种

4、比较理想的通用方法。最初拟合理论变异函数的方法是人工拟合法,但结果往往因人而异,缺乏统一的、客观 标准,且不利于计算机自动化的实现。后来有人提出用最小二乘法拟合,由于其对实验变差 函数点对数目的重要性强调不够,往往得不到最优结果。但实践证明,在既定的采样设计条 件下,理论变异函数的估计必须考虑实验变差函数点对数目1,2。1988年中国地质大学的王 仁铎、胡光道提出用加权回归多项式回归方法来拟合球状变差函数模型,该法优点是计算量 不大,用数据对数加权一般均可起到重视前三、四个点的作用,避免了平均主义的毛病。但 这种方法在实验变差函数点波动较大时,由于可能出现负解,而无法拟合到最优结果,且对 多级

5、及各向异性套合模型拟合比较麻烦3。矫希国、柏森、黄诗峰利用改进的遗传算法估计 了变异函数的参数,但忽略了参与拟合的实验变异函数点的选择及各参数点权重对理论变异 函数的影响,实际上和最小二乘法存在相同的问题4-6。但遗传算法作为一种全局优化算法,1本课题得到国家自然科学基金资助项目(50609023);扬州大学“新世纪人才工程”优秀青年骨干教师科 研经费的资助。在估计最优参数方面仍然不失为一种好方法。本文在已有的研究成果基础上,结合理论变异函数本身的最优性特点,提出了利用遗传算法估计变异函数模型参数的新方法,此法发扬以 上各种算法的优点,避免了它们的缺点,是一种很有效的方法。1. 理论变异函数基

6、本理论1.1 理论变异函数模型如前所述,理论变异函数模型有多种,其中应用最广泛的是球状模型,球状模型又有各 向同性模型(包括多级套合)和各向异性套合模型。在地质、矿业及水-土科学实践中,变 量各向异性是绝对的,各向同性则是相对的,是近似意义上讲的。因而求取空间变量在各个 方向乃至各向异性套合变异函数模型对研究变量的空间变异性及插值估计尤为重要。然而, 与各向同性模型及同一方向的一级模型相比,多级套合与各向异性套合模型的获得更为复 杂,一般不易一次求得。为此,本文选择各向异性套合模型介绍一种新方法,阐明它的优点。假设某区域化变量在 x , y 两个相互垂直方向上变异最大或最小, hx , hy

7、分别表示该 区域化变量在两方向上的滞后距,两方向具有相同的块金常数,基台值和变程不同,y 方向基台值 C y 大于 x 方向的基台值 C x ,且各向异性比 k = a x a y ( a x ,a y 分别表示 x , y 方向的变程),则总的结构可套合为:0 r = 0,hy = 0y 1 (r ) + 2 (hy )0 r ax (h ) = C0+ C x+ 2 (h )r ax ,0 kh y a x(3)yC0 + C x + Cr ax ,kh y axx其中: r =h + (kh)2 ;C = CCxy2h2(kh )2hx + (khy ) 3 khy1 (khy ) (r

8、) = C+ C 3x +ya2 1 2 3 2y ; (h ) =3C 2 a 2 a10x 2 a 3xxx x 这样,待估的参数就是 C0 ,C x , a x ,C y , a x ,为了使C= C y C x 始终为正,本文选择C 0 , Cx , a x , k , C 为待估参数。此处,各向异性比可以小于 1,这样,对于所有块金常数相同的带状各向异性和几何各向异性变量的变异函数套合模型都可以用(3)式表示, 并可用本文介绍的方法估计参数(这里仅指平面上呈各向异性分布的变量,不包括三维变 量)。1.2 最优性检验由于选择的实验变异函数点、权系数、拟合方法的不同,对同一实验变异函数可

9、以拟合 出不同的理论变异函数模型,究竟何者最优,需要有种方法来客观进行检验。一般有以下三种检验方法:(1)刀切法,即计算 (z * z )2 的值( z * 是某实测点上根据周围其它点对它的Kriging 估计值,z 是其实测值),该值越小表明理论模型确定的越好,这是由于理论变异函数模型计算的最终目的通常是为了用于 Kriging 估计2)离散方差检验法,即计算(z * z ) s * 2的值( z * , z 的意义 同上, s * 是相应的 Kriging 估计标准差),该值绕 1 波动表明理论变异 函数确定的好;(3)I 值检验法,它是上述两种检验指标综合成的一个检验理论变异函数最优 性

10、的指标:2I = (z* z) P 1 ( *1) * 2+ (1 P)(4)其中:z z s 0 . 1,P = if 0 (z z )2 1000 . 2 ,if 100 (z z )2P 为经验性参数。这种方法的好处是可以同时检验实验变异函数点选择的好坏与变异函数图 拟合的好坏,I 值越小表明变异函数确定的越好。为逼近最优变异函数,本文将以 I 值的大 小作为最优变异函数的检验指标。2. 基于遗传算法的理论变异函数优化本文提出的基于遗传算法的理论变异函数优化方法(由于用 I 值法检验最优性,为便于 叙述,简记为 IGA)设计如下:(1)确定编码方法为了改善遗传算法的计算复杂性,以提高运算

11、效率和精度,采用浮点编码方法,即个体每个基因值用某一范围内的一个浮点数(, C , a , k , C 之一)来表示,个体编码长度等于其决策变量的个数,即 5。C 0 xx(2) 确定目标函数及个体适应度评价方法就对实验变异函数点的拟合而言,目标函数 通常被确定为求下式的极小值6:n2f (X ) = ( (h) (h)i =1(5)式中 n参加拟合的实验变差点数目,其它各符号意义同()式。这一目标函数给予各 实验变差函数值相同的权重,认为各实验变差函数点具有相同的可信度,无法突出前三、四 个点的重要性,为此,本文取优化准则为极小化下式:n 2f (X ) =1 N (h )( (h ) (h

12、 )(6)n N (h ) i =1i =1各符号意义同前。这一目标函数以点对数为权重,完全克服了以上缺点。个体适应度评价函数确定为:F (X ) = max ( )( ) max(7)Cf Xif f X C0iff (X ) C max这样,该适应度函数值越大,相应个体适应度越高,遗传到下一代的概率越大。(3)适应度尺度变换为缩小遗传算法在运行初期阶段个体适应度的差异程度,维护群体 多样性,克服传统遗传算法早熟现象,且为了扩大遗传算法在运行后期阶段个体适应度的差 异程度,维护群体的竞争性,实现对重点区域重点搜索,本文对(7)式计算的适应度进行 了线性尺度变换7。适应度尺度变换公式如下:CF

13、F =avgFmax Favg Favg(F Favg) + Favg(8)minmin当上式中 F = F时,计算得 F 0 ,则改为用下式变换:FF =Favgavg Fmin(F Fmin )(9)其中。F 原适应度;F 尺度变换后的新适应度;C 最佳个体的期望复制数量,取为 1.5; Fmin ,Favg ,Fmax 原最小、平均、最大适应度; Fmin ,Favg ,Fmax 新的最小、平均、最大适应度。同样,新的适应度函数值越大,相应个体适应度越高,遗传到下一代的 概率越大。(5)选择采用确定式采样选择方法。这种选择操作方法可保证适应度 F 较大的一些个体 一定能保留在下一代群体中

14、,并且操作也比较简单,具体操作过程见参考文献7。(6)交叉将上步选择的 M 个个体以随机方式组成 M进行两两单点交叉,得到 M 个新个体。2 对配对个体组,依交叉概率 pc(7)变异为使遗传算法在起初始运行阶段( t 较小时)在解空间内进行均匀随机搜索, 而在后期运行阶段( t 接近于T 时)进行局部搜索,采用非均匀变异,即对个体的每个基因 座依变异概率 pm 在原基因值附近作轻微扰动。下面就该方法不同于其它拟合方法的特点作如下交代。(1)改进了目标函数(见上文),即优化准则。这继承了加权多项式回归法的优点,克 服了直接应用遗传算法6及线性规划方法4的缺点。(2)考虑了实验变差函数点的选择对理

15、论变异函数的影响。用于拟合的实验变差点不 同,得到的理论变异函数是不同的,为此,该法首先根据研究者的经验确定可能参与拟合的 最多点数 n2(可全选),然后有规律的减少实验点数,每减少一个点进行一次遗传算法拟合(包括上述遗传算法基本步骤的(1)(7)步),求得一个 I 值,直至减少到可能的最小点数 n1。最后选择最小的 I 值所对应的成熟个体,作为变异函数最优模型。这一步不仅有利 于实现计算机自动化,而且与(1)结合,还可充分利用研究者的经验。编程后加权多项式 回归法虽也可以完成这一步,但对于多级或各向异性变量需分段或分方向实现,不利于自动 化。至于直接应用遗传算法6及线性规划4等方法根本没有考

16、虑这一点。(3)用 I 值法检验变异函数模型,特别是(多级或各向异性)套合模型。最优的理论 变异函数模型必然同时包含变异函数图拟合最优与实验变异函数点选择最优,即 I 值最小。 套合模型而言,要求得最优模型(I 值最小),必须同时求得各单级或单向的最优变异函数。 对于常用的加权多项式回归等须分段、分方向推求各级、各方向模型的方法,虽然也能求到 单级或单向的最小的 I 值,并据以选择到较优的单级、单向模型,但不一定全局最优。3025201510SN实验EW实验5 SN理论 EW理论00 100 200 300图 1 土壤含水率变异函数图3. 实例分析某试验地以 50m50m 布置土壤采样网格,在

17、结点处共采集 78 个土样,其土壤含水率 实验变异函数值如图 1 所示。显然,该试验地土壤含水率的东西向变异大于南北向,具有异 向性分布,可以用带状各向异性球状模型拟合(式(3)。利用本文的 IGA 法、与文献6及加权多项式回归三种方法比较。IGA 法运行参数取值如下:种群大小 M= 100 ;终止进化代数T = 300 ;交叉概率 p c = 0.8 ;变异概率 pm = 0.1。另外,优化准则精度 = 0.001 。表 1 3 种方法估计土壤水分理论变异函数结果比较C0C1a1C2a2I 值IGA4.0121.21111.812.21111.812.48遗传算法(文献6)4.421.611

18、6.211.95123.212.95加权多项式回归法5.4522.84141.711.45135.713.15三种方法的结果比较如表 1。表 1 中两种遗传算法的各运行参数及待估参数取值范围均相同。表 1 可看出,IGA 法所得 I 值最小,其对应的参数是三种方法中的最优拟合结果。文 献6中介绍的直接应用遗传算法搜索最优解,由于没考虑实验变差函数点的置信度,将所 有点等同视之,且忽略了研究者对参与拟合点的选择,导致 I 值偏大,这在实验变差函数点 波动较大的案例中将可能更为突出。加权多项式回归法由于需分别拟合两个方向的变异函数 后,再进行套合,致使问题的完整性遭到破坏,因而结果不理想。总之,这

19、一实例充分表明 本文所提方法在实践中是可行的、有效的。4. 小结目前,地质统计学已成为研究各种空间变量必不可少的基础工具,变异函数拟合方法必 将推陈出新。本文提出的 IGA 方法不仅可充分考虑参与拟合的实验变差点的数目及各点对 理论变异函数影响的权系数,而且可适用于各种线性、非线性及套合模型,计算精度、效率 高,可完全自动化,这将为研究者提供更多方便,也有利于初学者对地质统计学的应用。参考文献1 Li Z,Stephen E S. Estimating the theoretical semivariogram from finite numbers of measurementsJ. Wat

20、erResour. Res.,2000, 36(1): 361-366.2 Patrick B,David Russo. Optimal spatial sampling design for the estimation of the variogram based on a least squares approachJ. Water Resour. Res.,1999, 35(4): 1257-1289.3 王仁铎,胡光道. 线性地质统计学M. 北京:地质出版社,1988.4 矫希国,刘超. 变差函数的参数模拟J.物探化探计算技术,1996,16(2):157161.5 柏森、李小敏.球

21、状模型的最优参数估计J. 物探化探计算技术,1998,20(1):25-29.6 黄诗峰、金菊良等.地质统计学中变差函数参数估 计的新方法J.地质与勘探,1999,35(1):41-43. 7 周明,孙树栋. 遗传算法原理及应用M. 北京:国防工业出版社,1999.A method and application of theoretical semivariogram optimization based on genetic algorithmXU Ying1, CHEN Ya Xin2, QIAN Xiao-qing3, ZHOU Ming-yao11. College of Conse

22、rvancy and HdraulicEengineering, Yangzhou University, Yangzhou (225009)2. Inner Mongolia Agricultural University, Huhhot (010018)3. College of Environmental Science and Engineering Yangzhou University, Yangzhou (225009 )AbstractCombining characteristics of estimating semivariogram parameters,a new m

23、ethod was proposedbased on genetic algorithm, and was followed by a case. It was thought necessary in the method that theoretical semivariogram estimation should include consideration of both the number of experimental semivariance points and the number of the data pairs. The applicability of the method is very wide, and it is helpful to improve the estimation accuracy and efficiency and to realize automatization of semivariogram estimation .Key words: Geostatistics; Semivariogram; Genetic Algorithm; Parameter Estimation; Optimization作者简介:徐英,(1972),女,内蒙古人,副教授,博士,主要从事水土资源的空间变异 性及非工程性节水灌溉措施研究。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号