《地质统计学.ppt》由会员分享,可在线阅读,更多相关《地质统计学.ppt(156页珍藏版)》请在三一办公上搜索。
1、地质统计 一门空间预测的科学点预测方法二.地质统计概论三.一元统计分析四.二元统计描述五.空间统计描述六.克里金技术七.分类变量的指标模拟八.孔隙度建模的高斯模拟十.渗透率的指标模拟十一.数据集成的模拟退火技术,一.点预测方法1 空间预测问题的提法2 就近取值法3 三角网预测法4 逆距离权预测法5 趋势面预测法6 加权线性估值,1 空间预测问题的提法 如何根据井点处的已知石油物理属性值来预测井间其他位置处的值?网格系统:三角网 矩形网,Locally different grids,2 就近取值法方法:直接取距被预测点最近的井点的值为预测值特点:等值面为不连续的柱状Voronoi多边形:俄国数
2、学家G.Voronoi在1908年用到他们。非结构网格的PEBI方法,3 三角网预测法方法:在井点之间布上三角形网格,每个三角形内部用线性插值。预测方程:Z*=a*x+b*y+c,其中a,b,c由以下方程给出:a*x1+b*y1+c=Z1 a*x2+b*y2+c=Z2 a*x3+b*y3+c=Z3等值面是连续的三角形屋顶平面面积坐标表示法:Z*=i3=1wiZi其中:wi=Si/(S1+S2+S3)Delaunay三角剖分:1934年提出用相邻Voronoi多边形的中心点连线形成剖分,4 逆距离权预测法方法:以到各井点距离的p次幂的倒数为权进行加权平均。预测方程:Z*=in=1wiZi,其中:
3、wi=ri-p/jn=1rj-p通常取p=2。特点:等值线连续光滑。受p影响大:p大等值图出现孤立圆弧区。p小局部特征减弱。搜索策略:影响半径R。取为变异函数的变程 4象限法,8象限法。规定每象限的最大点数。,5 趋势面预测法1.一次趋势面:Z*=a*x+b*y+c 系数方程:(in=1xi2)*a+(in=1xiyi)*b+(in=1xi)*c=(in=1xiZi)(in=1xiyi)*a+(in=1yi2)*b+(in=1yi)*c=(in=1yiZi)(in=1xi)*a+(in=1yi)*b+(in=11)*c=(in=1Zi)由 F(a,b,c)kn=1a*xk+b*yk+c-Zk2
4、=min 获得。F(a,b,c)/a=0,F(a,b,c)/b=0,F(a,b,c)/c=0,2.二次趋势面:Z*=a0+a1*x+a2*y+a3*x2+a4*x*y+a5*y2 系数方程:j5=0kn=1i(k)j(k)*aj=kn=1i(k)Zk,i=0,5其中:0=1,1=x,2=y,3=x2,4=xy,5=y2,3.三次趋势面、距离权抛物面插值等:,6 加权线性估值.基本想法是在一个我们不知道其真值的地方估计属性(例如孔隙度)的值 Z*(u)=i=1,n iZ(ui).其中u是位置矢量,Z*(u)是u处的估值,这里有n个数据点iZ(ui),i=1,n,i是权重.在确定权的时候应该考虑什
5、么:-与被估值点的远近-数据点的集群和遮蔽效应-变异性的大小-变异性的各向异性(偏爱方向)如何利用变异函数?那就是克里金方法,二.地质统计概论1 地质统计的历史回顾2 地质统计教学参考书3 地质建模要点4 一些关键的地质统计概念5 不确定性初探6 基于不确定性的决策制定,1 地质统计的历史回顾.现代形式的统计理论是在17世纪由Blaise Pascal和Pierre de Fermat奠基的(Gauss和Bayes是较近年代才加入的).地质统计技术是在20世纪早期由Kolmogorov,Weiner,Matern和Gandin等人建立的.地质统计学始于20世纪50年代,由南非的Krige和Si
6、chel,以及60年代法国的Matheron所开创。Matheron的两名早期的学生(Jounel和David)分别到美国和加拿大建立了新的地质统计研究中心.地质统计技术的应用在采矿业和气象学中变得流行起来。今天,这些技术已经应用到许多陌生的领域,象鱼群搜索、造林、环境改造等.广泛地被各大石油公司采用.众多的研究中心,包括Stanford,Fountainbleau和其他,如Alberta大学,2 地质统计教学参考书(教师:刘明新 62098050)1.Reservoir modeling with GSLIB(213p 2.5M pdf)http:/,2 地质统计教学参考书6.王政权,199
7、9,地质统计学及在生态学中的应用,北京,科学出版社7.侯景儒,1992,实用地质统计学,北京,科技大学,3 地质建模要点(3.基于网格的模拟).按岩相、孔隙度和渗透率的次序相继进行,基于网格的随机的3维模拟.保证重要的非均质性和统计特征.由岩心、测井、地震和露头获得统计控制条件,3 地质建模要点(4.基于对象的模拟).对于清晰定义的几何对象采用基于的对象的、随机的3维模拟.假想遗传地模拟沉积历史.由岩心、测井、地震和露头获得统计控制条件,5 不确定性初探.给定从1到49连续编号的49个小球,那么从中任取6个,它们号码的平均值是怎样的呢?.准确的答案肯定是3.5到46.5中间的一个数(有13,9
8、83,816种组合).最大的可能值是2.5.最佳答案依赖于:1.平均值的不确定性2.错误选择的代价随机模拟定量化了不确定性不确定性的分布,5 不确定性初探(随着有效数据的增加而减少).回到前面的关于从49个1到49连续编号的小球中任取6个,求它们号码的平均值例子,6 基于不确定性的决策制定1.错误的代价:损失函数.我们要带雨伞吗?-不确定性:会下雨吗?-欠估计的影响:被淋湿。-过估计的影响:带着没用上。.我们要设计多高的水坝?-不确定性:在水坝生命周期内最大的降雨有多大?-欠估计的影响:大坝坍塌,财物损失。-过估计的影响:花费了多余的材料和劳力代价。.我们需要清理一个潜在的垃圾点吗?-不确定性
9、:脏的程度如何?-欠估计的影响:由于健康问题而遭遇保险声明或法律纠纷。-过估计的影响:不必要的清理代价。,6 基于不确定性的决策制定(2.最优估计).(基于不确定性和错误代价)损失函数把错误影响定量化:,6 基于不确定性的决策制定(3.对混相驱设计的应用).被优化的决策:需要注入多少表面活性剂?.答案取决于连通孔隙体积的大小.连通孔隙体积大小的不确定性可以用地质统计模拟来定量化.损失函数是表面活性剂花费和油价的函数,6 基于不确定性的决策制定(3.1地质统计模拟).一个油藏的多个等价的随机实现,6 基于不确定性的决策制定3.2连通孔隙体积的不确定性.运行随机游走扫及程序来求得每一个地质统计模拟
10、,则可以获得连通孔隙体积的分布 现在,应用损失函数和计算机,你就可以求出需要多少表面活性剂了。,6 基于不确定性的决策制定(3.3结果).简单的回答集成了不确定性和错误代价的分析.在最优决策的图中给出了各种油与表面活性剂价格比情形下的决策结果,三.一元统计分析1 频度表和直方图2 累计直方图3 位置测量4 展形测量5 形态测量6 正态分布,1 频度表和直方图1.一元描述.直方图:样品按类别的计数.有时,需要两个坐标刻度以 显示细节(用坐标框).有时可采用对数刻度.统计量总结-均值对数值异常点敏感-中位数对分布中点处的缝隙敏感-用选择的分位数对分布进行定位(如,4分位数)-展布由标准差度量(对极
11、端值非常敏感).GSLIB程序:histplt,1 频度表和直方图2.数据采样 本例采用一口井的声波时差测井曲线作为数据源。在3111到4603英尺的深度段每0.5英尺采样一次,共有2985个声波时差采样数据。记为:xi,(i=1,2950)其最小值 Xmin=64.5 最大值 Xmax=159.6,1 频度表和直方图3.频度表 类别 点数 频度(百分比),把x方向从Xmin到Xmax之间200等分,1 频度表和直方图4.直方图(X,频度)图,2 累计直方图(1.与直方图的关系).累计频率是小于或等于给定门限值的样品总体频率或累计分数.累计频率曲线不依赖于箱宽:在数据的分辨率下它也可以绘出.是
12、一个变量描述性工具,可用来作为参考,2 累计直方图3.累计直方图 其值0 且 1。此处用曲线表示,形成一条单调上升的曲线。x区间等分为200份,3 位置测量1.均值:m=(1/n)i=1,n xi m对异常高值敏感。本例中:m=120.3232.分位点q0.25,q0.5q0.75,3.中位数M=q0.5本例中:m=120.607,3 位置测量4.其他分位点上4分位点Q1=q0.25下4分位点Q3=q0.75十分位点=q0.1百分位点=q0.013.众数 直方图最高点处对应的X。最小值:Xmin最大值:Xmax,4 展形测量1.方差:2=(1/n)i=1,n xi-m2 对异常高值敏感。2.标
13、准差:=2本例中:=8.839143.四分位间距:IQR=Q3-Q1本例中:IQR=7.88838,6 正态分布1.正态分布 N(m,2)=1/(2)exp-(x-m)2/(22),四.二元统计描述1 散点图2 相关系数3 条件分布4 Monte Carlo模拟5 Q-Q曲线6 两个不同分布的变换7 应用实例,1 散点图1.形式.双变量显示,预测 值与真值、两个相 关变量、或同一变 量在相隔一个矢量 距离上的取值等.关注双变量的总体.边上的直方图,2 相关系数1.协方差Cxy=j=1,n(xj-xm)(yj-ym)2.相关系数在-1到+1之间取值,对离群点非常敏感 j=1,n(xj-xm)(y
14、j-ym)R=j=1,n(xj-xm)2 j=1,n(xj-xm)2几何解释:两个n维矢量的夹角余弦减均值:以数据中心为原点,去系统误差除标准差:变为单位矢量,3 条件分布1.条件分布具有已知孔隙度值的渗透率可能取值的分布.条件分布的预 测是地质统计 算法的核心之 一,4 Monte Carlo模拟(1.累计直方图).累计频率是小于或等于给定门限值的样品总体频率或累计分数.累计频率曲线不依赖于箱宽:在数据的分辨率下它也可以绘出.是一个变量描述性工具,可用来作为参考,4 Monte Carlo模拟2.分位数.分位数是对应于给定的累 积频率处的变量值-第一4分位数=0.25分位数-第二4分位数=0
15、.5分位数-第三4分位数=0.75分位数 可以从累计频率曲线上读出任何分位数.也可以从累计频率曲线上读出概率区间(如,90%概率的区间).直接联系到频率,4 Monte Carlo模拟3.Monte Carlo模拟.又叫随机模拟/随机绘制通过在累积分布上读分位数来实现步骤:.生成0-1间的随机数(计算器、表、程序).读和该随机数相应 的分位数例如:,5 Q-Q曲线1.定义Q quantileP probability.比较两个一元分布.Q-Q曲线是分位数-分位数曲线直线意味着两个分布具有相同的形态.P-P曲线是累计概率-累计概率曲线直线意味着两个分布具有相同的形态.Q-Q曲线具有数据的单位制,
16、P-P曲线永远在0-1之间取值.GSLIB程序:qpplt,5 Q-Q曲线2.数据.对每个数据集排序.计算它们各自的累 积分布函数(CDF).按CDF值配对,5 Q-Q曲线(3.建立Q-Q曲线).岩心孔隙度和测井曲线的孔隙度的直方图.该特殊的例子解释了差别:由于不存在“配对”样品,我们不能确定样品的偏差,5 Q-Q曲线(3.建立Q-Q曲线).从累计频率曲线中读相应的量.把这些量绘制到曲线中,6 两个不同分布的变换(1.方法).通过匹配分位数方式能够变换数据以使它们具有不同的直方图.许多地质统计技术要求数据被变换到高斯或正态分布,7 应用实例1.向正态分布的转换,7 应用实例1.向正态分布的转换
17、,7 应用实例(3.1测井渗透率的CDF),7 应用实例(3.2裂缝强度的CDF),7 应用实例(3.3裂缝强度q与渗透率K关系曲线),7 应用实例(3.4变换渗透率的CDF),7 应用实例(3.5 渗透率场的显示),五.空间统计描述1 变量的空间相关性2 变异函数概要3 经验变异函数的计算4 经验变异函数的解释5 变异函数计算的挑战6 变异函数的模型,1 变量的空间相关性(1.发现).考虑由滞后矢量分开的首、尾点对上的数据值(相关、误差),1 变量的空间相关性(2.变异函数概念).变异函数是对空间相关性进行定量化描述的工具,1 变量的空间相关性(2.变异函数概念).空间变异性或连续性的度量依
18、赖于岩石物理属性的详细分布。我们的测量必须对每个油藏、每个属性(或K)分别进行.依据成岩水平,在一个类似沉积环境内空间变异性也应是类似的。这种认识导致露头研究。,2 变异函数概要1.简要历史-地质统计学由南非的Krige和Sichel以及法国的Matheron所开创。Matheron的两名早期的学生(Jounel和David)分别到美国和加拿大建立了新的地质统计研究中心 50年代,克里格(D.G.Krig,南非矿业工程师)60年代,马特隆(G.Matheron,法国巴黎矿业学院教授)90年代,随机建模,美国斯坦福大学,2 变异函数概要(5.变异函数的定义).以概率论的表示法,变异函数定义为:2
19、(h)=EZ(u)-Z(u+h)2-对所有可能的位置u求期望.滞后h的变异函数近似定义为对相距h的两点值之间的差的平方取平均值:2(h)=1/N(h)N(h)z(u)-z(u+h)2其中N(h)是滞后h的点对的数目,2 变异函数概要(6.变异函数与协方差函数之间的关系).考虑残差值:Y(ui)=Z(ui)-m(ui),i=1,n.其中m(u)可以是常量、局部变化或未知常量.变异函数定义为:2(h)=E Y(u)-Y(u+h)2.协方差函数定义为:C(h)=E Y(u).Y(u+h).变异函数与协方差函数之间的关系:2(h)=EY2(u)+EY2(u+h)-2.EY(u).Y(u+h)=VarY
20、(u)+VarY(u+h)-2.C(h)=2C(0)-C(h)从而,C(h)=C(0)-(h),3 经验变异函数的计算(4.计算:其他滞后).现在,重复到所有的节点.并且重复到所有的滞后,3 经验变异函数的计算(5.实例),3 经验变异函数的计算(5.实例),4 经验变异函数的解释(1.基础).拱顶值(sill)=方差(经正态校正的数 据=1).变程(range)=变异 函数接近拱顶值时 的距离.块金效应(nugget)=地质微构造和测量误差的总和-任何对数据值的测量误差或对数据值的人为指定都会导致较高的块金效应-数据点稀少也会导致较高的块金效应,4 经验变异函数的解释(2.实例).纵向渗透率
21、变异函数.拱顶值:清晰定义(logK数据的方差).块金效应:似乎太高,4 经验变异函数的解释(3.全方位变异函数),6 变异函数的模型(1.基础).对经验变异函数建立一个适合克里金和随机模拟(以后介绍)需要的规范的(正定的)变异函数模型。保证:.对所有的滞后矢量h都存在协方差.变异函数成为距离的一个规范度量正定模型的和仍是正定模型。可以用已建立起来模型的线性组合来模拟变异函数。一些通用的变异函数模型:幂函数模型,块金效应模型,球状模型,指数模型,高斯模型,6 变异函数的模型(2.公式),6 变异函数的模型(3.实例),6 变异函数的模型(3.实例)孔隙度变异函数,六.克里金技术1简单克里金2
22、其他克里金3 克里金效果4 多区域克里金5 协同克里金6 克里金总结7 模拟结果的检验,1简单克里金1.公式推导定义残差值:Y(ui)=Z(ui)-m(ui),i=1,n其中m(u)可以是常量、局部变化或未知常量考虑线性估值:Y*(u)=in=1iY(ui)误差的方差为:E Y*(u)-Y(u)2=,令误差的方差对最优权i,i=1,n求偏导等于0:jn=1jC(ui,uj)=C(u,ui),i=1,n这个含有n个未知权的n个方程组成了简单克里金(SK)的方程组。从而,误差的方差为:E Y*(u)-Y(u)2=in=1ijn=1jC(ui,uj)-2in=1iC(u,ui)+C(0)=in=1i
23、C(u,ui)-2in=1iC(u,ui)+C(0)=C(0)-in=1iC(u,ui)从而说明,简单克里金实际上给出了被预测点处预测值的一个高斯分布。,1 简单克里金2.详细方程.确定3个权的3个方程是:.用写成矩阵形式:(注意,C(h)=C(0)-(h),2 其他克里金(1.概要)-现代应用是在随机模拟算法中建立不确定性的局部分布.利用最小化误差方差的方式求得未知量 z*(u)=i=1,n i(u)Z(ui)+1-i=1,n i(u)m.对于简单克里金(SK):没有约束且均值m已知2 其他克里金(2.普通克里金).普通克里金(OK):约束权的和等于1 z*(u)=i=1,n i(u)Z(u
24、i)i=1,n i(u)=1+j=1,n j(u)C(uj,ui)=C(u,ui),i=1,n,2 其他克里金(3.泛克里金UK).带有趋势模型的克里金(KT)认为m未知且具有形态已知但参数未知的复杂形式 m(u)=i=1,L ai fi(u).其中m(u)是局部均值,ai,j=1,L是驱使模型的未知系数,fi(u)是坐标的低次幂。GSLIB允许9个不同的坐标幂形式x、y、z、xx、yy、zz、xy、xz、yz,可以产生坐标的二次函数2 其他克里金(4.扩展).具有外部趋势的克里金是KT的扩展。它考虑一个在每个位置由某些外部变量事先定义的单个趋势函数f(u).协同克里金是带有不同类型数据的克里
25、金.指标克里金的目标不同不是给出估值,而是建立一个条件cdf(累积分布函数),2 其他克里金(5.实例_UK),2 其他克里金(5.实例_UK),2 其他克里金(5.实例_OK)小层沙体有效厚度分布,2 其他克里金(5.实例_UK)小层沙体三维空间展布,3 克里金效果1.实例各向同性变异函数各向异性变异函数,3 克里金效果1.实例_用各向同性,5 协同克里金,7 模拟结果的检验(1.准则).在建立地质统计油藏模拟的过程中许多独立的目标决策被作出。有些事情需要检验:-模型是否地质上貌似合理?-相比于其他模型,飞均质性的分布是否合理?-孔隙度和渗透率模型是否语言是类型模型兼容?-层内地质相关类型正
26、确吗(错误的z相关)?.模型表征了所有的输入数据吗?-局部已知数据(绘出结果曲线),-去集群化的直方图(Q-Q图),-变异函数-孔隙度和渗透率间的交会图,7 模拟结果的检验(1.准则).所用的技术通过了所有的交叉验证了吗?.模型能够用在建模过程中没有采用的数据(即,试井与生产历史)检验吗?,7 模拟结果的检验(2.为评估直方图再现的Q-Q图).Q-Q图用来比较两个直方图或均匀分布,即,对于特定区域规定岩石类型的输入去集群化直方图和最终3维模型的分布.一种匹配两个分布的分位数的绘制。例如,第一个分布的中位数与第二个分布的中位数组成图上的一点,如果许多不同分位数的点(1%,2%,98%,99%)落
27、在一条直线上,则两个分布一致.两个坐标轴是数据单位的。下面给出了一个大型碎硝沉积油藏一个区的例子:,7 模拟结果的检验(3.变异函数再现的评估).对三个主要方向同时绘出输入的变异函数模型(实线)和3维实现(点线)的变异函数:,七.分类变量的指标模拟序贯模拟:概念序贯模拟的步骤SISIM程序,7.6 指标模拟 1.指标变换的定义:i(u;k)=1,如果岩相k在位置u出现 0,否则 2.岩相k在位置u出现的概率 的计算 岩相k在位置u出现的概率=EI(u;k)=(1/n)n=1wi(u;k)其中权系数w考虑了数据集群效应的影响。3.指标的平均值等于全局概率,7.6指标模拟 4.指标变异函数:度量空
28、间相关性 I(h)=(1/2)EI(u;k)-I(u+h;k)2,7.1 序贯模拟:概念1.把已知数据向最临近节点赋值2.建立一个走遍全部节点的随机路径3.访问每个节点:(a)找到附近的数据点及前面模拟过的节点(b)用克里金方法构建条件分布(从这里变异函数被利用)(c)由该条件分布产生一个模拟值4.检验模拟结果,7.2 步骤一:将井数据赋值到网格(中心)1.为什么要这样做?(a)显式地表示数据,原始数据值能出现在最终的3维模型中。(b)改善算法的CPU速度,使对前面已经模拟的数据的搜索和对原始数据的搜索一步完成。2.实施时的具体技巧:(a)如果有多个数据要赋值到同一个网格单元,仅取利网格中心最
29、近的一个。,7.3 步骤二:建立一个随机访问路径 1.在该随机访问次序中必须访问每个单元一次,且只有一次。2.有许多方法可以实现这点:(a)产生0-1区间均匀分布的随机数,并用总网格数N去乘它作为该次访问单元的网格号(若该网格尚未被访问过)。(b)通上,但用查找存放于数组中的随机数表来取代生成随机数。3.跳过所有已经被赋值的网格单元。,7.4 步骤三:寻找最近的一些已经有值的网格单元 1.有值的网格单元指那些被赋予井点值的单元和在前面的随机访问中已经求得值的单元。2.通常采用搜索半径来确定最近的有值网格单元。3.关于有值网格单元数方面的实际考虑:(a)分别在8象限中搜索?(b)每象限中的最大有
30、值网格单元数(例如4)(c)最大有值网格单元数,7.5步骤四:构建局部条件概率分布1.局部条件概率的约束:(a)每种岩相类型的全局概率(b)局部临近点的数据(c)象地震等软数据提供的局部概率2.对每种岩相类型用经二值指标变换后的克里金插值来实现。,7.7步骤四:用克里金技术构建局部条件概率分布 1.给定了n个邻近点的数据k(ui),i=1,n,我们如何计算局部条件概率分布呢?2.每种岩相类型的局部条件概率p*k(u),k=1,K由临近数据的一个线性组合来确定:p*k(u)=n=1(u)I(u;k)+1-n=1(u)mk其中,权系数(u),=1,n由求解克里金方程组来确定。3.克里金权系数考虑了
31、:(a)数据集群效应的影响。(b)数据距离被插值点的远近影响。,7.8步骤五:产生一个随机实现 1.由克里金过程可以得到该点K个岩相类型的条件概率分布p*k(u),k=1,K,从而我们可以做成一个累计概率分布。2.在该点处产生一个随机实现的步骤:(a)产生一个0,1区间均匀分布的随机数。(b)从累计直方图(概率分布)上找到所对应的岩相类型k。(c)把岩相类型k赋予该网格。3.由于条件概率是由克里金用给定的变异函数k(h),k=1,K得到的,从而模拟值从整体上也应该满足这些变异函数。,7.9 序贯指标模拟SISIM中的详细步骤 1.建立网格和坐标系统(在真实Z的空间中)2.把井数据赋值到最近的网
32、格上(多口井对一个网格时取最近井)3.确定一个能访问到所有网格点的随机路径并实施:(a)找到最近的一些有数据点(包含前面已经求得值的网点)(b)用克里金技术构造局部条件概率分布(c)从条件概率产生一个随机实现值4.结果检验:(a)表征原始数据点了吗?(b)表征全局概率了吗?(c)表征了变异函数了吗?(d)看起来合理吗?,八.孔隙度建模的高斯模拟岩石物理属性的模拟高斯模拟序贯高斯模拟序贯高斯模拟的步骤SGSIM程序,8.3 预测与模拟的差别 1.预测保证了原数据点准确,且属剧场光滑。适合于对趋势的可视化。由于没有体现极端值的影响和全局不确定性,因而不适合于流动模拟(油藏数值模拟)2.模拟除保证原
33、数据点准确外还表征了分布特征、空间相关特征(变异函数),接受不确定性和多重实现,因而适合于流动模拟,8.5 为什么要序贯高斯模拟采用高斯分布是因为它在建立条件概率分布方面的极端简单性,确定高斯分布仅需两个参数:均值和方差。而它们又可通过克里金获得1.在求变异函数之前,就把原始数据变换为标准正态分布。随后的3维模拟都在标准正态分布的空间中进行2.用克里金方法计算局部条件概率分布,要求其表征:(a)全局直方图:N(0,1)(b)局部数据(c)软数据(地震数据、生产数据等)4.完成全部模拟后,再把数据变换回原始的分布*数学简单性的代价是空间熵的最大化:低值和高值不能直接相邻而必须渐变。不适合渗透率模
34、拟。,8.14 SGSIM中的详细步骤:1.变换数据到标准正态分布空间2.建立网格和坐标系统(参考Z空间)3.把井数据赋值到最邻近的网格(多口井对应一个网格时取最近井的)4.确定一个访问全部网格节点的随机访问次序(a)搜索邻近的有值网格,包括数据点和前面已模拟的点(b)用克里金构建局部条件概率分布(c)从条件概率产生随机实现5.计算结果的检验(a)表征了井数据吗?,8.14(b)表征了直方图吗?具有均值0,方差1的标准正态分布N(0,1)?(c)表征了变异函数吗?(d)表征了所要表达的地质概念吗?6.把模拟结果转换到原始数据空间,十.渗透率的指标模拟讨论考虑软数据的问题回顾传统的技术序贯指标模
35、拟实例,10.1 数据的指标化1.局部硬指标数据i(u;z)来源于局部硬数据z(u)i(u;z)=1,如果z(u)z 0,否则 2.局部软指标数据y(u;z)来源于关于z(u)的先验概率等辅助信息。y(u;z)=Prob Z(u)z|局部信息 y(u;z)0,1 且不等于全局先验概率F(z)3.全局先验累计概率F(z)是对平稳区A内的所有点都成立的概率 F(z)=Prob Z(u)z,对全部uA,10.2 指标克里金(IK)1.利用邻近数据点建立一个累计分布函数cdf。2.可以计算出一下各类结果(a)局部条件平均(E型预测)(b)大于门槛值z的概率(c)对应任何概率的z值(d)概率区间(e)截
36、断统计,10.3马可夫-贝叶斯(Markov-Bayes)模型 1.指标克里金(IK)过程可以看作是把局部的先验cdf放入一个后验的cdf的Bayes实现。而这个后验的cdf利用了邻近数据点的局部先验cdf。ProbZ(u)z|(n+m)*IK=0(u)F(z)+n=1(u;z)i(u;z)+m=1(u;z)y(u;z)其中(u;z)是关于n个硬指标数据点的权,(u;z)是关于m个软指标数据点的权,0(u)是关于全局先验cdf的权。2.解释:左端表示得出的是一个累计概率。0(u)项是全局先验累计概率的贡献,前一个求和是硬数据的贡献,后一个求和是软数据的贡献。3.为保证无偏,0(u)应满足:0(
37、u)=1-n=1(u;z)-m=1(u;z),10.3 4.该式也可以看作是整合不同类型数据与一起的协同指标克里金平台:(a)指标硬数据i和j(b)软的先验概率y等5.Markov-Bayes模型是一个由下式给出其协方差矩阵的模型:CIY(h;z)=B(z)CI(h;z),对全部h CY(h;z)=B2(z)CI(h;z),当h0|B(z)|CI(h;z),当h=0 6.系数B(z)来源于软数据y(u;z)到硬数据I(u;z)的校正,具体为:B(z)=m(1)(z)-m(0)(z),-1,1其中:m(0)(z)=E y(u;z)|I(u;z)=0 m(1)(z)=E y(u;z)|I(u;z)
38、=1,10.4 次序关系校正 1.由于计算误差的影响,由克里金得到的局部累计条件概率分布有时不满足累计概率的基本要求,为此必须进行校正。2.下左图是计算结果,下右图是校正后的结果,十一.数据集成的模拟退火技术讨论渗透率预测的问题介绍具有协同模拟特点的模拟退火技术模拟退火技术的细节实例SASIM程序,11.1 渗透率的回归类型的确定性预测方法1.传统预测渗透率的方法(a)线性回归(b)二次、三次,回归(c)按孔隙度分类的平均或各种条件平均2.特点:(a)极端低或高值被光滑掉了(b)没有反映不确定性(c)变换后的渗透率具有不正确的空间相关性,11.1 3.我们的考虑:(a)对于地下渗流,极端低或高
39、的渗透率值具有更大的影响(b)由于渗透率K的硬数据比孔隙度的更少,从而其空间相关性就变得更为重要(c)渗透率K与孔隙度相关(d)先建立孔隙度模型,然后建立渗透率模型(纯粹的第二变量),11.3考虑软数据的模拟退火技术 什么是模拟退火(annealing)?模拟退火是一种优化算法,它模仿了金属缓慢冷却的物理过程1.把目标函数O作为能量函数2.对一个初始化实现进行冷却:(a)扰动系统以模仿热扰动(b)永远接受能使O更小的情形(c)有时也有条件地接受使O增加的情形(d)缓慢地进行冷却,直到找到一个最小能量解接受概率:P接受=exp-(O2-O1)/(cT),当O2O1 1,当O2O1温度以的比率降低
40、,n=0.8-0.9,n为每温度段跌代步数,11.3 什么是协同模拟(cosimulation)?1.协同模拟就是生成一个变量的数值模型,而这个变量又要受到另一个变量的值的约束。例如:(a)模拟受到孔隙度值约束的渗透率(b)模拟受到测井数据约束的孔隙度(c)序贯地模拟多个变量,11.4 模拟退火技术的发展历史 1.模拟退火技术是组和优化领域的一个解法,它模仿了金属缓慢冷却的物理过程。解一个组合优化问题涉及在有限或无限可数个可能的解中寻找“最佳”或“最优”的解2.该技术早在1980年代由Kirkpatrick,Gelatt与Vecchi1992;1983和Cerny1985分别引入3.“模拟退火
41、过程”可追溯到1953年Metropolis,Rosenbluth,Rosenbluth和Teller&Teller的工作4.在空间统计中的应用:(a)Geman and Geman,1984(b)Farmer,1989(c)Others,1990-现在5.在模拟退火技术的应用中不存在显式的随机函数模型,相反,一个模拟实现的产生是靠用随机松弛或“模拟退火”技术来求解一个最优化问题获得的,11.6 渗透率模拟退火算法的步骤 1.建立一个表征井数据的初始猜测在每一单元指定一个渗透率值K,它满足该单元孔隙度所约束的渗透率条件分布2.初始化目标函数的计算原始的变异函数与当前数据场的变异函数差的数值度量
42、等3.改变一个网格的渗透率随机地选择一个非井数据网格,改变其渗透率K为一新的值,它满足该单元孔隙度所约束的渗透率条件分布4.评估新的目标函数值(a)更好:接受该新K值(b)更差:抛弃该新K值5.该目标函数是否足够接近于0?(a)是:完成迭代(b)否:转到3继续迭代,11.7 实例 1.目标函数:O=iNh=1*z(hi)-z(hi)2,11.8 目标函数1.表征孔隙度-渗透率交汇图:Oc=in=1jnk=1f(i,Kj)模型-f(i,Kj)实现2其中f(i,Kj)是第(i,j)单元格内的概率密度2.表征变异函数:Oc=in=1i模型-i实现2,11.9 一个简单实例 1.已有孔隙度曲线,需产生
43、相应的渗透率曲线2.用一个表征变异函数的目标函数,11.9 3.计算结果,11.10 在目标函数中不同约束的加权1.权vc等价于该目标(约束)分量Oc在整个目标函数O中的贡献:O=cn=1vcOc2.权vc的计算是通过反比于目标分量Oc改变量绝对值的平均进行的:vc=1/ave(|Oc|),c=1,C3.ave(|Oc|)在数值上由M次迭代的的平均获得:ave(|Oc|)=(1/M)mM=1|Ocm-Oc|,c=1,C4.总体目标函数有时也表达为标准形式:O=(1/O(0)cn=1vcOc,11.12 渗透率的模拟退火1.模拟退火的过程:(a)建立一个表征井数据的初始实现(b)计算初始目标函数
44、值(c)随机地改变一个网格的渗透率(d)评估新的目标函数值(更好:接受该新K值,更差:抛弃)(e)该目标函数是否足够接近于0?(是:完成,否:转到c继续)2.增加目标函数的分量,用来表征孔隙度(或岩石类型属性)的纵向平均与地震属性的差 Oc=in=1jnk=1f(i,Kj)模型-f(i,Kj)实现2 Oc=模型-实现23.其中定义为孔隙度的纵向平均P与地震属性S的差:=P-S,11.13 西部Texas的一个实例 1.研究工区属于西部Texas的Permian盆地(数据由SCRF(斯坦福大学研究基金)提供)2.研究区域中有74口井,其中50口被三维地震覆盖,11.13(地震属性数据)1.在80
45、平方英尺的面积上布置了13*13个数据点2.平面上变化明显,11.13(地震属性数据的直方图)1.存在0值锥2.相当低的变异系数,11.13(地震属性与孔隙度纵向均值的关系)1.孔隙度纵向均值与地震属性正相关2.相关系数为0.543.校正孔隙度的范围使之覆盖地震数据的范围(当区域中井数较少时尤为重要),11.13(孔隙度的直方图)1.如期望的那样,方差比2D纵向均值的大2.为获得表现力较好的直方图,可能需要去集群化或做点光滑3.3D模型将以随机性遍历的方式复现这个直方图。这相当于一个重新采样的过程以体现孔隙度直方图中的不确定性,11.13(孔隙度的变异函数),11.13(3维孔隙度建模)1.采用基于模拟退火的技术,约束为:(a)井数据(b)99等分的孔隙度直方图(c)50个距离上的变异函数(d)孔隙度纵向均值与地震属性之间相关系数取值0.542.可以产生多重实现3.为图示,只选其中一个实现4.结果的地震属性与孔隙度纵向均值交会图,11.13(水平切片),11.13(孔隙度纵向均值与地震属性之比较),11.13(剖面),