当前位置:文档之家› C1 测井曲线的自动分层问题

C1 测井曲线的自动分层问题

测井曲线自动分层问题测井曲线自动分层问题摘要本问题要求以1号井建立数学模型,对第2号至7号井进行自动分层,并与人工分层结果进行比较。

确定合适的数学模型后,再对第8号至13号这些未人工分层的井进行自动分层。

本文的研究包括三个部分:模型准备、已人工分层井的模型建立与求解以及未人工分层井的模型建立与求解。

模型准备中首先对数据进行了筛除、中值滤波和归一化,使数据受干扰更小,之后通过主成分分析,加权平均出一个新主成分曲线作为综合测井指标。

已人工分层井模型中,首先应用了层内差异法对1号井进行细分层,其分层结果局部过细,因此再应用聚类分析进行并层处理,使一些过细的分层与临近合并,得到合理结果。

之后与活度分层法进行对比,最终确定了层内差异结合聚类并层作为最终分层方案。

当有人工分层结果时,可以参考进行层名对应确定,但面对一个未知的井时,层名确定就是新的问题。

在未人工分层井模型的建立与求解中,提出了利用纯泥岩这个具有鲜明特征的地质现象作为定位标记,用来定位长71层。

在未人工分层井模型中,首先应用之前成熟的层内差异结合聚类并层得到不含层名的分层结果后,利用纯泥岩经验,确定长71层,以此为突破,先后推理可确定所有层名。

上述模型,应用在已人工分层的井上,和人工分层吻合得很好,比较成功。

应用在未人工分层的井上时,结果合理,分层清楚均匀。

层内差异和聚类并层结合使用,既能保证分层准确又可使层次合理,问题得到了很好地解决,但是极个别会出现两层合并的现象。

最后我们对所有井进行井层剖面展示和简要分析,以新的角度看到所有井的层面分布和地形变化。

本文编程和数据处理在Matlab和Excel中完成,绘图在“卡奔”地质研究软件中完成。

关键字:主成分分析层内差异聚类层名对应活度函数分析1问题重述地质人员通过经验,从一定深度开始对井进行井层划分和命名,通常这些工作都是通过人工来进行的,即人工分层方法。

该方法费时费力,且分层取值过程中主观性较强,会因为不同的个人标准出现不同分层结果。

因此,随着一个区域开发井的数量增加,可以利用已有分层井点数据与变化特点作为控制点,结合每口井丰富的测井曲线数据,如密度 (DEN)、声波 (AC)、中子 (CNL)、自然伽玛 (GR)、自然电位 (SP) 和电阻率 (RT) 等的变化特点,建立合理的数学模型,利用计算机工具和各种数据处理技术实现井位分层人工智能处理,也就是实现自动分层。

首先以1号井为标准井,根据它的各种测井曲线数据,建立数学模型,对第2号至7号井进行自动分层,并且通过分析,与人工分层结果进行比较分析。

考虑是否需要利用所建立的数学模型,对1号井的分层结果进行说明。

其次确定合适的数学模型对第8号井至13号井进行自动分层,并分析该结论。

2问题分析2.1 处理流程的确定通过初步观察题目所给出的数据,测井仪采样间隔为0.125米,跨度长达七八百米,并且给出的测井参数众多,因此每个井的数据量都是庞大的并且参数丰富的。

我们要进行三个步骤的处理,即模型准备,已人工分层井处理和未人工分层井处理。

处理流程如图1所示。

模型准备的主要是数据预处理包括筛选、滤波和归一化,测井曲线的拣选以及主成分分析确定综合测井指标;已人工分层井模型处理是自动分层的核心,本文准备使用层内差异法与聚类分析法相结合的方法,并与活度函数法对比确定最终分层模型;未人工分层井模型是在已人工分层井模型基础上加以改进,比已人工分层模型多一处层名对应分析,用以确定所有层名。

最后会画出整体剖面图,并简要分析。

2.2 模型方法的选择目前在专业中应用的方法主要分为三类,数理统计方法、非数理统计方法和人工智能方法[1]。

其中数理统计方法中的经典代表是层内差异法和聚类分析法,其指导思想是认为同一井层内部之间的差异小,不同井层之间的差异较大[2]。

因此数理统计方法在数学上比较严格,能保持岩层内部的均一性,岩层间的差别大,实际应用较广泛,并且实践已久,但计算量较大。

非数理统计方法中,经典代表是活度函数法,该方法是利用测井曲线的变化程度找出极大值来分层。

由于数理统计方法比较严格,并且在勘探专业上比较成熟,本文使用层内差异法与聚类分析法相结合的方法来进行建立分层模型,但为了进一步说明该方法应用的正确性和优势,我们还采用了活度函数法来对比参考,从而增强可信度。

3 假设1) 假设该地段未发生过奇特的地质现象和严重的地壳变动,即该区域地质地貌是普通常见的。

2) 假设各井层排列顺序固定,即不存在井层之间翻转的现象,比如长41绝不会翻转到长61的下面。

在地质勘探专业中,也认定井层的特定排列顺序未经过强烈地质变动不应变化。

3) 允许缺层现象的存在,井层的尖灭是会发生的。

4) 假设每层的宽度不会有较大变动,大致都保持在每层三四十米左右。

5) 假设各个井之间关系密切,而且都可以用1号标准井的层次系统来衡量,不存在某个井独立的体现不寻常特征。

6) 仪器所测得的数据在主体部分,虽然不可避免有其他干扰,但应该是真实可靠,能够反映采样点的实际特征。

7) 假设人工分层也是真实合理的,虽然是利用人工经验,但也是基于变化的井层特征来分层的。

8) 假设长31至长92井层只是该区域所有地层中的一段,长31之前,长92之后,若要分层,还是可以分出新的层次来。

4 符号约定GR :自然伽马;AC :声波;RML :微梯度;RMN :微电位;{要修改}模型准备:x :归一化之前的测井数据,如GR 的测井数据表示为GR xX :归一化之后的测井数据,如GR 归一化后为GR X ;(max)(min)x x ,:某条测井曲线的未归一化的最大值与最小值;图1层内差异和聚类分析部分:X :这部分的X ,都是采用主成分分析得到的综合测井指标。

i X :第i 层内所有采样点的均值,称为该层的测井值;i σ:第i 层内的均方根误差(后文中说明);()i E X :第i 层的允许误差(后文中说明);活度函数部分:X :这部分的X ,都是采用主成分分析得到的综合测井指标。

21n +:计算活度时所取测井曲线的区间长度,即“窗长”(n 为正整数); ()E d :在第d 点的以21n +为窗长的活度值;()X k :测井曲线在第k 点的归一化后测井值()X d :[,]d n d n -+内归一化后所有点的平均值;5 模型准备5.1 数据筛选和滤波处理在测井时,得到的数据不可避免的会有非地层因素引起的干扰,某些地方甚至会出现数据失常,如声波跳跃、自然伽马波动异常剧烈等。

应通过一定条件将其剔除,保留地层因素的变化,尽可能消除所有其它非地层因素引起的变化[3]。

例如在浏览1号井GR 曲线时,开端会出现大于1000的数值,在结束时也有一段小于10的数据,考虑到GR 的正常范围,上述的数值应该筛除。

值得一提的是,为减小非地层因素引起的干扰,滤波处理也必不可少[4]。

不进行滤波处理,不仅会造成分层后每层测井值有偏差,更会因数据量的庞大导致计算机程序运行速度严重降低,甚至停止响应。

因此,可以利用matlab 中的中值滤波函数medfilt1,对作为分层考察指标的曲线进行滤波,以消除曲线的尖峰干扰,并增加运算速率。

5.2 数据归一化为突出测井值的相对变化,可以对某条测井曲线作归一化处理,即(m i n )(m a x )(m i n )100x x X x x -=⨯- [5]。

如要对1号井的GR 数据进行分析,就需要代入其(max)249GR x =和(min)17.51GR x =,将一号井中的GR 数据归一化处理。

这种归一化在对某个井分层时,使测井曲线变化趋势明显,对比出井内部之间的区别。

5.3 曲线类型的分类和拣选本题给出了66条曲线,参数众多,但是并不是所有参数都能使用。

在勘探专业中,选择测井曲线确定参考指标至关重要,挑选出的曲线需要纵向分辨率强,即随着深度而变化波动明显,具有参差有层次感的特征[3]。

选择代表性强的曲线可以使得过程事半功倍,若选取不当,会使结果差异过大甚至被误导。

首先需要仔细观察66条曲线的数据情况,大致可以分为四类,其中只有第四类才可以被应用:1)间断空缺型:THK、PORR、PORC、SXO、POR、PW、POW等代表地层特性的参数如水油含量泥沙含量等,他们时有时无,出现大批无效数据或空缺数据,几乎无法使用,这样的曲线多达34条,都无法被使用。

见下图左两列。

2)百分制型:有很多曲线他们意义重复,比如GR和GR%、AC和AC%等。

非百分制数据就可以充分代表地层信息,就没有必要再采用百分制数据,而且在专业上较非常少,因此我们也不采用此类型,有13条。

3)不合理波动型:DEVi、AZIm、SH、RLL8、RILD、RILM、SP1等,这些参数虽然波动或者过于剧烈或者极其平稳,实际上应用起来分层效果很差,甚至与人工分层结果迥然不同,需要舍弃此类型。

例子见下图左二列至右四列。

4)波动合理型:排除上述三类只有这一类的数据,波动合理,数据有效,有层次感,可以作为分层的参考指标,他们是DEN、SP、GR、AC、RML、RMN、CAL 、CNL。

而且勘探专业中,他们被认为是最重要的曲线。

例子见下图右两列。

图2绝不是曲线选择越多越好,根据上述观察和分析,只有第四类“波动合理型“中曲线可以作为考察指标,其余的应该舍弃,经反复试验,若选取不佳曲线会产生较大误导。

5.4 主成分分析确定综合指标为充分采用上述的第四类曲线,将他们全部综合在一起,可采用主成分分析法,从中提取反映地层特征的主成分,从而有效地综合多种测井参数,这个主成分就成为我们的综合测井指标。

设有N 个采样点,p 个指标,这p 个指标分别是GR 、AC 、RML 、RMN 、CAL 、CNL 、SP 和DEN ,即上述第四类中的八种指标。

下面是原始数据矩阵:111212122212N N p p pN X X X X X X X X X X ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦求指标间的相关系数矩阵,()11T R X X N =- ,并求解相关系数阵的特征值1λ2λ~p λ和对应的特征向量1μ2μ~p μ。

得到p 种主成分F ,1122i i i ip p F X X X μμμ=+++ ,主成分i F 的方差贡献率为1/pi i i λλ=∑。

对1号井的八条曲线进行滤波以及归一化处理后,进行上述运算,得到了八种主成分,1和图3。

图3显然,主成分8的贡献率遥遥领先,通常当贡献率大于85%,就可以认为主成分以基本反映了原始数据的主要信息。

因此就后文中的自动分层就可以直接利用主成分8,不再利用其他,并且认为是涵盖性好,真实度高的(经过所有井的验证,都是主成分8的贡献率非常大)。

表2显示主成分8中在各个指标上的系数,系数比较大的是GR 、RML 、RMN 、SP ,则0.0130.0260.3840.54AC CAL RMN SP X X X X X =-++++,作为用来对1号井分层的综合指标。

相关主题