大数据保障油田可持续发展

CCW*

文章来源:计算机世界

    保证稳定的油气田产量,很重要的一项工作就是集中发展油气勘探开发业务。随着地球物理技术的进步,油气勘探相关的地学综合研究对包括高性能计算、大数据处理在内的信息新技术提出了更高的要求。

    大庆油田是中国的最大的石油生产基地。在 50 多年的发展历史中,经过一代又一代大庆人的艰苦奋斗,大庆油田创造了举世瞩目的巨大成就。累计生产原油超过 20 亿吨,主力油田采收率突破 50%,实现年产原油 5000 万吨以上连续 27 年高产稳产......

    石油作为一种不可再生能源,开采一天,就少一天。辉煌的背后,大庆油田正在逐渐步入产量衰减期,可持续发展战略成为今后大庆油田能否进一步发展的核心。

可持续发展打造百年油田

 

    中国工程院院士、全国总工会党组书记、副主席、书记处第一书记王玉普曾任大庆油田有限责任公司总经理,他曾经专门撰文指出,“大庆油田要抓住历史机遇,创建百年油田。”

    王玉普认为,创建百年油田,不仅是基于当前发展形式的分析,也是借鉴了国内外油田开发的历史经验,更是结合了大庆油田自身数十年开发时间的理性思考。

    《大庆油田可持续发展纲要》(下称纲要)指出,大庆油田的改革发展正处在新的历史起点,“它联接着 50 年的辉煌历史,联接着百年油田的长远未来”。当前大庆油田发展面临“五大挑战”:一是资源接替的问题。油田每年提交的油气储量,还不能满足原油稳产、天然气上产的需要,实现储量有序接替、储采基本平衡,困难多、任务重;二是稳产效益的问题。目前长垣主力油田三次采油成本较高,外围低品位储量动用难度大,在保持原油稳产的同时,把投入降下来、效益提上去,是一个亟待解决的问题;三是优化结构的问题;四是经济质量的问题;五是发展空间的问题。

    如何应对上述五大挑战,《纲要》提出,“大庆油田要建设成一个资源探明率最大、油田采收率最高、分阶段持续稳产,在国家能源布局中始终保持重要地位的百年油田。实现原油 4000 万吨持续稳产,2020 年油气当量保持在 4000 万吨以上,本世纪中叶、油田开发 100 周年之际,大庆油田本土油气当量保持在 2000~2500 万吨。”

从数据下手确保稳产高产

 

    保证稳定的油气田产量,很重要的一项工作就是集中发展油气勘探开发业务。而随着勘探手段越来越先进,计算处理能力的不断提高,油气勘探相应的勘探数据进入到“大数据”时代。当前,地震波法勘探收集的数据通常都以 TB 计,甚至在近年来海洋油气勘探所采集的数据都已开始向PB的规模发展。

    付喜春是大庆石油管理局物探一公司研究研究院副院长,二十多年来他一直工作在石油物探的第一线。“当年我刚开始工作的时候,在野外地震队,所采集的地震波数据也就 120 道,现在我们下属规模较小的勘探队采集的数据都在 3000 道至 5000 道之间。另外就是数据采集频率也不断提高,五年以前,采用二毫秒采样,现在已经变成了一毫秒,甚至变成了每间隔 0.5 毫秒进行数据采集。这还只是野外采集的原始数据,一旦进入数据处理阶段,数据又会大幅度增加。例如,之前我们在对一块约 700 平方公里地区进行勘探时,原始数据大约有 17TB,整个处理过程完成,要经过 10-18 个步骤,这么多的步骤下来以后,整个数据量就是原始的数据量 10-12 倍左右,也就意味着针对这样一个项目至少需要 170TB 的存储空间。我们一年会有这样七八个大的区块项目,可想而知后面的数据量还是非常大的。”

    付喜春透露,目前在其所工作的研究院,存储容量已经达到了 2PB(注:等于2048TB)左右,计算处理能力达到了 3000 多颗 CPU。“我们采用的都是英特尔至强服务器平台,在数据处理系统主要用的是两路服务器,在 I/O 节点上用的主要是四路至强服务器。”

    付喜春还表示,为了将如此大量数据更好地为勘探工作服务,他们一方面针对提高存储空间利用率对存储系统进行了整合,另外一方面对系统性能也进行了优化。“我们根据数据特点,采用分级自动存储技术,在整个存储共享系统里面实现了分级自动存储,这样满足了数据对存储速度和存储容量的要求。针对不同类型的数据,选用不同的存储设备。例如一些需要经常调用的地震数据,就把它们保存在高速的光纤的存储设备中。那些不频繁调用的数据,可能短期内,例如六个月、或者多长时间就不需要调用的,我们就把它们存储到到相对价格便宜的存储设备中中。剩下一些长时间都不会使用历史数据,我们就会它们存到磁带库中。”

    在实际工作中,付喜春注意到,随着数据量的不断增大,数据的传输在 I/O 传输上出现瓶颈。“针对这方面的问题,我们在近期采用了高性能万兆核心交换机线速端口聚合技术,再辅以并行存储磁盘系统,对存储系统进行了扩充。改造后,系统速度大大提高,从 600MB/秒提升到 900MB/秒,提高了 1.5 倍,随着今后不断的优化,性能还会进一步的提高。”付喜春说。

    在付喜春的脑海中,将数据保存好,接下来很重要的就是要把这些数据管理好。为此,付喜春考虑采用云计算的服务模式的作业调度系统,对地震资料处理和解释所涉及到数据,进行自动调度管理,实现对相应数据存储空间和计算结点的自动分配。“这样的调度系统一旦实现起来,使我们有限的存储空间更加灵活,针对不同的处理解释工作,根据数据量大小和供需任务的紧急程度,更加高效、合理地分配存储资源也就成为可能。”

    付喜春表示,有了数据的保证,同时随着高性能计算和可视化技术的发展,正在为油气勘探开发提供了全新的工作模式。“依托复杂的数据模型、海量的数据资料,正在形成对复杂地质构造的快速计算和图形展示。以油层模拟为例,其中就会涉及到一些非结构化的三维图形显示数据,根据我们的实际测试,采用至强四路或八路服务器进行三维可视化解释工作的效率,比采用双路服务器的效率要高很多,如果再配合相应的瘦客户端,相应的成本也会降低。”付喜春说。

产品和性能信息

open

. * 媒体文章均为第三方观点,仅供参考,不代表英特尔官方观点。