《地质大数据发展现状和地矿局数字经济发展意见建议.docx》由会员分享,可在线阅读,更多相关《地质大数据发展现状和地矿局数字经济发展意见建议.docx(9页珍藏版)》请在三一办公上搜索。
1、地质大数据发展现状和地矿局数字经济发展意见建议地质学是研究地球如何演化的自然科学,以固体岩石圈为主要研究对象,探讨趣求各圈层的物质组成、内部构造、夕陪特征、各层圈之间的相互作用和演变历史。地质学的产生源于人类社会对石油、煤炭、金属、非金属等矿产资源的需求,随着社会生产力的发展,人类活动对地球的影响越来越大,地质环境对人类的建勺作用也越来越明显。如何雉有效地用喇资源、维护人类生存的环境,已成为当今世界所共同关注的问题。因此,地质学研究领域进一步拓展到研究地球资源的合理利用、资源与环境和人-地和谐的可持续性发展。地质学是通过对自然现象的观察,发现观测数据中内在的规律性,其本质上是一门信息学科,是典
2、型的数据密集型科学。21世纪以来,随着地球信息探测技术的日新月异,获取娄的能力不断提高,积累的地球观测数据呈朦1级增长,估计到2022年全壬檄据总量将达到4OZB10多元、多维、多源、异构、时空性、方向性、相关性、随机性、含糊性、时空不均匀性和过程的非线性是地质大翔居的特点。地质大期居与普娄有相似之处,但也存在显著差SIl ,大数据给地质学带来了前所未有的机遇与挑战。当前,大数据正在影响着人类生活,改变着人类认识和研究世界的思维方式2o大数据时代,翅S密集型知识发现成为继理论科学、实验科和计算科学后科学研究的第四范式。2022年、2022年Nature和Science分别出版了大数据研究的专刊
3、。大数据研究成为各国关注和优先发展的国家战略性技术。作为国家战略的重要组成部份,地质大期居的应用研究方兴未艾。国土资源十三E”科技创新发展规划指出,要强化地学基础研究,开展地球深部过程与动力学、地球环境演化与生命过程、矿产资濡口化石能源形成机理研究,力口强地球关键带过程与功能、全球环境变化与地球圈层相互作用、人类活动对环境影响、三灾害形成机理研究,深化地学大数据与地球系统知识发现研究。云计算、物联网、人工智能等技术的兴起,使信息技术渗透方式与处理方法及应用模式发生变革、地质研究中多系统联合与结合成为可能3。利用地质学与大数据的结合,开展对地质数据的综合研究和应用,拓展了地质学的认知空间,提升了
4、获取地质学新知识的能力。相比大气科学、海洋科学、遥感科学以及全球变化等地学大数据的研究,地质学大数据的研究起步较晚,由于缺乏顶层设计和基本规划,地质大数据中心建设薄本文着眼于我国未来地质学发展,在分析地质大数据特点及国内地质大数据研究现状的基础上,阐述地质出据拟研究的前沿科学问题,提出了未来中国地质大数据发展战略目标,探讨了地质学大数据发展的主要内容和解决途径。1地质大数据的特点地质遇聘通过露头地质观测、勘查工程、tm理探测、地球化翔测、遥感和物理测试、化学分析等手段采集到的一种科学大知居4,涉及地球从内到外的各个圈层,涉及地球形成与演化的历史,涉及地球的物质组成及其变化,涉及矿产资源的形成、
5、勘查与开辟利用,涉及人类环境的破坏与修复等5。地质大数据具有传统大蝇的4V特性,即数据量大(volume)、类型繁多(variety).速度快时效高(VeIOCity)、价值密度低(value),同时还具有科学大数据的三高特点,即高维度(Kighdimensi。)、n高计算复杂性(highcomplexi)t和高不确定性(Highuncertainty),且由于地质对象的发展演化时空范围庞大、地质作用影响因素众多,这种高维度、高计算复杂性和高不确定性特点则更加显著。地质大数据的特点主要表现在以下4个方面。1.1 多源(元)异构性地质数据的采集平台和手段繁多,不同手段获取的数据也具有不同的数据组
6、织管理形式。例如:野露头描述数据、钻孔岩芯描述数据、各种地质报告文档得实时点位数据,以及大量野外填图、素描和照片,遥感获取的影像数据,地质灾害监测获等。有的甥居是以纸J页形式存隔口管理,有的经过结构化转换汇聚GIS并入库存储。不同的数据组织方式形成为了不同的数据结构,对同一地质本体的描述也因空间基准和时空尺度存在差异而形成语义鸿沟。不同的数据采集方法,多角度的描述,造成为了地质大数据的严重异构和多模态。1.2 时空相关性由于地质体、地质结构、地质资源、地质环颜口地质灾害通常占领庞大的空间范围且伴有长时序的发展演化,地质大数据的时间维具有长期性和阶段性的复杂特点,是其他地球科学数据不具备的。地质
7、数据高度的时空特性体现在两方面:地质对象本身具有特定的地质年代,地质学研究也具有明显的区域性,在特定时段、特定区域内的研究对m往往带有明显的差异化特征。地质数据用来描述某一时间点在特定位置的对象的属性,这种固有属性在获取数据时就已经产生。地质数据的时间尺度可从分秒横跨至数十万年,再加之描述其空间位置的坐标系、投影参数以及探测精度、基本粒度的变化,则进/增加了地质数据的复杂度。因此,脱离了时间、空间的地质糊居是没故意义的,在涉及地质大数据的融合分析时也要将其划归到统一的时空基准下。1.3 复杂性与含糊性地球是一个复杂的巨系统,地质数据的参预在一定程度上降低了该系统的复杂度,使建模和求解成为可能。
8、然而由于地球各圈层因素相互作用,各类地质过程本身具有高度的复杂性,人类对于许多地质规律的解释和结论还存在争议。再加之地质数据对描述7寸象的定量化艰难,决定了地质数据分析、建模和计算的困难程度。大数据的技术取向之一是重关联不重因果,我们不可能仅通过数据就搞清晰地质现象发生的机理,且采集全球样本数据到现阶段还无法实现,因此地质大数据分析的结果大多是含糊不确定的6。1.4 地质体的全球性与国家利益地质体和地质单元的分布不以国家界限为界限,地质资源的分布不以国家和人口的需求而分布。这就造成国家利益干预造成的全球麴居库建设的艰难。2地质大数据研究发展总体来看,我国地质燧剧开究还处于起步阶段。一方面,许多
9、人质疑康据对于期求科学这一门观察学科的合用性,另一方面,多数研究人员还未意识到积累物居、共享数据的重要性,这在一定程度上妨碍了地质大物居的发展刀。此外,檄据研究追求的相关性研究与科学研究中的因果性知识发现存在巨大矛盾,这对科学家们的思维方式转变提出了挑战8。综合近年来的研究成果,国内地质大数据研究现状可以归结为以下3点。2.1 地质大数据的存储管理地质学发展至今积累了大量的地质资料数据,随着地球信息探测技术的迅速发展,又有源源不断的新的地质数据快速产生。地质拽娠不仅有定性、定翰据,还包括文字说明,甚至是地质图件或者是地质工作者在工作中留下的衩濒、音频文件等资料,而长期的目录文件存储方式极大地降
10、低了数据查询、检索、统计、更新、挖掘等操作效率,导嬲据服务能力低下。因此,构建一套能够有效地实现结构化、半结构化和非结构化辘一体化、静态黝居与动态班一体化、地质数据与地质模型一体化存储管理的地质信息系统,对于完成海量地质资料稳定、高效地存放与读取就显得十分重要4。目前已有学者提出进利用云平台、HadOoP和NoSQL等技术,借鉴实时GIS时空数据模型9,实现对地质时空大数据模型的动态管理。Hadoop是目前大数据存储与处理的标准平台,可以通过M叩RedUCe支持大规模数据的并行处理。而NoSQL数据库使用分布式节点集动态处理负载。采用分布式文件系统技术可以对地质大数据进行存储并提高数据的容错能
11、力与可靠性10o例如中国地质调查局发展研究中心国土资源部地质信息技术重点实验室研发的中国地质调查云平台,就是在这种框架下建立的非结构化地质数据存储组织模式,通过改变非结构化翔居的存储、阅读、搜蔚版Z用模式,为智能地质调查提供精确、快速服务奠定了基础11。2.2 地质大数据的挖掘分析时代下的3个重期趣向是:要全样;要效寸精确;要关联不要因果刀。这迫使我们从数据的类型、数据运维以及大数据带来的挑战性这3个维度重新思量数据分析。周永章等12认为大数据与数学地球科学的核心应用技术应该包括高维翔居降维、图象数据处理、无限数据流挖掘、机器学习、关联规则算法与推荐系统算法等。数据挖掘是指从大量数据中通过算法
12、搜索其隐藏信息的过程13。相较于数据检索和信息提取,数据挖掘需要基于大数据和知识库的智能推理的理论和技术支撑14。地质大数据挖掘就是从数据仓库中找寻隐含的特征和规律,并应用在地质规律研究、成矿预测、资源评价、环境保护和地灾防治领域的过程。该过程需要利用涉及到人工智能、机器学习、模式识别、归纳推理、统计学、数据库、高性能计算、数据可视化等相关方法和技术手段,在多主题、多模态的地质数据中自动或者半自动地获取新的可被理解的知识,从而为地质专题研究和应用提供决策。目前,数字地质的任务就是大力推动地质科学的数据挖掘和数据分析方法的更新。如何从规模巨量,但价值密度偏低的大数据中有效地挖掘提取信息是当下地质
13、大数据研究中拟解决的关键问题。地质大数据分析的关键技术主要是对多源(元)异构的地质数据进行综合分析。其中包括对结构化数据的相关性分析,对半结构化数据的信息提取和结合非结构化数据作为以上数据处理结果的验证分析。此外,物联网、扇以现实、云计算等技术兴起,使得基于互联网的地质数据资源共享平台的研制成为可能,也为复杂地学计算提供了条件。将云计算、人工智能融入地质大数据挖掘与分析已经成为新的发展趋势。例如,有学者借鉴了大数据思维,利用贝叶斯网络探寻矿床的成因机制,从而构建大数据-智能矿床成矿与找矿模型15,推动从数字地质到智能地质的革命。2.3 地质大数据的应用服务地质大数据不仅改变了地质学家研究科学问
14、题的思维范式,也给以数据分析为基础的地质行业带来了技术革新。地质大雌在各领域数据化水平的提高,有效地打通了信息孤岛化分析娥三蝇地班翔居的朔服务主要体现在以下5个方面。(1)基础地质调查。国土资源十三五科技创新发展规划指出要推进数字地质调查系统向智能化方向发展,逐步实现地质数据快速采集、实时汇聚、高效分析处理与建模,推动大数据技术支撑下的智能地质调查和服务模式创新,深化地质填图、矿产地质调查、油气地质调查、海岸带综合地质调查等领域的应用。如何将分布式的数据云存储、云管理和云服务体系应用在我国各类基础地质调查数据库,实现海量、碎片化、非结构化与多样性的数据高效快速存储,是大数据时代基础地质调查研究
15、的热点16o止匕外,我国正在开展数字地质调查,中国地质调查局开辟的“地质云1.0已经在2022年正式发布并上线服务。该系统面向各类地质调查专业人员提供世也质、矿产地质、水工环地质、海洋地质等多类专业数据共享服务;面向社会公众提供多类地质信息产品服务。升级完善的智能地质调查系统已在基础地质和矿产地质调杳领域示范应用。(2)国土资源管理。国土资源部门在多年的信息化建设实践中积累了海量的土地数据,进而提出了国土资源全尺度数据整合与大数据构建技术。2022年国土资源部提出要持续完善国土资源一张图数据资源体系,构建统一的国土资源数据共享和开放平台。其中大数据采集与分析技术成为构建决策支持系统、智库信息化
16、工作平台,逐步形成信息化条件下的新型互联网+智库运行体系的重要技术手段,对于提升国土资源宏观调控、管理监测、形势分析、政策评估、舆情分析等领域具有重要的决策支持能力。(3)地质灾害监测。以物联网、大数据技术为支撑,从海量地质灾害数据中充分挖掘数据的潜在信息价值,并结合多轨道、多尺篇口多时相的遥感环境监测技术,建立智能化的地质灾害、地下水、矿山地质环境、地面沉降、水土环境、地质遗迹等调查、监测数据采集系统和预警预报系统,从而加强对灾害发生趋势的研判和预测,强化实时监测与预警,用数据的力量防治地质灾害。(4)矿产资源勘查。矿产资源是国民经济发展所需的重要物质基础,而矿产资源预测是资源发现与勘察中的
17、指导性工作。以往专业人员都是在一定的理论和方法指导下,凭借已有的知识和经验并采用定性或者定量的方法进行预测找矿。而随着矿产资源预测理论的不断进步,以及地学信息与虚拟现翅术、3S技术、数据库技术、三维建模及可视化技术等的有机融合,对于认识新的成矿规律意义重大。这种方法从地质科学相关的海量数据中进行挖掘,对各种矿床类型进行多维度、多特征的描述和建模,从而代替由少量参数构成的预测模型,实现了地质理论和实际问题解决、数学应用和数学模型研究与信息技术应用三结合的矿产资;颠测评价1刀。此外,大数据驱动下的成矿预测理论的浮现,进一催生了大量以空间数据库为基础的三维可视化软件系统和矿产资漏页测系统,为智慧找矿
18、奠定了基础18。(5)三维可视化。数据可视化是描述、表达和理解各种半结构化甚至非结构化问题的关系和模型的蜀圭方法和手段19。以地质空间大数据为基础,结合三隹可视化、虚拟现实技术等,针对地质体和地质结构进行三维动态可视化建模,则可构成“玻璃W,獭科研人员分析、预测、评估利魁。以数字矿山技术发展为例,三维可视化技术能够更加生动地展示矿山地质顺的信息,清晰地反映矿体赋存状态20,从而综合、动态地指导研究人员进行矿体定位与成矿预测工作。3结语趣居时代给地质学的发展带来了机遇和拟默。一方面,地质大数据为我们的三高特点,全面解口、了解地球打开了新的图景,也为地质科学的知识发现、科技创新提供了新的手E毋瞳径
19、。另一方面,由于地质梯据具有科学给趣居的挖掘和利用提出了难题。此外,数据交流、共享机制的不成熟也成为地质大数据研究发展的妨碍之一。如何建立高效的大数据服务平台,推动具有大翔居源的各个学科协同研究是今后要解决的重要问题。我国地质大数据的研究还处于起步阶段,但它的重要战略意义和发展应用前景都应该得至啃定。为此,提出加快我国地质大数据建设进程的3点建议。(1)推动地质+大数据人材培养体系的建立。高校要应对大数据时代的挑战,建立地质大数据人材培养方案。呼吁教育部和科技部加大对地质大数据项目的支持,以项目育人材,哺育出既有才域的地质学基础,同时熟悉算法开辟、数据建模及数据架构,并且能够胜任地质大数据系统
20、研发、地质大数据挖掘与分析、地质大数据应用开辟等工作的学科交叉型专业人材。(2)加快地质大数据共享交流平台的建立。数据的自由流通和共建共享是发挥数据资源价值的关键。目前大多地质数据资源建设都由重大科研项目驱动,有一定的项目实施周期,其数据服务平台也存在着功能单一、检索效率低下、数据库建设标准不一等缺点,造成系统平台数据流通性、可用性较差。应由国家层面的专门机构协调构建由高校、科研院所和地质生产单位共同参预的地质大数据中心,在保护国家利益的前提下,加快构建规范统一的地质梯据共享交流平台,推动地质大数据的研究与应用。(3)地质学家和地质工作人员的思维变革。科学大数据已成为科学研究的重要途径,数据密集型科学范式也已逐渐被接受。地质学家和泛博地质工作人员应频住历史契机,拥抱大数据,改变经验的传统思维模式,以新的态度看彳搬据,以新的思维方式利用数据,从中获取亲欣口识,创造新价值。