科研项目立项论证报告基于云数据空间的航空航天多源情 报数据管理与共享关键技术研究.doc

上传人:仙人指路1688 文档编号:3033527 上传时间:2023-03-09 格式:DOC 页数:18 大小:475.50KB
返回 下载 相关 举报
科研项目立项论证报告基于云数据空间的航空航天多源情 报数据管理与共享关键技术研究.doc_第1页
第1页 / 共18页
科研项目立项论证报告基于云数据空间的航空航天多源情 报数据管理与共享关键技术研究.doc_第2页
第2页 / 共18页
科研项目立项论证报告基于云数据空间的航空航天多源情 报数据管理与共享关键技术研究.doc_第3页
第3页 / 共18页
科研项目立项论证报告基于云数据空间的航空航天多源情 报数据管理与共享关键技术研究.doc_第4页
第4页 / 共18页
科研项目立项论证报告基于云数据空间的航空航天多源情 报数据管理与共享关键技术研究.doc_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《科研项目立项论证报告基于云数据空间的航空航天多源情 报数据管理与共享关键技术研究.doc》由会员分享,可在线阅读,更多相关《科研项目立项论证报告基于云数据空间的航空航天多源情 报数据管理与共享关键技术研究.doc(18页珍藏版)》请在三一办公上搜索。

1、 XX 科 研 项 目立项论证报告项目名称:基于云数据空间的航空航天多源情报数据管理与共享关键技术研究编报单位:二九年五月目 录1 立项的必要性 12 主要战术技术指标 12.1 主要功能指标 12.2 主要技术指标 13 技术可行性和先进性 13.1 技术方案或主要技术途径 13.2 主要技术难点分析 13.3 研制单位的能力分析 13.4 与国内外同类产品、技术对比分析 14 推广应用意向及前景预测 15 研制周期及主要工作节点 16 研制经费概算及年度拨款强度需求 11 立项的必要性随着信息技术的发展,航空航天情报数据量正在以指数级的速度迅猛增长,目前全球每年至少产生15TB的新数据。互

2、联网和通信设备的普及使人们能够很容易地实现数据的共享,数据库之间也因此建立起越来越密切的联系,所以如何在庞大数据量的背景下进行高效的数据共享也是当下面临的重要问题之一。具体地说,当用户需求某个主题的数据时,需要从数据库中进行检索,若这些数据存放于单一数据库中则对数据的获取难度并不高,但是当与此主题相关的数据同时存在于多个数据库当中,则获取难度大大增加。在传统的数据库模式下,解决这种问题具有非常大的难度。首先,由于不同数据库本身存在异构性,所以从不同数据库中提取数据之后的整合难度也会有所提升;其次,随着数据量的急剧增长,从不同数据库中查询的时间也会有所增长。此外,航空航天情报数据源分别存储在许多

3、不同部门的结点上,分散管理,这种分散的存储方案无法做到透明的数据共享、随着数据量的日益增长,需要不断地扩充已有存储资源,给系统管理和运行都带来很大的压力,同时也大大提高了系统维护成本。现代数据管理中的跨域、海量、异构、不确定性特点推动了数据管理范式从数据库范式向数据空间范式的转变,推动了计算机信息资源管理领域的新一轮革命。相对于传统数据库技术,数据空间技术具有先行支付的建设模式、模式在先而数据在后的数据模式、不确定性数据模型、不改变数据源中的数据格式、分布式“共存”存储模式等内在特征,而且这些内在特征也表现出了诸多外部特征,包括数据源的不确定性、数据管理和数据控制的不完全性、信息集成过程中信息

4、丢失较少、数据关联的复杂性和演化性、服务质量的不确定性和次优性。数据空间是与主体相关的数据及其关系的集合,数据空间中的所有数据对于主体来说都是可以控制的。主体相关性和可控性是数据空间中数据项的基本属性,一般所说的数据空间实际上是指主体数据空间,与之相对的是公共数据空间。利用这种模式可以解决分散、异构数据的共享和管理问题,也就是可以非常好地完成对不同数据库的数据查询和获取任务。除此之外,还具有相当好的数据延展性,能够适应未来的发展的需要。与传统的存储设备相比,云存储不仅仅是一个硬件,而是一个网络设备、存储设备、服务器、应用软件、公用访问接口、接入网、和客户端程序等多个部分组成的复杂系统。各部分以

5、存储设备为核心,通过应用软件来对外提供数据存储和业务访问服务。可以通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。它具有传统存储方式不具有的诸多优点:比如硬件冗余、故障切换、存储设备的升级不会导致服务中断等等。而基于云存储的方式可以有利于综合管理,实现数据在云中的透明迁移,最大限度地减少系统扩展带来的影响,大大降低成本,节省资源。数据迁移到云存储或基于云构建,所有的数据存储在云中,这样,依赖云存储平台,能够提供统一的管理服务,减轻管理成本和投入此外,云存储服务强大的可扩展性,当数据存储需

6、求变更后,云存储服务则可以很方便的在原有基础上扩展服务空间,满足需求。而且这种变更对用户使用是完全透明的,大大减轻了系统管理和升级带来的压力。由此可见,结合云存储技术和数据空间理念,可以较好地解决航空航天情报数据特点给数据管理技术带来的挑战。因此,本课题以多源、海量、异构情报数据的科学管理需求为牵引,满足航空航天领域情报数据的深度挖掘和高效利用的需要,研究云环境下的数据空间技术,突破文件管理、语义检索、动态加载和数据划分中的技术难点,解决多源异构数据的获取、存储、组织、共享和利用问题,为航空航天各类情报信息系统和数据库纳入统一的云数据中心提供技术手段,从很大程度上提升情报信息的准确性和利用率,

7、保证情报服务的高效性、可靠性。2 主要战术技术指标2.1 主要功能指标2.1.1 研究目标以多源、海量、异构情报数据的科学管理需求为牵引,满足航空航天领域情报数据的深度挖掘和高效利用的需要,研究云环境下的数据空间技术,突破文件管理、语义检索、动态加载和数据划分中的技术难点,解决多源异构数据的获取、存储、组织、共享和利用问题,为航空航天各类情报信息系统和数据库纳入统一的云数据中心提供技术手段,以便从很大程度上提升情报信息的准确性和利用率,保证情报服务的高效性、可靠性。2.1.2研究内容本课题的研究内容可以分为关键技术研究和应用研究两大部分。1 关键技术研究1) 数据空间技术随着跨域、异构、海量、

8、不确定性等新的数据管理特性的出现,数据空间技术逐渐取代传统数据库技术,成为一种重要的数据管理手段。数据空间是与主体相关的数据及其关系的集合,主体是数据空间的所有者,可以是个人,也可以是一个组织。可以从时间、空间和内容三个纬度理解数据空间的主体相关性特点。从时间维度看,随着应用需求、成本、能力、进度的增强,公共数据空间中的数据项不断被纳入到数据空间的管理范围之内,数据空间具有动态管理不确定数据的能力;从空间维度看,数据源可以分布式存储在不同的网络环境中,数据空间支持跨域数据的集成管理;从内容维度看,数据源可以是结构化、半结构化、非结构化等多种格式数据,数据空间可以实现对异构数据的统一管理。情报信

9、息同样具有异构、海量、跨库、动态更新等特点,因此,本课题研究适用于情报信息的数据空间技术,主要包括数据空间系统框架、数据空间模型以及数据的管理(更新、查询、存储、索引等)。2) 云文件系统技术分布式文件系统有许多成熟而简单的架构方案,然而无法满足云存储和支持云计算系统的需求。这是因为面向云存储的分布式文件系统应该建立在超大规模的基础上,并且具有海量文件存储能力、高并发、低延迟的读写效率以及相当高的可靠性、稳定性和安全性。因此,面向云存储需求的应用目标为分布式文件系统的架构设计带来了新的挑战。本课题将研究面向云存储应用的分布式文件系统的特定需求,具体包括元数据的管理技术、文件的分块存储技术、用户

10、大压力下的访问数据支持与管理技术、存储和计算的对接结束、大文件与小文件读写的同时支持技术、节点失效的隔离技术等。3) 基于语义的检索技术传统的检索技术存在不少的问题,如信息丢失、返回信息太多、信息无关等,造成这些问题的主要原因是仅仅采用机械的关键词匹配来实现,缺乏知识处理能力和理解能力。情报信息系统以大规模的知识库为基础,它需要一个强大的推理系统支持。该系统可以在已知情报基础上,推理分析出没有明显表现出来的情报信息以及他们之间的隐藏关系。用户需要什么样的情报信息,就能通过形式化语义推理功能,动态检索到提供该信息的情报,以及相关的情报。这样就能够极大提高构件检索的查全率和查准率,并以目标情报信息

11、的入库、检索等工作奠定基础。4) 多源数据动态加载技术一般的检索系统通常对动态加载要求不高,通常允许检索的信息在时间上有一定程度的滞后,而且其数据源通常相对固定,数据源的动态性和信息的及时要求不高。而在情报系统中,系统所需的数据源通常是多变的,而且又必须提供最新的信息。因此,提供随时动态地加载新的数据源的能力是对系统的基本要求之一。解决系统的动态加载需要解决以下几个问题:一是数据源的抽象描述,即研究如何将情报系统中各种各样的数据源特征进行抽象,并在此基础上建立统一的描述模型和相应的配置支持,这是实现动态加载的基础。二是数据源动态适配技术,即研究系统在运行状态下如何将多种异构数据源动态接入到系统

12、中,并根据抽象描述文件加载相关的驱动,实现数据源的即插即用。三是动态数据源综合技术,即如何获取已连接的数据源的数据及元数据信息,并与当前其它的连接数据源进行整合,以便提将最新的信息提供给用户。5) 分布式数据的划分与处理通过对现有技术如Hadoop+, Twister, Haloop, HadoopDB,Spark及其最新语义计算技术的跟踪研究。不断改进MapReduce的框架,在MapReduce基础上增加索引层,研究低时延的多条件、多维度复杂分析的框架技术。2 应用研究 在上述关键技术研究的基础上,拟实施的应用研究包括:1) 基于云数据空间的情报数据存储与管理工具云数据空间的情报数据存储与

13、管理工具需要为系统提供存储管理服务和数据空间的管理服务支持。云数据空间的存储管理服务为用户提供云存储空间中情报源结点和应用服务器的部署、配置服务,包括结点的加入、修改、删除功能、配置信息更改以及各类信息的查看和统计等服务;此外,该部分还要为数据源的动态扩展提供相应的管理支持界面,包括配置文件的编辑、修改、导出、验证等功能。数据空间的管理与支持服务主要为语义匹配提供支持,除需要提供本体的存储等基础功能支持外,还需要为用户提供基于的本体构建界面,为系统的维护者提供本体的编辑、导出导入、认证、标注、浏览提供支持。此外,还需要提供关系映射支持界面,用户可以根据领域知识进行关系映射,实现对查询语义的动态

14、扩展和调整。2) 基于语义的航空航天情报智能检索工具智能检索工具不但应该支持自然语言检索,而且还应具有一定的推理能力,综合用户在每次检索结果选择的取舍,自我表现学习并进行推理,从而调整检索策略,完善检索效果。智能检索工具主要分为索引和检索两大部分。索引器的主要功能是基于航空航天情报领域知识库,抽取出反映情报形式和内容的信息作为索引项,描述情报及生成相应的索引表。检索器的功能将用户输入的信息的概念模型与索引库中的信息进行匹配,并且快速检出符合要求的文档,然后按照文档与查询的相关性对结果进行输出,并实现某种用户相关性的反馈机制。信息检索模型的检索器的核心技术,它决定了检索器的性能和特点。3) 基于

15、云数据空间的情报数据统一服务平台基于云数据空间的情报数据统一服务平台是面向不同用户建立的统一平台。主要服务功能包括: 用户注册、权限管理服务,为情报信息系统的用户,包括情报中心、各级指挥所不同的人员提供注册服务功能。不同的用户需要注册不同的信息,并具有不同的权限; 查询检索服务,不同的用户可以根据自己的权限对相关信息进行查询和检索; 情报信息展示服务,通过不同的方式展示查询结果,并可根据查询实现进一步查询的导航; 情报信息的维护服务,为情报信息的录入、修改提供报务支持; 本体的构建服务,为航空航天情报知识库的建设者提供本体编辑、导出导入、权威认证和本体标注和本体浏览器服务支持; 本体的管理服务

16、,一是提供在传统的数据库中存储知识的方法;二是通过图形用户界面,管理知识的储存、访问和获取。2.1.3成果形式1软件系统基于云数据空间的航空航天多源情报数据组织与共享系统软件(1套)2技术报告符合军用软件标准文档(1套)技术研究论与研究报告(1套)1) 航空航天情报信息数据空间研究报告2) 云文件系统技术研究报告3) 基于语义的检索技术研究报告4) 多源数据动态加载技术研究报告5) 分布式数据的划分与处理技术研究报告6) 基于云数据空间的航空航天多源情报数据组织与共享软件系统设计报告7) 基于云数据空间的航空航天多源情报数据组织与共享软件系统测试报告2.2 主要技术指标主要技术指标如下:(1)

17、 支持多于100个存储节点的有效;(2) 管理情报搜索准确率:90%以上;(3) 情报搜索率:1000010000000(条)/秒;(4) 查询分析结果的显示模式:图形显示和文本显示。3 技术可行性和先进性3.1 技术方案或主要技术途径3.1.1 主要技术途径 本课题拟采取以下的研究方法及途径: 密切结合空军情报信息系统的建设现状; 密切结合航空航天情报工作的实际; 基于软件工程、信息工程、数据库、海量信息处理、SOA与Web服务技术、语义Web、软件体系架构等方面的最新研发成果; 跟踪学习国内外先进的经验与方法,开展一些创新性研究。3.1.2 技术方案图1基于云数据空间航空航天多源情报组织与

18、共享系统总体设计基于云数据空间的航空航天多源情报组织与共享系统示意图如图1所示。本课题拟采用的具体实施方案如下:1 数据空间技术在数据空间模型方面,提取情报信息数据的共性,建立统一的数据表示方式,抽象出统一的数据源管理接口,满足跨库、异构数据的集成需求。在数据空间管理方面,一方面,研究数据空间监控引擎,监控数据空间外部数据源的变化以及数据空间内部数据的变化。根据不同的变化,对数据空间进行更新。通过并发控制、事务处理、版本控制等手段保证数据更新过程中引起的一致性问题。另一方面,研究数据的查询技术,通过基于语义的数据查询技术提高系统的查询能力和效率,通过查询转换实现多数据源的查询。在数据空间系统架

19、构方面,依据之前建立的数据空间模型以及相关的技术研究成果,构建适用于情报信息系统的数据空间系统框架,为情报信息应用系统提供数据访问与管理的基本支撑。图2情报信息数据空间集成与管理框架情报信息数据空间系统框架如图2所示,数据集成引擎负责对多源数据对象进行信息抽取和表示,并通过模式匹配确定数据对象在数据空间中是否已经存在,完成数据集成操作。数据管理负责数据的访问、查询、更新等,是数据空间系统框架的核心部分。配置管理实现数据空间的参数配置管理,是数据空间的操作更加高效。数据输出接口为用户提供统一的数据访问方式,屏蔽底层异构数据源数据访问方式的差异,使得用户只需关注于数据本身以及应用的逻辑操作。2 云

20、文件系统关键技术研究在元数据管理技术方面,采用元数据服务器的代理冗余方式,即由元数据服务器代理机构成了元数据服务层,每个代理机构成一个对等的服务节点,规避主从式存储模式架构的性能和可靠性瓶颈问题,提高性能和可靠性。在并行处理技术方面,拟利用一个并行优化的BlobSeer存储层代替Hadoop云计算系统的分布式文件存储系统。在单点故障技术方面,拟基于P2P构建数据共享网络,消除单点失效,保证较好的拓展性和可靠性。在文件分块存储技术方面,拟研究一种有效的动态的文件分块存储算法,在文件容错、磁盘碎片、分块大小、并行支持等方面上提供动态的策略与折中。图3面向云存储的文件系统架构基于以上关键技术的研究,

21、设计面向云存储的分布式文件系统架构,如图3所示,采用层次结构,从里向外依次定义为块数据服务层、元数据服务层以及客户端应用层。元数据服务层是系统的关键与核心,采用多代理的方式,将元数据服务器主机构成了一个对等式的分布式服务网络,形成该元数据服务层。主要负责侦听客户端和块数据服务器端的请求时间与处理、文件到文件块的映射以及文件块到文件服务器的映射、名字空间管理、文件管理等功能。块数据服务层与基本的主从式分布式系统功能类似,主要包括管理数据块信息、数据块的读写、以及元数据服务器的指令处理等功能。应用客户端层作为服务的接入层,提供用户接口。3 基于语义的检索技术情报信息本体的构建。对情报信息系统领域内

22、概念以及概念间关系的精确描述,通过对领域中知识和概念的分析,确定他们之间的关系和可能的约束规则,选择一定的知识本体构建方法和知识本体建模工具,形成情报系统知识本体。原始信息收集。信息库是检索系统的基础设施之一,在信息检索时,首先要确保信息库中存在足够多的可供检索的信息,然后才能考虑如何有效的检索。因此,为保证信息检索的信息资源的充分和有效,必须将所需的信息收集到检索信息库中。在本课题中,信息的将通过数据空间的数据集成来实现。元数据提取。智能检索系统中的元数据不仅包含了传统信息检索系统索引数据库所描述的内容信息,而且还体现了具体领域的语义关系,为予以推理、息息检索等后续操作奠定了基础。情报信息的

23、元数据提取主要依据数据空间数据集成对元数据的描述。4多源数据动态加载技术在数据源抽象描述方面,方案基于XML类型数据源类型描述和数据源连接描述,系统通过对基于XML抽象描述信息和相关配置信息的解析,实现动态适配。其中数据类型描述包括传统数据库、FTP、网页、各类文件,包括常用的pdf、doc、txt等内容。数据源连接描述提供典型的数据库和FTP及典型文件系统的访问URL、驱动类型和位置、用户接入凭证等多种信息。在动态适配方面,系统可以基于插件技术,通过解析的数据源描述信息,实现数据源的动态适配与扩展。在系统中将连接驱动和相关的解析模块以插件等式提供,依赖与插件平台实现动态的加载和更新。这样,当

24、与新数据源连接时,通过连接描述信息可以查找驱动类型及连接参数,动态载入驱动插件,实现动态连接。当需要扩展新的数据源类型时,则通过用户对文件类型描述信息,查找与之相应的解析模块的名称和位置,并将其加载到系统中,从而实现对系统的动态适配。在动态数据源综合技术方向,系统可以通过各类数据源提供的元数据信息和系统领域本体描述信息,基于相应的推导规则,实现基于语言的动态匹配,从而能够对多类动态数据源的综合处理,为用户提供准确、完备、统一的查询结果。5 分布式数据的划分与处理本研究主要针对MapReduce在Shuffle阶段的瓶颈,改进Shuffle阶段的处理算法,设计一个新的互联网海量数据处理框架Map

25、Reduce+,如图4所示。图4海量数据处理框架MapReduce+3.2 主要技术难点分析1 通过研究适用于情报信息的数据空间技术,主要包括数据空间系统框架、数据空间模型以及数据的管理(更新、查询、存储、索引等),解决异构、海量情报信息的跨域访问与动态管理。2 通过研究面向云存储应用的分布式文件系统技术,具体包括元数据的管理技术、文件的分块存储技术、用户大压力下的访问数据支持与管理技术、存储和计算的对接结束、大文件与小文件读写的同时支持技术、节点失效的隔离技术等,解决情报信息的海量存储、高并发、低延迟的读写效率以及高的可靠性、稳定性和安全性等问题。3 通过研究情报信息系统的本体模型、元数据提

26、取等技术,实现情报信息系统的领域本体构建以及元数据信息提取,实现信息的智能检索,提供一个强大的推理系统支持。提高构件检索的查全率和查准率,并以目标情报信息的入库、检索等工作奠定基础。4 通过对数据源的抽象、动态适配以及数据源整合技术的研究,提供随时动态地加载新的数据源的能力,解决情报系统中数据源多变的、动态更新所带来的查询结果不确定性以及时间延迟等问题。5 通过对现有技术如Google MapReduce及其HadoopMapReduce尚未对海量数据建立索引及其在MapReduce处理过程中,尤其是在其Shuffle阶段调度性能差的问题进行相关技术研究,实现对低时延的多条件、多维度复杂分析的

27、支持更为优秀的MapReduce+调度策略和其相应的调度算法,实现单点或者多点故障的高效恢复。3.3 研制单位的能力分析空六补充清华大学信息技术研究院(以下简称:信研院)是清华大学信息学科群的技术创新基地,人才引进渠道和产业发展源头。作为清华大学信息科学技术学院(以下简称:信息学院)和清华信息科学与技术国家实验室(以下简称:信息国家实验室)的重要组成部分。信研院WEB与软件研究中心,长期从事网络存储技术,海量数据管理和分析;视频编码、存储、检索与流化技术;数字图书馆/档案馆关键技术的研究。先后开发了海量数字资源管理系统DRMS、CNGI(下一代互联网智能网络存储系统)存储节点管理系统、基于云服

28、务的清华科技史数字图书馆(包括建筑、数学、机械、水利等多个主题),北京市数字视频资源编目和检索系统,中文海量网络资源库(30TB),基于列存储的国产关系型数据库华鼎等系统。在海量数字资源的存储、管理、索引、服务方面有长期的研究和技术积累,为云数据中心和数据管理关键技术研发奠定了良好的基础。发表学术论文120余篇,其中SCI33篇、EI54篇,获得发明专利5项,国家标准3项和行业标准5项。软件著作权12项。 中心从1999年开始从事海量数字资源管理系统(DRMS)的研究,此后一直持续研究这方面的基础理论和关键技术问题,主要成果包括基于SOA和OSS 提出了支持海量数字资源服务和管理的多层体系结构

29、框架,构建了自主知识产权的通用软件支撑平台;研究了基于THVDM 模型的视频管理技术;基于信息过滤的个性化服务技术;面向存储区域网的性能分析与仿真建模方法;基于全生命周期的长期保存和归档;基于中国数字对象标识(CDOI)的内容分类、聚合、搜索和数字版权等支撑技术;以及海量网上资源的聚焦采集、标引和挖掘,其中融合了多年的理论研究成果。部分研究成果发表在一些有影响的会议和期刊,在本领域同行中有一定的显示度。教育部组织专家鉴定认为,DRMS是具有我国自主知识产权的面向数字图书馆和电子政务数字资源管理的通用软件支撑平台,系统总体设计和关键实现技术达到了国际先进水平。中心受国家211计划和清华大学985

30、计划的支持,建设了非常先进的科研实验环境。多年来一直承担国家重要课题的研究,科研力量雄厚,科研成果显著,有丰富的从事科学研究和科研管理经验,为本项目的研究提供坚实的保证。近5年来,中心参加了发改委CNGI项目-“面向下一代互联网的智能网络存储系统研究与产业化”;主持了863目标导向项目“支持数据驱动型应用的跨域共享与服务支撑平台”;参加了863重点项目“多语言基础资源库研制和共享海量网络数据资源库”;参加了十一五国家科技支撑计划“数字平面内容支撑技术平台”。这些项目都与海量数字资源的存储、管理、索引、服务相关。参加了铁道部重点项目“高速铁路客运专线票务系统”,在大型分布式高并发系统的高性能、高

31、可靠性关键技术方面积累了重要经验。目前正在主持973计划“面向复杂应用环境的数据存储系统理论与技术基础”项目中“海量数据组织与资源共享的方法研究”课题的研究,该课题主要围绕云数据管理关键技术进行研发。上述这些工作为本项目的研发与实施奠定了基础。此外,中心从“十一五”开始积极参与并承担了我国国防重要科研项目:军队“核高基”、总装预研、空装预研、军队科研、航空基金、航天支撑技术基金以及航空航天院所的合作项目。通过这些项目的实施,了解军队信息化建设的现状和进一步发展的需求,并在军用软件集成和情报检索等方面取得了重要成果。3.4 与国内外同类产品、技术对比分析1海量数据检索随着计算机技术和Intern

32、et技术的迅猛发展,全球化时代已经到来,各类信息急剧增长,在航空航天情报领域,数据的级别也同样呈指数级增长,目前已经达到每天几十GB数据,而数据的类型也各种各样,如何在海量数据中快速查找有效的信息,是情报系统首先需要解决的问题。目前,常用的检索技术有全文检索和数据检索。全文检索的特点是把用户查询的请求与全文中的词一一比较,考虑查询请求语义上的匹配,虽然全文检索可以保证查全率,但查询效率极低。而数据查询要求用户查询请求和信息系统中的数据必须遵循固定的格式,具有很大的局限性。目前通用的检索如google、baidu通常基于简单的匹配策略,虽然基于倒排索引,在查询效率上有了显著提高,然而支持语言匹配

33、的能力极差,经常返回大量无意义的信息,准确率极低,无法满足情报系统中快速准确的需求。寻求新的、智能化的检索方法已经成为近年来的研究热点,近年来基于本体的技术受到研究者的重视,探讨本体在信息检索领域的应用,并提出了一系统列基于本体的智能信息检索设计方案,但目前还未得到广泛应用。情报领域作为一个特殊领域,其查询必须做到准确、高效,因此,构建领域本体,实现基于语义的准确查询支持,能够综合各类查询方式的优点,帮助用户在海量数据中快速提取有效信息,显著提高情报人员的工作效率,大海中迅速捞到“针”。2云存储和数据空间管理 在存储方面,目前,航空航天情报数据源分别存储在许多不同部门的结点上,分散管理,这种分

34、散的存储方案无法做到透明的数据共享、随着数据量的日益增长,需要不断地扩充已有存储资源,给系统管理和运行都带来很大的压力,同时也大大提高了系统维护成本。而基于云存储的方式可以里德综合管理,实现数据在云中的透明迁移,最大限度地减少系统扩展带来的影响,大大降低成本,节省资源。数据迁移到云存储或基于云构建,所有的数据存储在云中,这样,依赖云存储平台,能够提供统一的管理服务,减轻管理成本和投入此外,云存储服务强大的可扩展性,当数据存储需求变更后,云存储服务则可以很方便的在原有基础上扩展服务空间,满足需求。而且这种变更对用户使用是完全透明的,大大减轻了系统管理和升级带来的压力。在情报系统中,数据管理大多基

35、于数据库或FTP等方式管理,前者,格式固定,无法管理非结构化信息,而后者却无法提供精细的管理支持,给情报管理带来极大的不便。.与已有数据管理技术相比,数据空间在数据模型、数据操作、数据对象、数据关系以及构建成本上都有明显的不同,首先数据空间的数据类型可以来自多个不同的数据源,数据格式多种多样,一个数据空间中可能包含关系表、文本、电子邮件、图像、音频、视频等多种异质的数据。其次,数据空间中数据关联是基于对象的,即任何对象之间都可以建立关联。因此,数据对象之间关联是复杂的、动态的、演化的,而传统的数据管理技术,数据关联建立在表一级,这种关联往往是稳定的,而且类型也相对单一,无法表达许多情报内容之间

36、的关联关系。同时,数据空间在构建方式上与传统数据库有很大的不同,传统数据库管理系统的构建往往是一步到位的,即通过分析相应的需求,设计出数据库模式,并在较长时间内保持稳定,而数据空间的构建是一种动态自动集成方式,这是一种基于用户需要的演化集成方式,只有当用户认为必要的时候,才会将对象保存到数据空间中,才会在对象之间建立关系。在情报系统中,通常,系统数据源非常复杂,关系无法固定,需要在运行中发现并动态建立这种关联,因此,基于数据空间这种管理方式更适合航天航空情报管理的需求。 4 推广应用意向及前景预测请空六补充5 研制周期及主要工作节点本项目的研制周期为2年(2012年1月至2013年12月)项目主要工作节点如下:年度主要研究内容阶段成果形式20121) 数据空间技术2) 云文件系统技术3) 基于语义的检索技术4) 多源数据动态加载技术5) 分布式数据的划分与处理技术6) 异构数据的统一访问技术方案、报告、论文20131) 基于云数据空间的情报数据存储与管理工具研发2) 基于语义的航空航天情报智能检索工具研发3) 基于云数据空间的情报数据统一服务平台研发4) 测试与完善5) 项目验收方案、报告、论文、软件6 研制经费概算及年度拨款强度需求序号项目总价(万元)备注1设计费2材料费3外协费4专用费5试验费6固定资产使用费7管理费8不可预见费总计

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 教育教学 > 成人教育


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号