向电信行业提供全面的IBM信息集成解决方案.docx

上传人:牧羊曲112 文档编号:1853953 上传时间:2022-12-21 格式:DOCX 页数:46 大小:1.06MB
返回 下载 相关 举报
向电信行业提供全面的IBM信息集成解决方案.docx_第1页
第1页 / 共46页
向电信行业提供全面的IBM信息集成解决方案.docx_第2页
第2页 / 共46页
向电信行业提供全面的IBM信息集成解决方案.docx_第3页
第3页 / 共46页
向电信行业提供全面的IBM信息集成解决方案.docx_第4页
第4页 / 共46页
向电信行业提供全面的IBM信息集成解决方案.docx_第5页
第5页 / 共46页
点击查看更多>>
资源描述

《向电信行业提供全面的IBM信息集成解决方案.docx》由会员分享,可在线阅读,更多相关《向电信行业提供全面的IBM信息集成解决方案.docx(46页珍藏版)》请在三一办公上搜索。

1、利用信息集成面向电信行业提供全面的IBM信息集成解决方案概述21.电信行业面临的信息集成挑战61.1.创建灵活的信息集成基础构架61.2.Internet 所引发的变革71.3.信息爆炸和信息多样性的挑战71.4.信息集成面临的技术挑战82.DBMS 技术的演变93.利用IBM INFORMATION INTEGRATOR创建电信行业的综合信息平台113.1 电信行业综合信息平台建设方案133.2 省电信公司综合信息平台建设方案134.IBM分层业务集成框架144.1.集中式数据查看164.2.灵活的访问方式174.3.丰富的特色功能185.信息集成体系结构215.1.数据层225.2.服务层

2、235.3.应用程序接口246.IBM DB2 INFORMATION INTEGRATOR 简介256.1.DB2 Information Integrator276.2.DB2 Information Integrator for Content296.3.流行的信息管理方案对比307.总结321. 1.概述随着经济全球化趋势和中国加入WTO,中国电信市场的政府管制力度将越来越弱,市场更加开放、竞争更加激烈。国内具有经营权的电信运营商,在全国范围内均拥有相当规模的公用电信网,经营多种基础电信业务和增值电信业务,形成本地网、移动、长途、数据、IP电话、寻呼、增值业务等多种业务并存共同发展的格

3、局,如何发挥各自的综合优势,实现灵活多变的营销策略,提高客户服务水平,成为当前电信企业迫切需要解决的问题。经过多年的建设和发展,国内电信企业各业务子系统如营业、计费帐务、网络管理、资源管理等系统日趋完善,并支撑着企业日常的业务运营,同时,电信企业越来越意识到客户是企业生存之本,“一切以客户为中心”的经营理念正在改变着电信服务企业的运作方式,实施CRM、商业智能、大客户/渠道管理系统将通过改善企业和客户的关系,从而达到提高企业利润的目标。为了提到企业的整体运营效率,国内的电信运营商正在致力于建设企业业务运营支撑管理系统,建设新型的电信运营支撑系统需要参考国际上统一的框架和模型,以使设备供应商、网

4、元提供商、系统集成商、应用开发商等能在一个框架范围内进行合作和协调。电信管理论坛(TMF)由一系列的运营商和系统集成商组成,主要致力于按TMN的框架规划和指导电信运营支撑系统的开发、建设和采购工作,国际电信管理论坛(Telecom Management Forum)制定了eTom模型标准。eTom模型示意图如下:从上述框架结构图来看,eTom 实际包含了电信企业管理信息系统的所有方面:n 企业战网络和产品管理、n 企业管理n 运营支撑管理对于一个新的运营商,其管理系统的建设必然不是一步到位的,即便是先进国家的运营商也不是都已建设完毕。其中,直接影响业务开展的部分也就是通常所说的业务运营支撑系统

5、(BOSS)。针对BOSS,eTom 模型将TOM中的FAB运营模型作了扩展,扩展后的运营模型如下:根据TMN的逻辑分层原则,在eTOM体系中,对电信业务处理框架分成以下几个层次:客户关系管理层、业务管理和运营层、网络与系统资源管理层、供应商和合作伙伴关系管理层。客户关系管理层包括:销售管理、业务受理、订单管理、故障受理、客户QOS以及SLA管理、收费和帐单管理等处理过程。业务管理与运营层包括:服务配置和实施、故障管理、服务质量管理、计费帐务和优惠等处理过程。网络与系统资源管理层包括:网络资源申请和配置管理,网络故障管理、网络质量管理等。供应商和合作伙伴关系管理层包括:合作伙伴网络资源接口管理

6、、网间计费结算等。电信运营商的主要工作是设计和实现面向客户的端到端(end-to-end)的业务管理。eTOM模型定义了3个基本的面向客户的端到端(end-to-end)的服务:业务实现(Fulfillment)、业务保障(Assurance)、业务计费(Billing)。n 业务实现(Fulfillment)负责及时和正确的处理客户订单。n 业务保障(Assurance)负责及时处理客户和网络的问题,实施对业务的有效保障。n 业务计费(Billing)负责及时和正确的处理帐单和收费。从国内电信企业的业务系统现状来看,由于各业务系统的分期、独立建设,不同开发商建设业务系统采用的应用架构各不相同

7、,某个电信企业的计费帐务系统实现了省级集中、而营业系统可能还是在地市运行;业务子系统采用的数据库系统不同,加之应用系统相对独立,各子系统间或与企业外部系统存在着众多的接口,以计费帐务系统为例,它与营业系统、数据业务系统、客服系统、催缴系统、银行代收系统均存在接口,而这些接口往往采用接口表的方式实现,即将相关接口信息从数据库中提取并生成文件,将文件在不同系统间进行传递。这意味着某些需要在不同业务系统中共享的用户数据不能得到实时的访问。用户资料对于任何电信运营商都是至关重要的,依据现状,一个用户的不同业务资料会散落在不同的业务系统当中,如:一个本地网电话用户资料存在于营业系统中,同时该用户又是16

8、9的用户,在数据业务系统中存有它的资料,如果用户同时申请ADSL和IP电话卡,那么在同一企业内部,同一身份的用户会有多份资料。而应用系统尤其是与客户服务相关的业务系统需要访问一个统一的客户资料。通过建设ODC(操作数据中心),采用ETL工具从现有各专业系统和业务系统中抽取相应的客户(用户)资料和业务运行数据,经过沉淀、规整、合并,形成综合的数据中心,包括统一业务资源数据、统一客户资料数据、综合业务运行数据。用ETL工具定义的数据抽取和转换的任务是定时启动的,会产生一定的数据延时。如何在不影响现有应用系统的前提下,实时访问用户的各种业务资料?如何弥补ETL转换带来的数据延时,对业务数据进行实时的

9、统计查询?如何快速集成新应用系统的用户和业务数据(小灵通)?.IBM 的信息集成软件Information Integrator能够全面满足电信企业的这些需求,利用信息集成技术可实现对传统及新兴数据源的统一、实时访问,还可进行信息转换来满足业务分析人员的需要,并能对数据安排进行管理,提高性能、现时性和可用性。2. 电信行业面临的信息集成挑战随着BOSS系统的建设和新业务的不断扩展,电信企业的业务环境日益复杂,各种业务数据不断的增加,使得企业中各种数据业务繁多,数据源也十分分散。用户越来越希望能够对整个企业不同数据源的数据进行统一的相关联的管理。但是目前很多企业受各方面因素的约束,分散的数据源很

10、难复制或集中到单一的数据库上。因此,这就使用户越来越渴望能够获得一个可以整合企业中各个分散的数据源以方便访问不同数据源的解决方案,信息集成的建设日益重要起来。企业信息集成的艰巨性令人望而却步。IT 主管们必须应对上方施加的种种压力:快速提供结果;满足最终用户能够方便访问种类繁多的数据源的愿望;围绕技术限制制订计划及适应不断变化着的环境。2.1. 创建灵活的信息集成基础构架在当今的竞争性环境中,企业希望达成下述目标:将新的网络应用程序与现有核心业务流程集成,同时通过 Internet 与更广泛的客户群建立联系利用关键电子商务系统中的信息提高门户网站的价值,进而提高业务用户的生产力l 通过在内部应

11、用领域(如生产和货运)中及与供应商和其它贸易伙伴间集成订单处理流程来提高产品交付速度l 通过将竞争力分析、分析家研究、销售信息及客户资料中的信息建立关联,更迅速地从新兴机会中获利l 利用购买的客户资料在整个企业范围内集成所有客户信息,以实现与客户沟通的个性化,进而提高客户忠诚度和增加收入l 理顺人员、流程和应用程序间的信息流,将不必要的工作和迟延降至最低水平。l 为满足这些需要,各企业正将其 IT 计划的重心向集成转移。CIO 杂志2002 年的一项调查表明,各企业首席信息官均将集成视为其 IT 战略的重中之重。12.2. Internet 所引发的变革Internet 的出现使客户对服务和信

12、息访问的期望值发生了翻天覆地的变化。通过像 Google、Lycos、Yahoo! 及其它一些搜索引擎,人们几乎可访问任何主题的信息集。通常情况下,响应时间受连接速度的影响要比任何其它因素大。各企业通过实现客户完整资料的集中式查看,并通过引入有趣和相关的内容增加附加价值吸引了客户的注意并赢得了客户的忠诚。关键在于客户期望能够在线快速、集中查看含有多种增值内容的个人资料。2.3. 信息爆炸和信息多样性的挑战内容匮乏之说是站不住脚的。数字化信息正在迅速增长,看似已超出企业可以对其进行掌控和利用的能力。根据加利福尼亚大学伯克利分校信息管理和系统学院的行业分析家的预计,2001 至 2003 年间将产

13、生的数据比记录历史全部数据的总和还要多。伯克利的研究人员发现,“全球每年产生的不重复信息量在 1 到 2 千兆兆字节1 至 20 亿吉字节之间,也就是说,地球上每个男人、女人和小孩人均要产生约 250 兆字节的数据。”2在信息膨胀和信息源多样性的共同作用下,对有用信息的检索更趋复杂。各企业必须不但能访问企业内外的关系数据库等传统应用程序源,还必须能够访问可扩展标记语言 (XML) 文档、文本文档、扫描图像、视频剪辑、新闻供给、网络内容、电子邮件、分析多维表和专用存储器。由于组织结构或运营方面的限制,互异且分散的数据源中的信息通常不适合进行全盘复制或在一个数据库中进行合并。但如果在信息之间建立关

14、联,就可以显现隐藏的信息,更轻易地识别出机遇,进而为客户提供更好的服务。Giga Information Group 预计至少有 30% 的新电子商务应用程序面临需要集成多个数据源的问题。3对于大多数企业来说,提供对异类数据的连贯性访问是一个重大障碍。这其中固然有技术解决方案存在局限性的因素,但还存在一个潜在的更大障碍,即在企业内部就共用分类系统达成共识。 2.4. 信息集成面临的技术挑战技术硬着头皮追赶着集成需求的脚步。企业将各种集成解决方案拼凑起来应付各种迫切需要,事后才意识到这样的解决方案缺乏可扩展性、可用性和灵活性。置身于浩如烟海般的市场(如企业应用集成、数据仓储、企业内容管理、门户网

15、站和应用服务器市场)中的技术供应商已开始将注意力重心向总体集成问题转移。这使客户选择一种能够满足业务需求的最佳技术变得难上加难。而且,由于点式产品的特定领域取向,往往难以在后续项目中利用前一个项目的成果。结果客户会发现,自己陷入了一个不断对集成解决方案进行再集成的怪圈。不断变化的环境集成是一项永远无法完成的工作。IT 环境始终处在一种变化莫测的状态之中,新应用程序层出不穷,套装应用程序的版本级别变化可在基础构架各环节引发连锁反应,始终存在着尝试下一个新工具或下一项新技术的机会,企业的投资决策必须着眼未来。正因如此,才不断有企业开始将工作重心向集成体系结构转移。无论是称作“信息管理部”、“集成服

16、务部”还是“数据体系结构部”,各公司中的这些专业化部门都在着手解决业务集成问题以及定义将为企业的未来发展奠定基石的集成体系结构和基础构架问题。3. DBMS 技术的演变下图表示了关系数据库技术的演变。关系数据库是在存储、操作和管理大量数据的完整性的需求下应运而生的。在 20 世纪 60 年代,网络和分层系统(如 CODASYL 和 IMSTM)是用于自动化银行业务、记帐和订单处理系统的一流技术,这些系统是由于商业大型计算机的引入才启用的。虽然这些系统为早期系统提供了良好的基础,但它们的基本体系结构将数据的物理操作与逻辑操作混合在一起。当数据的物理位置改变时(譬如从磁盘的一个区域移到另一个区域)

17、,也必须更新应用程序,以引用新的位置。1970 年,Codd 的一篇革命性论文 CODD 及其商业实现改变了一切。Codd 的关系模型引入了数据独立性的概念,它将数据的物理表示与在应用程序中的逻辑表示分开。数据从磁盘的一部分移到另一部分或以不同格式存储,都不会导致重写应用程序。应用程序开发人员从单调的数据操作物理细节中解放出来,因而可以将注意力转移到特定应用程序上下文中数据的逻辑操作上。关系模型不仅减轻了应用程序开发人员的负担,而且在数据管理业界造成了堪称楷模的转变。检索什么数据和如何检索数据的分离提供了一种体系结构,新数据库的供应商可以使用这种体系结构来对其产品进行改进和创新。SQL 成为描

18、述应该检索什么数据的标准语言。新的存储模式、访问策略和建立索引的算法得以开发,以加速数据在磁盘上的存储和检索,并发性控制、日志记录和恢复机制方面的发展进一步保证了数据完整性 GRAY、LIND 和 ARIES。基于成本的优化技术 OPT 完成了数据库从作为抽象数据管理层到成为高性能的、大容量查询处理引擎的转变。随着公司的全球化,以及公司的数据迅速地分布于其国内和国外的办公室,DBMS 技术的界限再次受到了考验。诸如 R* 和 TANDEM 之类的分布式系统表明:可以轻松地利用基本 DBMS 体系结构来管理大量的分布式数据。分布式数据导致新的并行查询处理技术的出现 PARA,它说明了 DBMS

19、作为高性能的、大容量查询处理引擎的可伸缩性。图 1. DBMS 体系结构的演变在用分布式和并行算法扩展 DBMS 时获得的经验还引起了可扩展性方面的发展,由此,即插即用组件改变了单一的 DBMS 体系结构 STARBURST。这样的体系结构使得在出现新的业务需求时,可以轻松地引入新的抽象数据类型、访问策略和建立索引的方案。稍后,数据库供应商将这些吸引人的技术向顾客推广,相关的产品有 Oracle 数据部件(Oracle data cartridge)、Informix DataBlades 和 DB2 ExtenderTM。在整个 20 世纪 80 年代,数据库市场已经成熟,各公司试图基于一家

20、数据库供应商来进行标准化。但是,做生意的实际情况通常使此类战略变得不切实际。从独立部门的购买决策到合并和收购,在一个 IT 部门中存在多种数据库产品和其它管理系统的方案屡见不鲜。企业寻找一种方法来降低与此类异构环境相关的管理和开发成本,数据库业界则以联邦作为响应。联邦数据库 FED 提供了用来透明地访问异构的、分布式数据源的功能强大而又灵活的方法。现在我们处于一个由因特网支持并由电子商务的剧增所推动的革命性的新时期。在过去的六年中,JavaTM 和 XML 已经成为可移植代码和可移植数据的实现手段。为了适应变化,数据库供应商已经能够利用数据库可扩展性和抽象数据类型方面先前的发展成果来快速提供对

21、象关系数据模型 OR、将关系数据作为 XML 文档存储和检索的机制 XTABLES 和 SQL 的 XML 扩展 SQLX。由于开发和部署复杂的基于因特网的应用程序得到了简化,从而显著地加速了使业务过程自动化的步伐。本文的前提是:现今企业所面临的难题是信息集成。企业应用程序不仅需要和数据库交互,还需要和关系数据库并行发展的内容管理系统、数据仓库、工作流系统以及其它企业应用程序交互。4. 利用IBM Information Integrator创建电信行业的综合信息平台利用IBM 数据管理领域的最新产品IBM Information Integrator可以帮助电信企业建立统一的信息集成访问接口

22、,建立一个逻辑上集中、物理上分布存储的电信综合信息平台, IBM Information Integrator 将会建立一个可读写的双向访问接口,在IBM Information Integrator所提供的访问接口的支持下,就可以在一个整体数据库的逻辑视图下(这一视图是跨越当前各电信业务系统之上的),实现电信行业内部统一数据管理和访问以及部署。可以提供一个统一的综合信息平台,通过统一的视图访问企业内部不同业务系统的用户和业务数据,并且及时将新增业务系统的各类数据集成到BOSS系统中,这个综合信息平台能够实现如下目标:a) 在不影响现有业务系统的情况下,通过Information Integr

23、ator访问营业、计费帐务、资源管理、智能分析和其它业务系统的数据,将原先的N*N的复杂接口简化为N-1,同时避免了采用文件接口造成的数据延时。b) 通过Information Integrator使综合客服系统、大客户、渠道管理系统和数据仓库系统访问统一的客户视图。c) 为新型业务提供了实时的、便利的访问多个电信业务数据库的途径。使用IBM推荐的这一设计实现模式,能够在整个企业范围内透明访问关系型、结构化、甚至将来可能存在的非结构化数据,支持读写操作。能提供战略上的数据集成架构,以帮助用户去访问、处理以及整合分散的、分布式的、甚至异构的实时数据。 IBM Information Integr

24、ator包括联邦数据服务器(Federated Data Server)和复制服务器(Replication Server),用于整合各种数据源的实时数据。联邦数据服务器(Federated Data Server)利用SQL或产生SQL的工具(整合的开发环境、报表、分析工具)访问、整合及处理分布式的和分散的数据。该产品主要适用于数据源为各类关系型数据库及其他如XML、Web或内容数据源。通过部署这一模式,可以将所有的分散数据源(分布在各个业务系统中的各个数据库,可以是同构的也可以是异构的),统一成一个数据库读写访问接口,应用开发者只需要使用IBM Information Integrator

25、提供的一套访问接口就可以实现与各个分散数据源的连接、访问、处理操作,简化编程难度,从而开发出跨越电信行业中的各业务数据库的综合业务功能。如下图所示:营业系统计费帐务综合客服商业智能电信运营支撑系统DBDBDBDB实时访问需求(用户资料、业务资料、统计)复制技术Cache技术事务控制IBM Information Integrator(读写接口)联邦数据库逻辑综合信息库下面我们将对这一解决方案中的各种关键技术和功能进行详细说明:电信行业综合信息平台建设方案以下是针对省级电信公司在进行综合信息平台的设计模型以及实现方式:省电信公司综合信息平台建设方案从上图可以看到通过逻辑上统一的综合信息平台,在实

26、现对业务子系统数据的实时访问:l 首先将各个业务系统不同数据源中的表映射到利用IBM Information Integrator支撑的综合信息平台中;l 通过IBM Information Integrator将一些经常访问的数据通过物化视图创建在综合信息库中,提高数据访问的效率;l 客服、大客户系统可以直接通过IBM Information Integrator 中所建立的业务库表的映射关系访问实时数据,建立有关客户信息的关联,为客户提供更好、定制化的服务。l 商业智能分析可以通过IBM Information Integrator来获取实时数据的查询访问。l 通过IBM Informat

27、ion Integrator与IBM Websphere和MQ的结合,为企业应用集成提供统一的数据平台。5. IBM分层业务集成框架IBM 认识到有必要将结构和透明度引入市场,并为此推出了全面业务集成框架。这种框架是实现随需应变电子商务的重要一环。IBM 对随需应变电子商务的定义是:对客户、合作伙伴和员工需求的响应极其迅速;聚焦企业的核心竞争力,有具备灾难恢复功能的 IT 基础构架为后盾。这种电子商务还提供了可变成本结构,为金融灵活性提供了方便。IBM 的业务集成框架也是满足随需应变运行环境标准的关键因素,该环境有四个基本特性:集成性、开放性、虚拟性和自主性。 从根本上讲,集成是围绕着人员、流

28、程、应用程序和信息展开的。不同类型的集成问题需要使用不同的集成技术来解决。例如,在线客户订单必须通过应用程序才能实现,而通过数据库应用程序编程接口 (API) 就无法实现。应用程序编程逻辑内嵌的业务规则可防止数据库被不当使用。换句话说,响应以预计交货日期的应用程序大可放心地在生产和货运数据库中访问关联信息,而复杂的嵌接及屏蔽数据源间差异的工作则依靠数据管理系统来处理。如本例中所示,最佳解决方案往往会利用几种技术,而它突出的是对技术间切换方便性的需要。竞争对手只能提供面向特定领域的集成,而 IBM 却可利用可无缝协作的方案提供全面集成。IBM 在建立和改良中间件基础技术及使这些技术能够在成千上万

29、种不同的业务环境中协同工作方面已浸淫 30 余载。如下图中所示,IBM 已确定了5 个基于开放式服务基础构架的集成方法,企业可组合或单独使用这些方法来解决这些问题。图 . IBM 为业务集成提供了一种开放式服务基础构架。这些方法是:l 信息集成,利用它可实现对企业内外不同形式业务信息的集成。利用信息集成可实现对采用集中式查看的信息资产进行相关搜索、访问、复制、转换和分析,从而满足业务需求,而不必顺序访问各信息源。l 应用程序连接,它将应用程序链接起来,以共享和利用信息。业务资产被高效地连接在一起,以使异类系统上的信息可以在企业中流动。l 流程集成,它改变了企业的流程自动化方式。流程集成将应用程

30、序的连通性提升到了一个新的层次,它通过将企业内外不同的人员组和异构系统组间的流程模型化、自动化并实施监控,使企业具备了改变运营方式的能力。l 用户交互,其本质在于跨应用程序和设备创建统一、交互式的用户体验。由于它可以提供统一、可定制的用户界面,并可通过几乎任何设备使用该界面,还能够实现完整的事务支持,更可与多个业务系统集成,各企业可因此享有更高的客户忠诚度、更有效的协作和新机遇。l 以集成为目标的构建,着重建立和部署充分利用网络服务和现有资产的、新的、可随时集成的应用程序。与传统仓库所采用的方式不同,新解决方案需以可使它们与现有软件资产即时集成的方式来实施。 通过采用一种可为开放式的随需应变电

31、子商务平台提供基础的开放式服务基础构架,IBM 拓展了其在各种异构环境并存的业务领域中的机遇和生产力。基于行业标准并秉承其对互操作性的执着追求,IBM 凭借其 WebSphere 软件平台和 DB2 信息管理系列产品提供了既能应对今时之需,又有助于实现未来灵活性的最佳方案。5.1. 集中式数据查看按照 IBM 的预想,信息集成基础构架须为应用层提供对其必须访问的数据的集中式查看,而且这种查看不受数据格式、数据位置和访问接口差异的限制。对数据管理软件的改良不是实现对单实例数据存储器的管理而已,而是还要能够提供对所有形式数据的增值性集成、对数据安排实施动态管理以满足可用性、现时性及性能要求以及提供

32、可继续减轻 IT 人员管理复杂数据体系结构负担的自主特色功能。为此,IBM 制订了一项代号为 Xperanto 的计划,旨在应对客户对集成结构化、半结构化和非结构化数据的需求。依靠在研究上的不断投资及在关系数据、XML、内容管理、联邦、搜索和复制等领域所拥有的可靠的数据管理技术,IBM 正着手开发集成式基础构架(如下图所示)。IBM 基础构架凭借一系列程序设计模型、一套丰富的集成特色功能及与 IBM 的整个业务集成框架的互操作性提供了灵活的访问方式。5.2. 灵活的访问方式IBM 的设想是通过行业标准接口提供对信息集成基础构架的灵活访问。客户访问可通过 ODBC、JBDC、网络服务、本地客户机

33、或异步客户机接口来实现。支持的查询语言将包括:结构化查询语言 (SQL),业界最成熟、功能最强大的查询语言,市场应用广泛XQuery,有关 XML 数据访问的新兴标准,万维网协会 (W3C) 目前正在进行其标准化工作IBM DB2 Content Manager 是面向对象的应用程序编程接口,它支持内容管理生命周期,包括富文本和图像查询。无论采用何种客户访问方式和查询语言,应用程序都应能够访问通过集成服务器连接的所有数据。这种客户访问和查询语言灵活性的组合使现有开发和分析工具对集成服务器提供的更广泛的数据访问和集成特色功能进行即时利用成为可能。它还使基础构架能够利用网络服务嵌入到服务导向的体系

34、结构中,还可向异步客户机提供与工作流程或调度长时查询的轻松集成,并能保护您在现有和新应用程序基础构架上的投资。5.3. 丰富的特色功能利用 IBM 信息集成基础构架可实现对各种分散于各处的实时数据的集成,就好像它们来自同一数据源。该基础构架的重要特色包括具有联邦、搜索、高速缓存、转换和复制异类数据的功能:联邦: IBM 提供业界领先的对相异数据源的联邦功能。联邦的概念是:用户可以像对待一个数据源那样对多个数据源实施查看和处理,同时保持其各自的独立性和完整性。视实施的具体情况,这些数据源可能是同类或异类数据源,也可能是集中或分散的数据源。IBM 的联邦引擎提供了下述功能: 透明度:它具有屏蔽作用

35、,可协助使用户无法察觉底层数据源的差异、特质和实施情况,并使一组联邦数据源看上去就像是一个系统。异构性: 一如其名它具有联邦异构类型数据的功能,这些数据类型包括结构化数据(例如,关系数据库)、半结构化数据(例如,XML 文档)、非结构化数据(例如,自由格式文本)。可扩展性: 一种可将联邦扩展到几乎任何数据源的功能。可扩展性专为这一目的而设计,即最大程度降低集成新数据源的工作量,同时灵活地为优化查询访问提供必要的信息。丰富的函数功能: 包括通过支持的查询语言提供的函数、对后端数据源中所缺函数的补偿以及将数据源专用功能无缝嵌入到查询语言中的功能。数据源自主性: 即可将数据源联邦在一起,而对现有应用

36、程序或系统没有或几乎没有影响。性能优化: 使联邦查询成为一种现实备选方案的性能特性。凭借超过 25 年的研究和开发经验及专利的优化技术,IBM 可以事实证明,联邦是一个能够满足性能要求的可行方案。搜索: IBM 的基础构架将提供高级搜索和查询功能,包括网络爬行、文档索引建立、多搜索引擎搜索结果联邦、以实现智能访问为目标的文本文档分类和摘要信息建立以及语义理解。2002 年,IBM 组建了“IBM 搜索和文本分析研究院”,以通过集成式体系结构统一并加速 IBM 在高级搜索和挖掘功能上的研究和部署。研究成果将可为 IBM 信息集成平台以及其它 IBM 方案提供动力。高速缓冲存储器: IBM 的信息

37、集成基础构架将支持在数据层级中的多个点放置和管理数据,以改善性能。这绝非是简单的高速缓存功能,而是基于策略的数据安排和管理。需要由一系列高速缓存策略才能向发出请求的应用程序提供足够的性能、现时性和可用性特性。转换: 基础构架必须提供丰富的转换特色功能,以便进行分析、交换和呈现。复制: 作为信息集成基础构架的一个基本特征,复制功能不可或缺。它是分布式访问特色功能的有益补充,实现了对集中式数据存储器的管理,并为高效管理数据高速缓冲存储器提供了必需的基础构架。简化全面业务集成: 如前所提及,信息集成只是整个业务集成基础构架的一部分。为支持业务的改良需求,此基础构架补充了强健的数据和内容存储器及附加集

38、成技术,并采用了行业标准。数据存储:IBM 现今提供业内领先的关系数据库管理系统和内容管理系统,并在提供集成 XML 支持方面引领着行业的发展。除现有功能(基于关系数据库模型)外,XML 储存还必须完整地包含和充分利用 XML 数据模型。XML 储存设计有一个内置 XML 注册表,以轻松管理大量 XML 工件。这些工件包括随 XML 数据数量和种类的增加而可能产生的 XML schema 文档、文档类型定义 (DTD) 和网络服务说明文档等。利用互补的集成技术:开发企业集成基础构架的关键在于能否自如地组合利用或单独利用适用的集成技术。IBM 继续专注于对“IBM 软件集团”全线产品,特别是 W

39、ebSphere 业务集成系列产品的集成,以提供一套全面的业务集成基础构架。WebSphere 软件平台为数据库及联邦数据库应用程序提供了一个开放、集成式的 Java 技术开发环境。同时,IBM 也在投入力量使其能够与 Microsoft VisualStudio 顺畅协作并实现集成。简言之,IBM 的集成式解决方案是业内覆盖领域最广、最完整的集成式解决方案。 支持行业标准:IBM 继续处于开发和采用行业标准的最前沿,为在不同开发商工具间实现广泛的互操作性提供便利。6. 信息集成体系结构在本方案中,我们提出了利用“信息爆炸”的技术平台和多种工具,并提供了一个端对端的解决方案,用来透明地管理当今

40、商业领域中庞杂的数据。我们将这种技术称为信息集成(information integration)。IBM 提供了数据管理产品系列,这些产品支持使用系统的方法来解决企业如今所面临的信息集成难题。该平台的基础是一个一流的数据库体系结构,该体系结构无缝地提供关系数据和本机 XML 作为一流的数据模型。基于以下三个重要原因,我们相信数据库技术为信息集成平台提供了最坚固的基础: 首先,事实证明,DBMS 在过去 30 多年中,在管理传统业务应用程序中出现的“信息爆炸”方面取得了巨大成功。DBMS 能够很自然地处理与健壮的数据管理相关联的存储、检索、转换、可伸缩性、可靠性和可用性等方面的难题。 其次,数

41、据库业界显示出它可以迅速适应过去 6 年中的电子商务应用程序引入的数据和访问模式的多样性。例如,大多数企业强度的 DBMS 都有内置的对象-关系支持、XML 功能和对外部数据源的联邦访问的支持。 第三,现在全球范围内都对 DBMS 技术进行了大量投资,包括数据库、支持工具、应用程序开发环境和熟练的管理员和开发人员。在所有级别上都利用并增强了 DBMS 体系结构的平台是提供健壮的端对端信息集成的最佳场合。下图说明了我们对健壮的信息集成平台的建议。 该平台的基础是数据层,它提供了对来自基本数据源的不同格式数据的存储、检索和转换。我们相信,基于增强的功能齐全的联邦 DBMS 体系结构来构建这个基础层

42、是极为重要的。 服务层构建在基础之上,它是从内容管理系统和企业集成应用程序中抽取的,用来提供将数据访问服务透明地嵌入企业应用程序和业务过程的基础结构。 顶层针对数据层和服务层提供的丰富的服务和数据集提供了基于标准的编程模型和查询语言。信息集成平台6.1. 数据层如图所示,数据层是增强的高性能联邦 DBMS。我们已经描述了 DBMS 成为管理结构化数据的健壮的、高性能和可扩展的技术所经历的演变。我们相信基于 DBMS 体系结构的基础将允许我们将这些关键的优势利用和扩展到半结构化和非结构化数据。存储和检索。可以将数据存储为结构化关系表、半结构化 XML 文档,或诸如字节流、扫描文档之类的非结构化格

43、式。因为 XML 是企业应用程序的“通用语言”,所以用 XML 文档的本机格式存储和检索它们的一流 XML 资源库是构成数据层有机整体的必要组件。这个资源库是真正的本机 XML 存储,它能够识别和利用 XML 数据模型,而不仅是改头换面的关系记录管理器、索引管理器和缓冲区管理器。它可以充当 XML 文档资源库以及用来合并联邦数据的中间区域(staging area)。在这个角色中,XML 数据的元数据和 XML 数据本身一样重要。这种混合了 XML关系存储和检索的基础结构不仅确保了两类数据格式的高性能和数据持久性,而且提供了企业数据库管理系统期待的 24x7 可用性和可扩展管理能力。联邦。除了

44、本地管理的 XML 和关系数据存储器之外,数据层还利用了具有灵活的包装器体系结构的联邦数据库技术来集成外部数据源 WRAP。外部数据源可以是传统数据服务器,如外部数据库、文档管理系统和文件系统,或者,它们也可以是企业应用程序,如 CICS 或 SAP,甚至可以是工作流实例。这些数据源可以提供结构化、半结构化或非结构化数据。6.2. 服务层服务层利用企业应用程序集成系统、内容管理系统的特性,并利用数据层所支持的增强的数据访问能力来提供嵌入式应用程序集成服务。查询处理。除了为完全不同的数据提供存储和检索服务之外,数据层还提供成熟的查询处理和搜索能力。数据层的核心是成熟的联邦查询处理引擎,它执行 X

45、ML 和对象-关系查询与执行 SQL 查询一样流畅。可以用 SQL、SQLX 或 XQuery 表示查询,可以将数据检索为结构化数据或 XML 文档。对于不提供此完全查询和分析能力的数据源,联邦查询引擎提供了功能补偿,使得在这些数据源上支持此类本机操作,并且引擎还提供有效扩展来支持诸如市场趋势分析或生物复合相似性(biological compound similarity)搜索这样的功能。除了标准查询语言构造以外,本机函数还将有保障的消息传递和数据库触发器集成起来 MQDB2,以允许基于数据库事件(譬如来自于实时数据馈送重要的新信息块的到达)自动触发通知。文本搜索和挖掘。对于在信息海洋中“航

46、行”,并定位到对企业应用程序有用的上下文中,Web 搜寻和文档索引服务很重要。服务层利用数据层提供的数据联邦视图,在原始的和合并的 XML 文档以及所抽取的元数据上提供组合的参数和全文搜索。必须对非结构化信息进行分析和分类,以用于企业应用程序,而对于实时决策,答案的即时性是其质量的关键组成部分。技术平台集成了诸如文本智能挖掘计分之类的服务以从文档抽取关键信息并创建摘要,根据预先定义的分类方法对数据分类并根据平台从文档内容中自动收集的信息来集中文档。将内置的计分功能(诸如智能挖掘器)集成到查询语言 SQLMM 中会将感兴趣的数据转换成可操作的数据。版本控制和元数据管理。随着企业应用程序越来越多地

47、采用 XML 作为信息交换的语言,生成了大量 XML 助诊文件,如 XML 模式文档、DTD、Web 服务描述文档等。这些文档是在多个位置由多方编写和管理的,很快就造成了分布式管理的难题。服务层包括符合 WebDav 的 XML 注册表,可以在分布式环境中轻松地管理 XML 文档生命周期和元数据。WebDAV XRR。注册表的特性包括版本控制、锁定和名称空间管理。数字资产管理。集成的数字权利管理能力和特权系统对于控制对数据层所提供内容的访问很重要。要实现这些目标,信息集成平台使用了丰富的内容管理特性集(如 IBM Content Manager 中提供的特性)来提供对多种格式(如文档、视频、音

48、频等)的数据、多种语言、多字节字符集的搜索、检索和分级服务,并提供对这些数字资产的控制和跟踪访问。转换、复制和高速缓存。内置复制和高速缓存工具 CACHE 和并行性可以在企业发展时提供透明的数据可伸缩性。将数据从一种格式抽取和转换成另一种格式的逻辑可以构建在现今数据库引擎的约束、触发器、全文搜索和对象关系特性之上。通过利用这些 DBMS 特性,数据转换操作发生在尽可能靠近数据源的地方,这样使数据移动、数据源和目标之间的代码路径长度变得最小。6.3. 应用程序接口企业应用程序可见的顶层是应用程序接口,它由编程接口和查询语言组成。编程接口。完全支持传统的编程接口(如 ODBC 和 JDBC),简化了旧

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号