《精品IT解决方案上海某大学EMC存储容灾系统方案建议书 .doc》由会员分享,可在线阅读,更多相关《精品IT解决方案上海某大学EMC存储容灾系统方案建议书 .doc(31页珍藏版)》请在三一办公上搜索。
1、上海学院EMC容灾系统方案建议书版本:V1.0EMC公司上海办事处2010年10月目 录前言3容灾系统的基本概念和指标4第1章 容灾系统建设概述61.1容灾建设工作内容61.2灾难备份/恢复方案应具备的特点7第2章 项目需求分析92.1上海学院核心应用系统环境现状描述92.2客户需求102.3容灾方案设计与建议10第3章 上海学院存储整合及容灾建设建议方案133.1方案设计原则133.2 EMC信息生命周期管理阶段概述143.2 上海学院存储整合(Consolidation)解决方案173.2.1上海学院存储系统规划193.2.2上海学院存储整合方案建议特点203.2.3基于CX4存储阵列的的
2、数据同步复制实现业务高可用的容灾233.2.4灾难恢复27灾难恢复目标27灾难恢复计划28第4章 EMC容灾和业务永续性系统服务和实施策略294.1 EMC公司专业技术服务294.2 EMC公司容灾和业务永续性系统实施策略294.3 制订灾难恢复规划304.4 制订业务永续性规划304.5 制订容灾和业务永续性系统的演练计划314.6 EMC容灾系统实施成功案例32前言首先非常感谢上海学院对EMC的信任。EMC也希望凭借自身多年在各个行业的容灾项目实施中的项目管理、容灾咨询、技术实现的经验,协助上海学院建设高效可靠的容灾系统,成功地完成业务连续性方案的咨询和实施,降低上海学院系统的运营风险。本
3、建议方案采用EMC智能存储阵列CX4作为容灾系统存储平台的主体,以SAN(存储区域网络)来整合数据,实现统一存储平台,并将其作为将来业务持续发展的基础平台。本方案是根据上海学院的IT环境现状,包括信息系统基础架构现状、网络现状以及核心应用类型容灾需求进行现场调研、通过全面的需求分析,结合方案的可行性、成熟性、可扩展性以及投资保护等多方面综合考虑而提出的。结合EMC多年来在容灾领域丰富的设计规划和实施经验,提出EMC公司的业界成熟的存储平台容灾解决方案。本方案所介绍的EMC产品将适应现在和以后可能选用的服务器系统平台,同时方案是经过实际案例验证的、完全成熟的方案。容灾系统的基本概念和指标n RP
4、O (Recovery Point Objective)数据恢复点目标,指的是业务系统所能容忍的数据丢失量。对系统和应用数据而言,要实现能够恢复至可以支持各部门业务运作,系统及生产数据应恢复到怎样的更新程度。这种更新程度可以是上一周的备份数据,也可以是上一次交易的实时数据。它包括一致性(Consistency)和完整性(Integrity)两个概念。n RTO(Recovery Time Objective)应用系统恢复时间指标,是指灾难发生后,从IT 系统当机导致业务停顿之刻开始,到IT 系统恢复至可以支持各部门运作,业务恢复运营之时,此两点之间的时间段称为RTO。一般而言,RTO 时间越短
5、,即意味要求在更短的时间内恢复至可使用状态。虽然从管理的角度而言,RTO 时间越短越好,但是,这同时也意味着更多成本的投入,即可能需要购买更快的存储设备或高可用性软件。对于不同行业的企业来说,其RTO 目标一般是不相同的。即使是在同一行业,各企业因业务发展规模的不同,其RTO 目标也会不尽相同。第1章 容灾系统建设概述1.1 容灾建设工作内容一般来说,针对容灾工作有以下几个方面的建设、工作内容:n 信息系统建设策略策略层面的考虑内容在于企业长期发展的规划:例如容灾是为了防范局部灾难(机房内火灾、供电事故)还是要抵御区域性(有毒化学物质泻露、爆炸),甚至地区级灾难(地震、水灾); 容灾中心建设目
6、的以容灾为主还是提供辅助生产,或者实现双中心并行工作;信息系统今后走向外包还是在一段时间内仍然自行运维;n 容灾管理组织架构容灾管理组织架构的最基本作用是保证各司其职。在平时,有专职的容灾相关的任务,包括数据保护、演练和系统运行情况监控;当灾难(危机)发生的时候,每个人都能快速完成角色转换,了解自己的职责和工作,立刻开始确定业务遭受的影响、进行容灾决策/确定下一步工作;n 操作流程操作流程是容灾工作的具体体现,由于技术并不能完全替代人工操作,实现所有的容灾工作,特别是当一些涉及到业务层面和操作控制的软件发生故障时,必须要人工干预。另外由于一些容灾动作有数据丢失,更需要决策者进行最终决策,这些动
7、作也只能通过人工来控制。但是人工操作如果没有规范,则更可能失误或者由于操作者没有足够的技能,不能选择正确的操作方案,所以需要对人工操作进行指导,也就是建立文档化的流程来最大限度规划人工操作,以便避免在紧急情况下操作失误、或者技能不足的问题;n 应用和数据应用和数据是用来构建信息系统的基础,只要有应用程序和数据存在,就可以实现业务系统能够恢复,这是进行业务恢复的基础之一;n 技术技术无疑也是容灾中的重要角色。依据不同的技术,可以实现不同的容灾指标,技术可以辅助数据保护,可以支持应用接管,可以控制网络切换,也可以帮助领导者进行业务监控和决策;n 容灾基础设施容灾基础设施包括机房及其环境(机房房屋/
8、承重/防静电/运输/、供电/UPS/发电机、空调、消防、磁带保存/防磁、机房安全);办公环境(人员座席、办公电话、传真、桌面机、打印机、休息室、会议室、安全管理);通讯线路(DDN专线、Internet专线、拨号线路);1.2 灾难备份/恢复方案应具备的特点针对现有的实际环境和发展规划,我们认为在建设灾难备份系统时,不仅需要考虑到技术因素,同时需要综合考虑方案实施的风险控制能力、人力资源的调配程度、要求达到的业务恢复的级别、系统的长远发展以及投资效益等方面,因此一个成功的方案应具备以下特点:A灾难恢复和业务连续性的技术成熟灾难恢复和业务连续性方案应该存在大量成功实施案例,特别地这些成功范例应运
9、行在核心业务的生产系统中,以说明其可靠性、可实施性得到世界范围用户的认可,有效控制实施的风险。B、完整、可行的机制确保业务数据的完整性、一致性要求,确保灾难情形下备份系统中数据的可用性和备份系统的可重启性。C、处理远程备份过程中出现的设备、网络故障及排除故障后两地数据完整性、一致性的恢复能力。D、实现简捷只要求企业存储系统之间直接互通,无需对应用作任何修改,即独立于应用,以满足业务系统今后的变动,例如数据库平台的改换、升级、新应用上线等,使客户致力于业务的发展。E、支持异种硬件平台且不占用任何主机CPU、主机I/O通道、系统网络资源、不影响主机业务处理的性能,实现异构环境中的统一备份,在客户改
10、变平台时提供完全的投资保护。F、系统切换简单易行,达到One-Page切换标准,使客户有效调配资深技术人员,标准化的规程使灾难切换过程切实可行。第2章 项目需求分析2.1上海学院应用系统环境现状描述2.2客户需求上海学院对灾难备份/恢复系统的建设构思为:1、首先采用业界主流的基于SAN方式,以信息为核心的信息基础架构的集中数据存储,整合核心应用系统。2、采用高可用性、高性能、开放的智能存储系统平台,实现架构级可用性和负载均衡功能。3、实现全面的资源管理体系和开放式管理平台集成。4、采用基于智能存储系统的数据同步复制解决方案,在存储设备间直接完成数据复制,实现业务高可用。2.3容灾方案设计与建议
11、EMC公司为上海学院的业务系统提供的灾难备份恢复方案可以满足对于计算机系统、数据的最高保护要求,保证即使发生硬、软件及人为破坏等灾难时,用户业务也可以7x24小时的连续运行,同时确保业务数据在主生产系统和备份系统得到及时的更新,保证用户数据最大的完整性。根据EMC公司多年来所积累的实施高可靠性灾难备份恢复解决方案的成功经验,我们可以保证用户在最小的投资范围内,按照EMC公司的项目实施流程,在最短的时间周期内达到整个项目的设计目标,并且通过EMC公司完善周全的售后服务体系,确保核心业务计算机系统的全天候、安全、稳定的运行。由于用户数据中心的核心业务系统相对集中,因此在数据中心实现关键业务数据的规
12、范化的本地数据备份是灾备系统建设的前提基础;提供重要业务数据的异构存储和服务器环境提供远程数据复制方案,为企业提供完整的数据保护,实现业务系统的远程正常运作奠定坚实的基础;容灾系统的关键就是远程生产数据的自动复制,由于用户的应用均为基于数据库的联机事务处理()业务系统,所以业务数据远程复制的关键就是确保数据库数据的完整性、连续性,实时性和可恢复性。针对上海学院的生产系统的信息基础架构和用户需求,目前适用的容灾技术方案主要有如下三种:下表列出了这3种层次数据复制方法的优缺点:优点局限性主机层 相对便宜 支持异构存储 无需额外设备 使用IP网络 每台服务器需配使用许可 不同平台需要不同的方案 耗费
13、主机资源,影响系统性能 若主机数量众多,则管理复杂网络层 支持异构存储 不占用主机资源 不占用存储资源 支持任何数量的主机 降低管理负担;基于IP网络 规划设计对正确实施方案至关重要 某些场合,扩展性受到限制存储层 不占用主机资源 支持任何数量的主机 高性能 可使用包括IP在内的多种网络 相对昂贵 某些场合,需要主,备存储设备属同一品牌和型号 对不同的存储平台,需要不同方案通过对上述三种容灾解决方案的优劣对比,结合上海学院现实环境的IT架构情况和容灾需求的分析,我们认为,基于存储系统的容灾方案的可实现的、合理的、可灵活扩充、投资保护和总体拥有成本(TCO)的特点,它的是适合上海学院的容灾方案。
14、第3章 上海学院存储整合及容灾建设建议方案3.1方案设计原则除了基本的技术要求,EMC公司针对上海学院信息中心应用的关键性和实际环境提出如下设计因素:1、系统具有高可靠与高可用性 ,满足7*24关键业务应用和关键应用的高性能对于关键应用,系统的保护已经不再仅仅停留在数据保护上,而是要保护业务的 24 X 7 持续性。在许多情况下数据是安全的,但业务却不得不停顿下来,即造成所谓的“虚拟停机”。关键业务的业务持续性受到许多因素的挑战,大体上分为计划内停机和计划外两大类。计划内停机是由于数据备份、软件和系统升级、软件和应用测试等系统管理工作与业务应用程序竞争资源造成的。计划外停机是由于软件误操作、硬
15、件故障和机房环境发生灾难造成的。如何确保 24 X 7 业务持续性,对服务提供商都是极具挑战性的。2、系统具有线性扩展能力和灵活的体系架构要求信息整合平台的软件平台的可扩展性与硬件平台的可扩展性相互配合。并且在扩展时,保证系统性能的线性扩展能力,确保整个系统能够满足将来业务扩展、数据增长和业务需求变化的需要。3、管理平台简单并且易于操作整个平台的建设将适合上海学院应用系统发展,存储资源管理平台必须易于管理而且操作简单,降低IT管理人员的劳动强度,提高管理效率。4、降低总体拥有成本(TCO)和保护现有的投资利用分级存储技术,对业务数据进行分层存储,实现投资优化。信息技术的一大特征是技术和产品的更
16、新换代速度是其他行业前所未有的。故对待投资的成本核算,不应只看购买成本,而应当以总体拥有成本的大视角来看待。充分研究设备的扩展性,互连能力和使用寿命。特别地,应关注设备使用后对整体系统的操作的改善、业务时效的增强并由此带来的对企业财务方面的好处等诸多方面的影响。5、应充分满足当前应用系统的现状,具有前瞻性和完整的安全保障措施。由于整个信息系统的集中存储和共享,将会有一部分内网信息和外网信息共存于同一个存储阵列,必须具备完善的安全保护机制,确保核心业务信息的安全。6、系统应非常强壮和稳定系统的强壮性和稳定性是关键业务系统应具备的基本要求。我们不应当假设系统都是在个个环节和环境非常理想的状态下工作
17、。相反,应当假设系统经常在一些不可测事件和频繁扰动的情况下,仍能正常工作。这要求组成系统的设备是强壮的和稳定的。设备的冗余配置非常重要。但是问题的关键是设备本身是否就具备容错的能力。同时,设备在市场上使用的情况也非常重要,设备只有在使用相当长时间后,才能在不断优化,达到稳定可靠。7、系统性能选择的智能存储系统不但具备极高的可靠性,同时也必须能够满足用户业务系统的性能需求,尤其是业务系统的高峰时段,依然可以保持良好的系统性能,最大限度降低对业务系统的冲击和影响。3.2 EMC信息生命周期管理阶段概述EMC将信息生命周期归纳为六个阶段:r 数据创建阶段 数据的价值通常会随着时间逐渐降低,因此所有数
18、据在创建时都应当获得一个由数据的类型、数据的价值和相关法规的要求决定的删除日期。系统将定期清除到期的数据。除非对过期数据的创建进行正确的控制,否则对相关数据的搜索将会导致运营效率的不断降低。信息生命周期管理就是要根据应用的要求,数据提供的时间及数据和信息服务的等级,提供相适应的数据产生,存储,管理等条件,以保障数据的及时供应。r 数据保护阶段今天很多企业的经济效益都与信息的连续可用性、完整性和安全性息息相关。随着越来越多的信息以数字化的格式出现,企业面临着如何以相同或者更少的资源管理迅速增长的信息和存储的挑战。同时,企业的各项业务需要找到和获取所需要的信息. 信息可用性的降低,或者信息的丢失,
19、对企业而言, 都意味着时间的浪费,生产率的降低或灾难。这个解决方案是一系列技术和流程的组合:备份、远程复制和其他数据保护技术。它们需要与一组流程和步骤组合,确保及时的恢复。当前,很多需要大量存储的应用,尤其是电子商务、医院HIS系统、PACS系统和制造业ERP等,都需要247的运作和在线。系统的可用性在一定的程度上取决于数据的可用性:即使在技术上服务器和网络都是可用的, 但是如果应用系统不能访问到正确的数据,用户将认为它是不可用。在此情况下, 即便是事先安排的停机(“备份时间”,“升级时间”等)也是无法接受的。企业已经对很多可以帮助他们减少计划性停机和意外停机的技术投入了大量的资金, 例如实时
20、数据复制技术,计算机群集系统,以及远程数据复制技术等。信息生命周期管理将按照数据和应用系统的等级,采用不同的数据保护措施和技术,以保证各类数据和信息得到及时的和有效的保护。r 数据访问阶段信息生命周期管理的主要目标是确保信息可以支持业务决策和为企业提供长期的价值。因此,信息必须便于访问,最好可以在一个企业的多个业务环节和业务应用之间共享,以提供最大限度的业务价值。此外,信息必须可以支持多种业务流程, 因此这个阶段将成为信息生命周期管理与业务流程管理的交叉点。成功的数据访问和管理是通过深入地了解数据在企业中扮演的重要角色而实现的。要做到这一点,首先要问:“这些数据的真正价值是什么?”换句话说,它
21、对于业务的成功运行具有什么重要意义?这可以帮助企业在制定一项数据存储战略时集中精力。另外一个应当考虑的问题是:“这些数据被访问的频率是多少?”数据存储基本上可以分为三类:第一类是每天都需要访问的数据;第二类是需要随时访问,但访问频繁和访问速度要求不高的数据,第三类是偶尔需要查询或访问的数据。这三种分类体现为在线、近线和离线三种访问方式。u 在线方式u 在线存储之所以非常重要,是因为它可以在网络中提供对信息的即时访问,在线存储为业务系统提供日常业务处理所需要的数据和信息。因而,在线存储要求高的性能,大的容量,高的扩充能力,以保证业务系统的快速处理。u 近线方式需要定期但访问频率和访问速度要求不高
22、的数据应当以近线方式保存。通过这种方式,可以实现较为及时的并且成本较低的数据访问。近线存储设备的价格要比在线存储要低,而且数据访问的速度要慢一些。u 离线方式对那些访问速度要求不高,存放的时间较长,访问的频率更低的数据,可以将其存放在价格更低的存储介质和设备上,当数据需要被访问时,才将其恢复到在线存储设备中。使企业的数据存储的成本进一步降低。r 数据迁移阶段信息技术发展是如此快速,以至信息技术的设备在比较短的时期内就要实现一定程度上的更新。在当前信息应用的环境中,保持应用系统的全天候运作已是必须条件。即使是事先计划的、为了对系统进行升级或对系统配置改变而进行的停机对许多客户来说也是无法接受的事
23、件。因此,越来越多的变动必须在运行系统上进行。数据迁移就是其中一个事例:将数据从一个存储设备转移到另外一个存储设备,而且不影响系统的正常运行。r 数据归档阶段维持一个数据备份和归档系统可以从多个方面支持企业的业务运作。它可以提供交易和决策记录,以及关于决策时的周边环境的所有信息。它可以防止这些记录被无意破坏。它能确保那些仍然对于一个组织具有一定作用的数据可以得到妥善的保存,即使在它不再具有立即的相关性(例如用作参考的数据)。可以从生产系统中清除使用率很低的数据,降低总拥有成本。数据备份是企业数据存储战略的重要组成部分,由于对备份数据访问的频率和速度要求不是很高。因而,价格低、容量大的存储介质和
24、系统成为最佳选择。r 数据回收(销毁)阶段许多数据总会在一段时期后,没有再继续保存的价值。这时,企业必须要制定相关的政策,对没有保留或保存必要的数据进行销毁或回收。被销毁或回收的数据将从活动和非活动系统,以及数据仓库等系统中清除。对一些数据,不能轻率地进行销毁。企业必须确保其销毁的数据不会与企业和政府的条例和法规相违背,对企业正在进行的诉讼案子或者其他政策无关。企业应当建立科学的和明确的数据回收(销毁)规则。EMC针对信息生命周期以上六个阶段,分别提出了针对性解决方案:3.2 上海学院存储整合(Consolidation)解决方案针对上海学院IT现状及核心应用系统的高可靠性和高可用性要求,建议
25、首先进行SAN 整合。存储区域网络连接(SAN)方式包括一组基于光纤通道协议的存储交换机,通常称为光纤通道fabric,光纤通道网络的特征是高性能。而一个Fabric能支持数百台服务器连接到一个或多个存储系统中。这一技术主要用于数据库和连机交易处理 (OLTP) 环境的应用,特别适合上海学院的应用典型地要求高性能和很好的连接能力。在SAN整合的同时,可以同时实现操作和管理整合的问题,操作整合意味着存储管理集中化以提供自动化的监控、报告、规划和资源调配。有效的战略还包括一个整合的磁盘备份解决方案,用于改进服务级别。而管理整合主要是实现集中化存储管理以提供自动化的监视、报告、规划和资源调配,从而提
26、高生产效率并降低成本。由于目前上海学院的应用系统的数据备份还处于单系统备份,各自为战的情况,建议在上述整合完成后解决备份整合的问题。新的备份整合选择使您能够提高备份和还原服务级别,包括缩小的备份窗口、更快的还原、增强的可靠性和可管理性,以及更低的成本。3.2.1上海学院存储系统规划存储系统是本次项目建设的核心,存储系统建设规划如下: 采用1台CX4作为应用系统的数据存储平台,配置17块600GB 4Gb/15K双通道光纤硬盘。 采用10块2TB SATA硬盘。 在容灾解决方案的选择上我们建议配置EMC MirrorView/s软件实现基于存储系统的实时同步数据复制。3.2.2上海学院存储整合方
27、案建议特点上海学院的应用系统有多台应用服务器。今后可能会为其他应用再购置一些服务器。因此,在实现数据集中系统设计时,既要满足当前的现实要求,又要兼顾未来扩充的要求,预留空间。在本方案中我们建议采用两台EMC的CX4系列的智能存储系统来整合关键业务和支撑应用的数据;将以上关键应用系统连入到SAN环境中,实现数据存储的整合。(1) 存储系统性能考虑l EMC2 CX4硬件系统采用业界领先的端到端4Gb全光纤通道技术设计。l 存储系统对外的主机接口都是支持4Gb的光纤通道接口(同时支持FC_SW和FC_AL光纤连接)l 能够为与磁盘阵列连接的主机提供4Gb/s x N(主机接口数)的数据带宽。l E
28、MC2 CX4的光纤硬盘配置先进的双4Gb光纤通道接口的硬盘。l 磁盘阵列内外都是4Gb的光纤通道体系结构。l 提供的闪存驱动器的提供快速的响应时间,大多数的应用程序都达不到闪存驱动器所能达到的最大 IOPS(2) 系统可靠性和可用性考虑l CX4独有的冗余结构及先进成熟的核心微码计算控制技术确,任何意想不到的故障发生时保证数据安全并且保证数据的完整性(不发生错误)。l 先进的软件功能,在阵列和主机连接通道某些部件故障时确保不停机,支持应用的连续运行。l 每个存储处理器的高速缓存均彼此构成镜像。l 如果发生存储处理器失效,存储处理器的高速缓存包括其基本高速缓存和与其并列的存储处理器的镜像将立即
29、被写入磁盘存储 (Destage)。l 备用电池装置可提供需要的电力,从而确保在电源关闭前将全局高速缓存安全地写入磁盘。l EMC CX4 大容量高速缓存的配置保障了CX4能提供中端存储市场中最好的性能,缓存的配置保证了系统整体的性能在硬盘损坏后不受影响。(3) 开放性与可扩充性l EMC2产品的开放性都是经过EMC2互操作性实验室严格验证的,不会存在任何实施方面的问题。l EMC CLARiiON存储阵列专门针对开放系统设计,可以从较小规模起步,按需购买,根据需求逐步扩充,很好的保护用户的投资。(4) 存储平台管理实现集中配置和管理l 配置 Navisphere Manager 从单个控制台
30、监视和配置 CLARiiON 存储系统。l 每台连接的主机上安装Navisphere Agent/CLI, 作为主机到阵列通信的桥梁,为常见存储管理任务编写脚本或实现其自动化。(5) 卷管理 (Volume Manager)l 通过metaLUN功能实现l 由FLARE(CLARiiON CX系列操作核心)提供l 通过Navisphere Management Suite管理l 对服务器完全透明,如服务器使用Win2k SP4,则可随时扩展存储空间而不用重新启动l 提供存储空间管理的灵活性l 空间扩展时不会对原有数据有任何影响(6) 访问控制管理l 建议采用EMC2 Access Logix软
31、件用于提供 EMC CLARiiON 光纤通道存储的数据保护和安全存取功能。通过建立存储组为每台主机配置其专用的LUN,保证数据的安全性。同时采用这种方式也能够很好的支持主机的群集应用(cluster)。l 使用EMC2 Access Logix软件能通过用于简化存储管理的存储组和逻辑单元 (LUN) 屏蔽,实现整个分布环境中 CLARiiON 系统的多主机连接和存储合并。当需要在SAN存储环境中部署新主机或重新分配容量时通过EMC2 Access Logix能在不影响系统正常工作情况下进行。(7) SAN网络环境管理l 对于SAN网络环境的管理,由于客户采用交换机以多条链路连接所有的主机和存
32、储设备,随着SAN网络环境的不断复杂化,可选择使用EMC ControlCenter进行管理,根据应用的要求对SAN网络划分Zoning,实现企业的数据存储访问策略。(8) 主机通道多个访问链路连接l 在主机上配置两块或更多光纤通道卡(HBA),通过光纤分别连接到存储的不同控制模块,同时在主机上安装EMC2 PowerPath,采用此方式在达到最高的性能的同时还避免了单点故障。l EMC2 PowerPath集成了多路径I/O能力、动态负载均衡和自动路径故障切换功能,用于连接CLARiiON网络存储系统的开放服务器平台。当PowerPath检测到光纤通道卡,光纤,光纤交换机或磁盘阵列控制器等故
33、障发生时,会自动进行路径故障切换和LUN控制切换,实现端到端自动化和无缝数据迁移的高级卷管理,在发生故障时确保信息流动而不会中断应用。当故障修复后,可自动将工作状态恢复到正常模式。3.2.3基于CX4存储阵列的的数据同步复制实现业务高可用的容灾容灾系统的根本是进行数据的远程复制,目前有基于中间件、数据库、操作系统软件、磁盘阵列的多种数据复制方式,而针对上海学院的具体情况,EMC建议采用基于EMC磁盘阵列的数据复制方式。其系统逻辑架构设计,以及总体灾难切换方式如方案拓扑图所示。EMC中端阵列的功能选件:MirrorView软件提供完全的灾难恢复功能。当配置了MirrorView软件的两台EMC阵
34、列处于异地时,光纤连接,主存储器可以随时自动将更新数据传至异地的备份存储器,以保持两台阵列数据的完全一致性。整个工作由EMC阵列本身完成,不需占用任何主机资源。正常情况下,系统运行在各自的服务器上,新增2台CX4作为应用系统的数据存储平台和容灾平台,通过远程数据镜像软件(MirrorView),,实时地应用系统的生产数据更新拷贝至容灾存储系统中,使实时存储数据与容灾存储数据保持实时完全一致。一旦实时系统的存储设备发生灾难,导致部分或全部生产系统功能不能正常运行,就可以将相应的应用切换到容灾存储系统,利用容灾存储系统上的实时同步数据来继续业务的运行,达到容灾的目的。EMC CX4阵列镜像可以通过
35、短波光纤通道支持300米距离范围,通过长波光纤通道支持10公里距离,通过光纤通道延长器支持60公里距离,或者通过FC到IP路由器(例如CNT Ultranet Edge 1000、Nishan)支持更长的距离。镜像可以是同步的也可以是异步的,根据用户在源数据中心和目标数据中心的投入不同,可以灵活选择EMC CX4的MirrorView/Synchronous同步镜像数据,或者选择MirrorView/Asynchronous采用异步的方式镜像数据。MirrorView/Synchronous通过应用程序的逐个I/O连续地复制数据,以最大程度地提高数据的可用性。MirrorView/Asynch
36、ronous复制数据可不受应用程序 I/O 的限制,从而确保可恢复性并延伸距离,同时减少网络带宽需求。在上海学院的项目规划上,由于距离很近,不用考虑时延的问题,因此我们建议采用MirrorWiew的同步数据镜像。l MirrorView同步操作流程描述如果用户的应用系统的生产数据分布于多个 LUN 上时,就需要一致性组。 如果分离了组中的任一辅助映像,则 MirrorView 会将该组中的所有辅助映像都分离开来。MirrorView 将在向主机确认任何没有镜像的写操作之前完成所有映像的分离。这样可确保在各 LUN 间具有正确的写入顺序一致性。如果主阵列出现故障,那么,由于辅助映像具有逻辑一致性
37、,因此,系统将提示您可在远程站点使用它。一致性组的所有成员都必须驻留在同一存储系统中。在 MirrorView/S 中,每当服务器写入主系统时,辅助系统都会在确认信息返回到服务器之前对写入内容进行镜像。结果,MirrorView/S 确保了应用程序从远程镜像拷贝中重启时没有数据丢失。MirrorView/S 在本地 CLARiiON 系统和远程 CLARiiON 系统上提供了完全相同的逐字节拷贝。l 同步操作的特性1. MirrorView/S 利用“增量映射”使写操作级的镜像保持尽可能高效。2. 两个不同的映射,一个在内存中另一个在磁盘上,允许在出现断连或链路故障后快速、有效地重新同步。这就
38、使 MirrorView 成为其同类产品中功能最强大的镜像技术。 3. MirrorView/S 独立于服务器操作系统、应用程序和文件系统。4. MirrorView/S 主要用于园区环境。MirrorView/S 在远程站点的镜像卷上维护着生产数据的实时镜像。5. 源卷和目标卷中的数据在通过先进先出的队列 (FIFO) 模式完成一个 I/O 序列后都将充分得到同步。所有的数据移动都是通过同步镜像在数据块级别进行的。l 同步数据复制优点:即时重新启动,最高的数据完整性l 缺点:由于延迟和其对应用程序响应时间的影响,距离受到限制;因为 MirrorView/S CLARiiON 平台之间的带宽必
39、须调整为可以适应所有时间段的峰值工作负载,所以必须使用更高成本的通信/链路。但对于上海学院的现状环境来说,在同一机房内实施同步数据复制,不受距离限制的影响。l 上海学院同步数据复制建议配置系统层次功能EMC解决方案存储平台面向客户提供最基本的、大容量的安全可靠的、高性能的数据存储服务 生产端:CX4(一套)灾备端: CX4(一套)业务永续性容灾和业务永续解决方案实现生产数据实时同步复制,确保灾难发生时的数据完整性MirrorView/S(两套)SAN存储网络的可靠性本地和园区内光纤连接DS300E(16端口/激活8端口)光纤交换机管理平台为企业现有的和将要建设的存储系统提供一个统一、集中的管理
40、平台Navisphere Managerl EMC MirrorView方案具有如下优势: MirrorView价格合理:MirrorView 是一个基于CLARiiON 存储平台的应用程序,它提供了数据从生产站点(主站点)到一个或多个辅助站点的在线、独立于服务器的镜像。MirrorView 建立在 CLARiiON 的基础之上在同类产品中有最好的性价比。MirrorView/异步 (MirrorView/A) 可以利用可用的网络带宽,使用三种同步速率之一 高、中、低。 MirrorView 的管理非常简单:可以在 EMC Navisphere 管理套件CLARiiON 的管理控制台中设置和管
41、理MirrorView。Navisphere还可用于使用户指定的策略自动化;例如,MirrorView/A可用于提供初次同步,或者它可以调节线路带宽。还为习惯于脚本编写的用户提供了功能强大的命令行界面。基于web的GUI缩短了学习过程,减少了培训和运营成本。 MirrorView 为配置、距离和重启点提供了灵活的选项:镜像可以是同步的,这意味着每当服务器写入主系统时,辅助系统都会在确认信息返回到服务器之前对写入内容进行镜像。MirrorView/Synchronous确保了在本地和远程 CLARiiON系统上都有完全相同的逐字节拷贝。 MirrorView 镜像还可以是异步的MirrorVie
42、w/A这意味着服务器会立即接收到写入确认,辅助系统在过某一时间段后将镜像主站点。MirrorView/A 通过在每一个异步周期中只移动对每个数据块最后的更改来减少网络带宽需求。 因为 MirrorView 是一种基于存储的软件,因此不使用服务器 CPU 周期。这允许 MirrorView 在后台运行,对任何服务器或应用程序都是透明的,并且能够为所有连接到 CLARiiON 平台的服务器平台和操作系统提供相同的信息保护服务。 MirrorView与EMC SnapView 快照充分集成。SnapView 是一种基于 CLARiiON 存储平台的软件,它创建了一致的生产数据的时间点拷贝用于进行保护
43、和其它目的。 MirrorView 提供了快速重新启动:MirrorView 提供了高性能基于磁盘的应用程序数据远程副本,并具有允许快速重新启动和切换回的高级功能。例如,在 MirrorView 中,您只需一个命令/一次鼠标点击就可以故障切换到远程镜像或切换回到主镜像。3.2.4灾难恢复 灾难恢复目标l 一是恢复数据,保护数据的完整性,使业务数据丢失最少甚至没有业务数据丢失。l 二是快速恢复应用的运行,尽可能缩短业务停顿的时间。我们所提出的灾难后备系统将确保能够很好地实现上面的目标。所谓灾难后备基础设施,是指可接替运行系统继续运行的备份运行系统;有用于将终端用户连接到灾难备份中心的网络通信设施
44、。而所谓一个科学的、可靠的、经过验证的灾难恢复计划包括两部分:l 一是有完善的灾难恢复操作处理程序;l 二是有责任明确,能熟练操作应用系统,熟悉灾难恢复处理流程的人员。所谓一整套数据保护和恢复的方法,是指,在后备运行中心能够得到尽可能完整的业务数据,以支持业务的连续运行。数据恢复方法是容灾系统建设时选择不同的产品供应商的重要技术考虑因素。 灾难恢复计划灾难恢复计划至少应包括:l 怎样确认灾难发生,决定是否启用灾难备份系统的批准流程;l 为接替生产系统,怎样保证在灾难备份系统上的系统软件和应用软件,通信和应用环境参数与生产系统保持一致;l 对大多数的业务数据恢复的流程;l 恢复孤立数据的流程;l
45、 启动后备系统的完整流程;l 将终端用户切换到灾难备份系统,并恢复业务运行的完整流程; 生产系统恢复正常后,将终端用户回切到生产系统的完整流程。第4章 EMC容灾和业务永续性系统服务和实施策略4.1 EMC公司专业技术服务EMC技术服务的宗旨是保证用户数据的安全并保证达到用户满意。EMC的技术服务均以此为核心而展开,并以此作为衡量技术服务质量的最终标准。与IT行业的其它公司不同,EMC的技术支持部门不是作为一个赢利中心(Profit Center),而是作为一个投资中心(Investm ent Center)而存在的。这保证了EMC公司在技术服务的投入及策略上不受当地销售业绩及获利程度的影响,
46、可以全心全意地做好技术服务工作。根据EMC公司独特的全球支持模式(Global Support)合理而高效地使用所需的技术服务资源,向用户提供专业水平的服务。EMC方案实施后,EMC将技术完整转移给客户,客户可以自行维护部分容灾系统的改变,节省维护费用。EMC拥有全球2000多家大型容灾系统的实施经验,方案成熟、技术人员经验丰富,减少CX3-40的实施风险。4.2 EMC公司容灾和业务永续性系统实施策略容灾和业务永续性项目是一项系统工程。用户在建立容灾和业务永续性系统之前,首先要进行全面的系统分析,其中包括业务系统风险分析、容灾和业务永续性系统对业务系统的影响分析和投资效益分析。风险分析是检查
47、那些可能造成数据损失或者系统瘫痪的外在和内在因素。既然是容灾和业务永续性系统,必须充分考虑业务系统所在地的自然环境,针对可能发生的灾难,准备相应的容灾对策。由于容灾和业务永续性系统对业务系统的性能或多或少都会有一定影响,因此,对于那些高负荷运行的业务系统必须认真计算和规划。建立容灾和业务永续性系统,除了需要购买必要的硬件设备外,还要考虑系统维护管理成本和使用通信线路的费用等。EMC公司技术解决方案部将会利用EMC公司在容灾系统方面的专业经验和技术人才,为CX3-40容灾和业务永续性项目将提供专业服务,包括提供需求分析、方案设计、方案实施、测试、演习等容灾和业务永续性系统建设全过程的专业服务。4.3 制订灾难恢复规划设计容灾系统,必须提出设计指标。既然建立容灾系统是为了数据或者业务的快速恢复,容灾系统的设计指标就与业务系统的数据可恢