《山东省广播电视台融合媒体统一数据资源平台V2.docx》由会员分享,可在线阅读,更多相关《山东省广播电视台融合媒体统一数据资源平台V2.docx(86页珍藏版)》请在三一办公上搜索。
1、山东省广播电视台融合媒体统一数据资源平台NetApp2016年11月目录1用户需求分析51.1背景概述51.2客户需求52方案设计原则83本项目实施的重点114NetApp存储系统特点135整体架构设计166数据双活的存储虚拟化平台方案描述186.1.1数据双活的存储虚拟化平台架构可行性分析186.1.2风险和影响分析216.1.3数据双活的存储虚拟化平台验证和演练236.2存储集成数据保护机制完善数据保护机制246.2.1逻辑故障防范 秒级备份和恢复256.2.2D2D备份设计规划277精编系统方案简述298NetApp的双活数据中心架构技术优势309数据双活的存储虚拟化平台面向私有云架构的
2、优化管理3210数据双活的存储虚拟化平台与服务器虚拟化平台的结合3510.1服务器虚拟化的整合3510.2虚拟化环境中的性能提速技术3610.3虚拟化环境中的数据保护和灾备3710.4NetApp FAS和VMware的深度集成3910.5VSC存储管理插件3910.6NFS Plug-in插件4010.7SRA插件4010.8VAAI插件4010.9VASA插件4110.10内置消重功能,降本增效4110.11vSphere HA实现的VM自动切换4310.12vSphere DRS组双活架构设计原则4310.13VMware vSphere HA for NetApp MetroClust
3、er4410.14VM失效场景4610.15ESXi host 失效4610.16ESXi host 失联4810.17磁盘扩展柜整盘柜故障4910.18控制器节点故障5010.19站点间心跳网络失联5010.20站点完全失效5311数据双活的存储虚拟化平台与Oracle RAC结构的结合5411.1架构对Oracle故障及灾难场景应对5411.2Oracle node 单节点故障5511.3Oracle host HBA 失效5611.4aggregate 单个磁盘失效5611.5disk shelf 磁盘柜失效5711.6MetroCluster cluster控制器故障5711.7Met
4、roCluster cluster 后台FC交换机故障5811.8ISL 心跳级联线故障5811.9site A to site B 主动站点级切换5911.10site A to site B 被动站点级切换6012NetApp存储资源池的划分方案6112.1NetApp存储目标架构6112.2存储架构的分层设计6312.2.1与前端高端存储的接口设计6312.2.2存储交换网络设计6313存储资源池的数据安全与隔离方案6813.1数据安全设计6813.1.1RAID DP6813.1.2本地Snapshot6913.2数据隔离设计7013.2.1应用数据的逻辑隔离7013.2.2网络隔离7
5、113.2.3存储数据卷隔离7214存储资源池的监控与管理7314.1NetApp OnCommand监控工具7314.2存储产品监控方法7614.2.1容量管理7614.2.2性能管理7614.2.3状态管理7714.3存储资源池内部和跨存储资源池的数据迁移方案7814.3.1资源池内部数据迁移设计7814.3.2跨资源池的数据迁移设计7914.4资源调度和调整自动化方案8114.4.1存储资源调度功能设计8114.4.2存储资源池管理流程8214.4.3存储自动化脚本编写8514.5存储配置标准化设计861 用户需求分析1.1 背景概述山东省广播电视台基于自身的业务高速发展,构建融合媒体统
6、一资源平台,满足服务器虚拟化和精编系统需求。1.2 客户需求目前需要针对山东省广播电视台现有存储平台进行双活平台升级,建立满足山东省广播电视台服务器虚拟化所需要的双活数据平台。同时,建立媒体资产存储资源池,提供满足精编系统业务应用的服务响应。存储平台作为山东省广播电视台整个IT基础架构的最底层基础平台,将决定整个IT基础架构的可靠性、可用性和资源使用效率,需要满足为前端各种类型的应用平台提供数据共享存储服务,存储平台的可靠性和可用性直接影响到私用云平台的可靠性和可用性,目前最可靠的容错和容灾架构就是能够达到RPO=0,RTO 0的数据双活基础架构。建立数据双活平台可实现业务连续性的量化指标如下
7、:情景解决方案业务系统运行情况单一组件故障全冗余系统架构零影响单一生产存储故障双活数据中心RPO = RTO = 0,零影响数据中心瘫痪双活数据中心RPO = RTO = 0,零影响生产数据逻辑故障快照结合日志恢复RPO 0 (恢复到出现故障前)RTO 30 分钟区域性灾难异地灾备系统RPO 5分钟,RTO 60 分钟存储平台做为山东省广播电视台整个IT基础架构的最底层基础平台,前端各种类型的应用平台所需的数据类型和访问模式也不尽相同,既有需要满足高并发、高IOPS的结构化数据块型应用类型,如Oracle数据库,又有满足高并发、共享访问、协同工作需求的NAS文件类应用需求,如大部分的非结构化文
8、件系统类的数据访问需求。特别是面向服务器虚拟化平台,由于服务器虚拟化平台的特殊架构,既有数据块类型的访问需求,又有大量的NAS文件系统类型的访问需求,所以存储平台必需是采用一体化架构的基础平台,可以提供各种类型的最新一代高速访问接口,如32Gbps FC接口,40Gbps IP接口或FCoE接口,同时提供FC SAN、IP SAN、NAS等多种存储连接能力,可以根据应用平台需求,按需提供各种服务响应级别的存储服务,最大化资源共享和资源复用能力,最大化存储平台的使用效率。同时双活基础架构平台也需要同时满足一体化平台的双活能力,既能够提供SAN类型数据的双活,也同时能提供NAS类型数据的双活架构。
9、精编系统的业务要求就是面向海量的文件管理,要求高带宽的输出和大容量的数据存储,满足山东省广播电视台的精编业务需求。2 方案设计原则整体方案设计将遵循以下基本原则:1) 先进性:先进的设计思想、网络结构、开发工具,市场覆盖率高、标准化和技术 成熟的软硬件产品。2) 灵活性:由于存储系统的数据量非常大,如何与服务器虚拟化结合,管理大量的数据,包括数据备份/恢复,都对存储系统的管理提出了巨大的挑战。系统管理人员需要有高效的方法实现全面的存储系统监控,包括实时数据性能监视、错误监测、错误状态识别等等。另外作为集中的存储平台,由于前端需要连接的服务器数量很多,如何在多个服务器平台之间对容量进行灵活的划分
10、和调度也将为存储系统的管理提出了巨大的挑战。采用积木式模块组合和结构化设计,系统配置灵活,满足用户逐步到位的建设原则,使存储及网络具有强大的可增长性和强壮性。3) 可靠性:本次存储系统数据的集中管理,属于关键业务,对系统的高可靠性有着很高的要求。由于采用了集中存储方案,存储平台的任何故障均会造成巨大的影响。因此存储平台的数据安全性和系统高可靠性尤为重要,我们设计的整体系统软、硬件设备具有高可靠性,具备长期稳定工作的能力,可实现系统冗余功能,并具有防止误操作等行为对系统造成的破坏。4) 实用性:方案设计符合国际相关标准和技术规范,并且容易使用、操作简便。充分考虑利用各种资源,人机界面友好,能使用
11、户最方便地实现各种功能。5) 高性能:存储系统要存储大量的在线/离线数据信息,支持更多服务器的数据存储要求。由于总的数据量较大,如何在大数据量情况下满足多客户机的并发访问,整个存储系统的性能也是一个非常关键的要求。6) 发展性:考虑到将来业务的增长,数据量还会持续增加,客户机的数量也会继续增加,系统的性能还应能很好的适应未来的扩展需要。存储系统规划设计满足用户发展在配置上的预留,满足因技术发展需要而实现低成本扩展和升级的需求。7) 扩展性:作为集中存储的基本要求,存储系统应能支持巨大的存储容量,可以集中存储不同平台的应用数据。随着时间的推移、技术的发展以及环境的变化,业务系统的数据量会飞速增长
12、,许多新业务系统会不断产生,因此对存储系统的可扩展性有很高要求。这主要表现在对存储系统容量的平滑扩充以及对新的主机系统的平滑连接,以尽量减少对已有正常业务的影响。我们设计的系统具有开放的、可扩展的系统架构,在用户相关业务发生变化时,可以方便地进行系统升级与扩展。8) 兼容性:同时连接不同的服务器平台,以满足数据集中存储的需要系统建设具有良好的兼容性,充分考虑系统向下、向上的兼容,将系统建设和现有的系统资源以及未来的系统规划充分结合。3 本项目实施的重点从融合媒体对存储资源的定义出发,借鉴业内的融合媒体云项目的经验,我们认为,要成功设计并实施山东省广播电视台融合媒体统一数据资源平台系统,必须考虑
13、如下要点:1) 存储能够灵活地扩展性。融合媒体统一存储资源平台应该类似于对虚拟服务器做的事情,需要能够迅速且以最少的开销分配、增加、减少并重新分配存储。存储的扩容、监控、调整等带来的天然的复杂性,如何处理存储的日常调整是项目设计与实施中需要重点考虑的内容。 2) 能够自动化存储管理流程。进行配置、备份和复制等常规操作的自动化程度越高,环境的可扩展性就越强。 3) 能够测量和汇报使用情况。将存储资源理解为满足各部门和各业务系统服务需求的一个要素,能够汇报该要素实际的使用情况,并且现在或将来能够按照资源的使用情况进行审计。 4) 能够自由移动数据。 如果数据束缚在缺乏灵活性的存储里,有效性和可用性
14、将变差。 5) 能够在确保资源足够安全的时候建立多租户,达到安全隔离要求。 允许多个业务单元或独立应用系统分享同一存储硬件是实施融合媒体统一存储资源平台的一个必要条件。 6) 能够提升存储效率。第一步是提高利用率,除此之外,削减开销、自动精简配置和消除冗余都有助于提高效率。 7) 能够有效保护业务数据。成功实现融合媒体统一存储资源平台的一个关键是集成所有的流程,让它们变得简单、可重复和有效。具有合适的策略级别、覆盖所提供的每项服务的一致数据保护和灾难恢复流程是基本的。 8) 存储环境支持存储虚拟化。 存储虚拟化将是融合媒体统一存储资源平台的一个关键组成部分,需要存储与现在正在使用和将来很可能采
15、用的任何虚拟化解决方案紧密集成在一起。 4 NetApp存储系统特点l 统一存储平台,一体化设备,同时支持FC SAN、IP SAN、NAS、FCoE,FC SAN和NAS在同一个管理界面下进行管理,存储空间管理方式完全相同,管理简便,可靠性高,易于维护。l NetApp一体化存储平台集成存储虚拟化和存储双活解决方案,无需任何外置的控制器,与VMware与Oracle RAC架构的紧密结合,提供应用级双活解决方案,全球有超过15000个双活结构案例,广泛应用于各行各业的核心业务系统和虚拟化环境。l NetApp存储产品完全模块化设计,产品包括从底端6块磁盘到最高端17,280块磁盘,扩容和升级
16、简便,产品延续性好,管理方式也完全相同,具有良好的扩展,易于保护投资。l NetApp存储产品全部采用RAIDDP 磁盘容错技术,数据保护级别最高,容错能力最强,磁盘利用率远远高于RAID0+1,产品性价比好。l NetApp存储产品提供副本消除技术,节省存储空间的耗费,最大可以比同类产品节省30-50%的存储空间耗费。l NetApp存储产品可以提供一整套完善的存储集成数据备份和容灾解决方案,解决数据管理的所有问题。l NetApp存储产品具有同类产品的最优性能,包括FC SAN性能和NAS性能,以及IP SAN性能。l NetApp存储产品同时支持SSD、SAS 磁盘和SATA磁盘,可以达
17、到性能、空间以及电力耗费的最优配比。l 配置复制备份软件、应用程序管理套件解决数据备份、应用程序数据备份恢复。l NetApp存储产品结构最简单,涉及数据存储管理的控制器数目最少,需要的管理平台也最少,对电力和空间的耗费最小。l 容量扩展简单命令、一秒钟即时见效,独到的Qtree概念方便空间的管理,同时真正实现“所买即所需”的升级模式,最大程度保护投资,不存在任何重复购买现象。l 最优的整体拥有成本(TCO)。l 数据大集中,有效利用存储空间,磁盘利用率最高。l 存储设备有业界领先的快速响应时间(NetApp是业界第一个提供低于1ms响应时间的存储厂商)。l 专业Data ONTAP操作系统,
18、高度可靠,免于病毒侵袭感染。l 秒钟级的备份和恢复,减少宕机时间,充分提高数据和系统的可用性。l Unix、Windows和Linux可以实现真正文件级的数据共享,节约投资、简化管理;5 整体架构设计针对服务器虚拟化需求,配置2套NetApp FAS8000一体化存储控制器,构成双活体系架构,配置无容量限制存储虚拟化许可FlexArray,两套存储控制器连接用户现有的两套VNX5600存储设备,构建同时实现SAN和NAS数据双活的存储虚拟化平台。按照精编系统大容量,高带宽的需求,配置一套NetApp FAS8000集群控制器系统,配置384块4T NL-SAS盘,配置16个10Gb光纤端口,满
19、足精编系统业务要求。同时,这两套系统可以构建成一套集群存储,对数据资源、磁盘空间和系统性能进行统一的管理、分配和使用。整体架构设计图如下所示:EMC VNX5600NetApp FAS8000控制器精编系统EMC VNX5600数据双活的存储虚拟化平台NetApp FAS8000控制器NetApp FAS8000集群系统两套系统都是基于NetApp FAS8000系统,通过万兆网络互联,能够实现对数据资源、磁盘空间和系统性能的统一管理和资源分配。6 数据双活的存储虚拟化平台方案描述6.1.1 数据双活的存储虚拟化平台架构可行性分析完整的数据双活的存储虚拟化平台需要以下几个层面的支持:n 双活的
20、存储架构。支持所有数据在两个数据中心之间互为镜像,任一损坏都不会影响应用运行。n 跨数据中心的存储网络互连(Extended Fabric), Oracle官方建议RAC之间的链路延迟低于1ms(Round-Trip)。n 跨数据中心的主机高可用n 跨数据中心的应用双活n 跨数据中心的应用网络互连,要求延迟低于1ms (同样是Oracle RAC的要求)因此,首先需要确认可以获得低延迟的裸光纤链路,用于存储的最低要求是4对裸光纤:用途连接设备光纤(对)服务器到存储原有SAN交换机互联2双活存储互联(心跳)MC内部SAN交换机互联4(建议)主机高可用方面, MSCS和VCS等都支持长距离的高可用
21、集群。因此这个条件也是具备的。应用方面,主要应用是Oracle RAC和vSphere。Oracle RAC在这种远距离距离的实施,早在2006年就有大量的安装案例了。可参考Oracle白皮书Oracle Real Application Clusters on Extended Distance Clusters Updated for Oracle RAC 10g Release 2,发布日期是2006年10月。Oracle RAC在NetApp MetroCluster上的应用是非常成熟和可靠的,早在2008年,Oracle官网就介绍了RAC和NetApp MetroCluster的案例
22、,见:下图描述了Oracle RAC Extended Cluster基于NetApp MetroCluster技术上的实现(两地三中心):VMware的白皮书“VMware vSphere Metro Storage Cluster Case Study”就以NetApp MetroCluster为例,阐述了VMware如何实现双活数据中心。综上所述,用户现有存储设备环境升级到数据双活的存储虚拟化平台完全是可行的。升级之后,同一个应用可以同时跑在两个数据中心,两个数据中心对客户端提供统一的接入接口。可以这样讲,逻辑上的一个应用,物理上分布到两个数据中心,均衡负载,互为备份。发生任一单点故障,
23、均不会影响应用运行。6.1.2 风险和影响分析由于数据双活的存储虚拟化平台的各个组成方面,或者是已经具备条件,或者采用成熟解决方案,如果实施计划周密,风险完全可控。两个数据中心之间采用裸光纤,满足双活的基本要求。数据双活的存储虚拟化平台建议选择NetApp FAS8000统一存储设备作为核心应用持续高可用存储控制器。由两套FAS8000统一存储控制器,分别连接原有EMC VNX5600存储控制器。两套FAS8000统一存储控制器之间通过光纤连接,采用光纤链路实现互相的心跳检测及数据传输,存储系统采用原有EMC VNX5600物理磁盘组成两份物理镜像通过SyncMirror软件实现磁盘数据同步,
24、利用MetroCluster技术实现存储远程双活集群。借助第三地的Tiebreaker仲裁节点,可以有效地防范双活架构中的“脑裂”(Split Brain)现象,并实现自动化的故障恢复。这个软件可以安装到用户指定的服务器上进行“脑裂”的仲裁。数据双活的存储虚拟化平台应用数据基本上为结构化数据和非结构化数据,可以考虑采用高性能低延迟的FC SAN网络和方便部署数据共享的NAS网络一起部署。对于数据双活的存储虚拟化平台,也可选择部署在NAS的大文件系统上,通过NFS协议访问,非常有利于管理和扩展,也可选择FC SAN方式,利用其高性能、低时延的特点。总结起来,本阶段双活数据中心达到的目标是:针对各
25、类物理故障可实现零数据丢失和零应用影响。6.1.3 数据双活的存储虚拟化平台验证和演练数据双活的存储虚拟化平台的验证和演练,是系统建设不可缺少的部分。通过日常的验证测试,以确保数据双活的存储虚拟化平台的数据完整性和可用性;而定期的演练,有利于让维护人员熟悉系统流程,完善应急预案。使用NetApp独有的精简克隆技术,可利用任一快照,秒级生成克隆,极低空间占用。利用这些克隆可方便地进行系统中必须定期完成的演练、数据验证。6.2 存储集成数据保护机制完善数据保护机制随着数据量的增加,同时希望故障后对业务的影响降到最低,因此有必要建立多重数据保护机制。前面提到,对于逻辑故障,现有解决方案是采用传统备份
26、软件和额外的硬件设备,增加了管理复杂度和设备维护工作。而且,在恢复速度上也满足不了实时可靠的系统要求。解决办法是:n 使用双活存储设备自身的快照备份功能,实现秒级数据备份和恢复n 优化原有备份方式,例如采用D2D2T的备份方案,备份和恢复速度上得到一定的提升,同时也可以保留离线归档备份。n 未来灾备存储也需要建立快照历史备份,有效应对逻辑故障传递建设完成之后,可以达到的效果是:n 恢复最近的数据,可利用双活存储自身的快照备份,秒级数据恢复,分钟级恢复应用n 恢复较长时间前的数据,从近线存储(可考虑未来部署一套)恢复,可实现分钟级的数据恢复6.2.1 逻辑故障防范 秒级备份和恢复NetApp F
27、AS8000内置快照功能,提供秒级备份和恢复功能,有效防范逻辑故障(海量文件、数据库和虚拟机的最有效备份恢复方式)利用NetApp卓越的快照技术,对Oracle、DB2、SQL Server以及海量文件系统进行数据一致性的秒级快照备份。备份窗口从原来的几个小时缩短为12分钟,仅仅为数据进入热备模式时间+1秒。对于同一个数据库,NetApp支持多达255个时间点的历史备份。如数据库(Oracle、DB2、SQL Server)或文件系统发生逻辑数据错误,可使用SnapRestore进行快速的恢复。数据恢复时间为数秒,再加上日志重做的时间,应用恢复可控制在十几分钟至数十分钟内,远低于其他方案的数个
28、小时。虚拟化平台(如VMware)下,因为备份窗口过长,传统的备份技术更加难以适应。而NetApp的快照技术,不但可以通过秒级备份和恢复解决这一问题,而且还可以实现与VMware在管理上的集成。即备份恢复数据,仅仅需要在vCenter内部调用NetApp的功能即可,无需掌握备份软件、无需掌握存储管理技术,提升应用在线能力的同时,大幅降低了管理的复杂度。6.2.2 D2D备份设计规划在未来,还可利用一套NetApp FAS8000作为近线存储,利用高效的SnapVault D2D备份,提升应用的可用性。和传统备份模式相比,NetApp SnapVault是Server-Free方式,备份流不通过
29、主机,因此不会影响主机性能;而传统方式为LAN或者LAN Free方式,对主机性能有一定的影响。除此之外,NetApp SnapVault和传统备份模式相比,还有如下优点:项目NetApp SnapVault传统D2D备份数据备份很快,秒级更多的备份点很慢,小时级一天一个备份点对生产的影响无较大,且时间较长数据恢复很快,秒级很慢,小时级空间效率高,仅一次全备的方式,加上消重技术较高,仅虚拟带库的消重技术备份验证方便,且不需要空间 降低人力、硬件成本复杂,且需要额外空间 额外人力和硬件成本备份数据利用备份数据为主机可以直接识别和挂接的格式;可方便用于开发、培训以及生产应急,提升投资回报率只能用于
30、数据恢复许可证方式总体很低:仅一次性购买,再多的主机接入、再多的数据量,均不会增加成本总体很高:按主机数量收费,每增加业务主机,需要额外购买备份软许可7 精编系统方案简述配置四节点的FAS8000集群存储系统,配置384块4T NL-SAS盘,配置32个10Gb光纤接口,满足精编系统容量和吞吐需求。8 NetApp的双活数据中心架构技术优势这两年来,大数据行业的应用有以下发展:一是数据量越来越大,数据类型也呈多样化。由于服务器虚拟化的应用发展,各种应用和业务沉淀数据量呈几何级增长。同时,非结构数据和结构化数据在各应用中将并存,而且数据增长方向主要在非结构化数据。如何管理海量的数据,对传统存储来
31、说,是巨大的挑战。二是应用要求越来越高。这既体现在应用对“不中断运行”的要求上,同时也对应用系统性能的需求。两者其实可以归为一个目的,保证应用正常运行,减少宕机时间。三是应用种类越来越多,对管理维护也提出更高要求。新需求不断地提出,也会产生新的应用。那么对于存储系统最大的挑战是,如何满足新应用需求的同时,降低管理维护的复杂度。四是突破不同系统、不同行业、不同地域之间的信息壁垒,实现充分的信息资源共享、互备。利用传统的存储技术,要实现以上目标,必须付出很大的代价。而NetApp的创新技术可以帮助用户轻松实现,而且这些技术全部“统一”到一个平台上了:n 统一存储NetApp发明了统一存储,它可以同
32、时整合不同类型的数据,统一管理。同时,单套NetApp FAS存储可以管理超过50PB的数据量,轻松应对新的业务带来的海量数据 这正是我们擅长的。n 弹性扩展从较小的型号起步,后期也可以灵活地对性能和容量进行扩展和升级,没有数据迁移的阵痛,而且可以保护原有投资。n 业务连续性NetApp存储内置了丰富的数据保护措施,足以应对各类故障。如“双活”、容灾、秒级快照备份、D2D备份这些功能全部内置于存储本身,不需要额外购买软件。n 高效率存储技术,应对海量数据针对日益膨胀的数据量,NetApp免费提供了压缩、消重等技术,可以大幅降低磁盘购买量。NetApp还提供性能加速技术,各项性能测试表明,相同硬
33、件配置下,NetApp可以提供最好的性能,保证核心业务的最低延时目标。n 面向虚拟化、云计算的共享式架构NetApp最初设计就是按照共享式的IT架构来做的。共享式架构,也是虚拟化和云计算的基础。不但可以打破应用、地域之间的信息壁垒,同时还可以提升硬件资源利用率,降低维护复杂度。更重要的是,面对新的应用需求时,可以做出更快的反应和调整。9 数据双活的存储虚拟化平台面向私有云架构的优化管理NetApp 提供自动化存储服务定制,支持与客户数据中心业务流程管理软件的集成:可利用NetApp管理工具实现存储服务自动化。也可和第三方管理软件进行无缝集成,同时NetApp也开放API和SDK,支持用户自定义
34、云管理平台。通过定制化的自助服务环境,使内部客户在几乎没有或是根本没有管理人员介入的情况下请求和获得适当配置的 IT 资源,是实现整体业务灵活性和服务快捷性的一个重要步骤。这样一来,可轻松实现: n 持续满足服务级别 n 快速扩展和添加新应用和IT服务 n 以最少的投入满足不断变化的业务需求 n 高效利用 IT 资源,最大限度地提高硬件利用率 n 通过自动执行重复性活动来提高生产率 n 借助集成工具和自动化配置流程来简化管理10 数据双活的存储虚拟化平台与服务器虚拟化平台的结合10.1 服务器虚拟化的整合NetApp FAS存储平台为虚拟化环境进行了专门的优化,以VMware为例,体现在以下几
35、个方面: 统一存储,支持VMware三种不同的部署协议 NetApp的智能二级缓存技术,针对虚拟化环境中常见的I/O热点数据,提供了实时加速能力,效果明显优于其他厂家的自动分层技术(有SAN标准性能测试SPC-1报告为证) 最紧密的特性和管理集成。VMware和存储相关的白皮书,包括双活架构(vSphere Metro Storage Cluster),容灾(SRM)和存储集成(VAAI),采用的唯一范例都是NetApp。此外,NetApp还提供了进一步的管理集成:VSC插件允许VMware管理员在权限范围内自由地调配和管理存储资源,从而大幅简化了运维模式 针对虚拟化环境下常见的备份难题,Ne
36、tApp存储内置的备份功能提供了最好的解决手段。例如成都一个央企(东方电气),部署了130个虚机,过去采用VAAI + 传统备份软件备份方式,日备时间为6小时,而采用NetApp方案,仅需12分钟。 降本增效。NetApp FAS内置消重功能,针对VMware环境中,大量冗余的虚机映像,能够节省90%以上的存储空间。10.2 虚拟化环境中的性能提速技术虚拟化平台对存储性能的要求非常苛刻,已成为业界的共识。存储性能的高低,将决定着应用性能的快慢,也决定着用户交易的体验。如何衡量不同存储性能的高低?业界公认的方法是通过第三方的公开性能测试,如代表FC SAN性能的SPC-1,代表NAS性能的SPE
37、C SFS2008。值得指出的是,SPC-1性能结果高低,虽然不能代表真实业务环境的存储性能,但是至少提供了一个公平公开公正的比较手段。性能测试结果往往以IOPS的形式展现。但必须注意的是,这个数字和用户购买的存储的性能IOPS,完全是两回事。因为用户购买的存储,和性能测试的存储,在配置上差别很大。性能测试往往都采用满配,以达到最好的结果。但用户配置,往往受容量需求和经费限制,远低于测试配置。因此,我们建议用性能效率来进行衡量,即通过测试IOPS/测试配置,来得到单位硬件能够提供的性能,以比较不同存储之间的性能差异。在相同配置的情况下,性能效率高的存储系统,可以提供更高的性能。提升性能效率的方
38、法,在保证性价比的前提下,除了不同的存储操作系统的算法差异以外,主要有两种: 二级缓存技术,如NetApp FlashCache和Flash Pool,EMC FastCache。是以闪存作为存储的二级缓存。这种技术不做任何数据迁移,因此对于性能提升的反应速度和效果都非常好。 自动分层技术,如EMC Fast、IBM Easy Tier,HDS Dynamic Tier,需要在不同的性能层之间迁移数据。对性能提升的反应速度较慢。但如果应用的热点数据分布变化本身较慢,这种技术也有不错的效果。10.3 虚拟化环境中的数据保护和灾备前文已经提及,VMware双活架构vSphere Metro Sto
39、rage Cluster支持NetApp MetroCluster,而且其技术白皮书正是以NetApp MetroCluster为范例。此外,在虚拟化环境中的数据保护具有如下特点:n NetApp的快照技术可集成于VMware环境中,提供秒级的数据备份和恢复。n NetApp可以提供VM中单个文件的恢复n NetApp全面支持VMware SRM容灾软件NetApp专利的快照技术可轻易地集成到VMware环境中,可实现虚拟主机的恢复、完整的虚拟主机克隆,或者站点复制以及冗灾等。这种解决方案的优点在于它是存储界唯一对系统性能没有负面影响的快照技术。VMware也声明为了达到最佳的性能和扩展性,建
40、议使用给予硬件的快照解决方案而不是软件的快照解决方案。在基于磁盘的备份方案中,包含了从生产系统拷贝虚拟磁盘文件到备份的磁盘系统。尽管和直接将生产系统的数据备份到磁带相比,这种方式提供了非常快速的备份方案,但是每次备份都需要100%的额外空间。 某些友商提供了Copy-Out的快照技术,但是Copy-Out快照技术所带来的性能问题,严重地影响了生产,使得这些快照技术也不能被用户所接受。而NetApp的专利的快照技术完全没有传统的基于磁盘备份的固有的问题。而和Copy-Out的快照技术相比,NetApp的快照技术由于不移动数据,从而不会产生对性能的负面影响。同时,NetApp快照技术的开销只是变化
41、的数据块,占用空间更少。10.4 NetApp FAS和VMware的深度集成NetApp FAS系列存储和Vmware虚拟化软件实现了深度的集成,可以最大化提升运行效率,简化管理。VMware vCenter通过调用FAS设备插件,可以驱动FAS执行一系列任务。比如备份、灾备功能,菜单化部署单元功能。FAS存储分别通过VMware的四个插件实现不同的功能。以下是详细的调用关系如下图所示。10.5 VSC存储管理插件在云计算架构下,管理不再是存储、服务器、网络等分离式管理,统一的、集成的管理平台是云存储的最佳实践。vCenter是虚拟化平台的管理平台,在vCenter上集中对存储进行配置、监控
42、等是虚拟化平台与云存储结合的一种推荐方式。为此,FAS系统存储拥有专门的vCenter上的存储管理插件Virtual Storage Console(VSC)。它主要有以下功能: 虚拟存储控制台 配置和克隆 备份与恢复10.6 NFS Plug-in插件ESX Server通过NAS的 NFS Plug-in插件,可以将NAS文件系统挂载到ESX Server,作为NFS DataStore。通过NFS Plug-in插件,还可以定义虚拟机IO的优先级,保证关键业务的IO的优先级,不受其它业务IO性能影响。10.7 SRA插件SRA插件由NetApp提供,部署在SRM Server上,与SRM
43、软件实现无缝连接。在SRM界面,通过SRA插件可以直接调用的SnapMirror(存储复制功能)和FlexClone(虚拟克隆工具),实现灾备功能和虚拟机克隆功能。10.8 VAAI插件VAAI(vStorage APIs for Array Integration)是VMware提供存储管理接口,主流的NAS和SAN存储都支持这个接口,并针对VAAI提供专用的插件,部署在vCenter Server。NetApp存储提供的VAAI插件,可以实现虚拟机和存储空间的快照和恢复功能、NFS Datastorge参数调整和配置功能。10.9 VASA插件VASA的目的是加强存储资源在VMware的可
44、视化,可以通过vCenter和CapacityIQ工具获得对物理存储阵列的一些细节信息,如 RAID 信息,磁盘数量等等。10.10 内置消重功能,降本增效在VMware环境中,非常流行的部署方式是从预先创建的虚机的模板来快速创建新的虚机。一个虚机的模板通常包含了虚机的配置文件(.vmx)以及一个或多个虚拟磁盘文件(.vmdk),包含了操作系统,公共应用程序,以及补丁文件或系统更新。从模板来创建新的虚机,通过拷贝配置文件以及虚拟磁盘文件,并注册成为独立的虚机,大大减少了管理上的时间开销。但是,在这种方式下,造成了大量的重复数据。下图说明了在VMware环境下的典型存储开销。NetApp提供了一
45、种重复数据删除的技术,称为FAS Dedup。通过FAS Dedup技术,我们能够消除在VMware环境中的重复数据,大大提供存储的总体利用率。FAS Dedup提供了一种虚拟化的技术,使得多个虚机可以共享在NetApp主存储上的相同的物理数据块。FAS Dedup无缝的集成到VMware的环境中,而不需要在VMware的配置和管理中进行任何的改变。下图说明了VMware环境中启用FAS Dedup后对存储开销的影响。在实际环境中,可以节省90%的系统空间。目前,FAS Dedup是Volume级别的,它消除在同一个Volume中的重复数据。因此,为了更好地提高存储利用率,我们建议尽量将相同操
46、作系统、相同应用的虚机部署在同一个datastore中,从而部署在启用FAS Dedup功能的FlexVol中。10.11 vSphere HA实现的VM自动切换10.12 vSphere DRS组双活架构设计原则10.13 VMware vSphere HA for NetApp MetroCluster 10.14 VM失效场景失效场景应对措施Host failure 主机故障Restart VMs 重启虚机Host isolation 主机失联Disabled Datastore with Permanent Device Loss (PDL) Power off and restart VMs Datastore with All Paths Down (APD) Power off and restart VMs Guest not heartbeating Reset VMs VM restar