IBM XX大学基于云计算的高性能计算平台.doc

上传人:laozhun 文档编号:2393139 上传时间:2023-02-17 格式:DOC 页数:91 大小:5.77MB
返回 下载 相关 举报
IBM XX大学基于云计算的高性能计算平台.doc_第1页
第1页 / 共91页
IBM XX大学基于云计算的高性能计算平台.doc_第2页
第2页 / 共91页
IBM XX大学基于云计算的高性能计算平台.doc_第3页
第3页 / 共91页
IBM XX大学基于云计算的高性能计算平台.doc_第4页
第4页 / 共91页
IBM XX大学基于云计算的高性能计算平台.doc_第5页
第5页 / 共91页
点击查看更多>>
资源描述

《IBM XX大学基于云计算的高性能计算平台.doc》由会员分享,可在线阅读,更多相关《IBM XX大学基于云计算的高性能计算平台.doc(91页珍藏版)》请在三一办公上搜索。

1、方案建议书IBM XX大学基于云计算的高性能计算平台致客户的一封信尊敬的XX大学领导:您好!感谢您一直以来对IBM产品及方案的关心、支持和厚爱。长期以来,IBM以满足客户需求为已任,秉承“成就客户、创新为要、诚信负责”的价值观,运用IBM公司强大的软硬件技术、整体解决方案能力、研发和客户服务能力竭诚为客户服务;致力于帮助我们的客户迎接当前所面临的挑战,改善业务模式以及提高企业的灵活性去适应可持续发展的要求。XX大学是国家在科学技术方面的最高咨询及研究机构之一,本次要进行的百万亿次高性能计算机系统的建设项目背负着重大使命,必须成功实施完成。我们了解到,本次规划的高性能计算中心不仅仅是提供传统的高

2、性能计算,也不仅仅是高性能计算设备方案,还需要增加资源的管理,用户的管理,虚拟化的管理,动态的资源产生和回收等等。对于XX大学来说,选择一个拥有高新技术发展能力、有高性能应用支持能力、大型计算中心实施经验的非常有诚意的长期合作伙伴,对中心今后成为高性能技术潮流引导者,突破计算能力瓶颈和系统顺利运行至关重要。IBM 作为全球高性能计算领域的领导者,一直非常重视高性能计算市场。我们拥有世界排名第一的高性能计算机: IBM公司为美国能源部洛斯阿拉莫斯国家实验室研发的“Roadrunner”(走鹃)超级计算机,运算速度达到了每秒1.026千万亿次;IBM作为云计算的领导者,是唯一一家能够提供云计算全方

3、位支持的厂家,无论是硬件、软件和服务;IBM作为 IT领导者,能使云计算更好地与高性能计算中心相结合,更好地发挥云计算在高性能计算领域运用的优势。我们本着满足此次项目结构的需要,并保证最大程度的兼容性和开放性的发展策略原则上,特意为您设计了“基于IBM 蓝云计算的高性能计算”解决方案。方案引入了先进的“云计算”理论的同时,为您提供代表世界先进水平的高性能计算产品和服务。我们愿与XX大学集团通力合作,设计与建设完善的、先进的、可靠的、中国最快速的高性能计算机系统。 IBM不仅希望能够积极参与到此次高性能计算中心的建设过程中,更有信心能够成为XX大学超算中心在这一领域的最佳长期合作伙伴。再次感谢您

4、花费宝贵的时间来浏览我们的方案建议,期望能有机会跟您针对方案的详细内容进行更细致的交流,并期待着与您开展真诚的合作。销售代表姓名: 联 系 电 话: 文档说明此文件属于商业机密文件,经过有关方面批准方可从作者获取。保密说明 本建议书属于商业机密文件,书中的所有信息均为IBM机密信息,仅供XX大学基于云计算的高性能计算平台项目 使用。务必妥善保管并且仅在与项目有关人员范围内使用,未经IBM公司明确做出的书面许可,不得为任何目的、以任何形式或手段(包括电子或机械复印、录音或其他形式)对本文档的任何部分进行复制、存储、引入检索系统或者传播。特别声明 本建议书内容,包括价格和配置,只适用于XX大学基于

5、云计算的高性能计算平台项目。尽管IBM已经尽力使本文档内容完整和有效,但仍可能有技术方面不够准确的地方或印刷错误。如果需求有所变化,IBM将对有关内容进行相对应的调整,并在本投标未来版本中体现。IBM是国际商业机器公司的注册商标。本文档提及的其他公司、产品和服务的名称,可能是其他公司的商标或服务的标志。本建议书的有效期为自开标日起90日历天。目 录第1章高性能计算与云计算概述11.1为什么高性能计算需要向云计算模式迈进11.2基于云计算的高性能计算模式1第2章我们对您的需求和目标的理解32.1我们对您的高性能计算中心建设目标的理解32.2我们对您的高性能计算中心建设需求的理解32.3基于IBM

6、 蓝云计算的高性能计算中心方案简介52.4IBM高性能计算中心方案将带给您的价值6第3章XX大学高性能计算中心方案设计93.1方案特性93.2方案总体架构设计103.3方案产品配置简表12第4章IBM 蓝云高性能计算方案各系统描述144.1集群硬件系统方案描述144.2集群软件系统方案描述16第5章IBM 基于蓝云计算的高性能计算方案优势265.1基于云计算的高性能计算方案优势265.2IBM并行文件系统GPFS的优势285.3IBM BladeCenter绿色节能解决方案优势305.4IBM BladeCenter 方案优势335.5IBM智能系统管理优势345.6IBM Tivoli Mo

7、nitoring 解决方案优势35第6章XX大学高性能运算技术实施方案376.1IBM的XX大学高性能计算机系统项目团队376.2系统集成服务介绍386.3项目管理服务介绍386.4项目实施服务介绍39第7章XX大学超算中心高性能运算的服务支持方案417.1服务支持体系417.2非现场维护支持系统427.3现场维护支持系统45第8章XX大学超算中心高性能运算的技术培训方案48第9章IBM在中国高性能计算市场的成功案例499.1在中国的大规模高性能计算机系统市场上,IBM占据着领导地位499.2在中国的高校领域,IBM在高性能计算中也展开了广泛的合作:51第10章为什么IBM是高性能计算领域之最

8、佳的合作伙伴5310.1IBM是重视科学研究的厂商5310.2IBM是高性能计算市场的领导54第11章IBM公司介绍5711.1IBM是全球信息工业的领导者5711.2IBM在中国5711.3IBM全球信息科技服务部优势概览58附录1 方案产品介绍591.1IBM硬件产品详细配置591.2IBM eServer BladeCenter621.3IBM eServer BladeCenter HS21651.4IBM System x3650661.5本方案中涉及的部分软件产品简介68附件2 场地电气要求说明751.设备外观与功耗752.场地环境763.场地布局784.走线方式79第1章 高性能

9、计算与云计算概述1.1 为什么高性能计算需要向云计算模式迈进在信息科学领域半个多世纪的发展历史中,高性能计算一直代表了当时技术的制高点,并成为理论科学和实验科学以后科技创新的主要工具。在过去十年中,高性能计算技术正处于创新的高峰期,其处理速度和总体计算能力的发展远高于摩尔定律描绘的芯片技术的发展速度,在近期刚公布的最新一期全球超级计算500强榜单中,第500名的实测浮点运算能力为5.92万亿次(峰值9.99万亿次)。在应用领域,一些传统领域和高性能计算结合的新兴交叉学科不断涌现,如计算化学、计算物理、生物信息学等,这也为我国计算技术的研究提供了跨越式发展的良好机遇。在高性能计算领域,我国总体上

10、较为落后于发达国家,在应用和教育方面的差距尤为严重。差距是挑战,更是发展空间和机遇。我国政府为应对国际金融危机加大投入拉动内需的重大举措,必然使我国信息化建设提速,激发有关行业对高性能计算机的需求:金融行业规避风险需要提升预测分析能力,高性能计算是重要手段;超级计算是精确地震预报、灾害天气预报的主要手段;此外,在应对能源和自然资源枯竭危机、环境污染、疾病威胁等人类面临的重大问题的进程中,在探索宇宙、物质和生命现象奥秘的过程中,高性能计算扮演着极为重要的角色。这些都为我国高性能计算中心的发展提供了极大的机遇。要把握机遇,高性能计算中心需要不断挑战和突破新的计算能力。然而,在当前的经济危机影响下,

11、中心更面临如何以更少的资源投入提供更高计算性能的巨大挑战。新一代的高性能计算中心建设不能仅仅考虑软硬件设备的选择,而是需要全面考虑中心运作、应用效率、技术创新合作等多方面因素,充分考虑总体架构的合理性和资源管理的高效性,具备长远的高性能运算科研和供应能力。换句话说,新一代的高性能计算中心不仅仅是提供传统的高性能计算,更不是一个高性能计算设备方案,还需要增加资源的管理,用户的管理,虚拟化的管理,动态的资源产生和回收等等。基于云计算的高性能计算就应运而生了。1.2 基于云计算的高性能计算模式事实上,云计算的演变从1990年左右开始,经历了网格计算、效用计算、软件即服务(SaaS)几个阶段。我们可以

12、这样定义云计算:云计算是一种计算模式,在这种模式中,应用、数据和IT资源以服务的方式通过网络提供给用户使用。云计算也是一种基础架构管理的方法论,大量的计算资源组成IT资源池,用于动态创建高度虚拟化的资源提供用户使用。基于中国目前的现实情况和IBM一直以来对中国的承诺,IBM把云计算的创新理念和先进技术引入中国,旨在通过云计算提供的优质服务帮助中国客户解决目前面临的各种问题,摆脱困境,并持之以恒,帮助客户创造更大的价值,促进中国科技的不断创新和发展,实现经济的持续快速增长。在云计算模式下,计算工作由位于互联网中的计算资源来完成,用户只需要连入互联网,借助轻量级客户端,例如手机、浏览器,就可以完成

13、各种计算任务,包括程序开发、科学计算、软件使用乃至应用的托管。提供这些计算能力的资源对用户是不可见的,用户无需关心如何部署或维护这些资源,因此,这些资源被比喻为“云”。 “云”就像是一个发电厂,只是它提供的不是电力,而是计算机的计算、应用和管理能力。只要通过网络进行连接,并得到授权,您就可以使用这些能力和资源了。采用云计算的基础架构,搭建高性能计算中心,可以提供一种新的IT资源供应模式。在这种模式下,计算中心可以自动地管理和动态的分配、部署、配置、重新配置以及回收资源,也可以自动安装软件和应用。从而实现快速高效、动态优化的高性能计算资源分配,在项目结束后,计算中心可以自动回收资源,能充分发挥计

14、算能力。 利用云计算的特性,高性能计算中心不仅仅能够提供科研所需要的高计算力,同时还可以扩展计算中心的服务内容,做为一个数据中心服务于其它的应用,提高整体资源的利用率。 第2章 我们对您的需求和目标的理解2.1 我们对您的高性能计算中心建设目标的理解XX大学科研力量雄厚,在生物、化学、电子等多个领域都有着高精尖的研究课题,XX大学,本次要进行的高性能计算机系统的建设将为不同领域的杰出科学家提供一个技术领先的研究平台,,该平台需要实现的主要目标有:l 能够提供世界领先水平的高性能计算平台。l 具备目前最先进的高性能计算技术,满足各个领域的应用需求。l 该系统同时作为XX大学下一个高性能计算机研发

15、项目的验证。由此可见,XX大学高性能计算机系统项目背负着重大使命,必须成功实施完成此重要目标。根据我们对XX大学本次项目的调研结果产生的需求分析报告,本次计划建设的高性能计算中心主要承担的服务任务有:1) 面向科研领域、提供优质服务的方针,积极为学校各个学院提供大型科学计算服务和技术支持;2) 服务单位遍布校内各类科研单位,科学计算题目涉及数学、物理、化学、计算机、地理、光电子、生命科学等多种学科领域,为科学计算研究与实际应用提供了强有力的支持;3) 集公共资源服务、计算技术研究与科研开发于一体的机构。上述三种服务中,公共资源的提供与服务是其基本职能,也是中心的主体;计算技术研究在一定时期内将

16、是其主要的服务内容和协助XX大学搞性能计算的攻关方向;科研项目的开发是保持其良性运转的基础,将通过重点课题、重大项目和有关科研领域的深入研究保障中心可持续发展。2.2 我们对您的高性能计算中心建设需求的理解根据我们对XX大学高性能计算中心的前期了解,本次中心建设需要解决的问题主要有以下几个方面:2.2.1 平台需求: XX大学在多个科研领域都已经开始利用计算科学的力量快速推动科研项目的进展,所以更好的满足各个学科科研软件的计算需求是保证科研进度的关键,但是通过我们的调查发现,由于科研领域广,科研软件多样,对平台的需求也呈多样化趋势。为满足所有用户的计算需求,中心必须能够满足提供广泛平台支持:l

17、 操作系统支持:windows、Linuxl 系统架构支持:单机、集群并行l 虚拟化支持:为了让有限的资源满足更多的用户需求,需要采用虚拟化的方式,提供更多的虚拟设备,包括单机或者并行环境,提高整体资源的利用率。2.2.2 用户管理需求l 可管理性:高性能计算中心服务全校,所以用户会来自各个院系,需要提供一种用户管理机制,可以根据用户来动态分配计算资源。l 用户界面:需要提供一个友善的用户使用界面,让用户可以便利在界面上进行资源查看、申请等操作l 统计:为了便于网络中心监控和分析资源的使用情况,需要可以根据用户为单位来查看所有用户的资源利用情况。2.2.3 资源管理需求l 动态资源分配:当用户

18、在用户界面上进行资源的申请时,经过管理员审批之后,可以动态的从可使用资源中分配出客户所需要的计算资源。l 物理资源管理:可以让管理员方便的查看到所有物理资源的健康状态,提前进行故障隔离,预防。l 虚拟资源管理:便利的进行虚拟设备的产生和管理,动态部署和动态回收。l 资源报表:提供给管理员使用,让网络中心查看现有资源的利用率,对计算资源进行调整,扩充。2.2.4 硬件规模需求l 集群总体性能 计算峰值 2/3/5T FLOPSl 集群内存总量内存总量 410/620/1000GBl 集群高速互连网络采等新一代高速网络系统实现节点间通讯。l 集群接点架构采用刀片服务器为节点机l 存储容量存储容量5

19、TB综合中心建设目标和各种需求,对于XX大学来说,选择一个拥有高新技术发展能力、有高性能应用支持能力、大型计算中心实施经验的非常有诚意的长期合作伙伴,对中心今后成为高性能技术潮流引导者,突破计算能力瓶颈和系统顺利运行至关重要。IBM为您特意设计了“基于IBM 蓝云计算的高性能计算”解决方案,满足您的各项需求,并为您提供代表世界先进水平的产品和服务,并且希望能够成为XX大学超算中心在这一领域的长期合作伙。2.3 基于IBM 蓝云计算的高性能计算中心方案简介2.3.1 基于IBM 蓝云计算的高性能计算中心建设思路 应用为先:根据调研结果,并根据应用的需求来选择最合适的软硬件平台。由应用决定平台,而

20、不是由平台限制应用; 创新为体:高性能计算技术发展日新月异,在架构设计时,应充分考虑技术发展趋势,采用先进的产品和创新的思路,最大化利用现有投入,并考虑到今后扩展的需求; 效率为要:不仅仅以峰值运算能力或单一的Linpack测试指标作为设备选型的依据,而是充分考虑总体架构的合理性和资源管理等要素,实现一个高效率计算(High Productivity Computing)的平台。2.3.2 IBM“基于蓝云计算的高性能计算”解决方案简介IBM云计算中心经过多年的探索和实践,结合高性能计算中心需求特征,设计开发出“基于蓝云计算的高性能计算”基础架构管理平台解决方案。其结合了业界最新技术,充分体现

21、云计算理念,且具有众多成熟案例。方案可以对高性能计算中心现有的基础架构进行整合,通过虚拟化技术和自动化技术,构建高性能云计算中心。实现硬件资源和软件资源的统一管理、统一分配、统一部署、统一监控和统一备份,打破单个运算对资源的独占,从而帮助中心实现高性能计算目标。基于蓝云计算的高性能计算中心解决方案拥有的功能如下: 服务器部署 存储资源的部署 集中式的OS映像备份和恢复 补丁的安装管理 服务器配置的改变 存储系统配置的改变 应用模板的管理 监控报告 费用管理基于蓝云计算的高性能计算中心可以自动管理和动态分配、部署、配置、重新配置以及回收资源,也可以自动安装软件和应用。“蓝云”可以向用户提供虚拟基

22、础架构。用户可以自己定义虚拟基础架构的构成,如服务器配置、数量,存储类型和大小,网络配置等等。用户通过自服务界面提交请求,每个请求的生命周期由平台维护。基于蓝云计算的高性能计算平台架构图如下:解决方案由以下部分构成:l 需要纳入高性能云计算中心的软硬件资源。硬件可以包括x86或Power的机器、存储服务器、交换机和路由器等网络设备。软件可以包括各种操作系统、中间件、数据库及应用,如Aix、Linux、DB2、WebSphere、Lotus、Rational等。l IBM“蓝云”管理软件及IBM Tivoli管理软件。“蓝云”管理软件由IBM云计算中心开发,专门用于提供云计算服务。l IBM“蓝

23、云”咨询服务、部署服务及客户化服务。“蓝云”解决方案可以按照客户的特定需求和应用场景进行二次开发,使云计算管理平台与客户已有软件硬件进行整合。2.4 IBM高性能计算中心方案将带给您的价值2.4.1 采用云计算模式的高性能计算,提供动态优化的高性能计算资源分配IBM作为IT行业的领导者,能使云计算更好地与高性能计算中心相结合,更好地发挥云计算在高性能计算领域运用的优势。 进行资源整合,提高资源利用率并能快速响应多种研究项目所需的资源环境; 解决使用人员众多,资源种类繁多的资源调配混乱现象,有效共享资源,杜绝浪费; 快速高效、动态优化的高性能计算资源分配模式,在项目结束后,自动回收资源,能充分发

24、挥计算能力; 消除由于多学科,多人使用,研究项目之间的互相影响,加快科研进度; 提供多种操作系统平台支持,促进科研项目发展; 支撑多种研发平台,为研究者提供独立计算环境; 可以成为网格计算的支撑平台,提升计算的灵活性和便捷性。2.4.2 IBM 全球领先的高性能计算平台技术,帮助您实现计算能力目标IBM 作为全球高性能计算领域的领导者,一直非常重视高性能计算市场。IBM在高性能计算技术的发展本着满足尽可能多的客户对不同结构解决方案的需要,和保证最大程度的兼容性和开放性的发展策略。IBM公司在这一领域积累了长达半个世纪的丰厚经验,并在关键技术领域不断创新,取得大量里程碑式的成果。2008年6月1

25、8日,最新一期高性能计算TOP500名单强势出炉,全球高性能计算由此正式进入了一个全新的阶段最高性能超过1千万亿次的超级计算机问世。排名第一的是IBM公司为美国能源部洛斯阿拉莫斯国家实验室研发的“Roadrunner”(走鹃)超级计算机,运算速度达到了每秒1.026千万亿次,这也是目前为之首个突破千万亿次运算性能的超级计算机。此外,Roadrunner也是TOP500名单中最节能的系统之一。 亚军和季军同样来自IBM,分别是IBM华生研究中心的BGW和LLNL的ASC Purple,性能分别为91.29Tflops和75.76Tflops。2.4.3 最具丰富的高性能计算中心建设经验和专业技术

26、团队,是您的项目建设顺利的最大保障IBM在高性能计算市场,尤其是在所谓高端市场上一直处于领先地位。无论是在超级计算机数上,还是计算能力上,IBM都遥遥领先其他电脑厂商。其中在台数上,IBM公司支持TOP500的计算机台数为232台,比第二名HP多出66台;在计算能力上,IBM 45%的占有率是第二名HP的近2倍之多。在中国的大规模高性能计算机系统市场上,IBM同样占据着领导地位。大中国地区目前运行速度排名前5的高性能计算机系统均由IBM中国公司提供,并成功实施。其中包括目前速度最快的计算机、安装于中国台湾超级计算中心(NCHC)的IBM x3550集群系统,及大陆地区运行速度最快的、安装在胜利

27、油田的HS21刀片集群系统。因此, IBM 公司大中华地区拥有了各厂商中最多实施过TOP500项目的技术人员。众多高性能计算项目的顺利安装与运行,为IBM中国公司在超大规模高性能计算机系统的设计与实施方面积累了宝贵的经验。同时也培养出一批专业的、高水平的高性能计算相关技术人才,包括系统架构设计、系统安装实施、以及并行计算与用户应用支持等各方面的专业团队。为您的计算中心系统高效率的运行和使用提供必要的系统及应用等方面的各项支持。2.4.4 中国本地IBM云计算中心支持,为您的高性能计算中心保驾护航IBM是唯一一家能够提供云计算全方位支持的厂家,无论是硬件、软件和服务, IBM在云计算领域已经有了

28、丰富的实战经验。而且IBM于2008年在中国成立了IBM大中华区云计算中心团队(IBM Cloud Labs & HiPODS)。为帮助中国本地客户解决云计算中心建设和维护过程中面临的各种问题,及时摆脱困境和提供本地化支持。 另外,我们与XX大学超算中心有着长期良好合作的历史, IBM不仅希望能够积极参与到此次高性能计算中心的建设过程中,IBM云计算及高性能计算技术团队愿与XX大学集团通力合作,为XX大学超算中心提供代表世界先进水平的产品和服务,设计与建设完善的、先进的、可靠的、中国最快速的高性能计算机系统。更有信心能够成为XX大学超算中心在这一领域的最佳长期合作伙伴。第3章 XX大学高性能计

29、算中心方案设计3.1 方案特性l 基于云计算的高性能计算中心运营模式:用户向计算中心申请项目所需要的计算资源环境,计算中心自动配置和部署其所需的装好软件和应用的虚拟计算机。这个虚拟计算机有可能对应一台物理机,亦有可能多个虚拟机对应一台物理机。最终用户通过网络连接到计算中心为其准备的虚拟机,相当于用户拥有了一台已装好他需要使用的软件的服务器。用户使用计算中心分配的权限开始运算操作,当然他也可以安装其它云计算中心不提供的软件。l 先进性选择了代表IBM先进水平和全球主流趋势的软硬件平台产品,使之不仅能够满足XX大学高性能计算中心目前业务的需要,还能适应未来技术发展的趋势和需要。l 灵活性根据您对解

30、决大问题(Capability computing)和同时运行多个中小型任务(Capacity computing)的综合需求,优化系统资源配置比例,实现最大的应用灵活性。l 可扩展性由于目前处于中心首期建设时期,当成功运作后会向全校推广拓展,因此在设计上充分考虑到可扩展性需求,提供具有最高可伸缩性的系统,并保护用户现有的投资。鉴于高性能计算中心整个项目分两阶段建设,充分考虑项目可扩展性是尤其必要的,是两阶段成功对接,建设最终系统的保证。l 稳定性整体系统确保稳定、高效、连续地运营,能够支持全天24 小时的连续运行需求。l 开放性系统方案采用开放标准,开放结构,开放系统组件和开放用户接口。充分

31、满足用户投资保护和业务扩展、系统维护等方面的需求。此外,根据用户应用的特点,在系统设计上还考虑到安全性、保密性、可视化处理等需求,力求提供一个完整实用的总体方案。3.2 方案总体架构设计本方案设计的蓝云基础架构方案可以自动管理和动态分配、部署、配置、重新配置以及回收资源,也可以自动安装软件和应用。“蓝云”可以向用户提供虚拟基础架构。用户可以自己定义虚拟基础架构的构成,如服务器配置、数量,存储类型和大小,网络配置等等。用户通过自服务界面提交请求,每个请求的生命周期由平台维护。本方案的整体架构构成包括硬件、软件和服务三个部分:硬件:主要是x86或IBM Power 系列机器;软件:包括管理计算机自

32、动化的软件,以及被管理的中心日常运行所需软件;服务:指基于云计算的计算中心的搭建和以后的运维。l 硬件设计方案:根据我们对您需求的理解和分析,同时为简化未来系统管理和运作开销,并便于今后升级,IBM推荐采用刀片式服务器作为计算节点硬件平台。硬件服务器的配置基于下面的三种HPC要求能力进行估算:理论性能估算:(以Intel Xeon E5430 2.66GHz四核为参考)目标性能1:2T FLOPS估算方式:2000G 2.66G442 23.5(台双路刀片)估算结果:要达到 2T FLOPS 理论性能,需要至少 24 台双路四核刀片服务器目标性能2:3T FLOPS估算方式:3000G 2.6

33、6G442 35.2(台双路刀片)估算结果: 要达到 3T FLOPS 理论性能,需要至少 36 台双路四核刀片服务器目标性能3:5T FLOPS估算方式:5000G 2.66G442 58.7(台双路刀片)估算结果:要达到 5T FLOPS 理论性能,需要至少 59 台双路四核刀片服务器在上述基础上再增加2-4个64位UNIX刀片作计算节点以满足如Cerius 2等Unix的应用要求。l 网络设计方案:本方案,共配置四套套网络:网络交换系统,作为计算网络;硬件管理网络(AMM);软件管理分发网络(Software network); 数据管理网络(Data network);l 软件设计方案

34、:本方案操作系统建议选择红帽子(Redhat inc)的AS5,集群管理软件选择CSM(Cluser System Management),并行文件系统选择GPFS。3.3 方案产品配置简表3.3.1 方案硬件配置简表:服务器及网络设备配置简表功能组成配置简要安装软件数量管理服务器IBM System X3650M3服务器2*Intel Xeon Processor E5640 (2.66GHz/12MB L3 Quad-Core), 1333MHz FSB, 16GB Kit (2x2GB) PC2-5300 DDR2 内存IBM 6*300GB 15K 3.5” SAS 热插拔HDDSer

35、veRAID-8k SAS/SATA 控制器 256MB缓存/电池备份1* Giga Ethernet PCI-E cardLinuxIBM Cluster System Management (CSM)/xCATIBM ITM2I/O服务器IBM Blade HS222*Xeon Quad-Core Intel Xeon Processor E5640 (2.66GHz 12MB L2 1333MHz,80W),16GB Kit (2x2GB DIMM) PC2-5300 CL5 ECC DDR2 FBDIMM 667MHz Low Power2*146GB 15K 2.5 SAS HDD1

36、*QLogic 4Gb Fibre Channel Expansion Card (CFFv)LinuxIBM General Parallel FileSystem (GPFS) server version 3IBM Cluster System Management (CSM/xCAT) client.IBM ITM Client2/3/5计算服务器IBM Blade HS222*Xeon Quad-Core Intel Xeon Processor E5640 (2.66GHz 12MB L2 1333MHz,80W),16GB Kit (2x2GB DIMM) PC2-5300 CL

37、5 ECC DDR2 FBDIMM 667MHz Low Power2*146GB 15K 2.5 SAS HDDLinux/WindowsIBM General Parallel FileSystem (GPFS) client version 3IBM Cluster System Management (CSM/xCAT) client.IBM ITM24/36/59计算服务器IBM Blade JS224核4.0 GHz 64位POWER6,带有 AltiVec SIMD 和硬件十进制浮点加速功能8G DIMM ECC Chipkill DDR2 SDRAM 533MHz146GB 2

38、.5 10K RPM SAS HDDIBM AIX/LiuxIBM General Parallel FileSystem (GPFS) client version 3IBM Cluster System Management (CSM/xCAT) client.IBM ITM2/3/4存储IBM DS48004GB Cache12块450 GB/15K E-DDM硬盘 Windows Host Kit, Linux/Intel Host Kit, 8-Storage Partitions3年7*24小时原厂服务。IBM Storage ManagementGPFS support1SAN交

39、换机IBM B2424口光纤交换机,激活16口1年5*9小时原厂服务。B24 管理模块23.3.2 方案软件配置简表:软件配置简表功能组成配置简要说明数量注释操作系统Redhat AS 5.0集群操作系统足够的许可证本方案目前不包括软件许可证报价,要另行协商集群管理系统CSM/xCAT集群管理系统,集群上/下电,软件安装等足够的许可证本方案不包括软件许可证报价,要另行协商集群硬件监控管理系统IBM Tivoli Monitor硬件状态监控,信息收集随机附赠本方案包括软件许可证报价并行文件系统GPFS集群并行文件系统,完成用户应用数据交换,存储。足够的许可证本方案不包括软件许可证报价,要另行协商

40、第4章 IBM 蓝云高性能计算方案各系统描述4.1 集群硬件系统方案描述随着用户对系统总体运作成本和系统管理维护成本的关注,刀片式服务器已经成为高性能计算集群的主流,在全球超级500强和国内100强超级计算机中,许多新增的集群系统都采用了刀片架构,目前全球运算能力最强的Linux集群就采用了IBM刀片系统。基于此,在计算节点的选择上,IBM建议采用HS21刀片,基于最新推出的Intel四核处理器,支持Windows和Linux 操作系统,可以对64位/32位高性能计算应用提供良好支持。并配置一定数量的IBM JS22 Power系列刀片服务器,使用IBM 强大的Power6 CPU,频率高达4

41、.0MHz,支持Linux和Unix操作系统。4.1.1 集群服务器硬件架构方案描述各功能服务器和网络连接对照表如下:网络服务器交换网络硬件管理网络软件分发管理网络数据管理网络管理服务器连接连接连接I/O服务器连接连接连接计算服务器连接连接连接连接软件的分发和管理通过软件管理分发网络实现,在本方案中,每个刀片中心配置一个2/3层交换机,14口对内连接所有的14个刀片服务器,6口对外,其中两个口连接到交换机上,所有I/O节点也连接到交换机上,软件分发管理网络,管理节点连接软件分发管理网络,统一管理。为了实现集群并行文件系统的数据管理。在本方案中,每个刀片中心配置一个2/3层交换机,14对内,连接

42、所有的14个刀片服务器,6口对外,四个口连接到千兆以太网交换机上,所有I/O节点也连接到的交换机上。本方案中,根据XX大学本项目的建设要求,分别有三种不同的配置,对应三种运算能力目标:2T FLOPS/3T FLOPS/5T FLOPS。 其硬件配置如右表:4.1.2 集群网络架构方案描述根据需求调研结果,我们提供两种不同的网络架构供选择:需要说明什么需求,需要两种网络架构l 网络架构一(部分10Gb互联)节点采用1Gb(千兆)互联、机箱之间骨干网采用10Gb(万兆)互联。需要说明本架构特点和优、劣势下图是用万兆与千兆网络混合方式的架构图:l 网络架构二(完全10Gb互联)所有节点和机箱骨干均

43、采用10Gb(万兆)互联。需要说明本架构特点和优、劣势下图是单纯的万兆网络方式的架构图:为了实现并行计算的高速数据交换,正如上面的描述,我们提供两种网络架构选择方案,均采用网络来互联所有的计算节点/登录节点和存储节点。本方案每套刀片服务中心(刀片箱)都配置Nortel 1/10Gb Uplink Ethernet Switch Module交换机做为交换系统,每台外部上联6个1Gb RJ45接口,3个SFP 10Gb端口。特点:本方案充分考虑了本集群IO节点与存储系统的连接,在有交换节点的刀片中心都加入了QLogic 10-port 4 Gb SAN Switch Module连接到存储区域网

44、络(SAN).4.2蓝云动态的基础架构方案描述=蓝云动态基础架构包括六个主要模块:l 蓝云集中资源管理模块 (详见 4.3.1)l 蓝云用户管理模块 (详见 4.3.2)l 蓝云自动化系统/软件部署模块 (详见 4.3.3)l 虚拟化网络管理模块 (详见 4.3.4)l 蓝云存储管理模块 (详见 4.3.5)l 蓝云监控模块 (详见 4.3.6)=下面分别对这六个模块及工作原理进行介绍。蓝云集中资源管理模块工作原理通过蓝云集中资源管理模块,数据中心管理员可以管理数据中心内所有的计算资源,包括服务器、网络、存储、软件等。数据中心管理员可以利用此模块进行计算资源的增加、删除、修改和配置。集中资源管

45、理模块由统一的Web界面提供服务,后台组成主要包括资源数据库,自动化工作流,中间件模块和设备管理接口。资源数据库存储所有计算资源的信息,可以实现分类、分级的计算资源管理,方便数据中心管理员配置所有的计算资源,通过数据库可以进行计算资源统计、报表等功能。自动化工作流定义了对计算资源进行操作的模式,通过自动化工作流,将数据中心计算资源的维护工作进行了标准化设置,将本来由数据中心管理员必须由手工,交互完成的工作变成自动化作业,提高工作效率,降低维护难度,减少了出现错误的风险。中间件模块提供了管理员和资源数据库、自动化工作流之间的接口,并最终以web界面的模式展现给管理员,提供了友好,便利的资源管理接口。设备管理接口是集中资源管理模块定义的针对不同计算资源之间的标准接口,这个接口可以进行扩展,也就是说,对于云平台目前不支持的设备,可以通过增加设备管理接口的方式进行增加,可以进行定制化的开发工作。集中资源管理模块的主要功能包括:l 增加、减少物理服务器l 管理虚拟服务器环境l 集中存储和本地存储的虚拟化管理l 对网络资源进行动态化配置l OS资源管理和配置l 应用软件的配置和管理蓝云用户管理模块工作原理及用户使用模式介绍中电28所数据中心最终用户使用云计算运行管理平台,根

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号