网格计算及其在高能物理中的应用概况.ppt

上传人:牧羊曲112 文档编号:6152161 上传时间:2023-09-29 格式:PPT 页数:89 大小:2.13MB
返回 下载 相关 举报
网格计算及其在高能物理中的应用概况.ppt_第1页
第1页 / 共89页
网格计算及其在高能物理中的应用概况.ppt_第2页
第2页 / 共89页
网格计算及其在高能物理中的应用概况.ppt_第3页
第3页 / 共89页
网格计算及其在高能物理中的应用概况.ppt_第4页
第4页 / 共89页
网格计算及其在高能物理中的应用概况.ppt_第5页
第5页 / 共89页
点击查看更多>>
资源描述

《网格计算及其在高能物理中的应用概况.ppt》由会员分享,可在线阅读,更多相关《网格计算及其在高能物理中的应用概况.ppt(89页珍藏版)》请在三一办公上搜索。

1、网格计算及其在高能物理中的应用概况,高能物理所计算中心,本报告参考了:CERN钱思进教授2002年7月的报告Grid Computing and its ApplicationIHEP孙功星副研究员准备2000年11月8日在韩国召开的“国际高能物理数据网格研讨会上所作的报告Grid Activity in chinaIHEP杨大鉴研究员的博士生蒋文保的报告Grid Computing美国加州理工大学Harvey B Newman 在2002年10月9日ICFA讨论会上作的报告Report from ICFA Standing Committee on Interregional Connect

2、ivity许榕生研究员为本次大会准备的报告高能物理网格发展动态,网络技术的三次浪潮什么是网格计算 为什么现在会发展网格计算哪些行业需要网格计算高能物理对计算的需求网格计算的基本技术国际网格计算技术的发展现状国内网格计算现状及发展前景,网络技术发展的三次浪潮,第一次浪潮:Internet的产生(80年代)计算机相互连接的发展产生了局域网FTP、Telnet、Emailnewsgroup、BBS第二次浪潮:WWW(80年代末-90年代中期)超文本文件由http协议连接WWW的产生(1989年由CERN科学家发明)第三次浪潮:Grid(90年代后半期-.)各种资源统一通过网格技术连接根据用途不同分为

3、数据网格、计算网格.,什么是网格,Argonne实验室的I.Foster认为网格是一种规模大小可变的虚拟组织:由动态合作的个体、研究单位和资源所有者之间的灵活的、安全的、协调的资源共享虚拟组织的成员分布在世界各地的,为了完成同一件事情的研究机构、大学、科学家个体资源计算机、存储设备、网络、大型科学仪器、数据库、软件、信息用户的观点:希望使用网上资源像使用电力、自来水那样方便,不必关心是从哪里来的资源,也不必考虑用多用少,总能满足需求。,与电力网比较,为什么现在会发展网格计算,需求计算密集型、I/O密集型、数据密集型计算的需求需要使用位于远处的大型、位置固定的仪器设备在不同地区使用具有不同政策的

4、已有技术的复杂需求大型国际合作项目的需求可能性计算机工业技术符合摩尔定律的发展网络基础设施飞速发展,发达国家、地区高速网络及跨大洋的洲际光缆已经具备相当的规模软件技术的新发展,哪些行业需要网格计算,生物、生化研究人类基因研究爱滋病药物研究地震仿真研究大气物理与气象预报高能物理理论与实验,社团组成:数千家庭计算机用户慈善机构提供的计算能力(Entropia)研究组(Scripps)共同的目的=促进爱滋病研究,家庭中的计算机用来评价爱滋病药物,_ image courtesy from,地震工程和仿真,NEESgrid(地震工程和仿真网格):将地震工程师与实验设施、数据库、计算机结合的体系结构按需

5、地使用实验、数据流、计算设施、档案、合作,NEESgrid:Argonne,Michigan,NCSA,UIUC,USC,高能物理对计算的需求,以LHC实验为例,Large Hadron Collider(大型强子对撞机),能量.:14 TeV(质子-质子)1250 TeV(铅核-铅核)亮度:1034 cm-2s-1(质子-质子)1027 cm-2s-1(铅核-铅核)周长:26.6 km主要实验:4个,4 主要的 LHC 实验,ATLAS CMS,ALICE,LHCb,LHC 计算需求,数据存储 原始数据率 0.1 1 GByte/sec 相当于 5-8 PetaBytes/year 需要磁盘

6、容量 10 PetaBytes处理能力 200,000 个目前(2001)最快的 PC机,LHC高能物理实验数据处理示意图,层 1,在线取数,CERN 700k SI95 1 PB Disk;Tape Robot,FNAL:200k SI95;600 TB,IN2P3 Center,INFN Center,RAL Center,Institute,Institute,Institute,Institute 0.25TIPS,PC或工作站,100-400 MBytes/sec,2.5 Gbps,100-1000 Mbits/sec,HPSS,HPSS,2007-8年达几十 Pbyte/sec.5

7、年左右达到1000PByte/sec,离线物理数据,PByte/sec,2.5 Gbits/sec,HPSS,HPSS,HPSS,2.5 Gbps,层 0+1,层 3,层 4,层 2,对撞实验,CERN内部/外部 比例 1:2层 0/(层 1)/(层 2)1:1:1,世界上参加高能物理实验合作的单位,欧洲:267 个研究单位,4603 个用户其他地区:208 个研究单位,1632 用户,ICFA 国际未来加速器委员会SCIC 地区间连接标准委员会,高能物理对网络的需求,ICFA 于1996年启动各国之间的高速网络互联计划 ICFA 要求参与国际高能物理合作的国家和机构必须:检查他们的运行方法以

8、便保证与远方合作者的完全连接 争取提供必要的通信设施和足够的国际带宽,ICFA 1998联网带宽计划(Mbps),估计1998-2005年期间将增加1001000 倍的带宽需求,每个物理学家使用的带宽(所用峰值带宽),大学组使用的带宽,中心实验室,包括一个或几个主要实验使用的带宽,本地实验室或地区中心,跨大洋连接带宽,跨越大西洋的带宽要求*,*按最大占用50%算,网格技术产生的技术基础,高性能计算技术的发展CPU技术飞速发展超级计算机与计算机集群大规模共享资源网络基础设施的高度发达发达国家的高速光纤网已四通八达跨大洋的海底光缆连接已经具有相当规模软件技术的新发展异构平台体系和语言广域网的资源共

9、享软件中间件网络安全技术,CPU的计算速度每18个月翻一番,你家里的PC机的CPU计算能力已经相当服务器的CPU了你办公室和你家里的计算机的CPU经常无事可做,或负荷很低它们在网格里可以提供给需要的人使用,而对你毫无影响,中国计算机TOP50排行榜,第一:“深腾1800”,联想研制,安装于科学院数学院,具有512个Intel Xeon 2.0G CPU,峰值计算能力2048 Gflops第三:HP SuperDome,用于北京社会保险,具有256个CPU,峰值计算能力384 Gflops第42:北京大学数学学院在国内最早自行组装的大型PC-Farm,具有60个PIII-700 CPU,峰值计算

10、能力42 Gflops,网络基础设施的高度发达,网络速度每9个月翻一番(技术)网络带宽每5年提高一个数量级(实际)发达国家的高速光纤网已四通八达跨大洋的海底光缆连接已经具有相当规模,主干网与各国连接的进展,欧洲 GEANT 主干网联结31个国家,速率 2.5 and 10 Gbps英国:JANET 网,速率10 Gbps2.5 Gbps NY-London,with 622 Mbps to ESnet and Abilene法国(IN2P3):2.5 Gbps RENATER里昂-日内瓦(CERN)的连接千兆以太网1.0G计划2003年改用光纤 SuperSINET(日本):10 Gbps I

11、P and 10 Gbps Wavelength Core东京-纽约的连接:2 x 2.5 Gbps;需要到StarlightCA*net4(加拿大):国内光纤,速率10 Gbps“Lambda-Grids”计划2004年5月实现GWIN(德国):2.5 Gbps 骨干;到美国 2 x 2.5 Gbps;俄罗斯:155 Mbps 连到莫斯科到GEANT 155 Mbps,(续),美国Abilene(Internet2)从 2.5G 正升级到10 GbpsEncourage high throughput use for targeted applications 美国能源部ESNET:升级到

12、10 Gbps美国与西欧中心(CERN)622 Mbps;到STARLIGHT2.5G 三地STARLIGHT-CERN-NL连接2003年到10G 美国SLAC到法国IN2P3(BaBar)100 Mbps通过US-CERN到Renater600 Mbps 今年BaBar的目标美国费米实验室(FNAL)与Esnet 连接升级到622 Mbps用光纤连到STARLIGHT纽约到阿母斯特丹由Tyco公司捐助(IEEAF)计划,2002年由IEEAF安排 622 Gbps+10 Gbps Research Wavelength,One of the mosthomogeneous bandwidt

13、h distribution,GENEVA,ABILENE,ESNET,CALREN,GEANT,NewYork,STAR-TAP,STARLIGHT,DataTAG Project,EU-Solicited Project.CERN,PPARC(UK),Amsterdam(NL),and INFN(IT);and US(DOE/NSF:UIC,NWU and Caltech)partnersMain Aims:Ensure maximum interoperability between US and EU Grid ProjectsTransatlantic Testbed for adv

14、anced network research2.5 Gbps Wavelength Triangle 7/02(10 Gbps Triangle in 2003),Wave Triangle,纽约-欧洲 9/02,加州-东京 1/03,(研究),软件技术的新发展,异构平台体系与程序语言Java语言、Java虚拟机中间件代理、可移动代理、CORBA广域网的资源共享软件文件共享,如AFS数据库,如Objectivity网络安全技术SSH、SSL认证/授权技术加密技术数字签名、防抵赖技术,网格计算的基本技术(服务功能),通信服务 信息服务 安全认证 名字服务 监视系统 资源管理和调度 资源交易机制

15、编程工具 用户图形界面,GRID的协议分层体系结构,计算网格是如何实现的,Grid 结构,Globus Toolkit,GRID技术要点组成结构,网格结点中间件开发环境和工具层 应用层,国际网格计算技术的发展现状,科学界美国Argonne实验室:Globus欧盟数据网格:EU DataGrid物理学网格:GriPhyN地震工程与仿真网格:NEESgrid政府美国能源部(DOE):DOE Science Grid 美国国家航天局(NASA):Information Power Grid美国国家科学基金会(NSF)国家计算科学联盟(NCSA):National Technology Grid德意志

16、联邦教育科研部(BMBF):UNICORE厂商 IBMSUNPlatform,HEP领域中的GRID技术,高能物理领域对计算技术的需求历来走在时代的前列,关于GRID技术的研究也不例外举例:美国的粒子物理数据网格 PPDG欧盟数据网格(EU DataGrid)西欧核子研究中心CERN的LCG计划,PPDG-参与者,加州理工大学阿槓国家实验室劳伦斯伯克利实验室布鲁克海文国家实验室费米国家实验室圣地亚哥超级计算机中心斯坦福直线加速器中心威斯康星大学,PPDG-主要目标,为成千个物理学家提供广域分布的PB量级(1015Byte)数据的粒子物理数据分析的体系结构加速广泛针对数据密集型科学合作的网络和中

17、间件体系结构的发展,PPDG-体系框图,PPDG-技术方案,第一步(1999年):提供两个不同地点间的高速文件复制服务提供多地点高速缓存的文件存取服务,PPDG-技术方案,第二步(2000-2001年):开发一个一般化的文件迁移框架(支持 QoS)作为透明写访问和代理技术所需要的基础,作到目录、资源代理和匹配服务的实现/通用化实现文件的透明的写访问实现对代理的有限支持实现数据网格的分布资源管理在组件级和结构级主要努力作到健壮性和快速问题诊断,PPDG-技术方案,长远目标:系统必须使用静态的和移动的独立代理去执行定义好的任务系统必须是有弹性的、预测性的/自适应的任务的优先级必须是基于策略和边界效

18、用两者必须使用辅助调度算法(匹配)在一定的时间限额内将请求配给资源,匹配的结果将影响用于度量边界效用的索引事务管理必须使用上述价格估算法,比如抽查/重算机制,PPDG-已有的技术基础,ANL:Globus 网格中间件服务SLAC:对象开放文件系统(OOFS)Caltech:全球互连对象数据库(GIOD)项目FNAL:数据访问架构(SAM)LBNL:存储访问协作系统(STACS)ANL:规模可伸缩的目标存储和访问 Scalable Object Storage and Access威斯康星大学的:Condor 分布资源管理系统SDSC:存储资源代理(SRB),欧盟数据网格计划,为进行数据密集型科

19、学研究给大型分布科学组织提供世界级的网格从计划的构思和机构的人员编制看主要涉及CERN和粒子物理界(由LHC计划推动)由地球观测和生物学共享,EU DataGrid 计划的目的,特定的计划目标:构架的中间件和网格管理软件(大部分由欧盟资助)大规模实验床(大部分由参加单位资助)具有产品质量级别的演示(部分由欧盟资助)与欧洲和美国的项目合作并提供补充为开放标准和国际实体作出贡献:,EU DataGrid 主要参加者,CERN International(Switzerland/France)CNRS FranceESA/ESRIN International(Italy)INFN ItalyNIK

20、HEF The NetherlandsPPARC-UK,项目计划,计划从2001年1月1日开始测试床 0(2001年前期)部署国际实验床0体系结构(仅用Globus 1-未用欧洲数据网格中间件)测试床 1(2002年前期)第一版EU DataGrid 软件在项目内部定义了用户:高能物理实验(工作组8)、地球观测(工作组9)、生物医学(工作10)2002年3月1日成功通过欧盟的项目评审测试床 2(2002年10月)在实验床 1上建立,扩充数据网格的功能测试床 3(2003年3月)和 测试床 4(2003年9月)计划到2003年12月31日停止,EU DataGrid计划的各工作组分工,中间件WP

21、1 网格工作负载管理WP2 网格数据管理WP3 网格监控服务WP4 构架管理WP5 海量存储管理测试床WP6 测试床集成WP7 网络服务科学应用WP8 高能物理WP9 地球观测WP10 生物学宣传 WP11项目管理 WP12,EU DataGrid 软件结构,Collective Services,Underlying Grid Services,Grid Application Layer,Web 用户界面(1),Roberto Barbera,4th Data,Web 用户界面(2),Web 用户界面(3),LHC 计算网格计划 LCG,开始称为MONARC计划,其任务是规划LHC的计算目

22、标:每一个物理学家应该具有对于数据和资源的相同的访问通道LHC 计算网格(LCG)计划是CERN理事会于2001年9月批准的一个LCG计划的研讨会于2002年3月在CERN召开CERN的人工计划:147 人年材料预算:7千5百万瑞士法郎它并不是另一个网格技术计划,而是一个网格部署计划,LCG 计划的目的,准备和部署LHC的计算环境应用-工具、框架、环境、持久性计算系统机群 合作的计算机中心 以CERN为中心的物理分析助长合作,LHC 与区域计算中心结合使用 data challenges 项目的规则,_ Image courtesy Harvey Newman,Caltech,Summary

23、of LHC Computing Grid,LCG 是一个在世界范围为LHC计算部署的专有的体系结构计划,并且是所有LHC实验计算共同的工作场所LCG 面临许多技术挑战并需要在部署前的今后几年内解决它们 LCG 需要通过其他有关的 Grid 计划向所有的参加国和他们的负责人、向其他的科学、向工业界伸手来汇集资源LCG 作为LHC计划的一部分在CERN享有最高优先级无论如何,LCG 对于它的参加者、他们的合作者和贡献者都是非常重要的,国内网格计算现状及发展前景,中国的网格计划,织女星网格计划(计算所、科技部)863计划的国家高性能计算环境(科技部与许多参加者)网格体系结构建设(教育部)科学数据网

24、格(科学院、科技部)高能物理数据网格(高能所),中国网格计划一览,为主要的网格基地研制超级服务器建设一些高性能计算中心为网格系统开发系统软件在网格上开发应用示例在100个大学之间建设2Gbps带宽的网络互连,织女星计划,1.设计目标:设计和实现网格级的软件 建立一个国家级的由高性能计算中心支持的体系结构 开发在试验床上运行的应用2.研究制造面向网格的超级服务器 曙光 4000,5000,等等3.它将是一个服务网格,提供计算能力和其他服务,曙光超级计算机,织女星网格的批处理系统,旅游在线事务系统,旅游在线事务系统-在中国旅游基于网格操作系统的应用在网格上注册了四种基本服务天气预报飞机票预订景点门

25、票预订收费将这四种服务推向应用,旅游在线事务系统,旅游在线事务系统,国家高性能计算项目,一览在中国各地建立若干个高性能计算基地将这些基地用现有网络互相连接起来(CERnet&CSTnet)为每个基地提供曙光、银河、Sun 等超级计算机和 PC集群,国家高性能计算项目网格软件一览,在节点操作系统之上的功能层资源、用户和任务管理认证与授权使用硬件加强的加密方法基于Web的用户界面,网格系统软件,用户管理,任务管理(提交),资源管理(寻找用户),网格系统监视,网格实用命令,国家高性能计算网格应用,气象预报石油库仿真生物信息数据库与应用数字风洞仿真汽车撞击模拟船舶结构分析国家科学数据库与应用数字图书馆

26、,国家高性能计算网格示意图,科学数据网格项目,在科学数据库之上建立属于中国科学院,向全世界开放计划在2004-2005年提供服务,科学数据库(SDB),科学院从1986年开始建立科学数据库科学数据库是一组多种学科的数据库,包括化学、生物学、地学、天文学、生态学、等等到2005年,科学院在全国有400多个研究所有分布在全国的300多个各种数据库有10TB以上的数据内容,为什么要搞科学数据网格(SDG)?,资源层共享和开发使数据更容易访问数据一体化更容易做到:数据-信息-知识应用层新兴的应用可以做以前做不到的应用多数据库/多学科交叉应用需要更多的资源(周期、带宽、仪器,等等)的应用,任务,建立实验

27、床1个数据中心3个子数据中心中间件信息服务安全用户界面应用化学/地学/天文学/生物学,生物中心 北京,数据中心(CNIC),地学中心 北京,1000M,化学中心上海,SDG 资源,155M,1000M,高能所的GRID研究,基础网络环境建设千兆校园网建设增加网络出口带宽加强网络管理和网络安全高性能计算环境建设PC集群系统建设海量分级存储系统研究广域网资源共享软件研究GRID中间件研究积极争取国内、国际合作,高能所千兆骨干网核心交换机,北京谱仪数据处理PC集群系统,3台数据服务器、17台计算节点机,共有25个CPU、4TB RAID磁盘组,LHC国际合作组PC集群系统,1台数据服务器、15台双C

28、PU计算节点机,共有32个CPU、1TB RAID磁盘组,高能所数据网格研究,目前由高能所知识创新课题支持在高能所校园网环境上为北京谱仪建立一个 BES虚拟组织如有可能将来为CMS和Atlas合作增加两个虚拟组织为羊八井ARGO实验建立ARGO-YBJ虚拟组织,高能网格实验床拓扑图,GIIS,GRIS,GRIS,Condor,PBS,Two 6 CPUs PC-FARM,目前主要任务,大规模Linux平台配置与维护管理LCFG.认证/授权GSI.资源信息管理MDS.网格资源配置管理GRAM.数据复制管理GDMP.高能物理分析软件网格化Appln.,将来工作,建设高能所校园网格环境,共享大约10个PC-Farm 促进与国家网格项目和国际网格界的合作为在中国建立LHC计算合作的2级区域中心而努力,结论,Grid是继Internet和WWW之后网络技术的新发展目前Grid技术尚未成熟,许多问题有待解决各国的科学家和IT业正在努力发展Grid相关技术Grid将在科学研究、工商业及生活中得到广泛应用Grid将在几年内走到你身边,谢谢!,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号