当前位置:文档之家› 高性能集群计算解决方案

高性能集群计算解决方案

/sige_online/blog/item/d6aa74a9106a10ff1f17a224.html和卫星遥测,遥感等探矿技术的发展,促使油气勘探的数据量爆炸性地增长, 要求信息系统能够获取,存储和处理TB级的巨量数据; 使用更精确的模型:为了提高探矿水平,必须使用规模更大,更精确数值模型来模拟地下矿藏的分布.5年前,模型的节点数一般不超过10万个;现在,经常需要使用节点数超过百万的3维模型来进行数值模拟; 提供更强的计算和数据管理能力:模型规模的扩大要求使用处理能力指数增长的计算机系统和更复杂的算法快速和精确地求解,同时也要求更强的数据管理能力来建立历史数据库,并把当前数据与长期积累的历史数据相比较,得到精确的综合预测结果; 支持功能丰富的应用软件:现代的油气探测应用软件必须具有直观的3维图象显示和输出,人机交互功能, 以提高工作效率; 降低成本:经济效益和市场竞争压力还迫使油气行业的信息系统在严格控制开支,降低总拥有成本条件下满足上述要求当前,传统的巨型机已经很难全面满足上述要求.油气行业要求使用更经济实惠的新解决方案来全面满足应用需求.Schluberger信息系统公司(SIS)是油气勘探信息处理领域中领先的厂商,也是HP在高性能技术计算领域重要的合作伙伴.该公司在使用基于安腾2的HP Integrity 服务器为计算节点的Linux集群上开发的面向油气矿藏模拟的ECLIPSE Parallel解决方案,能够全面满足油气矿藏勘探信息系统在性能和成本两方面的需求,提供解决人类社会现代化进程中能源问题的利器. 目标市场 ECLIPSE Parallel解决方案使用数值模拟方法满足油气行业探测石油和天然气地下分布状况和预测储量的需要, 油气公司从低级经理到高级主管各种类型的人员都可以得益于这一解决方案,包括:负责提供优化的矿藏分布和产量预测评估人员和经济分析师,负责作出开采决策的经理,信息系统管理人员;需要得到直观和实时矿藏信息的首席信息官(CIO)和首席执行官(CEO),负责监管的政府机构等等. 这一解决方案特别适合于要求打破油气行业使用巨型机传统,采用性能更高,价格/性能最佳的新颖解决方案的油气公司. 解决方案概貌 SIS ECLIPSE Parallel是一个基于英特尔和HP工业标准技术的成套解决方案,便于实施和灵活配置,提供先进的油气矿藏模拟功能.这一解决方案由系统平台和模拟软件两大部分组成(见下图). HP Linux ClusterBlocks集群系统是第一个经过认证的系统平台.这一Linux集群包括如下的层次: 计算节点:采用基于安腾2的HP Integrity rx2600服务器,使用新一代安腾2提供强大的64位处理能力; 互联设备:采用工业标准的高速Myrinet把计算节点联成一体,以太网联接管理节点; 操作环境:采用应用最广泛的RedHat Linux Advanced Server操作系统建立集群运行的操作环境; 集群管理和作业调度:采用Scali, Scyld或ClusterWare 公司著名的Linux工具软件管理集群系统;采用业界领先的Platform Computing的LSF 5.0软件来实现负载平衡,提高集群的工作效率上层的ECLIPSE Parallel模拟软件负责完成矿藏模拟的数值计算,它把整个数值求解问题分解成一系列较小的子问题,送到各个计算节点上并行地求解,然后再合成完整的结果. ECLIPSE Parallel解决方案这一基于Linux集群并行计算的设计思想,在性能,性价比,可伸缩性和可用性等方面都超过基于巨型机的传统解决方案,具有广阔的发展前途. 组成部件 SIS ECLIPSE Parallel软件与HP ClusterBlocks 集群结合在一起形成了一个把最先进硬件和软件完美地结合在一起的油气储藏模拟解决方案,它的主要组成部件有: 基于安腾2处理器的HP Integrity rx2600服务器; 工厂组装的基于Myrinet高速互联网络的16-128节点 Linux集群系统; RedHat Linux Advanced Server 2.1操作系统; Platform Computing的负载调度软件(LSF) 5.0:用于平衡集群内各节点的工作负载,提供运行效率; 消息传递接口(MPICH/GM):用于支持基于集群架构系统内的并行计算; 集群管理软件:允许采用Scali, Scyld, ClusterWareLinux 等公司的软件管理集群系统运行和资源共享; SIS ECLIPSE Parallel 油气储藏模拟软件 SIS ECLIPSE Parallel解决方案的硬件系统使用HP Integrity rx2600服务器作为计算节点,高速的Myrinet作为互联设备组成Linux集群,为油气储藏模拟软件提供高性能运行平台. ECLIPSE Parallel软件把整个模拟模型分解成若干个子区域.子区域的个数与系统中处理器个数相等.每个处理器负责模拟一个子区域,相互之间通过消息传递接口通信,使整个系统能够并行地求解整个油气储藏模拟问题, 提供强大的处理能力.子区域的划分是自动的,也可以由用户控制. 143 144 SIS ECLIPSE Parallel 解决方案还允许用户在基于奔腾4的 HP工作站上通过直观的3D模型显示,观察和分析模拟的结果,优化软件的运行,提高工作效率. 客户价值基于英特尔和HP最强大的硬件和先进的软件技术, ECLIPSE Parallel解决方案为客户提供如下的实利: 更快的结果:节约矿藏模拟计算阶段所用的时间使客户能够在规定的时间界限内完成更多的分析,从而提高决策的水平和竞争优势.在16节点的集群上运行大的模型速度可以提高10倍,单机系统上48小时的计算任务在集群上只需使用5个小时; 更精确的结果:在相同的时间框架内运行更大,更详细模型的能力产生更好的报告和预测结果; 更低的风险:开挖一个油井往往耗资上千万美元.精确结果能够帮助用户优化开采计划,降低挖到"干井" 和低产井的风险,这对于客户具有很高的经济价值; 更好地适应市场的变化:快速的分析能力使公司能够适应市场变化,及时发现和掌握各种机遇; 更低的总拥有成本:使用工业标准的技术能够降低管理和维护的费用,实现最低的总拥有成本; 基于工业标准技术的其他好处,还包括:提供最佳的性价比,可用性和可伸缩性,保护用户的投资联系方式需要进一步的信息请访问如下的网站: 市场需求设计链加速器(DCA)通过为制造厂(如汽车和飞机工业制造厂)提供超级的高性能产品开发解决方案改进产品开发. DCA以更高精度和可靠性帮助公司开发基于先进的设计标准销售的产品.它通过从产品设计到正式投产前,进行复杂的模拟,包括计算流体力学(CFD),碰撞和结构模拟,大大减少代价极大的设计错误.DCA在基于英特尔赛扬处理器,英特尔奔腾和英特尔安腾2的HP工作站和服务器上运行,提供很高的速度,兼容性和可靠性.开放的英特尔工业标准的64位和32位处理器系列保证了解决方案能够满足各种实施的需要,提供很高的可伸缩性和更快的投资回报. 目标市场 MSC在HP平台上提供的高性能计算解决方案主要面向汽车,飞机等行业,以这些行业的制造厂和研究院所为目标市场.这些行业的制造厂设计部门和研究院所经常处于压力之下,要求提供更好,更快和更便宜的产品,保持竞争优势和增加市场份额.必须通过允许在开发过程中更早理解和改进设计来提高产品的开发水平.更早了解设计获得的知识和对设计的改进能够消除制造中昂贵的错误,使得客户获得可预测和较好的体验. 改进开发过程的关键是在"电子"舞台上模拟产品的性能,而不是在物理样机上测试产品的性能.例如,利用计算机模型模拟汽车碰撞的过程,不再需要投资和化时间制造整个车辆进行碰撞测试,就能够通过"电子模拟碰撞"得到更好的结果.通过计算机模拟测试汽车的好处还包括能够得到许多通过物理测试难以得到的深入结果.这允许生产出更好的产品,同时缩短上市时间,降低成本. 过去,昂贵的超级计算机和复杂的实施过程给制造厂使用这一新的工程过程造成很大的障碍.MSC在运行Linux 的HP工业标准计算机上以低得多的成本建立了容易实施,高性能计算环境,满足旨在优化设计的高性能技术需要,使得许多制造厂都能够承受这一投资,得到相应的投资回报,开辟了Linux和高性能计算新的市场领域. 解决方案概貌 DCA从考虑制造厂的工程需要和优化设计应用出发,实施一个完整的高性能计算环境.这一专门解决方案的组成依赖于客户的需要,因此可以随着每次实施的具体情况而变化.但是,每个解决方案一般都包含如下的部件: 基于英特尔安腾2处理器的服务器,它们是今天和未来要求最高的,计算密集64位HPC解决方案的理想计算平台; 基于英特尔赛扬处理器的服务器,它们是今天32 位HPC解决方案的理想计算平台; 基于英特尔奔腾4处理器的工作站,它们非常适合于分布式,对等(P2P)桌面环境; 基于Netservers或HP工作站的计算机集群,包括互联设备,交换器和存储设备; Linux和/或Microsoft Windows 2000技术来自MSC.Linux套件的中间件,支持高性能计算(HPC) 集群配置; 现场系统集成; 认证的Linux培训和知识传授; 信息技术(IT)服务和支持; 应用创建,调整和移植,包括调整和移植商品化的 CFD,碰撞和结构分析应用高性能技术计算解决方案 9.2 MSC优化产品设计的高性能计算解决方案 145 典型产品开发过程起初是以几何设计为特征.许多公司专门开发以交互方式使用的CAD产品.由于工程师通过程序接口构建和修改几何图形的工作速度是十分有限的, 处理器的实际计算量相当低,可以利用桌面系统来处理. 一旦定义了几何图形后,典型的产品开发过程仍然是在理想的几何图形上进行,使得其它的应用能够解释它, 预测设计的性能.最常用的预测设计性能的方法是有限元方法(FEM).在这一方法中,创立"网格"把模型分解成有限元素.网格化的过程也是相对地交互的,不需要很大的计算量. 工程师可以通过向其它应用发送请求,利用网格了解设计的物理性能.工程师就是利用这些应用来执行不同类型的模拟.例如,利用LS-DYNA程序,工程师可以模拟如果一辆汽车撞到墙上将如何变形(或破损).这要求应用 (此时是LS-DYNA)能够求解复杂的模拟问题,通常需要完成非常大的计算量.DCA允许在基于英特尔工业标准平台上以合理的代价,更快地解决这些问题.其它类型的模拟也都需要高性能计算,它们是结构分析和CFD.例如,一个飞机制造厂使用基于英特尔处理器的HP机架安装DCA集群来预测不同飞机的空气动力学性能.制造厂可以利用这些信息确定具有最佳飞行特性的几何,包括最高的速度,机动性或最低的燃料消耗等.这可以在制造飞机前在"电子"空间中确定.它也提供设计其它内部参数,允许工程师在进行昂贵的风洞试验前改进设计.快速和方便地完成这些工作是DCA解决方案提供的好处之一. 组成部件 DCA使用下面所列的组成技术部件把产品设计技术提供给制造厂.DCA在基于英特尔64位和32位处理器的 HP工作站和服务器上运行.基于英特尔处理器系列服务器提供的数据中心水平的可靠性,可用性,可维护性和可管理性帮助制造厂取得成功.在今天快速发展的经济中, 许多工业都得益于英特尔架构提供的速度和可靠性. 应用架构-应用可以包括商业的CFD,碰撞和结构应用软件包以及必要时针对用户需要定制的程序. 硬件-解决方案采用HP硬件,包括工作站和服务器以及互联交换器和其它高质量的部件: HP Netservers; HP工作站; HP互联设备:Procurve (快速Ethernet),4108GL; KVM (键盘,视频和监控器); SAN (存储区域网络) 服务器处理器-完整的解决方案往往是异构的.根据客户的需求,完整的解决方案可以包含一些基于英特尔赛扬处理器或英特尔安腾2处理器的2-路服务器系统. 操作系统-解决方案也能够使用异构的操作系统环境包括Linux和Microsoft Windows 2000操作系统. 安装,管理和集群工具-MSC.Linux套件包括基于Web 的安装和管理工具Webmin和现代的集群工具包OSCAR (开放源集群应用资源),由开放集群组提供集成服务. 按分析网络设计首节点指派给集群并返回结果提交给首节点首节点 CFD 碰撞结构结构CFD碰撞首节点高速网络高速网络首节点高速网络结果通过首节点返回用户 146 147 其它软件(中间件)包括: 安装软件(PXE, Etherboot, SystemImager); 消息传递软件(MPIch, LAM/MPI, PVM); 队列调度软件(LSF, PBS, Maui Scheduler); 集群工具(C3, CCP); 安全和保密软件(OpenSSH, OpenSSL); 监控软件(MON, fping, ganglia, MRTG, lm-sensors, IPMI, btools, Health); 高可用性软件(Heartbeat) Linux套件是集群成功的关键.为了提供最高水平的性能, 套件应当按照高性能特殊需要进行裁剪,把重点放在支持大内存,大文件,高性能I/O和集群工具上.DCA所使用的MSC.Linux套件就是按照这些重点裁剪.它包含如下的主要模块何软件包: lm_sensors:这一核心模块用于监控基于母板的传感器 (如CPU温度和风扇速度),使得集群监控工具在硬件故障变得严重前探测到它们,或者在发生故障后立即探测到它们; 应用层网络:MSC.Linux套件包括Myrinet网络的驱动程序.这些网络提供高带宽和低延迟.低延迟是通过在应用层利用最小核心驱动程序驱动接口实现的,这能够最大限度地减少集群中范围交换的开销; OSCAR集群工具包:OSCAR集群工具包是一个开放源项目,包括一个可伸缩,分布式并行命令执行工具 C3.其它工具和程序库是消息传递接口(MPI)和并行虚拟机器(PVM) 客户价值 DCA为制造厂提供一体化的设计解决方案,允许它们使用高性能计算改进产品开发过程.典型的行业包括汽车, 飞机和一般的制造业.模拟包括对汽车制造特别重要的碰撞测试和飞机制造关键的结构分析.制造厂能够利用 DCA增加它们的容量,加速它们的工作,降低开支.制造模拟需要进行大量的计算,这样大的计算量过去只有非常昂贵的超级计算机才能够提供,但现在DCA解决方案能够以合理的成本,提供满足大规模模拟应用所需的计算能力.这一解决方案给客户提供如下的实利: 高性能和超额的价值; 更快的设计周期和更短的新产品上市时间; 降低产品开发和保修的成本; 加速投资回报,系统一般能够在到货后一天内投入生产运行; 可伸缩性:DCA能够方便地随着客户需求增长而扩展联系方式需要进一步的信息请访问如下的网站: 首节点指派给集群并返回结果提交给首节点 Webmin 控制台按分析网络设计HTTP OS分布 Webmin OSCAR 互连设备驱动程序内核 Linux内核中间件:排队(LSF, PBS, Maul Scheduler) MPI (MPIch, LAM/MPL, PVM) 碰撞 LS-DYNA* Pam-Crash, MSC, Dytran 结构分析 MSC. Nastran , MSC. Marc , ANSYS CFD StarCD*, Fluent*, OverFlow* CFL3D* C3工具。

相关主题