1.最新TOP10榜单2.中国进展3.体系结构4.技术参数解析TOP 10 Sites for June 2016For more information about the sites and systems in the list, click on the links or view the complete list.Rank Site System Cores Rmax(TFlop/s) Rpeak(TFlop/s)Power (kW)1 National SupercomputingCenter in WuxiChina Sunway TaihuLight -Sunway MPP, SunwaySW26010 260C 1.45GHz,SunwayNRCPC10,649,600 93,014.6 125,435.9 15,3712 National Super ComputerCenter in GuangzhouChina Tianhe-2 (MilkyWay-2) -TH-IVB-FEP Cluster,Intel Xeon E5-2692 12C2.200GHz, TH Express-2,Intel Xeon Phi 31S1PNUDT3,120,000 33,862.7 54,902.4 17,8083 DOE/SC/Oak Ridge NationalLaboratoryUnited States Titan - Cray XK7 ,Opteron 6274 16C2.200GHz, Cray Geminiinterconnect, NVIDIAK20xCray Inc.560,640 17,590.0 27,112.5 8,2094 DOE/NNSA/LLNLUnited States Sequoia - BlueGene/Q,Power BQC 16C 1.60GHz, CustomIBM1,572,864 17,173.2 20,132.7 7,8905 RIKEN Advanced Institute forComputational Science (AICS)K computer, SPARC64VIIIfx 2.0GHz, Tofu705,024 10,510.0 11,280.4 12,660Japan interconnectFujitsu6 DOE/SC/Argonne NationalLaboratoryUnited States Mira - BlueGene/Q,Power BQC 16C1.60GHz, CustomIBM786,432 8,586.6 10,066.3 3,9457 DOE/NNSA/LANL/SNLUnited States Trinity - Cray XC40,Xeon E5-2698v3 16C2.3GHz, AriesinterconnectCray Inc.301,056 8,100.9 11,078.98 Swiss National SupercomputingCentre (CSCS)Switzerland Piz Daint - Cray XC30,Xeon E5-2670 8C2.600GHz, Ariesinterconnect , NVIDIAK20xCray Inc.115,984 6,271.0 7,788.9 2,3259 HLRS -HöchstleistungsrechenzentrumStuttgartGermany Hazel Hen - Cray XC40,Xeon E5-2680v3 12C2.5GHz, AriesinterconnectCray Inc.185,088 5,640.2 7,403.52.中国进展2009年金秋时节,天河一号横空出世。
2010年11月,经过系统升级后的天河一号,在第36届国际超级计算机500强排行榜上位居世界第一。
天河二号——六连冠排名第一2010年,中国国防科学技术大学研制的“天河一号”曾在第三十六届超级计算机TOP500榜单上名列第一,2011年时排名第二,2012年排名已下降至第五,我“天河二号”又重返冠军领奖台。
二连冠2013年,在德国莱比锡举办的2013年度全球超级计算机技术大会,负责调查有关全球各国研发大型超级计算机排行情况的国际大型超级计算机TOP 500组织,公布了最新全球超级计算机TOP 500强排行榜榜单;在本次大会上由中国政府国家科技部与中国国防科学技术大学共同研制的名为“天河二号(”又称银河2号)的大型超级计算机以每秒33.86千万亿次的浮点运算速度成为全球最快的超级计算机。
三连冠2014年6月,由国防科技大学研制并落户国家超级计算广州中心的天河二号超级计算机,23日再次荣登全球超级计算机500强排行榜榜首,获得世界超算“三连冠”。
天河二号超级计算机是国防科技大学承担的国家“863”计划和“核高基”国家科技重大专项项目。
四连冠2014年11月,在美国新奥尔良市召开的世界超级计算机大会上,天河二号在国际TOP500组织首次正式发布的超级计算机高性能测试排行榜上位居世界第一。
此前,由该组织发布的第44届世界超级计算机500强排行榜中,天河二号以峰值计算速度达每秒5.49亿亿次、持续计算速度达每秒3.39亿亿次位居榜首,获得“四连冠”。
五连冠2015年7月13日,国际TOP500组织在德国举行了2015年国际超级计算机大会,并在大会上发布全球超级计算机500强最新榜单,中国“天河二号”以每秒33.86千万亿次的浮点运算速度第五次蝉联冠军,获得“五连冠”。
六连冠2015年10月16日,新一期全球超级计算机500强榜单在美国公布,“天河二号”超级计算机以每秒33.86千万亿次连续第六度称雄。
3.体系结构天河二号:天河二号超级计算机系统由170个机柜组成,包括125个计算机柜、8个服务机柜、13个通信机柜和24个存储机柜在每个主板上有2个计算节点,而每个框架则有16个主板,4个框架组成一个机柜,整个系统由125个机柜组成。
每个计算节点主板分为两块,一块CPU一块APU,CPU上有4核Ivy Bridge、内存和一个Xeon Phi协处理器,而APU基板上则承载着5个Xeon Phi协处理器.CPU和APU之间有5个水平插入的链接口,由Ivy Bridge内置的PCI-E 2.0进行连接,虽然Ivy Bridge内置为PCI Express 3.0接口,但Xeon Phi仅支持2.0,单个通路为10Gbps带宽。
计算节点的前端处理器为4096个FT-1500处理器, FT-1500处理器是由国防科技大学为天河1研发,其可以说是天河1项目的最大收获,其为16核心的Sparc V9架构处理器,在40nm工艺情况下运行频率为1.8Ghz,峰值性能为144 Gflops/s,功耗为65W,但相比英特尔22nm 12核 2.2GHz 211Gflops/s性能的Ivy Bridge还是有明显差距。
【前端处理器(front end processor,FEP),通常也被称为通信控制器,其主要功能是释放主机以运行应用程序。
这样,主机就不会不断地被外部设备打扰,使得它能更有效地处理应用。
它可以是复杂的前台大型计算机接口或者简单的设备如多路复用器、桥接器和路由器等。
这些设备把计算机的并行数据转换为通信线上传输的串行数据,并完成所有必要的控制功能、错误检测和同步。
现代设备还完成数据压缩、路由选择、安全性功能,并收集管理信息。
】天河2互联方面采用自主研发的 Express-2 内部互联网络,其为有13个交换机,而每个交换机有576个端口。
连接介质为光电混合。
具体控制器是名为NRC的ASIC专用目的集成电路,其采用90nm工艺,封装尺寸为 17.16x17.16 mm,共有2577引脚。
单个NRC的吞吐能力为2.56Tbps.而在终端方面网络接口也采用类似结构的NIC,但规模稍小,为10.76x10.76 mm, 675 pin,其采用PCIE 2.0方式连接,传输速率为6.36GB/s.并且在在12000节点的情况下延迟也很低,仅为85us.而在计算能力方面,使用14336个节点总计50GB内存进行LINPACK测试,理论性能为49.19Pflops,而实际测试性能为30.65Pflops,效率为62.3%.这个效率并不算高,还有很大优化提升潜力。
当然也可能是被Xeon phi仅支持PCI Express 2.0带宽不足限制。
4.技术参数解析天河二号型号为TH-IVB-FEP4.1.处理器16,000个运算节点,每节点配备两颗Xeon E5 12核心的中央处理器、三个Xeon Phi 57核心的协处理器(运算加速卡)。
累计32,000颗Xeon E5主处理器和48,000个Xeon Phi 协处理器,共312万个计算核心。
中央处理器为英特尔提供的,运作时钟频率为2.2GHz的Xeon E5-2692 12核心处理器,基于英特尔Ivy Bridge微架构(Ivy Bridge-EX核心),采用22纳米制程,峰值性能0.2112TFLOPS。
运算加速上,使用基于英特尔集成众核架构的Xeon Phi 31S1P协处理器,运行时钟为1.1GHz,每个使用61个核心中的57个(因为使用61个会存在运算周期协调问题),每核心籍由特殊的超线程技术能运作4个线程,产生峰值性能为1.003TFLOPS。
4.2存储4.2.1内存每个节点拥有64GB主存,而每个Xeon Phi协处理器板载8GB内存,故每节点共88GB 内存,整体总计内存1.408PB。
4.2.2外存12.4PB容量的硬盘阵列4.3主架主板、机架与机柜均由浪潮集团制造,共有125个机柜,每个机柜容纳4个机架,每个机架容纳16块主板,每个主板设置有两个计算节点。
每个机柜还装有负载指示灯,根据机柜内主机的运算负载变更发光二极管的发光颜色。
每块主板上分为APU模块和CPM模块两部分,APU部分承载5块Xeon Phi,CPM部分承载1块Xeon Phi+4颗Xeon E5。
APU模块和CPM模块之间以CPU内部提供的PCI-E 3.0 16x接口进行连接,但实际由于Xeon Phi的硬件限制,仅支持至PCI-E 2.0 16x,单通道数据传输速率为10Gbps。
4.4前端处理器计算节点前端处理器为4096颗FT-1500 16核心SPARC V9架构的处理器,40纳米制程,运作时钟频率1.8GHz,热设计功耗65瓦,峰值性能144GFLOPS。
4.5连接使用光电混合传输技术(Optoelectronics Hybrid Transport Technology),使用自制的TH Express-2主干拓扑结构网络连接,以13个大型路由器通过576个连接端口以光电传输介质与各个运算节点互联,控制器名为NRC,使用90纳米制程,单个控制器的数据吞吐量2.56Tbps,终端网络接口使用名为NIC的控制器,以PCI-E 2.0接口链接,数据传送速率6.36GB/s。