继去年底向NVIDIA和IBM投资3.2亿美元研发10亿台超级计算机后,美国能源部再次向英特尔和Cray投资2亿美元研发18-45亿台超级计算机,主要部署在能源部下属的氩国家实验室。此前,由英伟达和IBM开发的10亿台超级计算机部署在橡树岭和劳伦斯利弗莫尔国家实验室。
这次投入2亿美元研发的超级计算机有两台,其中代号为Theta的那台计算性能只有8.5 flops(8500万亿次),采用了代号为KingtsLanding的英特尔至强处理器和至强融核加速器卡。这款HPC采用成熟的元器件,性能较低,但功耗只有1.7 MW。
值得我们关注的是代号为极光(Aurora,Aurora)的HPC。因为要到2018年开发者_JAVA百科才会部署,这款电脑集成了各种黑科技和高科技,理论浮点性能可以达到180 pflops(18亿次),最高可以扩展到450 pflops(45亿次),远高于NVIDIA和IBM的10亿次。也比目前排名TOP500第一的天河二号的54.9 pflops(549万次)高出2-7倍。除非中国能在未来两年内解决高性能计算芯片的问题,否则极光在2018年登顶TOP500应该没有悬念。在HPC领域,除了中国可以和美国竞争,其他国家的财力和需求都要小得多。
英特尔极光超级计算机。
让我们仔细看看英特尔极光超级计算机的架构。为了实现高达18-45亿倍的性能(相比之下Mira是目前的HPC),Aurora不得不采用新一代硬件,其中英特尔已经确认至强处理器只起到管理作用,主要计算力量是新一代XeonPhi处理器,代号为Kinghts Hill,细节不多。不过今年的骑士岛已经采用了14纳米技术,这款骑士石加速器卡将在2018年采用10纳米技术。单张卡的性能估计在4到4-4.5 flops之间,目前骑士登陆加速卡的性能在3TFLOPS左右。
极光超级计算机将采用新一代至强融核加速器卡。
整个HPC将有5万多个节点,基于Cray公司的Shasta新一代HPC平台设计。板载内存容量超过7,000 TB,内存带宽高于30PB/s,每个节点带宽超过2.5PB/s和500 TB/s.存储系统将采用英特尔第一代和第二代Omni-Path架构,容量不低于150PB,文件吞吐量为1 TB/s
整个系统的功耗为13 MW,比目前Mira电脑的4.8 MW高1.7倍,但性能却是后者的18倍以上。因此,整体性能功耗比实际上从2GFLOPS/W提升到了13GFLOPS,能效比提升了5倍以上。
目前在美国拥有或在建的几家高性能计算公司。
精彩评论