北京时间12月22日下午,NVIDIA总裁黄仁勋先生在结束了“2010 GPU高性能计算峰会”之后,带领NVIDIA公司众多员工和媒体记者朋友们,共同参观了位于天津滨河新区的国家超级计算机天津中心,目前世界上最快的超级计算机“天河一号A”就安装在这里。


笔者有幸跟随黄仁勋先生亲眼目睹了世界最强超级计算机的尊容,并且在国家超级计算机天津中心工作人员的讲解下,深入了解了有关天河一号A的相关技术特性和应用。下面笔者就将本次天津之行的过程分享给泡泡网友们。

一进入国家超级计算机中心,映入眼帘的就是国家主席***亲笔题写的“天河”两个大字,以及鼓励科研人员不断进取创新的发言。经过三年的努力,“天河一号A”不负众望终于拿下了TOP500世界第一,为国争光!

国务院总理温家宝在得知“天河一号A”成为世界最强的超级计算机之后,第一时间来到了国家超级计算天津中心,参观并慰问了广大科研工作者,并发表了重要讲话。

现在,我们就沿着温家宝总理的参观路线,跟随黄仁勋先生,一同揭开天河一号A的庐山真面目。
进入天河一号A机房重地
在进入天河一号A机房之前,我们可以看到这台超级计算机所取得过的荣誉和奖项。天河一号A是在天河一号的基础上改进而来的,而天河一号曾在去年一举杀进了TOP500前十名,而且是首次以CPU+GPU异构计算的身份,因此备受瞩目。


天河一号去年排行第七,今年成为了世界第一

准备进入天河一号A机房

超级计算机是由无数颗CPU和GPU以及互联网络组合而成的,因此我们可以看到天河一号A的真身就是一组组类似于服务器的机柜,相信大家对其内部结构更加感兴趣。


国家超级计算中心的工作人员知道大家对天河一号A的内部结构非常好奇,于是打开机柜,将其中的一组加速模块抽了出来,展示给黄仁勋先生以及众多记者朋友们。

这一组加速模块就是由两片Tesla M2050高性能计算卡组成的,天河一号A 70%左右的运算能力都是由Tesla GPU所提供。Tesla能够帮助天河一号A取得如此佳绩,黄总表示非常自豪。

在天河一号A的机柜上,我们看到了类似于空调的冷却系统,光散热就需要消耗8.3千瓦的功率。当这对于一台超级计算机来说并不夸张,据专家表示,方面表示,如果单纯使用传统处理器的话,要达到同样的性能需要至少50000颗CPU,同时系统功耗也会达到惊人的1200万瓦特,而现在使用混合架构之后功耗仅为404万瓦特,节省下来的电力足够5000多户居民使用一年。

天河一号A机柜下方的地板原来是空的,里面就是冷却系统的传输通道,20多万颗处理器核心在工作时发出的废热,就从这里导出到整个大楼之外。
天河一号A处理器芯片实物
对于正在运行中的天河一号A系统来说,我们不能要求工作人员抽取更多的模块来满足大家的好奇心,所以还是来看看展示中的天河一号A主要配件吧。首先是最重要的处理器芯片:




天河一号A拥有14336颗Intel Xeon X5670 2.93GHz六核心处理器、7168块NVIDIA Tesla M2050高性能计算卡,还有2048颗我国自主研发的飞腾FT-1000八核心处理器,总计20多万颗处理器核心,同时还更换为专有互联网络。
天河一号A互联网络系统
超级计算机恐怖的运算能力,简单来说就是靠堆CPU、GPU来实现的,但如何将庞大数量的处理器通过网络和节点集合起来、让它们高速并行的协同工作,这就是硬件方面最大的难点。“天河一号A”通过使用自主研发的处理器、网络、互联芯片,解决了这一难题,从而实现了不可思议的硬件规模和傲视群雄的运算能力。














据悉,组成天河一号A的以上板卡和芯片,多为国产自主研发设计。正是因为天河一号A拥有如此庞大而又高效的互联网络系统,才使得CPU+GPU的异构系统可以获得50%左右的最大性能与峰值性能比值,堪称GPU加速系统中的佼佼者。
天河一号A超级计算机的应用领域
“天河一号”目前已在国家超级计算天津中心完成安装部署,系统调试结束后将面向国内外市场,为包括石油勘探数据处理、生物医药研究、航空航天装备研制、卫星遥感、基础科学理论计算等领域内的大规模计算提供服务。









以下为现场展示的天河一号A实际应用案例:







超级计算机多用于计算密集的科学仿真,在能源、石油、地球物理、气象、科学计算、生物信息、网游、金融等各种领域应用广泛。由于高性能计算在国防、军事上 至关重要,某种意义上也象征着一个国家的IT技术实力。但是,高性能计算由于造价高昂,编程困难,导致应用门槛高,一直有“高处不胜寒”的问题。
天河一号A所使用的CPU+GPU异构计算系统,在编程方面也遇到了很多困难,但在NVIDIA的鼎立协助下,依靠CUDA计算平台在运行效率方面取得了突破,在各行各业都得到了普遍的应用,目前天河一号A已经在高负荷商业运行当中,为国际国内科研工作者提供超级计算服务。