日 报周 报杂 志 人民网
人民日报海外版 2014年01月11日 星期六

速度至上还须绿色节能 全力赶超要讲市场导向

中国超算:高处怎御寒?

本报记者 张保淑

《 人民日报海外版 》( 2014年01月11日   第 08 版)

  超算档案

  超级计算机(supercomputer),指能够执行一般个人电脑无法处理的大资料量高速运算的电脑,其基本组成组件与个人电脑的概念无太大差异,但规格与性能则强大许多。在极高的运算速度下,人们可以通过数值模拟来预测和解释以前无法实验的自然现象。现有的超级计算机运算速度大都可以达到每秒万亿次以上。“超级计算”(supercomputing)这个名词,第一次出现于《纽约世界报》1929年关于IBM为哥伦比亚大学建造大型报表机(tabulator)的报道中。

  

  汽车尾气对北京雾霾的贡献究竟是区区“4%”,还是超过20%?中国科学院两个团队近日公布的两个研究结果相差之大让公众大跌眼镜。如果是事不关己的纯科学争论,人们大可姑且听之,处之泰然,但这恰恰是关乎每个人身体健康和公共政策选择的大事,人们当然格外关注。

  然而,不幸的是,真相在短期内可能难以被揭开,因为雾霾的形成是一个大区域、多物理过程,不同区域之间的雾霾在某种程度上是相互关联的,同时它还涉及大气物理、化学、生物、陆地与大气耦合等多种因素,弄清雾霾的成因和来源恐怕要借助超级计算机。

  实际上,就在上个月,以超级计算机“天河一号”为支撑平台的“我国雾霾监测与数值预报模式系统研究”项目已经启动。科学家将在超级计算机上综合各项实际影响因素,建立数值模拟模型,把模拟结果与实际观测数据对照后修改、完善模型,可望通过三至五年的努力,最终用模型精确揭示雾霾的发生原因和形成过程。

  

  超算加速中国创造

  超级计算机“天河一号”在雾霾精确研究方面的效果有待进一步观察,但它取得的成果已有目共睹。国家超级计算天津中心应用研发部部长孟祥飞介绍说,“天河一号”在航空航天、天气预报与气候预测、新材料新能源等重大科技创新领域取得了一批具有国际先进水平的成果。数据显示,“天河一号”为汽车装备、石油物探、动漫渲染、生物医药等相关企业带来上亿元效益,辐射区域和行业经济规模近百亿元。

  英国爱丁堡大学并行计算中心主任阿瑟·特鲁说:“拥有超级计算机只是任务的一部分,重要的是去使用它,用它来做出有意义的成果。”在刚刚过去的一年,超级计算机在我国重要科技领域取得的突破中功不可没。2013年12月14日,我国嫦娥三号探测器在月球表面预选着陆区域成功着陆,这标志着我国已成为世界上第三个实现地外天体软着陆的国家。6月13日,神舟十号与天宫一号实现空间交会对接,标志着我国进入应用性太空飞行时代。而实现这些历史性跨越的重要功臣之一就是超级计算机。它在飞船目标轨道计算、空间碎片定轨计算、控制飞船入轨、发射气象气候监测卫星、飞船发射窗口设计等方面,做出了无可替代的卓越贡献。中国太空领域取得的进步从一定意义上来说就是中国超算进步的结果。

  建设超算中心是我国超算领域进步的重要表现之一。经过多年努力,我国在上海、深圳、天津、济南和重庆等地建设了超算中心,广泛覆盖东、中、西部地区,在推动超算实际利用方面发挥了巨大作用。但是,与超算的高性能相比,利用率和效能很不匹配,甚至可以说是“高速公路上跑拖拉机”。以上海超算中心为例,该超算中心拥有200万亿次计算能力,但只有20%-30%的运算任务能够扩展到10万亿次,有20%-30%的计算任务能够利用的计算力低于2万亿次。对此,孟祥飞评价说:“超算的真正效能是在各种用户的使用中产生的,如果得不到广泛的实际利用,对性能的追求也就失去了意义。”而清华大学计算机系主任杨广文认为,制约利用的因素总结起来有3个方面:一是由于学校课程设计不合理等,造成专业超算人才严重不足;二是超算应用开发滞后,而向国外购买价格昂贵;三是所处的政策环境不佳、企业利用超算的意识不强。

  IBM公司相关部门负责人戴夫·图雷克说:“就连品客薯片的加工也要用到超级计算机,人们需要用超级计算能力评估薯片的空气动力学特性,以便在生产过程中它们不会飞出生产线。”由此可见,在美日等发达国家,超算运用已经成为企业相关人员的必备技能,中国超算界应该与企业一起努力,大力推动企业和员工“超算化”工作,用超算全面改造和升级中国制造业。 

  30年磨砺勇夺第一

  “速度至上,利用滞后。”这是中外专家对中国超算的中肯评价。当然,这是在奋起直追时期正常的现象。从1983年我国第一台被命名为“银河”的亿次巨型电子计算机诞生到1999年曙光2000-II超级服务器峰值计算速度突破每秒1000亿次浮点运算,从2004年曙光4000A实现每秒10万亿次运算速度到2008年“深腾7000”突破每秒百万亿次,从2011年“天河一号”峰值速度千万亿次夺冠到2013年“天河二号”以峰值计算速度每秒5.49亿亿次再度夺冠,中国超算完成了30年赶超的大跨越。

  在此过程中,速度成为我国科学家的一个最重要指标之一,这当然是无可厚非的选择。国际同行对此给予高度评价的同时,大力赞赏他们推动自主创新的努力。在2013年6月“银河二号”以每秒33.86千万亿次的浮点运算速度,击败美国“泰坦”成为全球最快的超级计算机时,排行榜主要编撰人之一、美国田纳西大学计算机学教授杰克·唐加拉评价说,“银河二号”拥有超过300万个计算核心,而且互联网络、操作系统、前端处理器以及软件都是中国自主研发的。这难能可贵。美国伊利诺伊大学厄巴纳-尚佩恩分校并行计算研究所主任威廉·格罗普高度赞赏中国研究人员的工作质量以及他们对高性能计算软件难题的深入了解,并表示中国自主研发的互联网络具备“最先进”水平,使得“天河二号”应用广泛。他说:“高性能计算是现代工程的关键技术。中国希望成为21世纪技术的领先者,在高性能计算方面的投入表明中国对此是严肃认真的。持续不断地研发更好的新系统,保证了中国成为高性能计算领域的重要角色。”

  市场导向不容回避

  虽然“天河二号”成功突围,但在整体实力上,中国与超级计算机第一大国美国相比还有不小的差距。

  从超级计算机数量上看,美国拥有全球500强超级计算机中的253个,总数较其它国家和地区的总和还要多,优势明显。中国大陆共有65个超级计算机进入500强榜单,位居第二。日本以30个位列第三。英、法、德国分别以29个、23个和19个位列第四至第六位。

  从处理器来看,“天河二号”采用了3.2万颗因特尔12核Xeon E5主处理器和4.8万个Xeon Phi协处理器,共312万个计算核心。而使用中国国产的FT-1500型16核芯片只有4000多颗,总数仅为全部处理器数量的5%。虽然,中国有国产处理器,但在速度和稳定性上存在差距,而装配国产处理器的“神威蓝光”超级计算机在效能和速度上比国际先进水平要差就说明了这一点。 当然,也有人认为中国超级计算机使用“美国芯片”无伤大雅,因为全球化时代,就是要发挥比较优势,全球配置资源,可以把“天河二号”看作中国科研界和美国因特尔公司合作双赢的产品。

  从标准上来看,“天河二号”问鼎500强榜单,是Linpack基准测试下的世界最快超级计算机。但超级计算机基准测试并非Linpack一种。德国举行的2013世界超算大会除了公布Top500榜单外,还公布了Graph 500榜单,后者是利用图论模拟超算在分析数据密集型应用时的性能进行排名的,前者依据是超算的浮点运算能力。也就是说,前者侧重于绝对速度排名,后者更侧重于实际应用,代表着超级计算机对大数据的吞吐和处理能力。而“天河二号”在Graph500榜单中排名并不理想。此外,中国超级计算机在耗电量等方面的指标也不尽如人意。

  与上述问题相比,中国超算面临的市场效益问题更为紧迫。超级计算机系统的使用寿命大概在5年左右,根据TOP500的统计,对任何一套系统来说,从第一名落到第500名要经历6-8年的时间,而再落到跟笔记本电脑一般水平,只要经过8-10年的时间。2004年曙光4000A的总投资近1亿元,而今天同样10万亿次的计算能力只要约100万元。而且,更要命的是,那么大一套系统满负荷运转一天的电费就高达1万元。超算系统技术更新周期短,这意味着超级计算机面临一个尴尬的现实:如果5年内机器使用率不高,或者效能不能得到充分发挥,盈利就很成问题,甚至亏本。因此,面对我国超算产业快速发展局面,我们在欣喜之余也要保持清醒的认识。 

  2013全球超算十强  

  2013年下半年度全球超级计算机500强榜单(Top500)于去年11月底发布,其中前十强分别是:

  第1名:国防科技大学的天河二号(中国)

  中国的天河二号(Tianhe-2)是世界上速度最快的超级计算机,它已连续两次荣登榜首。其运行速度达到了惊人的每秒33.86千万亿次浮点运算,遥遥领先于其他超级计算机。天河二号配备了310万个主处理器核心和270万个加速器核心,数量委实惊人,是当之无愧的领跑者。

  第2名:克雷的“泰坦”(Titan)(美国)

  入围最近这次前10强的速度最快的美国产超级计算机是“泰坦”(Titan)。它也是跻身一流超级计算机行列的唯一基于皓龙(Opteron)架构的系统。“泰坦”采用了大约50万个主处理器核心和25万个英伟达提供的加速器,可以为其在橡树岭国家实验室的用户提供每秒17.5千万亿次浮点运算的计算能力。

  第3名:IBM的“红杉”(Sequoia)(美国)

  “红杉”(Sequoia)是另一款常年入围前500强的超级计算机,也是最近这次榜单上排名最高的蓝色基因/Q超级计算机。这台巨无霸坐落于利物莫尔国家实验室,运行速度达到了每秒17.1千万亿浮点运算,是没有采用加速器核心的速度最快的超级计算机(不过它配备的主处理器核心数量确实超过了157万个。)

  第4名:富士通的K超级计算机(日本)

  富士通的K超级计算机是经常入围榜单的老面孔之一,它是唯一跻身于前10强的搭载SPARC64处理器的系统,运行速度达到了每秒10.5千万亿次浮点运算。这台超级计算机的能耗极大,每瓦特计算能力只有每秒830百万次浮点运算。

  第5名:IBM的“米拉”(Mira)(美国)

  “米拉”是美国阿尔贡国家实验室采用的一台蓝色基因/Q超级计算机,按Linpack基准测试衡量,其运行速度达到了每秒8.58千万亿次浮点运算,与上一回榜单一样也位居第5。它使用了786000多个处理器核心,采用了大规模并行阵列架构。

  第6名:克雷的“代恩特峰”(Piz Daint)(瑞士)

  “代恩特峰”(Piz Daint)以阿尔卑斯山的一座山峰命名,它是新入围前10强榜单的超级计算机,仅用116000个处理器核心就达到了每秒6.27千万亿次浮点运算的计算能力。它安装在位于卢加诺的瑞士国家计算中心,也是前10强能源效率最高的超级计算机。

  第7名:戴尔的“惊跑”(Stampede)(美国)

  得克萨斯大学的“惊跑”(Stampede)运行速度达到了每秒5.16千万亿次浮点运算,也是这次榜单上第一台除主处理器外还采用辅助加速器核心(这里是英特尔至强Phis)的超级计算机。它也是前10强排名最高的纯学术型超级计算机。

  第8名:IBM的JUQUEEN(德国)

  JUQUEEN坐落于德国西部城镇于利希,它是前10强中采用IBM的蓝色基因/Q框架的4台超级计算机之一。

  第9名:IBM的“火神”(Vulcan)(美国)

  “火神”(Vulcan)位于美国能源部下属久负盛名的劳伦斯·利物莫尔国家实验室,按用来测算500强超级计算机性能的Linpack基准测试衡量,其运行速度达到了每秒4.3千万亿次浮点运算。作为前10强中能源效率比较高的超级计算机之一,“火神”采用了大规模并行计算架构,而且PowerPC处理器核心的数量总共超过了393000个。

  第10名:IBM的SuperMUC(德国)

  SuperMUC是经常入围500强榜单的超级计算机,其运行速度在147000多个处理器核心的配置下达到了每秒近2.9千万亿次浮点运算。SuperMUC位于德国慕尼黑附近的莱布尼兹超级计算中心,它也是最新前10强中能源效率不太高的超级计算机之一,每瓦特计算能力只有每秒846百万次浮点运算。它也是IBM制造的入围前10强的5台超级计算机之一。

  (珏  晓) 

中国超算:高处怎御寒?
责编:张保淑 邮箱:beijing2008@people.cn