在江苏省无锡市滨湖区一个巨大的机房中,40个计算机柜排列成二进制语言“010”的样式,每个机柜有1024个CPU,每个CPU有4个主核,每个主核又带有64个从核——这就是超级计算机“神威·太湖之光”。国家超级计算无锡中心主任助理、研发中心主任甘霖每天的工作,就是和这台超级计算机打交道。
超级计算机是什么?它与我们的日常生活有什么关系?“超算没有那么高深莫测,它作为功能最强、速度最快的一类计算机,就像一个最强大脑,为天气气候、地球物理、生物医药、先进制造等领域提供强有力的算力服务,帮助它们算得更快更准。”甘霖介绍,这些计算看不到摸不着,却支撑着日常生活的点点滴滴。
超算技术的飞速发展及其在众多领域的重要应用,让甘霖对它产生了浓厚兴趣,并在读博时选择了这个研究方向。2015年12月,还在读博的甘霖,与一群平均年龄只有25岁的年轻人来到无锡研发基地,投入“神威·太湖之光”的试算与调试工作中。
“机器是全新的,硬件是全新的,我们的任务是设计软件与应用,就像为一款新手机开发APP。”来到基地的甘霖第一次触摸到庞大的机身,从此与这台国之重器并肩作战,和年富力强的团队共同成长,肩负起为这款国产超级计算机打造系统的重要使命。
开发这一系统的过程殊为不易。甘霖和团队成员们有时候要面对百万行的程序代码,还要克服数学、物理等不同学科的众多关键问题,以此实现基于国产超算的超大规模、高分辨率的科学应用模拟。在重点攻关时期,为精确定位和排除一个细小的程序错误,往往要花费几天甚至几周,有时甘霖一天只有三四个小时的休息时间。
设计方法、撰写程序、测试代码……甘霖和年轻成员们努力将强大算力真正投入应用,让这台超级计算机既能“算得快”也能“用得好”。
2016年11月,被誉为世界高性能计算应用领域最高奖项的“戈登·贝尔”奖揭晓,甘霖作为团队成员之一,凭借“千万核可扩展全球大气动力学全隐式模拟”项目成果,实现了该奖设立29年来中国团队的首次获奖。“我非常激动!”甘霖说,该成果设计开发了一种新的用于大气动力模拟的高可扩展全隐式求解算法和软件,这是世界上第一次在有效时间尺度完成了500米以上分辨率的大气模拟,在航空、地学、能源等领域的挑战性计算问题中有广阔的应用前景。
此后,甘霖和团队一路披荆斩棘,在国产超算系统方面不断取得新突破,将新成果应用到国家急需的重要领域中。
最近,甘霖又带领团队,基于神威系列超级计算机,研发出3900万核规模的复杂地震模拟程序,成功实现多个复杂地震的高精度模拟。这项工作的持续开发,有望为地震研究提供更加快速、准确的计算结果,从而助力地震发生机理研究、建筑物规划布局设计。
甘霖还牵头打造“超级计算机进校园”普及课程,组建了一支“神威侠”志愿者团队,依托共青团、青联等,定期走进校园、企业,向年轻人科普科技成果、分享青年科技工作者的奋斗故事。目前,超算中心已接待参观者超4万人次。
“我们这一代超算人非常幸运地赶上了科技发展的好时候,有更广阔的视野和空间继续前行、接力奋斗。”甘霖说,作为新时代的科研人,有信心创造更多更好的成果,为超级计算贡献青年力量。