高性能计算公共服务平台助力科研教学腾飞
文章来源:图书信息中心            发布日期:2017-12-28            浏览次数:1755

在科研与信息化技术高速发展的推动下,高性能计算已成为当今诸多学科进行前沿研究的重要基础工具,是分析处理海量科研数据的重要生产力。为满足广大科研人员对高性能计算的迫切需求,图书信息中心建成了“高性能计算公共服务平台”,并于2017年6月正式向全校老师提供服务。该平台共部署有20把刀片节点及2台大内存节点,向全校提供每秒20.4万亿次单精度计算能力。平台运行半年来,已收到了70多位用户的申请,累计运行作业25500余项,累计运行核小时数已经突破140万。

目前在平台上主要开展的研究有DNA或RNA的组学数据分析、肿瘤等疾病相关研究、量子拓扑材料的理论预言和计算、通过大数据分析进行新型纳米材料的研究与设计、数值模拟实现对新型材料体系的基础研究等。目前,许多老师已通过利用该平台,产出了高水平的科研成果。生命学院张力烨教授及其课题组利用平台对于DNA-Seq,RNA-Seq,ChIP-Seq等多种组学数据进行处理,并使用计算平台对于组学数据进行了机器学习来开发生物标记物,研究成果已经发布在EMBO Journal。物质学院李刚教授课题组利用平台进行第一性原理计算,研究具有非平凡拓扑性质的新奇量子材料。从理论上预言Na2CuTe3中存在具有三重兼并的准费米子,研究成果即将发表在Physical Review B期刊。

平台运行以来,通过与用户的深度对接,在解决问题的同时不断提升支撑能力。生命学院张力烨教授课题组在使用Speedseq的基因组分析工具时,编译环境要求较为复杂且上线时间紧迫。在了解到相关需求后,图信中心的平台负责同志快速响应,及时协助完成了程序的编译优化工作,为用户解决了架构复杂软件的安装运行问题。在实施过程中,张力烨老师也向图信提出了国外同类平台的先进使用经验。在按相关建议调试部署了Environmental-Module环境后,实现了高性能运行软件多版本间的灵活切换,也促成了运行环境的一站式标准化交付,给后续用户的使用带来了更多的便捷性。

平台运行过程中,通过不断观察计算任务运行情况,力求及时发现解决科研用户的各类潜在需求。比如,物质学院杨波教授课题组的计算任务和机时数在数天内有较大的提升。发现这一现象后经主动沟通了解,该课题组的一个项目已进入计算密集需求阶段。通过平台资源调度系统,分配了额外的弹性计算资源,有效保障了用户计算任务的高效运行。8千多core的计算任务在4天内全部运行完毕,整体运行时间较之前缩短了10天,受到了杨波老师的好评。

平台除了深度挖掘自身硬件计算能力外,也在不断结合新技术摸索计算效能提升的方式。比如,物质学院史武军老师希望能进一步提升VASP软件的运算效率。在生命学院的最新GPU节点加入共享服务平台后,我们立即在该节点上重编译及进行了运行参数优化调优。经过对比测试,单GPU卡对VASP软件的加速运行效率即提升了40%。未来在更高规格的GPU资源加入共享服务平台之后,科研常用软件在GPU平台下的性能将得到2~5倍的提升。

面对越发紧迫的计算需求,为了更好地为助力科研创新工作,图书信息中心通过云计算、虚拟化等技术,不断深度挖掘云计算中心自身的计算潜力。目前已在云计算中心和科学计算平台之间建立起了资源调度机制,为平台额外提供了近10万亿次的弹性计算能力。同时,各院所也用实际行动积极响应和支持共享服务平台的能力建设。以生命学院为例,目前已在科研计算平台与其托管的高性能计算集群之间建立起互通,在优先保障学院使用的前提下,为全校增加了16万亿次的计算能力。通过校级平台与院所集群之间的互通互联,既提升了平台整体的计算能力,又向全校其他院所的计算集群提供了一定的错峰运算能力。下阶段,将有更多的院所将他们的CPU及GPU计算集群纳入我校高性能计算公共服务平台中来,为学校整体的科学计算资源池建设做出新的贡献。

未来,高性能公共服务平台还将继续坚持其“资源统筹、规模适度、按需分配、贴身服务”的路线,继续拓展和夯实平台深度支撑科研的能力。力争与全校各学院的优秀人才携手共建,开拓上科大全校信息化资源共享共建共促进的新格局,成为促进上科大科研教育事业腾飞的强力推进剂。

物质学院李刚教授课题组利用平台进行第一性原理计算

物质学院杨波教授课题组使用平台进行运算