10月28日,2022鲲鹏应用创新大赛全国总决赛在浙江杭州举行,经过激烈的角逐,柳朝晖教授团队从56支队伍中脱颖而出,夺得HPC赛道银奖。
本次比赛,柳朝晖教授团队组织“华中科技大学-SKLCC103”战队,以自主研发的PFLows软件参与HPC赛道的比赛。战队主要成员为2020级研究生马匡和2022级研究生王亚宁,江茂强博士后和柳朝晖教授全程参与指导。战队在8月份获得湖北赛区二等奖,成功入围全国半决赛,并最终代表湖北赛区参加全国总决赛。
PFLows是团队在自主提出的边界增厚浸入边界-格子Boltzmann算法(Jiang&Liu,JCP, 2019)基础上,近年来开发出的可大规模高效并行计算的颗粒两相流直接数值模拟软件(Jiang et al.,Compt. Fluid, 2022)。目前该软件已成功在华为鲲鹏、天河-3、曙光等国产超算平台实现了大规模高效并行计算。本次比赛,战队将PFLows从基于X86-NVIDIA GPU异构并行计算框架迁移拓展到基于鲲鹏ARM CPU-NVIDIA GPU异构计算并行计算框架,并进行了细粒度并行、合并内存访问、通讯隐藏等多方面的性能优化。进一步针对GPU计算特点,创新性地提出了One-Step Index算法,满足更低的内存消耗、更小的内存带宽需求和更简单的编程实现。测试实现了单GPU相比单CPU核心近千倍加速、512块GPU上模拟680亿网格高达98%的异构计算并行效率,展示了PFLows在鲲鹏平台极佳的加速效果、并行效率和可扩展性能。
PFLows定位于颗粒两相流的全解析直接数值模拟(FDNS)研究,其基础算法克服了早先模型处理颗粒移动边界时计算精度和计算效率上的矛盾,实现了流体流动、颗粒碰撞和颗粒流固耦合的高效并行,并初步实现了面向高Re数、复杂流固边界的通用CFD模拟计算,可支持基于OpenACC/CUDA/HIP等多种同构和异构MPI大规模并行加速计算,未来可以广泛应用于能源、化工、水利、医药、生物、环境等众多领域。该软件以及中科院过程所EMMS团队LBM软件、德国埃尔朗根-纽伦堡大学的WaLBerla软件等,是国际上已报道的少数几个可实现百亿网格/百万颗粒,并行计算能力达每秒两千亿次网格更新率(200GLUPS)的大规模颗粒两相流全解析模拟软件。
鲲鹏应用创新大赛是面向全球开发者的顶级赛事,大赛由鲲鹏生态创新中心与华为、联合中国软件行业协会、绿色计算产业联盟、中国计算机行业协会、中国计算机学会高专委共同举办,旨在激发行业应用创新、加速产业融合、促进人才培养。本次大赛主要面向企业伙伴/高校/科研院所参赛者,从初赛到决赛总共历时6个月,共吸引来自24个赛区的2000多个团队,超过5000名开发者报名,总奖金池达1000+万元。经过区域赛、全国半决赛和全国总决赛比拼,最终每个赛题评选出1金2银3铜2优胜奖项。
柳朝晖教授团队注重国际前沿的基础研究和技术开发,包括化石能源清洁低碳利用技术(富氧燃烧、无焰燃烧)、湍流两相反应流体力学、能源动力装置和系统的仿真及优化等。PFLows相关工作得到了国家自然科学基金(NSFC 51876075)的支持。
图1. 2022鲲鹏应用创新大赛全国总决赛宣传海报
图2. PFLows通用计算算例:(左)圆球绕流和(右)水下潜艇流动
图3.江茂强博士后在HPC赛道现场答辩中
图4.现场颁奖仪式(中间获奖代表为江茂强博士后)