湖南大学在“存算一体”分子动力学高速芯片领域取得进展

近日，湖南大学电气与信息工程学院刘杰教授课题组自主研制出了“存算一体”非冯·诺依曼类脑芯片架构，用于加速分子动力学高性能科学计算。相较主流Intel CPU、NVIDIA GPU芯片，在保持计算高精度前提下，实现了约2个数量级提速。研究成果以“Accurate and efficient molecular dynamics based on machine learning and non von Neumann architecture”为题，发表在《npj Computational Materials》期刊。第一作者为电气院博士生莫平辉，通讯作者为刘杰教授。

自1946年发明至今，冯·诺依曼架构一直占据统治地位，是CPU、GPU等主流芯片的基础，也是手机、台式机、笔记本、计算服务器、超级计算中心的底层基础架构。目前，需要运行分子动力学等高性能科学计算时，使用冯·诺依曼架构的计算机是几乎所有研究人员的唯一选择，这已成为一种“固有范式”（paradigm）。遗憾的是，冯·诺依曼架构中，计算单元（例如CPU/GPU）和存储单元（例如内存）是互相独立的（即“存算分离”），导致计算总耗时和计算总功耗中的绝大部分（>90%）消耗于存储单元、计算单元之间的频繁数据搬运，俗称“存储墙（memory wall）”和“功耗墙（power wall）”瓶颈。这严重制约了计算性能的提升。

为解决该问题，刘杰教授团队自主设计了“存算一体”的类脑芯片架构，并基于FPGA研制出了基于新型非冯·诺依曼芯片架构的分子动力学计算系统“NVNMD”（第一版），实现了从传统冯·诺依曼芯片架构向新型非冯·诺依曼芯片架构的“范式转移（paradigm shift）”。NVNMD的核心计算模块中，存储单元和计算单元紧密融为一体（即“存算一体”），避免了频繁的数据搬运，极大缓解了计算中的“存储墙”和“功耗墙”瓶颈。实测表明，相较主流CPU、GPU等传统冯·诺依曼架构芯片，可将计算速度提升大约2个数量级；并可将计算功耗降低大约3个数量级。

长期以来，受制于冯·诺依曼芯片架构内禀的“存储墙”等瓶颈，在“速度”和“精度”这两个核心指标上，分子动力学存在“鱼与熊掌不可兼得”的问题——经典分子动力学（classical molecular dynamics, CMD）速度快，但精度低，难以满足高精度计算要求；第一性原理分子动力学（ab-initio molecular dynamics, AIMD）精度高，但速度慢，难以计算大系统。该成果提出的新型NVNMD兼具AIMD级别的高精度、CMD级别的高速度，在物理、化学、生物、制药、地质、材料、半导体、纳米技术等领域有广泛应用前景。

[attachment=112489]

该成果得到了中组部海外高层次人才计划、国家自然科学基金、湖南省委组织部百人计划、湖南省科技厅、长沙市科技局、华为技术有限公司等经费支持。目前，该团队正在基于高端工艺节点，设计非冯·诺依曼架构ASIC芯片的NVNMD（第二版），旨在实现单节点（平方cm量级芯片、百瓦量级功耗、新型非冯·诺依曼芯片架构）分子动力学算力大致相当于美国最强超算中心Summit算力总和（占地一栋楼、十兆瓦量级功耗、传统冯·诺依曼芯片架构）的研究目标。

论文链接：https://www.nature.com/articles/s41524-022-00773-z

查看本帖完整版本: [-- 湖南大学在“存算一体”分子动力学高速芯片领域取得进展 --] [-- top --]