湖南大学在“存算一体”分子动力学高速芯片领域取得进展

发布:cyqdesign 2022-05-18 11:42 阅读:1151
近日,湖南大学电气与信息工程学院刘杰教授课题组自主研制出了“存算一体”非冯·诺依曼类脑芯片架构,用于加速分子动力学高性能科学计算。相较主流Intel CPU、NVIDIA GPU芯片,在保持计算高精度前提下,实现了约2个数量级提速。研究成果以“Accurate and efficient molecular dynamics based on machine learning and non von Neumann architecture”为题,发表在《npj Computational Materials》期刊。第一作者为电气院博士生莫平辉,通讯作者为刘杰教授。 JQsS=m7Et  
ZHICpL  
自1946年发明至今,冯·诺依曼架构一直占据统治地位,是CPU、GPU等主流芯片的基础,也是手机、台式机、笔记本、计算服务器、超级计算中心的底层基础架构。目前,需要运行分子动力学等高性能科学计算时,使用冯·诺依曼架构的计算机是几乎所有研究人员的唯一选择,这已成为一种“固有范式”(paradigm)。遗憾的是,冯·诺依曼架构中,计算单元(例如CPU/GPU)和存储单元(例如内存)是互相独立的(即“存算分离”),导致计算总耗时和计算总功耗中的绝大部分(>90%)消耗于存储单元、计算单元之间的频繁数据搬运,俗称“存储墙(memory wall)”和“功耗墙(power wall)”瓶颈。这严重制约了计算性能的提升。 :I F&W=?9  
zScV 9,H1  
为解决该问题,刘杰教授团队自主设计了“存算一体”的类脑芯片架构,并基于FPGA研制出了基于新型非冯·诺依曼芯片架构的分子动力学计算系统“NVNMD”(第一版),实现了从传统冯·诺依曼芯片架构向新型非冯·诺依曼芯片架构的“范式转移(paradigm shift)”。NVNMD的核心计算模块中,存储单元和计算单元紧密融为一体(即“存算一体”),避免了频繁的数据搬运,极大缓解了计算中的“存储墙”和“功耗墙”瓶颈。实测表明,相较主流CPU、GPU等传统冯·诺依曼架构芯片,可将计算速度提升大约2个数量级;并可将计算功耗降低大约3个数量级。 &.=d,XKN  
%6L!JN  
长期以来,受制于冯·诺依曼芯片架构内禀的“存储墙”等瓶颈,在“速度”和“精度”这两个核心指标上,分子动力学存在“鱼与熊掌不可兼得”的问题——经典分子动力学(classical molecular dynamics, CMD)速度快,但精度低,难以满足高精度计算要求;第一性原理分子动力学(ab-initio molecular dynamics, AIMD)精度高,但速度慢,难以计算大系统。该成果提出的新型NVNMD兼具AIMD级别的高精度、CMD级别的高速度,在物理、化学、生物、制药、地质、材料半导体纳米技术等领域有广泛应用前景。 }9:\#  
L,waQk / @  
aAu upPu  
该成果得到了中组部海外高层次人才计划、国家自然科学基金、湖南省委组织部百人计划、湖南省科技厅、长沙市科技局、华为技术有限公司等经费支持。目前,该团队正在基于高端工艺节点,设计非冯·诺依曼架构ASIC芯片的NVNMD(第二版),旨在实现单节点(平方cm量级芯片、百瓦量级功耗、新型非冯·诺依曼芯片架构)分子动力学算力大致相当于美国最强超算中心Summit算力总和(占地一栋楼、十兆瓦量级功耗、传统冯·诺依曼芯片架构)的研究目标。 1b;Aru~l  
.-`7Av+7  
论文链接:https://www.nature.com/articles/s41524-022-00773-z
关键词: 芯片
分享到:

最新评论

我要发表 我要评论
限 50000 字节
关于我们
网站介绍
免责声明
加入我们
赞助我们
服务项目
稿件投递
广告投放
人才招聘
团购天下
帮助中心
新手入门
发帖回帖
充值VIP
其它功能
站内工具
清除Cookies
无图版
手机浏览
网站统计
交流方式
联系邮箱:广告合作 站务处理
微信公众号:opticsky 微信号:cyqdesign
新浪微博:光行天下OPTICSKY
QQ号:9652202
主办方:成都光行天下科技有限公司
Copyright © 2005-2024 光行天下 蜀ICP备06003254号-1