字节跳动研发并开源了基于gpu加速的大规模量子化学计算工具集byteqc,显著提升了量子化学计算效率。该工具集在现代gpu上高效实现了多种标准量子化学算法,并结合量子嵌入方法,在保持高精度的前提下,大幅扩展了可计算体系的规模。
论文链接:https://www.php.cn/link/f0a94cc746c82ccf258040d541a2e15e代码链接:https://www.php.cn/link/f0a94cc746c82ccf258040d541a2e15e
ByteQC的核心优势在于其高效的GPU实现和创新的算法策略。通过引入NVIDIA的cuTENSR/cuTENSORMG张量计算库,并优化缓存及原位操作,ByteQC最大限度地减少了显存占用,并提升了计算速度。针对GPU架构特点,ByteQC团队还开发了基于warp特例化的动态生产者-消费者模型和基于warp同步原语的竞态求和算法,有效解决了复杂计算逻辑的GPU实现难题。
图2. 基于warp特例化的生产者-消费者模型
图3. 基于warp同步原语的相邻7个线程的竞态求和
基准测试结果显示,ByteQC在单A100 GPU上,标准量子化学算法最高可实现60倍于100核CPU的加速,且多卡扩展性良好。可计算体系规模也显著提升,例如CCSD(T)计算可达1380轨道,MP2计算可达11040轨道,平均场计算甚至可超过10万轨道。
图4. ByteQC的子模块加速比(数据点)和计算规模(虚线)
结合量子嵌入方法,ByteQC成功实现了对2753轨道水团簇和3929轨道氮化硼表面水吸附体系的CCSD(T)高精度计算,验证了其在真实材料计算中的应用潜力。
ByteQC的开源发布,为量子化学计算领域提供了强有力的工具,有望加速相关领域的研究进展。
以上就是大规模实用化量子化学计算曙光显现,ByteDance Research开源工具集ByteQC的详细内容,更多请关注【创想鸟】其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。
发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/3047856.html