2024年11月15日上午,AMD 发布最新版本的深度神经网络库 ZenDNN 5.0 ,与英特尔的 oneDNN API 和基础设施兼容。ZenDNN 5.0 现已针对 AMD Zen 5 处理器(如EPYC 9005系列)进行了优化。ZenDNN 5.0 还通过其 PyTorch 插件为生成式大型语言模型 (LLM) 提供了性能增强。
ZenDNN 5.0 针对第五代 AMD EPYC“Turin”处理器进行了优化,同时它在新的 Ryzen 9000 系列 Zen 5 台式机处理器上的表现也将比之前的 ZenDNN 版本更好。 ZenDNN 5.0 还兼容 AMD BLIS 5.0 库、EPYC 特定的 MATMUL 运算符和相关融合增强功能、BF16 的自动调整、专注于 LLM 的性能增强、优化的标量点积注意力 (SDPA)、PyTorch 中推荐系统模型对 BF16 精度的支持,以及 PyTorch 插件中的图形优化和模式匹配改进。
ZenDNN 5.0 已使用 TensorFlow 2.16+ 和 PyTorch 2.0+ 进行了测试。ZenDNN 5.0 发布公告指出:
“ZenDNN 5.0 版本的重点是提供对 Zen5 AMD EPYC™ 架构的支持,以及通过 PyTorch 插件增强生成式 LLM 模型的性能。支持的模型列表包括 Llama2 和 Llama3、Phi2、Phi3、Qwen、ChatGLM 和 GPT 等架构。该版本还为 BERT 等非生成式 LLM 模型提供了性能改进。”
AMD ZenDNN 在 Apache 2.0 许可下可用。