2024年11月20日,英特尔开源软件开发人员发布了 OpenVINO 2024.5,这是此跨平台 AI 工具包的最新主要功能版本。
OpenVINO 2024.5 继续构建此工具包的生成式 AI“GenAI”功能,并扩大大型语言模型 (LLM) 的覆盖范围。OpenVINO 2024.5 增加了对 1B 和 3B 大小的 Llama 3.2、2B 和 9B 大小的 Gemma 2 以及 YOLO11 的支持。英特尔 NPU 现在还支持 Llama 3 8B、Llama 2 7B、Mistral-v0.2 7B、Qwen2 7B Instruct 和 Phi-3 的大型语言模型。
在优化方面,英特尔酷睿超显卡以及英特尔 Arc Graphics 独立 GPU 都有新的优化。现在还正式支持英特尔至强 6 P 核处理器,即 Granite Rapids,以及英特尔酷睿超 200V Arrow Lake S 台式机处理器。
OpenVINO 2024.5 还提供了对 Flax 的预览级支持,Flax 是一个基于 JAX 的高性能 Python 神经网络库。OpenVINO 2024.5 的完善之处在于为 GenAI API 添加了推测解码功能,为具有多模式管道的多模式 AI 部署添加了 GenAI API 预览支持,并为英特尔 NPU 上的 LLM 添加了 GenAI API 支持。
OpenVINO 2024.5是此 AI 工具包的一个相当大的更新。有关更改的更多详细信息可访问https://github.com/openvinotoolkit/openvino/releases/tag/2024.5.0