OpenVINO™ 工具套件：一款可轻松实现“一次写入，处处部署”的开源 AI 工具套件。

2024.1 版本新增功能特性

OpenVINO™ 工具套件 2024.1 版本改进了大型语言模型 (LLM) 性能，扩大了模型覆盖范围，提高了生成式 AI 的普及性。它还提高了可移植性和性能，便于在边缘、云端或本地随处部署。

最新特性

更轻松地访问和转换模型

产品	详细信息
全新模型支持	支持具有卓越性能指标的 GenAI LLM 即用型 chat/instruct 模型 Falcon-7b-Instruct。

生成式 AI 和 LLM 增强功能

扩展了模型支持，加快了推理过程。

功能	详细信息
模型覆盖范围	新增 Jupyter* Notebook：YOLOv9、YOLOv8 定向边界框检测 (OBB)、Keras 中的 Stable Diffusion*、MobileCLIP、RMBG-v1.4 背景移除、Magika、TripoSR、AnimateAnyone、LLaVA-Next，以及带有 OpenVINO 工具套件和 LangChain 的检索增强生成 (RAG) 系统。
LLM 性能增强	通过增加的压缩嵌入优化，缩短了 LLM 编译时间。利用英特尔® Advanced Matrix Extensions (英特尔® AMX)，提高 LLM 在第四代和第五代英特尔® 至强® 平台上的第一个分词性能。利用对英特尔锐炫™ GPU 的英特尔® oneAPI Deep Neural Network Library (oneDNN)、int4 和 int8 支持，提高 LLM 压缩能力和性能。

功能

详细信息

模型覆盖范围

新增 Jupyter* Notebook：YOLOv9*、YOLOv8* 定向边界框检测 (OBB)、Keras 中的 Stable Diffusion*、MobileCLIP、RMBG-v1.4 背景移除、Magika、TripoSR、AnimateAnyone、LLaVA-Next，以及带有 OpenVINO 工具套件和 LangChain 的检索增强生成 (RAG) 系统。

LLM 性能增强

通过增加的压缩嵌入优化，缩短了 LLM 编译时间。

利用英特尔® Advanced Matrix Extensions (英特尔® AMX)，提高 LLM 在第四代和第五代英特尔® 至强® 平台上的第一个分词性能。

利用对英特尔锐炫™ GPU 的英特尔® oneAPI Deep Neural Network Library (oneDNN)、int4 和 int8 支持，提高 LLM 压缩能力和性能。

改进了可移植性和性能

一次开发，随处部署。通过 OpenVINO 工具套件，开发人员可以在边缘、云端或本地使用 AI。

产品	详细信息
Arm* 处理器支持更新	对于卷积神经网络 (CNN)，Arm 处理器现在默认启用 FP16 推理。
英特尔硬件支持	为提升英特尔® 至强® 处理器的性能，优化了 Mixtral 和 URLNet 模型。为提高集成 GPU 的英特尔® 酷睿™ Ultra 处理器的推理速度，优化了 Stable Diffusion* 1.5、ChatGLM3-6b 和 Qwen-7B 模型。英特尔® 酷睿™ Ultra 处理器的神经处理单元 (NPU) 预览插件除了包含在 PyPI 的主要 OpenVINO 工具套件包中外，现在也包含在 OpenVINO 工具套件开源 GitHub* 存储库中。对于集成 GPU 的英特尔® 酷睿™ Ultra 处理器，部分小型生成式 AI (GenAI) 模型的内存显著降低。
JavaScript* API	现在，更容易通过 npm 存储库访问 JavaScript API。因此，Javascript* 开发人员能够无缝访问 OpenVINO 工具套件 API。

产品

详细信息

Arm* 处理器支持更新

对于卷积神经网络 (CNN)，Arm 处理器现在默认启用 FP16 推理。

英特尔硬件支持

为提升英特尔® 至强® 处理器的性能，优化了 Mixtral 和 URLNet 模型。

为提高集成 GPU 的英特尔® 酷睿™ Ultra 处理器的推理速度，优化了 Stable Diffusion* 1.5、ChatGLM3-6b 和 Qwen-7B 模型。

英特尔® 酷睿™ Ultra 处理器的神经处理单元 (NPU) 预览插件除了包含在 PyPI 的主要 OpenVINO 工具套件包中外，现在也包含在 OpenVINO 工具套件开源 GitHub* 存储库中。

对于集成 GPU 的英特尔® 酷睿™ Ultra 处理器，部分小型生成式 AI (GenAI) 模型的内存显著降低。

JavaScript* API

现在，更容易通过 npm 存储库访问 JavaScript API。因此，Javascript* 开发人员能够无缝访问 OpenVINO 工具套件 API。

注册了解独家消息、提示和版本发布

率先了解关于英特尔® 发行版 OpenVINO™ 工具套件的一切新内容。注册后，您可以获得抢先了解产品更新和发布信息、独家受邀参加网络研讨会和活动、培训和教程资源、竞赛公告以及其他突发新闻。

除非标为可选，否则所有字段均为必填。

公司电子邮件地址

请选择国家/地区

边缘开发人员类型：

英特尔致力于为您提供优质、个性化的体验，您的数据帮助我们实现这一目标。

我同意英特尔按如下所述收集和使用我的个人信息。

我同意英特尔将我的个人信息转移到中国境外以便根据英特尔的隐私和 Cookie 声明以及英特尔针对中国用户的隐私政策补充进行处理。

提交此表单，即表示您确认自己已经年满 18 周岁，同意与英特尔分享您的个人信息以用于此业务需求。您还同意订阅通过电子邮件和电话及时获取英特尔® 技术和行业趋势的最新信息。您可以随时取消订阅。英特尔网站和通信内容受到我们的隐私声明和使用条款的约束。

感谢您注册，了解使用 OpenVINO™ 工具套件进行 AI 推理的最新进展。

资源

社区与支持

探索各种参与方式，并及时了解最新公告。

获取帮助

在社区论坛上提问

联系英特尔支持

在 GitHub* 上发布问题

在 StackOverflow 上获取答案

掌握最新消息

学习

入门

利用随附的模型优化器以及运行时和开发工具进行优化、调优并运行全面的 AI 推理。

免费下载

由 oneAPI 提供支持

高效、智能的途径，可以摆脱专有替代方案的经济和技术负担，实现加速计算的自由。

注册了解独家消息、提示和版本发布

除非标为可选，否则所有字段均为必填。

公司电子邮件地址

请选择国家/地区

描述您的用例：

英特尔致力于为您提供优质、个性化的体验，您的数据帮助我们实现这一目标。

我同意英特尔按如下所述收集和使用我的个人信息。

我同意英特尔将我的个人信息转移到中国境外以便根据英特尔的隐私和 Cookie 声明以及英特尔针对中国用户的隐私政策补充进行处理。

选择您的语言

使用 Intel.com 搜索

快速链接

最近搜索

高级搜索

仅搜索

OpenVINO™ 工具套件：一款可轻松实现“一次写入，处处部署”的开源 AI 工具套件。

2024.1 版本新增功能特性

最新特性

注册了解独家消息、提示和版本发布

感谢您注册，了解使用 OpenVINO™ 工具套件进行 AI 推理的最新进展。

资源

社区与支持

入门

由 oneAPI 提供支持

注册了解独家消息、提示和版本发布

感谢您注册，了解使用 OpenVINO™ 工具套件进行 AI 推理的最新进展。