跳转至主要内容
支持知识库

将 INT8 模型转换为中间表示文件 (IR)

内容类型: 故障排除   |   文章 ID: 000058759   |   上次审核日期: 2026 年 03 月 05 日

说明

在模型优化文档中提到了量化感知训练 (QAT)。它指出QAT允许用户获得准确的优化模型,该模型可以转换为OpenVINO™中间表示(IR)。但是,未提供其他详细信息。请参阅:

解决方法

神经网络压缩框架 (NNCF) 支持量化感知训练 (QAT),采用与OpenVINO™兼容的训练框架,用于:

  • TensorFlow* 2/Keras* 模型 (通过 NNCF QAT 工作流程)
  • PyTorch* 模型 (通过 NNCF QAT 工作流程)

NNCF 是一个提供训练后和训练时间模型压缩方法(包括 QAT)的框架,用于优化用于OpenVINO推理的模型。

QAT 微调完成后,可以导出优化模型(通常为 ONNX*),然后转换为 OpenVINO™ IR 进行部署。

注意将模型转换为 OpenVINO IR 之后,将过渡到 INT8 精度并享受相应的封装优势。

相关产品

本文适用于 1 产品。

免责声明

本页面上的内容是原始英文内容的人工翻译与计算机翻译的组合。我们提供此内容是为了您的便利并且仅供参考,未必完整或准确。如果本页面的英文版与翻译版之间存在任何冲突,应以英文版为准。 查看此页面的英语版本。