将 INT8 模型转换为中间表示文件 (IR)
内容类型: 故障排除 | 文章 ID: 000058759 | 上次审核日期: 2026 年 03 月 05 日
在模型优化文档中提到了量化感知训练 (QAT)。它指出QAT允许用户获得准确的优化模型,该模型可以转换为OpenVINO™中间表示(IR)。但是,未提供其他详细信息。请参阅:
神经网络压缩框架 (NNCF) 支持量化感知训练 (QAT),采用与OpenVINO™兼容的训练框架,用于:
NNCF 是一个提供训练后和训练时间模型压缩方法(包括 QAT)的框架,用于优化用于OpenVINO推理的模型。
QAT 微调完成后,可以导出优化模型(通常为 ONNX*),然后转换为 OpenVINO™ IR 进行部署。
| 注意 | 将模型转换为 OpenVINO IR 之后,将过渡到 INT8 精度并享受相应的封装优势。 |