跳到主要內容
支援知識庫

INT8 模型轉換為中介表示(IR)

內容類型: 疑難排解   |   文章 ID: 000058759   |   最近查看日期: 2026 year 03 month 05 day

說明

在模型優化文件中,提及量化感知訓練(QAT)。它指出 QAT 允許使用者獲得一個準確且優化的模型,並可轉換為 OpenVINO™ 中間表示(IR)。不過,未提供更多細節。參考:

解決方法

量化感知訓練(QAT)採用 OpenVINO™ 相容的訓練框架,透過神經網路壓縮框架(NNCF)支援:

  • TensorFlow* 2 / Keras* 模型 (透過 NNCF QAT 工作流程)
  • PyTorch* 模型 (透過 NNCF QAT 工作流程)

NNCF 是一個提供訓練後及訓練時間模型壓縮方法(包括 QAT)的框架,並用於優化 OpenVINO 推論模型。

QAT 微調完成後,優化後的模型可匯出(通常為 ONNX*),然後轉換為 OpenVINO™ IR 以供部署。

轉換為 INT8 精度及相應的封裝效益是在將模型轉換為 OpenVINO IR 後發生的。

相關產品

本文章適用 1 個產品。

免責聲明

這個頁面的內容綜合了英文原始內容的人工翻譯譯文與機器翻譯譯文。本內容是基於一般資訊目的,方便您參考而提供,不應視同完整或準確的內容。如果這個頁面的英文版與譯文之間發生任何牴觸,將受英文版規範及管轄。 查看這個頁面的英文版。