INT8 模型轉換為中介表示(IR)
內容類型: 疑難排解 | 文章 ID: 000058759 | 最近查看日期: 2026 year 03 month 05 day
在模型優化文件中,提及量化感知訓練(QAT)。它指出 QAT 允許使用者獲得一個準確且優化的模型,並可轉換為 OpenVINO™ 中間表示(IR)。不過,未提供更多細節。參考:
量化感知訓練(QAT)採用 OpenVINO™ 相容的訓練框架,透過神經網路壓縮框架(NNCF)支援:
NNCF 是一個提供訓練後及訓練時間模型壓縮方法(包括 QAT)的框架,並用於優化 OpenVINO 推論模型。
QAT 微調完成後,優化後的模型可匯出(通常為 ONNX*),然後轉換為 OpenVINO™ IR 以供部署。
| 註 | 轉換為 INT8 精度及相應的封裝效益是在將模型轉換為 OpenVINO IR 後發生的。 |