跳到主要內容
支援知識庫

為什麼選擇使用最佳 Intel / 神經網路壓縮框架 (NNCF) 進行重量壓縮的 FP16 型號?

內容類型: 疑難排解   |   文章 ID: 000098174   |   最近查看日期: 2024 年 03 月 21 日

描述

無法確定使用最佳 Intel / NNCF 在重量壓縮中選擇 FP16 型號的原因。

解決方法

FP16 半精度將 FP32 精度的模型大小減半,在使用一半的 GPU 資源的同時,可以獲得幾乎相同的推論結果。

相關產品

本文章適用 3 產品。
Intel® Xeon Phi™ 處理器軟體 OpenVINO™ toolkit 效能程式庫

免責聲明

這個頁面的內容綜合了英文原始內容的人工翻譯譯文與機器翻譯譯文。本內容是基於一般資訊目的,方便您參考而提供,不應視同完整或準確的內容。如果這個頁面的英文版與譯文之間發生任何牴觸,將受英文版規範及管轄。 查看這個頁面的英文版。