跳到主要內容
支援知識庫

為什麼模型載入到 GPU 的時間比載入 CPU 的時間還長?

內容類型: 維護與效能   |   文章 ID: 000057525   |   最近查看日期: 2026 year 03 month 05 day

環境

OpenVINO™ 工具包 GPU 外掛 CPU 外掛

說明

將輸入模型的中間表示(IR)載入 GPU 所需時間比將相同模型載入 CPU 更長。

解決方法

手動在應用程式的工作目錄中建立cl_cache目錄。

驅動程式會利用此目錄來儲存已編譯核心的二進位表示。這功能適用於所有支援的作業系統。

或者,設定環境變數:

export INTEL_OPENCL_CACHE=1

其他資訊

請參閱本文的模型快取概覽以優化延遲。

將輸入模型以中間表示(IR)格式載入 GPU 比將相同模型載入 CPU 花費更長時間,因為 GPU 堆疊是基於 OpenCL*。載入時間取決於 OpenCL* 核心的編譯時間。

啟用 cl_cache 時,第一次載入模型仍會花很長時間,因為 OpenCL* 核心會編譯。然而,同一型號的每次後續載入速度都會快得多。

關於 OpenVINO™ 2026.0 中的程式快取配置:
core.set_property("GPU", {"CACHE_DIR": "./cl_cache"})

相關資訊

OpenVINO™ 2026.0 GPU 外掛文件

相關產品

本文章適用 1 個產品。

免責聲明

這個頁面的內容綜合了英文原始內容的人工翻譯譯文與機器翻譯譯文。本內容是基於一般資訊目的,方便您參考而提供,不應視同完整或準確的內容。如果這個頁面的英文版與譯文之間發生任何牴觸,將受英文版規範及管轄。 查看這個頁面的英文版。