為什麼模型載入到 GPU 的時間比載入 CPU 的時間還長?
內容類型: 維護與效能 | 文章 ID: 000057525 | 最近查看日期: 2026 year 03 month 05 day
將輸入模型的中間表示(IR)載入 GPU 所需時間比將相同模型載入 CPU 更長。
手動在應用程式的工作目錄中建立cl_cache目錄。
驅動程式會利用此目錄來儲存已編譯核心的二進位表示。這功能適用於所有支援的作業系統。
或者,設定環境變數:
export INTEL_OPENCL_CACHE=1
請參閱本文的模型快取概覽以優化延遲。
將輸入模型以中間表示(IR)格式載入 GPU 比將相同模型載入 CPU 花費更長時間,因為 GPU 堆疊是基於 OpenCL*。載入時間取決於 OpenCL* 核心的編譯時間。
啟用 cl_cache 時,第一次載入模型仍會花很長時間,因為 OpenCL* 核心會編譯。然而,同一型號的每次後續載入速度都會快得多。
關於 OpenVINO™ 2026.0 中的程式快取配置:
core.set_property("GPU", {"CACHE_DIR": "./cl_cache"})