與 CPU 相比,在 GPU 上採用OpenVINO™效能標竿的推斷模型時,為什麼延遲與輸送量都比較高?
內容類型: 產品資訊與文件 | 文章 ID: 000093152 | 最近查看日期: 2023 年 02 月 09 日
如果同步推斷,延遲會測量處理單一輸入所需的推斷時間。
當以預設參數執行OpenVINO™效能標竿時,就是以非同步模式推斷。因此,結果延遲會測量處理推斷請求數量所需的總推斷時間。
此外,在具有預設參數的 CPU 上執行效能標竿應用程式時,會建立 4 個推斷要求,而如果在具有預設參數的 GPU 上執行效能標竿應用程式,則會建立 16 個推斷要求。因此,在 GPU 上推斷所產生的延遲高於 CPU。
在 CPU 和 GPU 上執行效能標竿應用程式以進行公平比較時,指定相同的推斷要求數量:
benchmark_app.exe -m model.xml -d CPU -nireq 4
benchmark_app.exe -m model.xml -d CPU -nireq 4