跳到主要內容
支援知識庫

與 CPU 相比,在 GPU 上採用OpenVINO™效能標竿的推斷模型時,為什麼延遲與輸送量都比較高?

內容類型: 產品資訊與文件   |   文章 ID: 000093152   |   最近查看日期: 2023 年 02 月 09 日

描述

  • 以 CPU 和 GPU 的OpenVINO™效能標竿推斷出相同的型號:
    benchmark_app.exe -m model.xml -d CPU
    benchmark_app.exe -m model.xml -d CPU
  • 結果 GPU 上的延遲與輸送量高於 CPU。
  • 無法確定為什麼 GPU 上的延遲與推斷輸送量都高於 CPU,因為低延遲會導致高輸送量。

解決方法

如果同步推斷,延遲會測量處理單一輸入所需的推斷時間。

當以預設參數執行OpenVINO™效能標竿時,就是以非同步模式推斷。因此,結果延遲會測量處理推斷請求數量所需的總推斷時間。

此外,在具有預設參數的 CPU 上執行效能標竿應用程式時,會建立 4 個推斷要求,而如果在具有預設參數的 GPU 上執行效能標竿應用程式,則會建立 16 個推斷要求。因此,在 GPU 上推斷所產生的延遲高於 CPU。

CPU 和 GPU 上執行效能標竿應用程式以進行公平比較時,指定相同的推斷要求數量:
benchmark_app.exe -m model.xml -d CPU -nireq 4
benchmark_app.exe -m model.xml -d CPU -nireq 4

相關產品

本文章適用 3 產品。
Intel® Xeon Phi™ 處理器軟體 OpenVINO™ toolkit 效能程式庫

免責聲明

這個頁面的內容綜合了英文原始內容的人工翻譯譯文與機器翻譯譯文。本內容是基於一般資訊目的,方便您參考而提供,不應視同完整或準確的內容。如果這個頁面的英文版與譯文之間發生任何牴觸,將受英文版規範及管轄。 查看這個頁面的英文版。