Napatech 縮圖

IPU 減少儲存工作負載的運算負荷

Napatech 將 Intel® IPU 技術的 F2070X IPU 與 Link-Storage* 軟體整合,卸載 NVMe over TCP 工作負載,減少運算額外負荷。

摘要

  • 企業和雲端資料中心越來越普遍採用 NVMe/TCP 儲存技術,因為這種技術具備效能、延遲、可擴充性、管理與資源使用率的優勢。然而,在伺服器主機 CPU 執行必要的儲存裝置啟動器工作負載時,會造成大量的運算負荷,並且限制執行服務和應用程式的可用 CPU 核心數量。

  • Napatech 的整合式軟硬體解決方案,包含在 F2070X IPU 執行的 Link-Storage 軟體堆疊,將儲存工作負載從主機 CPU 卸載至 IPU,並且維持應用程式層級完整的軟體相容性,這個問題迎刃而解。

  • Napatech 的儲存工作負載解決方案,釋放了儲存功能原本會耗用的主機 CPU 核心。這個方案的效能大幅優於軟體型實作,減少了資料中心 CAPEX、OPEX 與能耗,此外更在系統引進安全隔離,提高抵禦網路攻擊的防護能力。

author-image

作者

nvm express 圖誌本解決方案簡介解釋了 Napatech 的整合式硬體加軟體解決方案如何將 NVMe/TCP 儲存工作負載從主機 CPU 卸載到 IPU,從而顯著降低資本支出、運營支出和能耗。此外更在系統引進安全隔離,提高抵禦網路攻擊的防護能力。

NVMe over TCP 是什麼?

NVMe/TCP 這項儲存技術,支援使用標準資料中心網狀架構,透過網路存取 Non-Volatile Memory Express (NVMe) 儲存裝置。請見圖 1。

現代雲端與企業資料中心越來越普遍採用 NVME/TCP,因為相較於舊式儲存通訊協定(例如網際網路小型電腦系統介面 (iSCSI) 光纖通道),此方案的優勢極具吸引力:

圖 1.分離式儲存架構

  • 效能更高:NVMe 的設計充分利用新式高速的 NAND 技術固態硬碟(SSD),而且資料傳輸速率比傳統儲存通訊協定快很多。NVMe/TCP 將這些優勢延伸至網路連線儲存環境,讓資料中心透過網狀結構實現高效能儲存裝置存取。

  • 延遲減少:NVMe/TCP 低延遲的特性,對於資料密集型應用程式與即時工作負載至關重要。NVMe/TCP 將通訊負荷降至最低,而且不需要轉換通訊協定,有助於減少儲存裝置存取延遲,改善整體應用程式效能。

  • 擴充性:資料中心經常處理大規模儲存裝置部署,而 NVMe/TCP 提供透過網路的彈性高效儲存裝置存取解決方案,實現了順暢無礙的擴充性。NVMe 裝置數量不斷增加之際,資料中心可以維持高效能水準,而且沒有嚴重瓶頸。

  • 共用的儲存資源池:NVMe/TCP 支援建立共用的儲存資源池,供多重伺服器與應用程式同時存取。這種共用的儲存架構提升了資源使用率,並且簡化儲存管理,大幅節省成本。

  • 舊式基礎架構相容性:資料中心通常已經在乙太網路、InfiniBand 或光纖通道網路建置基礎架構。NVMe/TCP 可讓資料中心利用現有的網狀架構投資,並且整合更新穎的 NVMe 型儲存技術,而且不需要徹底改造整個網路基礎架構。

  • 高效的資源利用: NVMe/TCP 通過減少每台伺服器上對專用存儲資源的需求,實現更高的資源利用率。多台伺服器可以透過網路存取共用的 NVMe 儲存裝置,將使用昂貴 NVMe 儲存資源的方式最佳化。

  • 面向未來: 隨著數據中心不斷發展並採用更快的存儲技術,NVMe/TCP 提供了一種前瞻性的存儲訪問方法,確保存儲網路能夠跟上現代應用程式和工作負載不斷增長的需求。

整體而言,NVMe/TCP 為資料中心提供強大靈活的儲存解決方案,在可擴充的共用儲存環境中,實現了高效能、低延遲,以及高效的資源使用率。

純軟體儲存架構的限制

儘管 NVMe/TCP 在記憶體具有引人注目的好處,但數據中心運營商必須意識到與所有必需的儲存啟動器服務在主機伺服器 CPU 上的軟體中運行的實現相關的重大限制。請見圖 2。

網路儲存裝置
圖 2。軟體型網路儲存裝置

首先,如果網路攻擊入侵儲存虛擬化軟體、Hypervisor 或虛擬乙太網路交換器(vSwitch),便會出現系統層級的安全風險。

第二,沒有任何方法可以確保租用戶工作負載之間完全隔離。單一架構代管了好幾位客戶在多重租用戶環境的應用程式與資料。應用程式或虛擬機器(VM)使用的資源最多,造成共用基礎架構上其他租用戶的系統效能下降時,就會發生「擾鄰」效應。

最後,執行基礎架構服務,例如儲存虛擬化軟體、Hypervisor 與 vSwitch,必須動用大量的主機 CPU 核心。這樣一來,可以為 VM、容器與應用程式創造營收的 CPU 核心數量隨之減少。報告顯示,基礎架構服務通常使用 30% 至 50% 的資料中心 CPU 資源。

高效能儲存子系統可能需要主機 CPU,才能執行多種通訊協定,例如 Transmission Control Protocol (TCP)、Remote Direct Memory Access over Converged Ethernet (RoCEv2)、InfiniBand 與光纖通道。為了執行這些儲存通訊協定和其他基礎架構服務,大量使用主機 CPU 時,租用戶應用程式可用的 CPU 核心數便大幅減少。舉例而言,16 核心 CPU 可能只能提供 10 核心 CPU 的效能。

基於這些理由,純軟體架構會對資料中心儲存裝置構成重大的業務和技術挑戰。

IPU 技術儲存卸載解決方案

將 NVMe/TCP 工作負載卸載至 IPU,以及其他基礎架構服務,例如 Hypervisor 與 vSwitch(請見圖 3),能夠解決純軟體實作的限制,為資料中心業者帶來顯著的優勢:

  • CPU 使用率:NVMe/TCP 通訊會將 NVMe 指令與資料封裝於 TCP 傳輸通訊協定。主機 CPU 會處理這些封裝與解封工作,而且不卸載。將這些作業卸載至專用硬體,CPU 便可專心處理其他關鍵工作,進而改善整體系統效能和 CPU 使用率。

  • 延遲更少:將 NVMe/TCP 通訊工作卸載至專用硬體,可大幅減少處理儲存指令時的延遲。因此,應用程式存取遠端 NVMe 儲存裝置時,回應速度更快,效能也更優異。

  • 資料高效移動:若將非 CPU 應用程式工作卸載至獨立硬體加速器,執行資料移動作業的效率比使用通用型 CPU 高。此方式可有效處理大型資料傳輸與緩衝區管理,減少延遲,提升整體處理量。

  • 提高可擴充性: 卸除 NVMe/TCP 任務可提高大規模儲存部署的可擴充性。系統減輕 CPU 處理網路通訊的負荷後,便可支援更多同時連線與儲存裝置,而且不受 CPU 限制。

  • 能源效率: 通過將某些任務卸載到專用硬體,可以減少主機 CPU 上的功耗。對於耗電量是重要考量的大型資料中心環境,這種能源效率可能格外重要。

ipu 分離式儲存裝置
圖 3.啟用 IPU 的分解存儲

除了上述適用於 NVMe/TCP 儲存工作負載的優勢,IPU 技術系統架構還提供遞增安全隔離選項,將基礎架構服務與租用戶應用程式隔離。這樣一來,便可確保租用戶應用程式發動的網路攻擊,無法入侵儲存裝置、Hypervisor 與 vSwitch 服務。基礎架構服務本身安全無虞,因為 IPU 本身的開機過程安全,而 IPU 則充當主機伺服器的根信任。

Napatech 的整合式軟硬體解決方案

Napatech 為資料中心儲存卸載提供整合式系統層級解決方案,包含在 F2070X IPU 執行的高效能 Link-Storage 軟體堆疊。請參見圖 4

圖 4.Napatech 在 F2070X IPU 執行的儲存卸載

Link-Storage 軟體包含豐富的功能組合,包括:

  • 將 NVMe/TCP 工作負載從主機完全卸載至 IPU;

  • 將TCP工作負載從主機完全卸載到IPU;

  • NVMe 至 TCP 啟動器;

  • 通過存儲性能開發工具包遠端過程調用 (SPDK RPC) 介面進行存儲配置;

  • Multipath NVMe 支援;

  • virtio-blk 介面向主機展示16個塊設備 ;

  • 與 常見 Linux* 發行版中的 標準virtio-blk

  • 主機 CPU 與 IPU 之間的安全隔離,並未向主機暴露任何網路介面。

除了 Link-Storage,F2070X 也支援 Link-Virtualization 軟體,而且該軟體提供卸載加速的虛擬化資料平面,含有 Open vSwitch (OVS)、即時移轉、VM 對 VM 鏡射、VLAN/VxLAN 封裝/解封、Q-in-Q、接收端調整(RSS)負載平衡、連結彙總,以及服務品質(QoS)等各項功能。

由於 F2070X 是以 FPGA 與 CPU 為建置基礎,而非 ASIC,因此部署後可更新平台完整的功能。無論是要修改現有服務、新增功能,還是微調特定效能參數,皆可在現有的伺服器環境中,單純以軟體升級的方式重新設計程式,而且不需要中斷連接、移除或更換任何硬體。

Napatech F2070X IPU

Napatech F2070X IPU 是搭載 Intel® IPU Platform F2000X-PL 的 2x100G PCIe 卡,採用 Intel Agilex® 7 FPGA F 系列與 Intel® Xeon® D 處理器,搭配全高半長(FHHL)的雙插槽外型規格。

F2070X IPU 的標準配置包含有四列 4GB DDR4 記憶體的 Intel Agilex® 7 FPGA AGF023,以及有兩列 8GB DDR4 記憶體的 2.3 GHz Intel® Xeon® D-1736 處理器。若要支援特定工作負載,可以提供其他配置選項。

F2070X IPU 透過PCIe 4.0 x16(16 GTps) 介面連接至主機,並在FPGA與處理器之間附加一個PCIe 4.0 x16(16 GTps) 介面。

兩個前面板 QSFP28/56 網路介面支援以下網路配置:

  • 2x 100G;
  • 8x 10G 或 8x 25G(使用跳接線)。

專用的 PTP RJ45 連接埠透過外部 SMA-F 與內部 MCX-F 連接器,提供選擇性時間同步。支援 IEEE 1588v2 時間戳記。

專用的 RJ45 乙太網路連接器提供板件管理。安全的FPGA映像更新允許在部署 IPU 後添加新功能或更新現有功能。

處理器會執行 Fedora Linux,具備 UEFI BIOS、PXE 開機支援,以及透過 SSH 和 UART 的完整殼層存取權。

Intel IPU F2000X 配接器
Intel® IPU Platform F2000X-PL 配接器