打造最佳化的 High Performance Computing (HPC) 架構與應用程式

全新技術與軟體開發工具可釋放完整 HPC 架構與應用的潛能,滿足使用者、系統建置者與軟體開發人員的需求。

HPC 系統的架構模塊

  • 在設計 HPC 系統時,可能會結合平行運算、叢集運算,以及網格/分散式運算等策略。

  • 透過混合雲端架構,將地端基礎設施與公有雲端資源結合,可依需求彈性擴展,同時降低錯失商機的風險。

  • Intel® HPC 技術涵蓋處理器、記憶體、Intel® 高效能網路與軟體,為高效能且高度可擴充的系統提供堅實基礎。

  • oneAPI 採用開放標準且跨架構的程式設計方式,使 HPC 應用程式能在多種異質架構與分散式運算模型中達到最佳效能。

  • Intel® 函式庫與工具可透過高效程式碼運用與最佳化,協助客戶充分發揮系統效能。

author-image

作者

在當今快速發展的商業環境中,成功導入 HPC 技術的關鍵在於建立明確的 HPC 架構基礎。依據組織的工作負載與運算目標,可選擇不同的 HPC 系統設計與支援資源,以提升生產力並實現可擴充效能。

現代 HPC 架構設計的核心原則

HPC 架構可根據所需採取多種形式。 組織可選擇不同方式,妥善設計 HPC 系統。

跨異構架構的平行運算

異質運算讓 HPC 叢集能處理大型工作負載,並將其拆分為多個可同時執行的計算任務。

這類系統可設計為向上擴充或向外擴充。向上擴充設計是在單一系統內將工作拆分,讓各個核心分工處理,充分運用整體伺服器資源。相對地,向外擴充則是將同一工作拆分為多個部分,分配至多台伺服器或電腦,並以平行方式同時執行。

隨著模擬、建模與進階分析等高強度工作負載日益普及,HPC 系統除了 CPU 外,也開始整合各類加速器。這些加速器帶來更廣泛且多元的異質配置選擇,開發人員需加以支援。

開發者可運用 oneAPI 跨架構程式設計打造單一程式碼庫,在 CPU、GPU 與其他加速器高效執行,讓開發效率更高且效能更優異。oneAPI 打破專有程式設計模型的限制,加速 HPC 創新,不僅簡化採用新硬體的過程,更減輕維護程式碼的負擔。Intel® oneAPI Toolkit 支援 HPC 開發人員常用的現有開放式產業標準和語言,包括 C、C++、SYCL、Fortran、OpenMP、MPI 與 Python。此外,Intel 也與 PyTorch* 等產業標準框架合作,提供整合 AI 與 HPC 的無縫開發體驗,進一步提升效能並推動創新。進一步探索 oneAPI 與 Intel® oneAPI Toolkit

在雲端環境中部署 HPC

過去,HPC 系統受限於內部部署基礎架構可提供的容量及設計。現今,雲端已可透過其他資源擴充本機容量。

雲端運算提供龐大的運算能力,可根據需求有效擴充。您可以在公共雲端執行 HPC 工作負載,或將內部部署基礎架構與公共雲端結合,以擴充可用資源。

採用混合式雲端方法,將內部部署基礎架構與公共 Cloud Services 結合,讓工作負載可在所有可用資源之間順暢流動。這種靈活性讓企業能夠向外擴充,同時有機會調整並最佳化總體擁有成本 (TCO)。

針對新的應用與工作負載,公有雲端也為尚未建置地端基礎設施的企業提供可用服務。

無論是強化地端運算基礎架構,或全面採用雲端,像是複雜模擬或深度學習等 HPC 工作負載,都能受益於 Intel 與雲端服務供應商的深度合作。

為了推動雲端中的 HPC 創新,Intel 與各大雲端服務供應商密切合作,以求最大化效能表現。Intel 運用如 Intel® Trust Domain Extensions(機密運算)與 Intel® Advanced Matrix Extensions(深度學習加速)等技術,強化雲端服務並簡化導入流程。進一步瞭解 HPC 雲端技術如何協助提升成果表現

選擇合適的 HPC 處理器,追求可擴充性與效能

憑藉在 HPC 技術領域的深厚專業,Intel 提供足以應對未來高強度工作負載的卓越效能。Intel® Xeon® 可擴充處理器打造高度靈活的平台,可無縫擴展,以支援關鍵 HPC 工作負載多樣化的效能需求。為進一步加速這些工作負載,Intel 即將推出代號 Crescent Island 的資料中心 GPU,採用 Xe3P 架構打造,針對風冷式伺服器進行功耗與成本最佳化設計,並具備大容量記憶體與高頻寬。本身將支援包含 FP64 在內的完整資料型態,為 AI 與 High Performance Computing 工作負載提供高度彈性。在 Intel Xeon 處理器持續作為運算核心的同時,Crescent Island 則為 AI 與 HPC 工作負載提供 GPU 加速能力。

HPC 架構的記憶體子系統創新

記憶體是 HPC 系統設計不可或缺的元件。記憶體負責系統的短期資料儲存,往往可能成為影響工作流程效能的瓶頸。Intel® Xeon® 6900 系列處理器透過優化儲存與記憶體階層之間的連結,協助資料中心克服這些瓶頸,確保運算資源持續高效運作。

運用 HPC Fabric 擴充效能

Intel 高效能網路 (HPN) 以 Intel 乙太網路全方位產品線為基礎(包含最新 800 系列控制器與網路介面卡),結合硬體層級加速、精準時間技術與 RoCE v2 (RDMA over Converged Ethernet),提供最高達 200GbE 的資料中心級速度,同時降低 CPU 負擔。這些網路具備高度可預測的應用回應時間、極低延遲,以及針對 AI 工作負載、高頻交易與大規模虛擬化所需的 CPU 資源最佳化。現有主流的 HPC 與 AI 中介軟體與框架(包括 oneAPI),可透過 OpenFabrics Interfaces(OFI,又稱 libfabric)與 Intel® Ethernet Fabric Suite 搭配 Intel® HPN 使用。

運用高效能處理器,將 HPC 架構最佳化

Intel 擁有深入理解 HPC 應用、架構與系統需求的專業能力,無論系統部署於地端、雲端或混合式環境,都能協助使用者產出成果並最大化成就。以 Intel® 技術為基礎建構的 HPC 架構,讓您為未來 HPC、百萬兆級與 Zetta 級的需求做好準備。

此外,oneAPI 工具套件可協助開發人員簡化 HPC 程式設計流程,支援更多硬體類型,並最大化企業成果。