京都大學提升高效能運算效能

京都大學的 ACCMS 將 Intel® Xeon® Max 系列 CPU 的效用發揮到極致,提升科學調查的速度與效率。

概覽:

  • 京都大學是運算與媒體學術中心(ACCMS)的所在地。ACCMS 支援運算與媒體的學術研究,並託管多個運算研究的高效能運算系統。

  • 他們持續追求最佳化,因此與 Intel 合作更新超級運算系統。這些新的系統採用最新的 Intel® Xeon® Max 系列 CPU 打造,旨在滿足使用者的需求,實現卓越的高效能記憶體頻寬、擴充的記憶體容量,以及在良好平衡的高效能運算基礎架構中,達成最佳平行效能。

author-image

作者

京都大學位居技術創新和學術卓越的最前線,是運算與媒體研究學術中心(ACCMS)的所在地,後者為先進運算與媒體研究中心的活躍重鎮。多年來,ACCMS 憑藉自身最先進的運算資源,成為推動前所未有的科學研究與開發的兵家重鎮。這種不斷的發展體現出我們致力於站在技術發展的最前線,突破運算研究的界線。

然而,在締造這些進展的同時,某些挑戰顯然持續存在。許多對研究流程不可或缺的複雜模擬程式碼,都受到現有高效能運算(HPC)資源中記憶體頻寬的限制。簡而言之,這些程式碼從記憶體讀取或寫入記憶體的速度,成為一個瓶頸,影響其整體效能。

這種記憶體頻寬限制為運算研究人員帶來持續不斷的挑戰。為了將程式碼的效能發揮到極致,他們努力設法在這些限制範圍內,最佳化程式碼。這可能關乎更有效率地使用記憶體、調整程式碼以更符合高效能運算系統的記憶體等級,甚至開發較不依賴記憶體頻寬的新演算法和技術。

正是這種對最佳化的不懈追求,促成京都大學與 Intel 協作,更新超級運算系統。這些新的系統採用最新的 Intel® Xeon® Max 系列 CPU 打造,旨在滿足使用者的需求,實現卓越的高效能記憶體頻寬、擴充的記憶體容量,以及在良好平衡的高效能運算(HPC)基礎架構中,達成最佳平行效能。

「我們必須為京都大學系統中的應用程式,提供易於使用的 CPU,即高 B/F 值、搭載 DDR5 的 x86 CPU,以及大型記憶體 x86 系統。根據我們的研究,除了 Intel® Xeon® Max 系列 CPU 之外,沒有別的 CPU 符合我們的需求。」—京都大學 ACCMS 運算研究部副教授 Keiichiro Fukazawa

增強運算資源的需求

若要得到有效的科學研究,加速產生成果是一大目標。除了需要更快的執行時間,研究人員還得應對許多關鍵挑戰。這些挑戰範圍廣泛,從資料管理和分析的複雜性,到對先進運算資源的需求。研究人員若要加快科學發現並加速創新,就一定要瞭解並因應這些挑戰。

運算發展神速,導致對更快、更大型計算的需求與日俱增。對於京都大學而言,隨著複雜性和運算需求的增加,顯而易見的是對更強大資源的需求。這些先進的資源對於提供運算能力至關重要,以便在更短的時間提供成果並提高研究生產力。然而,除了需要更快的執行時間,另一項關鍵挑戰是,隨著工作負載增加及需要處理更大規模的任務,每個節點需要更多的記憶體頻寬。

「為了追求進步的研究成果,研究人員不斷努力推動更快、更廣泛的程式執行,」京都大學 ACCMS 運算研究部副教授 Keiichiro Fukazawa 解釋道。「他們的具體需求集中在,每個節點是否需要大量分配記憶體,」他補充道。

尋找解決方案

強調以更快的處理速度和更大的記憶體容量,來迅速取得科學成果,反映了研究界的持續努力。這對於提升運算系統的效率和能力非常重要,如此才能應對日益複雜、資料密集型的科學挑戰。這正是京都大學開始更新 ACCMS 高效能運算系統時所追求的目標。

Fukazawa 教授說明:「幾年前,我們主要的高效能運算系統是以 Intel® Xeon Phi™ 處理器 7250 為核心配置。這項設定包括 16 GB 的 MCDRAM,儘管峰值效能為 3 TFlops,但頻寬卻約為每單位 400 GB/s,因此 B/F 值為 0.1333。相較於當時的 DDR4 記憶體,此值代表更高的頻寬。然而,在上一套系統實施約末五年後,電腦技術的發展突飛猛進,人們對更快速、更大型運算的需求也隨之增加。此外,在 Intel Xeon Phi 處理器上,我們也觀察到非向量化應用程式的效能下降,而這似乎源於 CPU 核心的問題。」

在高效能運算和超級運算中,大規模模擬和複雜運算十分普遍,最佳化系統效能需要同時考慮運算能力和資料傳輸效率。位元組/浮點值(B/F 值)透過指示每個浮點運算所需的資料移動量,深入瞭解系統如何利用運算資源。有鑑於此,Fukazawa 教授強調了一個事實,那就是迫切需要利用具有高 B/F 值的 CPU 來增強現有系統。

因此,ACCMS 在 Fukazawa 教授的指導下,承擔起設計採用尖端技術新系統的任務,以滿足高效能運算(HPC)中,對更高記憶體頻寬效能的迫切需求。這些系統的核心設計原則以三款配置系統為中心。「我們在三代之前便啟用三款配置系統,注重多核心處理能力,並為程式碼、通用用途和大型記憶體需求提供高記憶體頻寬,」Fukazawa 教授表示。

圖 1。ACCMS 三款配置系統。

他進一步闡明這項策略的目標:「在這三種系統類型(圖 1)— 系統 A(Camphor 3)、系統 B(Laurel 3)和系統 C(Cinnamon 3)中 — 大部分使用者主要使用的是 Camphor 3。這些使用者主要從事的研究,涉及使用客製的科學運算應用程式。許多使用者的確偏好使用這段期間所建立的原始應用程式。基本上,在 Camphor 3 上執行的應用程式,有超過 80% 必須實現高 B/F 值。因此需要一個能滿足這些需求的 CPU。」

將 Intel® Xeon® 處理器的能力發揮到極致,實現最佳效能

為了實現新設計,Fukazawa 教授及其團隊研究最新技術,並執行最新 Intel Xeon Max 系列 CPU 的評測基準。這一點至關重要,因為 Intel® Xeon® 處理器提供了最大的價值,尤其是在 CPU 效能方面。Intel Xeon Max 系列 CPU 透過高頻寬記憶體(HBM)為 Intel® Xeon® 可擴充處理器提供超強效能,旨在釋放資料密集型工作負載的效能,並加快探索速度,例如建模、人工智慧、深度學習、高效能運算(HPC)和資料分析。

Intel Xeon Max 系列 CPU 經過最佳化,可利用各種軟體生態系統,包括編譯器、數學資料庫、開放原始碼應用程式等。另一項關鍵優勢是 Intel Xeon Max 系列 CPU 提供順暢的體驗,可在各種工作負載上實現最佳效能。除了效能優勢,搭載 Intel Xeon Max 系列 CPU 的系統也支援 HBM,提升整體效能並加速研究進程。這表示研究人員可以將寶貴的時間專注於真正的研究工作,而不是耗費在編寫與最佳化程式。

Fukazawa 教授解釋他選擇 Intel Xeon Max 系列 CPU 的原因:「我們需要為京都大學系統中的應用程式,提供便於使用的 CPU,即高 B/F 值、搭載 DDR5 的 x86 CPU,以及大型記憶體系統 x86 系統。根據我們的研究,除了 Intel 之外,沒有符合我們需求的 CPU。」他進一步補充道:「更新系統時必須選擇具有最高 B/F 值的配置。當時必須選擇配備 HBM 記憶體的 CPU,而選項不可避免地縮窄成兩種:Intel Xeon Max 系列 CPU 和另一款 CPU。然而,考慮到運算效能時,即使我們使用不同選項的 CPU,運算效能也大約只有 Intel Xeon Max 系列 CPU 的一半,因此 Xeon CPU Max 是符合我們需求的理想選擇。」

「反觀 Laurel 3 對 B/F 值的需求不如 Camphor 3 那麼高,但仍有一系列考量強調需要更寬的記憶體頻寬。因此,我們開始考慮使用 DDR5 的可能性,但在考慮的同時,很少有正式支援 DDR5 並符合所需效能的 CPU 選項,因此我們對幾款候選產品進行評測基準,並得出了結果。最後,考量採購的時機和其他因素,我們選了第 4 代 Intel Xeon 可擴充處理器。」Fukazawa 教授補充道。

圖 2。Camphor SPR+HBM 與 KNL 系統的比較。

提供有影響力的結果

隨著新系統的部署,京都大學開始看到顯著的效能提升。Fukazawa 教授表示:「根據與前一代系統比較,Camphor 3 的平均速度提升 4.7 倍,1 而 Laurel 3 的平均速度提升 3.7 倍。」1 (圖 2 和圖 3)

圖 3。Laurel SPR+DDR 與 Broadwell 系統的比較。

Fukazawa 教授強調 Intel Xeon Max 系列 CPU 在推動這項效能優勢中扮演了關鍵的角色,他說:「我們在中心進行名為程式編碼支援聯合研究的研究。這涉及接收使用者的程式碼,在大約一年內最佳化,然後返還給使用者。以 Intel Xeon Phi 處理器為例,通常需要對應用程式進行相應的最佳化,才能發揮效能。然而,對於 Intel Xeon Max 系列 CPU,直接使用 Intel 的編譯器與數學核心程式庫,無需任何特殊最佳化即可輕鬆擷取效能。」

為了進一步說明這一點,Fukazawa 教授舉了幾個例子,闡明 Intel Xeon Max 系列 CPU 如何在推動研發過程中發揮關鍵作用:「我在最近參與的一個專案中開發一項應用程式,利用 3D MHD 模擬解決全球木星磁層的問題。這是一項高 B/F 值應用,由於磁層規模巨大、網格間距較小,因此需要一年多的時間來觀察時間演變。不過,利用 Intel Xeon Max 系列 CPU,我能夠以兩倍以上的速度取得成果。另一個例子是一般循環模型(GCM),用來利用各種參數進行模擬,研究全球暖化的影響。GCM 也是一項高 B/F 應用,可讓研究人員從 Intel Xeon Max 系列 CPU 中受益。這項應用有助於利用多個參數進行模擬,辨識可緩解全球暖化的參數。」

為未來做好準備

京都大學的 ACCMS 是學術卓越與創新的燈塔,致力於為日本在先進研究領域的領航地位開疆闢土。ACCMS 堅定不移地追求知識與突破,準備繼續在各個學科領域展開富有影響力的學術研究。

為了履行這項承諾,全球技術領導者 Intel 已蓄勢待發要發揮關鍵作用。透過為 ACCMS 提供強大的技術支援,Intel 旨在拓展它在學術研究方面的影響力,推動探索科學、技術和各個領域的新疆界。這項合作努力不僅代表京都大學追求學術發展的承諾,也彰顯為日本國內外不同領域之整體發展和進步,做出貢獻的決心。透過這項合作,Intel 致力於成為轉型進步的催化劑,不僅要培育創新,更要塑造多個領域學術研究的未來。

Intel 日本工業業務部高效能運算業務開發總監 Katsumi Yazawa 重申,有必要進一步推動這項合作,並實現京都大學立下的里程碑,他表示:「我們完全明白 B/F 值在高效能運算市場中的重要性。然而,實施 HBM 並落實高記憶體頻寬的解決方案,勢必所費不貲。因此,Intel 瞭解這些需求,並正在考量各種新的記憶體技術。我們期望在不久後的未來提供與 DDR 外型規格相同、但能實現近兩倍的記憶體頻寬的 MCR-DIMM,進而提升 B/F 值。作為京都大學值得信賴的顧問,Intel 始終致力於加強合作,並期待在我們的長期合作關係中,提供滿足 HBM 解決方案需求的藍圖。」

下載 PDF ›