Intel 為新一波超級電腦推動科學研究與效能

在 SC23 上,Intel 分享了如何利用全球超級電腦加速科學研究的進展,並展示 AI 和 HPC 如何推動下一個運算時代。

新聞

  • 2023 年 11 月 13 日

  • 聯絡 Intel PR

  • 關注社群媒體的 Intel 新聞室:

    Twitter 標誌
    YouTube 圖示

author-image

作者

最新消息: SC23上,Intel 展示了人工智慧加速的高效能運算 (HPC),在 Intel® Data Center GPU Max Series、Intel® Gaudi®2 人工智慧加速器和 Intel® Xeon® 處理器的 HPC 和 AI 工作負載方面具有領先效能。Intel 與阿貢國家實驗室合作,分享了Aurora生成式 AI(genAI)專案的進展,包括 Aurora 超級電腦上 1 萬億參數 GPT-3 LLM 的最新資料,這得益于 Max 系列 GPU 的獨特架構和 Aurora 超級電腦的系統功能。Intel 與 Argonne 利用Aurora早期科學計畫 (ESP) 和百萬兆級運算專案的應用程式,展示了科學的發展加速。該公司還展示了通往 Intel® Gaudi®3 人工智慧加速器和Falcon Shores的道路。

「Intel 一直致力於提供創新的技術解決方案,以滿足 HPC 和 AI 社群的需求。Xeon CPU 以及 Max GPU 和 CPU 的優異效能,有助於推動研究和科學發展。再加上我們的高迪加速器,展示了我們全面的技術,為我們的客戶提供令人信服的選擇,以滿足他們的各種工作負載。

– Deepak Patil,Intel 公司副總裁暨資料中心人工智慧解決方案總經理

為什麼重要: 面向科學的生成式 AI,加上最新的效能與評測基準結果,突顯了 Intel 提供量身打造解決方案以滿足高效能運算和 AI 客戶特定需求的能力。Intel 的軟體定義方法具有 oneAPI 和 HPC 以及人工智慧增強的工具組,可説明開發人員跨架構框架無縫移植其代碼,從而加速科學研究。此外,Max 系列 GPU 和 CPU 將部署在即將上線的多台超級電腦中。

關於用於科學的生成式人工智慧: 阿貢國家實驗室(Argonne National Laboratory)與Aurora超級電腦分享其 genAI for Science 計畫的進展。Aurora genAI 專案是與 Argonne、Intel 及其合作夥伴合作的成果,旨在為科學建立最先進的基礎 AI 模型。這些模型將在來自不同科學領域的超過1萬億個參數的科學文本,代碼和科學資料集上進行訓練。使用威震天的基礎技術與DeepSpeed,genAI專案將為多個科學學科提供服務,包括生物學,癌症研究,氣候科學,宇宙學和材料科學。

獨特的 Intel Max 系列 GPU 架構和Aurora超級電腦系統功能,僅用 64 個節點即可高效處理 1 萬億參數模型,遠遠少於通常所需的數量。阿貢國家實驗室在 256 個節點上運行了四個實例,展示了在Aurora並行運行多個實例的能力,為在 10,000 多個節點上使用數萬億個代幣更快地擴展數萬億個參數模型的訓練鋪平了道路。

關於 Intel 和阿貢國家實驗室: Intel 和阿貢國家實驗室展示了 Aurora 上的系統功能和軟體堆疊所帶來的大規模科學加速。1 工作負載示例包括:

 

  • Connectomics ML 大規模啟用腦連接組重建,在 500 多個Aurora節點上顯示出具有競爭力的推斷輸送量。
  • 通用原子與分子電子結構系統 (GAMESS) 使用 Intel Max GPU 的競爭力是 Nvidia A100 的 2 倍以上。這使得藥物和催化劑設計中複雜化學過程的建模成為可能,從而使用Aurora超級電腦解開分子科學的秘密。
  • 硬體/混合加速宇宙學代碼 (HACC) 已證明在 1,500 多個Aurora節點上運行,能夠視覺化和理解宇宙的物理和演化。
  • 藥物篩選 AI 推斷應用程式是 Aurora 藥物發現早期科學專案 (ESP) 的一部分,僅在 256 個節點上就能篩選超過 200 億種合成最多的化合物,從而高效篩選龐大的化學資料集。

 

Intel 也展示了全新的 HPC 和 AI 效能,以及跨硬體和應用程式的軟體優化:

 

  • Intel 與 Dell 共同公佈了 STAC-A2 的結果,STAC-A2 是一個基於真實市場風險分析工作負載的獨立評測基準套件,顯示了金融業的優異表現。相較于八個 Nvidia H100 PCIe GPU,四個 Intel® Data Center GPU Max 1550 的暖希臘 10-100k-1260 效能提升 26%,空間效率提高 4.3 倍。
  • 在各種 HPC 工作負載上,Intel® Data Center GPU Max Series 1550 的平均效能比 Nvidia H100 PCIe 卡高出 36% (1.36x)。
  • Intel Data Center GPU Max Series 改進了對 AI 模型的支援,包括多個大型語言模型 (LLM),如 GPT-J 和 LLAMA2。
  • Intel® Xeon® CPU Max 系列是唯一採用高頻寬記憶體 (HBM) 的 x86 處理器,與 AMD Epyc Genoa 處理器相比,效能平均高出 19%。
  • 上周,MLCommons2發佈了 用於訓練 AI 模型的行業標準 MLPerf 訓練 v3.1 基準測試結果。Intel Gaudi2 展示 在v3.1 訓練 GPT-3 評測基準上實作 FP8 資料類型,效能大幅提升 2 倍。
    • Intel 將在 2024 年迎來 Intel Gaudi3 AI 加速器。Gaudi3 AI加速器將基於與Gaudi2相同的高性能架構,預計將提供4倍的計算(BF16),兩倍的網路頻寬以獲得更大的橫向擴充性能,以及1.5倍的板載HBM記憶體,以隨時應對LLM對高性能,高效率計算不斷增長的需求,而不會降低性能。
  • 如 LAMMPS-Copper 所示,第 5 代 Intel® Xeon® 處理器在 HPC 應用程式上的效能將比前一代提高 1.4 倍。
    • Granite Rapids 是未來的 Intel Xeon 處理器,將提供更多的核心數和內建加速功能,Intel® Advanced Matrix Extensions並支援多工器組合列(MCR)DIMM。Granite Rapids的 DeepMD+LAMMPS AI 推論將提升 2.9 倍。MCR 採用 DDR5,可實現每秒 8,800 次超級傳輸的速度,在雙插槽系統中實現每秒超過 1.5 TB 的記憶體頻寬能力,這對於滿足現代 CPU 快速增長的核心數量以及實現效率和靈活性至關重要。

 

關於 oneAPI 的新進展: Intel 宣佈推出其 2024 年軟體發展工具的功能,這些功能可推進由 oneAPI 多架構程式設計驅動的開放式軟體發展。新工具可説明開發人員擴大覆蓋範圍,在 Intel CPU 和 GPU 上擴展新的 AI 和 HPC 功能,包括更快的效能和使用標準 Python 進行數位工作負載的部署,以及編譯器增強功能,提供近乎完整的 SYCL 2020 實施,以提高生產力和代碼卸載。

此外,德克薩斯州高級計算中心(TACC) 宣佈其oneAPI卓越中心 將專注于開發和優化地震成像基準代碼的專案。Intel 營造了一個軟硬體創新與研究推動產業發展的環境,在全球設有 32 個 oneAPI 卓越中心。

下一步: Intel 強調了其對 AI 和 HPC 的承諾,並強調了市場勢頭。採用 Intel Max 系列 GPU 和 CPU 技術的全新超級電腦部署包括 Aurora、Dawn Phase 1、SuperMUC-NG Phase 2、Clementina XX1 等系統。搭載 Intel Gaudi2 加速器的新系統,包括以穩定 AI 為主要客戶的大型 AI 超級電腦。

這一勢頭將成為 Intel 適用于 AI 和 HPC 的新一代 GPU Falcon Shores 的基礎。Falcon Shores將利用 Intel Gaudi 和 Intel Xe 智慧財產權 (IP),以及基於 oneAPI 構建的單一 GPU 程式設計介面。目前以 Intel Gaudi AI 加速器以及 Intel Max 系列 GPU 為基礎的應用程式,將來將能夠輕鬆遷移到 Falcon Shores。

 

更多背景資訊: Intel Gaudi AI 加速器透過 FP8 軟體與 GPT-3 相比,效能大幅提升 2 倍 | 英國最快的人工智慧超級電腦,由英特爾和戴爾技術提供支援,推動研究