英特爾推出第4代Intel Xeon可擴充處理器、Max系列CPU和GPU

獲得業界主要CSP、OEM、ODM和ISV的廣泛採用 呈現AI、網路以及高效能運算方面的全新表現

新聞

author-image

作者

新聞焦點

  • 廣受全球客戶與合作夥伴的採用,如AWS、Cisco、Cloudera、CoreWeave、Dell Technologies、Dropbox、Ericsson、Fujitsu、Google Cloud、Hewlett Packard Enterprise、IBM Cloud、Inspur Information、IONOS、Lenovo、洛色拉莫士國家實驗室(Los Alamos National Laboratory)、Microsoft Azure、NVIDIA、Oracle Cloud、OVHcloud、phoenixNAP、RedHat、SAP、Supermicro、Telefonica以及VMware等(依英文名稱排列)。
  • 在台灣已採用第4代Intel Xeon可擴充處理器的客戶與合作廠商包含ADLINK、Advantech、AIC、Altos、ASRock Rack、ASUS、Compal、GIGABYTE、Giga Computing、Inventec、Lanner、PEGATRON、QCT、Wistron以及Wiwynn(依英文名稱排列),展現在台生態系的強軔實力。
  • 第4代Intel Xeon可擴充處理器和Intel Max系列產品,擁有全球所有CPU當中最豐富的內建加速器,可用於AI、分析、網路、安全、儲存和高效能運算(HPC)等關鍵工作負載,透過特製、工作負載為優先的方式,提供領先的效能。
  • 第4代Intel Xeon可擴充處理器是英特爾最具永續性的資料中心處理器,提供一系列電源和效能最佳化的功能,充分利用CPU資源以協助實現客戶的永續目標。
  • 與前幾代產品相比,第4代Xeon處理器的客戶能夠預期在使用內建加速器時,在目標工作負載的每瓦效能平均提升2.9倍1,特定工作負載在Optimized Power Mode、效能損失最少的情況下,每個CPU可節省最高70瓦2的耗電量,並將總擁有成本(TCO)降低52%〜66%3

 

2023年1月11日-英特爾於今(11)日推出第4代Intel® Xeon®可擴充處理器(代號Sapphire Rapids)、Intel® Xeon® CPU Max系列(代號Sapphire Rapids HBM)以及Intel® Data Center GPU Max系列(代號Ponte Vecchio),是英特爾最重要的劃時代革新產品之一,顯著提升客戶資料中心的效能、效率、安全性,並為AI、雲端、網路和邊緣、以及全球最強大的超級電腦提供各項新功能。

英特爾與客戶和合作夥伴一同透過第4代Xeon處理器,以大規模的方式提供具差異化的解決方案和系統來解決他們所面臨難度最高的運算挑戰。英特爾的獨特之處在於能夠提供特製、以工作負載為優先的加速器,及針對特定工作負載達成高度最佳化的軟體,讓英特爾能夠以適當的功耗提供確切的效能,進而實現最佳的整體總擁有成本。

更多內容:第4代Intel Xeon可擴充處理器(媒體資料)| 英特爾推出第4代Xeon可擴充處理器與Max系列(活動影片)

此外,作為英特爾最具永續性的資料中心處理器,第4代Xeon處理器提供客戶一系列電源和效能管理功能,能最佳化使用CPU資源,協助達成客戶的永續目標。

英特爾執行副總裁暨資料中心與AI事業群總經理Sandra Rivera表示:「第4代Xeon可擴充處理器和Max系列產品的推出,是加速英特爾再造顛峰的關鍵時刻,不僅延續我們在資料中心的領先地位,更同時跨足新領域。英特爾的第4代Xeon和Max系列產品提供客戶群真正所需要的,於安全的環境中實現領先的效能和可靠性,滿足客戶的實際需求,在更短的時間內實現價值並同時驅動客戶的創新步伐。」

與市場上其它資料中心處理器不同,已交付至客戶手中的第4代Xeon大幅拓展了英特爾特製、以工作負載為優先的策略和方式。

擁有最豐富的內建加速器,達成領先效能和永續優勢

時至今日,市面上有超過1億個Xeon處理器被安裝使用-從執行新式即服務(as-a-service)商業模式等IT服務的內部伺服器,到管理網際網路流量的網路設備,再到邊緣的無線基地台運算,以及雲端服務。

以數十年的資料中心、網路與智慧邊緣創新和領先地位作為基礎,新款第4代Xeon處理器提供領先的效能,為全球擁有最多內建加速器的CPU,解決客戶在AI、分析、網路、安全、儲存和HPC方面最重要的運算挑戰。

與前幾代產品相比,第4代Xeon處理器的客戶能夠預期在使用內建加速器時,目標工作負載的每瓦效能平均提升2.9倍1,在Optimized Power Mode、效能損失最少的情況下,每個CPU可節省最高70瓦2的耗電量,並將TCO降低52%〜66%3

永續性

第4代Xeon內建加速器的廣泛性,意味著英特爾從平台層級降低功耗,減少對額外獨立加速器的需求,並協助客戶達成其永續目標。此外,新的Optimized Power Mode能夠針對特定的工作負載,在影響效能不到5%的情況下,節省高達20%的處理器插槽功耗11。空氣和液體冷卻方面的創新能夠進一步減少資料中心整體能源消耗量;至於第4代Xeon的製造,則是透過擁有最先進水資源回收設施的英特爾站點位置,採用90%或以上的可再生電力進行生產。

人工智慧

與前一世代相比,第4代Xeon處理器在AI領域透過內建Intel® Advanced Matrix Extension(Intel® AMX)加速器,達成最高10倍5,6的PyTorch即時推論和訓練效能。英特爾的第4代Xeon為廣泛的AI工作負載的推論和訓練釋放了全新的效能水準。Xeon CPU Max系列拓展了這些能力,在自然語言處理能力上,客戶在大型語言模型的運算速度上發現了最高20倍的提升12。隨著提供英特爾AI軟體套件,開發者能夠運用所選擇的AI工具,提升生產力並加速AI開發時程。這款套件能夠從工作站移植到雲端並擴展到邊緣運算。目前它已被橫跨各種業務領域最常見的AI使用案例,超過400個機器學習和深度學習的AI模型所驗證。

網路

第4代Xeon提供一系列專為高效能、低延遲的網路和邊緣工作負載進行最佳化的多款處理器。這些處理器是電信、零售到製造和智慧城市等產業,推動更多在未來以軟體定義為基礎的關鍵角色。針對5G核心工作負載,內建加速器有助於提升吞吐量和降低延遲,電源管理方面的進步則同時提升平台的回應性和效率。同時與前幾代相比,第4代Xeon在不增加功耗的情況下,提供最高2倍的虛擬化無線接取網路(vRAN)容量。這讓通訊服務供應商能夠將每瓦效能提升1倍,滿足其關鍵效能、擴展和能源效率的需求。

高效能運算

第4代Xeon和Intel Max系列產品帶來一個可擴展的平衡架構,將CPU和GPU與oneAPI開放式軟體生態系整合在一起,應用在HPC和AI之中要求嚴苛的運算工作負載,解決世界上最具挑戰性的問題。

Xeon CPU Max系列是首款也是唯一一款搭載高頻寬記憶體的x86處理器,無需修改程式碼即可加速許多HPC工作負載。Intel Data Center GPU Max系列是英特爾電晶體密度最高的處理器,將推出多種外型尺寸,滿足不同客戶的需求。

Xeon CPU Max系列在封裝上提供64GB的高頻寬記憶體(HBM2e),顯著提升HPC和AI工作負載的資料吞吐量。與頂級的第3代Intel® Xeon®可擴充處理器相比,Xeon CPU Max系列在能源和地球系統建模等一系列實際應用當中,提供最高3.7倍10的效能。

更進一步地,Data Center GPU Max系列將超過1,000億個電晶體裝載至具備47個晶片塊(tile)的單一封裝,為物理學、金融服務和生命科學等具有挑戰性的工作負載,將吞吐量提升至新的境界。與Xeon CPU Max系列搭配,執行LAMMPS分子動力學模擬器時,該組合平台的效能比前一代產品高出12.8倍。13

迄今功能最豐富、最安全的Xeon平台

第4代Xeon作為英特爾最大的平台轉型,不僅提供令人驚豔的加速器,更是在製造方面有所成就,在單一封裝結合最高4個採用Intel 7打造的晶片塊,透過英特爾EMIB(嵌入式多晶片互連橋接)封裝技術進行連接,並提供新功能,包含提升記憶體頻寬的DDR5、提升I/O頻寬的PCIe 5.0和Compute Express Link(CXL) 1.1互連。

安全是這一切的基礎。藉由第4代Xeon,英特爾提供業界最為全面的機密運算產品組合,強化資料安全、法規遵循和資料主權。英特爾仍是唯一一家透過Intel® Software Guard Extensions(Intel® SGX)為資料中心運算提供應用程式隔離的晶片供應商,為私有、公共以及雲端到邊緣環境的機密運算,提供當今最小的攻擊面。此外,英特爾新的虛擬機(VM)隔離技術-Intel® Trust Domain Extensions(Intel® TDX),是現有應用移植至機密環境的理想選擇,將首次與Microsoft Azure、Alibaba Cloud、Google Cloud和IBM Cloud一同亮相。

最後,第4代Xeon的模組化架構,讓英特爾能夠為客戶的使用案例或應用提供一系列廣泛的處理器,從主流通用型號,再到專門為雲端、資料庫和分析、網路、儲存,以及單插槽邊緣使用案例所設計的型號,其數量將近50款。第4代Xeon處理器系列支援On Demand並提供多種核心數量、時脈、加速器組合,功耗範圍和記憶體吞吐量,適合多樣化的使用案例,並滿足客戶實際需求的外型尺寸。

 

型號列表:第4代Intel Xeon和Intel Xeon CPU Max系列型號列表

¹ Geomean of following workloads:  RocksDB (IAA vs ZTD), ClickHouse (IAA vs ZTD), SPDK large media and database request proxies (DSA vs out of box), Image Classification ResNet-50 (AMX vs VNNI), Object Detection SSD-ResNet-34 (AMX vs VNNI), QATzip (QAT vs zlib)

² 1-node, Intel Reference Validation Platform, 2x Intel® Xeon 8480+ (56C, 2GHz, 350W TDP), HT On,  Turbo ON,  Total Memory: 1 TB (16 slots/ 64GB/ 4800 MHz), 1x P4510 3.84TB NVMe PCIe Gen4 drive, BIOS: 0091.D05, (ucode:0x2b0000c0),  CentOS Stream 8, 5.15.0-spr.bkc.pc.10.4.11.x86_64, Java Perf/Watt w/ openjdk-11+28_linux-x64_bin, 112 instances, 1550MB Initial/Max heap size, Tested by Intel as of Oct 2022.

³ ResNet50 Image Classification

New Configuration: 1-node, 2x pre-production 4th Gen Intel® Xeon® Scalable 8490H processor (60 core) with Intel® Advanced Matrix Extensions (Intel AMX),  on pre-production SuperMicro SYS-221H-TNR with 1024GB DDR5 memory (16x64 GB), microcode 0x2b0000c0, HT On, Turbo On, SNC Off, CentOS Stream 8, 5.19.16-301.fc37.x86_64, 1x3.84TB P5510 NVMe, 10GbE x540-AT2, Intel TF 2.10, AI Model=Resnet 50 v1_5, best scores achieved: BS1 AMX 1 core/instance (max. 15ms SLA),  using physical cores, tested by Intel November  2022. Baseline: 1-node, 2x production 3rd Gen Intel Xeon Scalable 8380 Processor (40 cores) on SuperMicro SYS-220U-TNR, DDR4 memory total 1024GB (16x64 GB), microcode 0xd000375, HT On, Turbo On, SNC Off, CentOS Stream 8, 5.19.16-301.fc37.x86_64, 1x3.84TB P5510 NVMe, 10GbE x540-AT2, Intel TF 2.10, AI Model=Resnet 50 v1_5, best scores achieved: BS1 INT8 2 cores/instance (max. 15ms SLA), using physical cores, tested by Intel November 2022.

For a 50 server fleet of 3rd Gen Xeon 8380 (RN50 w/DLBoost), estimated as of November 2022:

CapEx costs: $1.64M

OpEx costs (4 year, includes power and cooling utility costs, infrastructure and hardware maintenance costs): $739.9K

Energy use in kWh (4 year, per server): 44627, PUE 1.6

Other assumptions:  utility cost $0.1/kWh, kWh to kg CO2 factor 0.42394

For a 17 server fleet of 4th Gen Xeon 8490H (RN50 w/AMX), estimated as of November 2022:

CapEx costs: $799.4K

OpEx costs (4 year, includes power and cooling utility costs, infrastructure and hardware maintenance costs): $275.3K

Energy use in kWh (4 year, per server): 58581, PUE 1.6

AI -- 55% lower TCO by deploying fewer 4th Gen Intel® Xeon® processor-based servers to meet the same performance requirement. See [E7] at intel.com/processorclaims: 4th Gen Intel Xeon Scalable processors. Results may vary.

Database -- 52% lower TCO by deploying fewer 4th Gen Intel® Xeon® processor-based servers to meet the same performance requirement. See [E8] at intel.com/processorclaims: 4th Gen Intel Xeon Scalable processors. Results may vary.

HPC -- 66% lower TCO by deploying fewer Intel® Xeon® CPU Max processor-based servers to meet the same performance requirement. See [E9] at intel.com/processorclaims: 4th Gen Intel Xeon Scalable processors. Results may vary.

4 Geomean of HP Linpack, Stream Triad, SPECrate2017_fp_base est, SPECrate2017_int_base est. See [G2, G4, G6] at intel.com/processorclaims: 4th Gen Intel Xeon Scalable.

5 Up to 10x higher PyTorch real-time inference performance with built-in Intel® Advanced Matrix Extensions (Intel® AMX) (BF16) vs. the prior generation (FP32)

PyTorch geomean of ResNet50, Bert-Large, MaskRCNN, SSD-ResNet34, RNN-T, Resnext101.

6 Up to 10x higher PyTorch training performance with built-in Intel® Advanced Matrix Extensions (Intel® AMX) (BF16) vs. the prior generation (FP32)

PyTorch geomean of ResNet50, Bert-Large, DLRM, MaskRCNN, SSD-ResNet34, RNN-T.

7 Estimated as of 8/30/2022 based on 4th generation Intel® Xeon® Scalable processor architecture improvements vs 3rd generation Intel® Xeon® Scalable processor at similar core count, socket power and frequency on a test scenario using FlexRAN™ software. Results may vary.

8 Up to 95% fewer cores and 2x higher level 1 compression throughput with 4th Gen Intel Xeon Platinum 8490H using integrated Intel QAT vs. prior generation.

8490H: 1-node, pre-production platform with 2x 4th Gen Intel® Xeon Scalable Processor (60 core) with integrated Intel QuickAssist Accelerator (Intel QAT), QAT device utilized=8(2 sockets active), with Total 1024GB (16x64 GB) DDR5 memory, microcode 0xf000380, HT On, Turbo Off, SNC Off, Ubuntu 22.04.1 LTS, 5.15.0-47-generic, 1x 1.92TB Intel® SSDSC2KG01, QAT v20.l.0.9.1 , QATzip v1.0.9 , ISA-L v2.3.0, tested by Intel September 2022.

8380: 1-node, 2x 3rd Gen Intel Xeon Scalable Processors (40 cores) on Coyote Pass platform, DDR4 memory total 1024GB (16x64 GB), microcode 0xd000375, HT On, Turbo Off, SNC Off, Ubuntu 22.04.1 LTS, 5.15.0-47-generic, 1x 1.92TB Intel SSDSC2KG01,QAT v1.7.l.4.16,  QATzip v1.0.9 , ISA-L v2.3.0, tested by Intel October 2022.

9 Up to 3x higher RocksDB performance with 4th Gen Intel Xeon Platinum 8490H using integrated Intel IAA vs. prior generation.

8490H: 1-node, pre-production Intel platform with 2x 4th Gen Intel Xeon Scalable Processor (60 cores) with integrated Intel In-Memory Analytics Accelerator (Intel IAA), HT On, Turbo On, Total Memory 1024GB (16x64GB DDR5 4800), microcode 0xf000380,  1x 1.92TB INTEL SSDSC2KG01, Ubuntu 22.04.1 LTS, 5.18.12-051812-generic, QPL v0.1.21,accel-config-v3.4.6.4, ZSTD v1.5.2, RocksDB v6.4.6 (db_bench), tested by Intel  September 2022.

8380: 1-node, 2x 3rd Gen Intel Xeon Scalable Processors( 40 cores) on Coyote Pass platform, HT On, Turbo On, SNC Off, Total Memory 1024GB (16x64GB DDR4 3200), microcode 0xd000375, 1x 1.92TB INTEL SSDSC2KG01, Ubuntu 22.04.1 LTS, 5.18.12-051812-generic,  ZSTD v1.5.2, RocksDB v6.4.6 (db_bench), tested by Intel  October 2022.

10 Intel® Xeon® 8380: Test by Intel as of 10/7/2022. 1-node, 2x Intel® Xeon® 8380 CPU, HT On, Turbo On, Total Memory 256 GB (16x16GB 3200MT/s DDR4), BIOS Version SE5C620.86B.01.01.0006.2207150335, ucode revision=0xd000375, Rocky Linux 8.6, Linux version 4.18.0-372.26.1.el8_6.crt1.x86_64, YASK v3.05.07

Intel® Xeon® CPU Max Series: Test by Intel as of ww36’22. 1-node, 2x Intel® Xeon® CPU Max SeriesHT On, Turbo On, SNC4, Total Memory 128 GB (8x16GB HBM2 3200MT/s), BIOS Version SE5C7411.86B.8424.D03.2208100444, ucode revision=0x2c000020, CentOS Stream 8, Linux version 5.19.0-rc6.0712.intel_next.1.x86_64+server, YASK v3.05.07.

11 Up to 20% system power savings utilizing 4th Gen Xeon Scalable with Optimized Power mode on vs off on select workloads including SpecJBB, SPECINT and NIGNX key handshake.

12 AMD Milan: Tested by Numenta as of 11/28/2022. 1-node, 2x AMD EPYC 7R13 on AWS m6a.48xlarge, 768 GB DDR4-3200, Ubuntu 20.04 Kernel 5.15, OpenVINO 2022.3, BERT-Large, Sequence Length 512, Batch Size 1

Intel® Xeon® 8480+: Tested by Numenta as of 11/28/2022. 1-node, 2x Intel® Xeon® 8480+, 512 GB DDR5-4800, Ubuntu 22.04 Kernel 5.17, OpenVINO 2022.3, Numenta-Optimized BERT-Large, Sequence Length 512, Batch Size 1

Intel® Xeon® Max 9468: Tested by Numenta as of 11/30/2022. 1-node, 2x Intel® Xeon® Max 9468, 128 GB HBM2e 3200 MT/s, Ubuntu 22.04 Kernel 5.15, OpenVINO 2022.3, Numenta-Optimized BERT-Large, Sequence Length 512, Batch Size 1

13 Intel® Xeon® 8380: Test by Intel as of 10/28/2022. 1-node, 2x Intel® Xeon® 8380 CPU, HT On, Turbo On, Total Memory 256 GB (16x16GB 3200MT/s, Dual-Rank), BIOS Version SE5C6200.86B.0020.P23.2103261309, ucode revision=0xd000270, Rocky Linux 8.6, Linux version 4.18.0-372.19.1.el8_6.crt1.x86_64

Intel® Xeon® CPU Max Series HBM: Test by Intel as of 10/28/2022. 1-node, 2x Intel® Xeon® Max 9480, HT On, Turbo On, Total Memory 128 GB HBM2e, BIOS EGSDCRB1.DWR.0085.D12.2207281916, ucode 0xac000040, SUSE Linux Enterprise Server 15 SP3, Kernel 5.3.18, oneAPI 2022.3.0

Intel® Data Center GPU Max Series with DDR Host: Test by Intel as of 10/28/2022. 1-node, 2x Intel® Xeon® Max 9480, HT On, Turbo On, Total Memory 1024 GB DDR5-4800 + 128 GB HBM2e, Memory Mode: Flat, HBM2e not used, 6x Intel® Data Center GPU Max Series, BIOS EGSDCRB1.DWR.0085.D12.2207281916, ucode 0xac000040, Agama pvc-prq-54, SUSE Linux Enterprise Server 15 SP3, Kernel 5.3.18, oneAPI 2022.3.0

Intel® Data Center GPU Max Series with HBM Host: Test by Intel as of 10/28/2022. 1-node, 2x Intel® Xeon® Max 9480, HT On, Turbo On, Total Memory 128 GB HBM2e, 6x Intel® Data Center GPU Max Series, BIOS EGSDCRB1.DWR.0085.D12.2207281916, ucode 0xac000040, Agama pvc-prq-54, SUSE Linux Enterprise Server 15 SP3, Kernel 5.3.18, oneAPI 2022.3.0