Performance for High Performance Computing (HPC) Platforms1 2

Performance for High Performance Computing (HPC) Platforms<sup>1</sup> <sup>2</sup> <sup></sup>

Performance for High Performance Computing (HPC) Platforms1 2

The latest Intel platform delivers the capability and agility to reduce the need for dedicated systems running specialized hardware and software for unique workloads. In addition, the 2nd Gen Intel® Xeon® Scalable processor offers outstanding performance across the board: Compute, floating point, deep learning, memory bandwidth, platform technologies, density, and real-world application ...performance.

Intel® Xeon® Scalable Processors

Workload-optimized to support high-demand applications and drive actionable insight.

Learn more

Maximize Processor Performance and Memory Bandwidth

The Intel® Server System S9200WK product family is a purpose built, performance-optimized data center block ideal for use in high performance computing (HPC) and AI applications.

Learn more

Breakthrough Performance for Your Real-World Challenges

From AI and analytics to simulation and modeling, Intel's high performance computing (HPC) platform integrates powerful memory, storage, fabric, and acceleration to tackle your biggest challenges.

Learn more

相關影片

產品與效能資訊

1

運用 Intel® Deep Learning Boost (Intel DL Boost) 的 Intel® Xeon® Platinum 9282 處理器,推斷輸送量提高 30 倍:依據 Intel 截至 2019 年 2 月 26 日所做之測試。平台:Dragon rock 2 插槽 Intel® Xeon® Platinum 9282(每一插槽 56 核心),開啟超執行緒,開啟渦輪加速,總記憶體 768 GB(24 插槽/ 32 GB/ 2933 MHz),BIOS:SE5C620.86B.0D.01.0241.112020180249,Centos* 7 Kernel 3.10.0-957.5.1.el7.x86_64,深度學習框架:適用於以下 Caffe* 版本的 Intel® 最佳化:https://github.com/intel/caffe d554cbf1,ICC 2019.2.187,MKL DNN 版本:v0.17(認可雜湊:830a10059a018cd2634d94195140cf2d8790a75a),型號:https://github.com/intel/caffe/blob/master/models/intel_optimized_models/int8/resnet50_int8_full_conv.prototxt,BS=64,無資料層 syntheticData:3x224x224,56 執行個體/2 插槽,資料類型:INT8;相較於依據 Intel 截至 2017年 7 月 11 日所做之測試:2S Intel® Xeon® Platinum 8180 CPU @ 2.50GHz(28 核心),停用超執行緒,停用渦輪加速,擴充管理員透過 intel_pstate 驅動程式設定為「performance」,384GB DDR4-2666 ECC RAM。CentOS* Linux 版本 7.3.1611 (Core),Linux 核心 3.10.0-514.10.2.el7.x86_64。固態硬碟:Intel® SSD DC S3700 系列(800GB,2.5 吋 SATA 6Gb/s,25 奈米,MLC)。效能測量使用:環境變數:KMP_AFFINITY='granularity=fine, compact‘, OMP_NUM_THREADS=56,CPU 頻率設定為 cpupower frequency-set -d 2.5G -u 3.8G -g performance。Caffe:(http://github.com/intel/caffe/),修訂版 f96b759f71b2281835f690af267158b82b150b5c。推斷以「caffe time --forward_only」指令測量;訓練以「caffe time」指令測量。對於「ConvNet」拓撲,使用綜合資料集。對於其他拓撲,在訓練前,資料儲存於本機儲存裝置上,並在記憶體中快取。拓撲規格來自於 https://github.com/intel/caffe/tree/master/models/intel_optimized_models (ResNet-50)。Intel® C++ 編譯器版本 17.0.2 20170213,Intel® 數學核心程式庫小型程式庫版本 2018.0.20170425。Caffe 以「numactl -l」執行。

2

相較於大規模(4 節點、8 節點)的 AMD* EPYC* 7601,搭載第 2 代 Intel® Xeon® Platinum 9242 處理器的 Linpack 效能提高 4 倍。

Intel® Xeon® 9242 處理器:
Intel 參考平台,搭載 2S Intel® Xeon® 9242 處理器(2.2GHz,48 核心),16x16GB DDR4-2933,1 個 SSD,叢集檔案系統:2.12.0-1(伺服器)2.11.0-14.1(用戶端),BIOS:PLYXCRB1.86B.0572.D02.1901180818,微碼:0x4000017,CentOS* 7.6,核心:3.10.0-957.5.1.el7.x86_64,OFED 堆疊:RH7.5 上的 OFED OPA 10.8 與 Lustre v2.10.4,HBA:100Gbps Intel® Omni-Path Architecture (Intel® OPA) 1 埠 PCIe* x16,交換器:(Intel® OPA) Edge Switch 100 系列 48 埠,HPL 2.1,Intel 編譯器 2019u1,Intel® 數學核心程式庫 2019,Intel MPI 2019u1,超執行緒=開啟,渦輪加速=關閉,每核心為 2 執行緒,4 節點=20,408.00,8 節點=39921 GF/s,越高越好,Intel 於 2019 年 3 月 3 日測試。

AMD EPYC 7601
:Supermicro AS -1023US-TR4,2S AMD EPYC 7601(2.2GHz,32 核心),16x16GB DDR4-2666,1 個 SSD,BIOS 版本:1.1b (2018/8/20),微碼版本:0x8001227,Oracle* Linux Server 7.5 版 (3.10.0-862.14.4.el7.crt1.x86_64),叢集檔案系統:Panasas(124 TB 儲存容量),韌體版本 5.5.0.b-1067797.15 EDR 型 IEEL Lustre,100Gbps Mellanox EDR MT27700,36 埠 Mellanox EDR IB 交換器,OFED MLNX mlnx-4.3-3.0.2.0,HPL 2.2,Intel 編譯器 2018u3,AMD BLIS v0.4.0,Intel MPI 2018u3,同步多執行緒=開啟,渦輪加速=開啟,每核心為 2 執行緒,4 節點=4739.96,8 節點=9406.07 GF/s,越高越好,Intel 於 2018 年 9 月 23 日測試。