透過 Intel 處理您資料的方法,讓您在 AWS* 上花費的每一塊錢都能帶來更高效能

探索選擇以 Intel® Xeon® 可擴充處理器為基礎的執行個體有何優勢。

重點精華

  • 基於 Intel® 處理器的 AWS* 執行個體可為關鍵工作負載提供更高的每元效能

  • 舉例來說,在高效能運算 (HPC) 工作負載方面,相較於採用 AMD EPYC* 的執行個體,採用 Intel® Xeon® 可擴充處理器的執行個體可提供高出 4.15 倍的投資價值1

  • Intel 技術亦可為資料庫、記憶體密集工作負載,以及網路型工作負載提供更優異的價值

BUILT IN - ARTICLE INTRO SECOND COMPONENT

您的 AWS* 投資是否帶給您最佳價值?

雲端提供您所需的擴充性、可靠度和彈性,但並非所有的雲端都相同:有些執行個體能提供更高的價值。為了瞭解最適合您工作負載的選項,您需要查看這些特定工作負載的表現。通用效能統計資料可能無法讓您徹底瞭解結果,尤其當您執行的是運算密集或資料密集的工作負載。同樣地,知道每個執行個體的價格也不能讓您完全瞭解每次交易的價錢,或是其他實際的業務或效能指標。您需要看得更仔細。

舉例來說,您知道根據高效能 Linpack* 效能標竿,在高效能運算 (HPC) 工作負載方面1,採用 Intel® Xeon® 可擴充處理器的 AWS* 執行個體可提供比採用 AMD EPYC* 處理器的執行個體高出最多 4.15 倍的每元效能嗎?根據 LAMMPS* 效能標竿,它們能提供高達 2.19 倍的每元效能。1 針對以 AWS 為基礎的資料庫工作負載,Intel® Xeon® 可擴充處理器能提供高達 2.84 倍的每元效能2;而在處理需要大量記憶體頻寬的工作負載時,可提供高達 2.25 倍的每元效能3 如果您執行的是伺服器端 Java* 或 Wordpress PHP/HHVM* 等網路型工作負載,您可能會發現,採用 Intel 技術能為您提供高出最多 1.74 倍的每元效能4

如果您正在使用 Intel® 處理器,亦可透過轉移至採用 Intel® Xeon® 可擴充處理器之更現代化的執行個體來節省金錢。TSO Logic 針對公有及私有雲運算的合適規模與成本,提供資料導向的建議。他們在 100,000 個匿名化 AWS 客戶資料的執行個體存放庫中,研究了數百萬個資料點。獲得了什麼結論?有百分之 19 的當前執行個體可透過轉移至更新、更小,且能以更低成本提供相同效能的 Amazon EC2* 執行個體類型,達到節省金錢的目標。舉例來說,由較舊的 C4.8XLarge 移轉至較新的 C5.4XLarge 執行個體,可為您節省最多 50% 的雲端成本,每個執行個體節省超過 3000 美元。5 此外,如果您的軟體授權是依據核心數量,會發現成本節省的幅度快速增加。TSO Logic 發現,透過運行於採用第 2 代 Intel® Xeon® 可擴充處理器的較新執行個體上,可為遞送單一工作負載減少 40 個核心的使用量。5 如果您的商用資料庫授權為每核心 1,800 美元,透過減少使用 40 個核心,每年能為您省下 72,000 美元。5

Intel® Xeon® 可擴充處理器與第 2 代 Intel® Xeon® 可擴充處理器內建許多最佳化功能,可加速您的工作負載。INT8 數字格式可捨棄不必要的細節,加速機器學習的能力;Intel® Deep Learning Boost (Intel® DL Boost) 則可提供新的處理器指令,加速影像分類、語音識別、語言翻譯和物件偵測等應用程式的推斷能力。Intel® Advanced Vector Extensions 512 (Intel® AVX-512) 提供 512 位元的向量指令,加速包括科學模擬等浮點計算能力。Intel® 渦輪加速技術可讓您的核心以比基礎運算頻率更高的速度運行,在您最需要的時候提供額外效能。為了協助保護您的資料,Intel® Advanced Encryption Standard New Instructions (Intel® AES-NI) 可提供處理器指令,以加速加密與解密的程序。

注意事項與免責聲明:

效能測試中使用的軟體與工作負載可能僅針對 Intel® 微處理器進行最佳化。包括 SYSmark* 與 MobileMark* 在內的效能測試,是使用特定電腦系統、零組件、軟體、作業與功能進行測量。這些因素若有任何異動,均可能導致測得結果產生變化。建議您參考其他資訊與效能測試數據,協助您充分評估欲購買產品的性能,包括該產品在搭配其他產品運作時的效能。如需更完整的資訊,請造訪 www.intel.com.tw/benchmarks

效能結果係根據截至組態中所示日期的測試,可能無法反映所有公開提供的安全性更新。請查看組態公開資料以獲得詳細資訊。沒有產品或元件能提供絕對的安全性。
Intel 並不控制或審核第三方的資料。您應檢閱本內容、查閱其他來源,並確認提及的資料是否正確。

所述之成本降低情境,用意是要提供範例,指出搭載特定 Intel® 處理器的產品,在特定情況與配置,可能會如何影響未來各項成本以及提供成本節省。實際情況可能有所差異。對於各項成本,或是成本降低幅度,Intel 不提供任何保證。

Intel® 技術的功能與優勢取決於系統配置,而且可能需要支援的硬體、軟體或服務啟動。實際效能會依系統組態而異。請洽詢您的系統製造商或零售商,或造訪 intel.com.tw 瞭解更多訊息。

Intel、Intel 圖誌及 Xeon 是 Intel 公司或其子公司在美國及/或其他國家/地區的商標。

*其他品牌和名稱為其所屬公司的資產。
© Intel Corporation

產品與效能資訊

1

結果是根據 Intel 使用截至 2019 年 1 月 12 日的 AWS 定價(每小時的金額,標準 1 年期,無預付費用)所計算而得。
每元效能測試採用 AWS* EC2 M5 和 M5a 實例 (https://aws.amazon.com/ec2/instance-types/),比較 96 vCPU Intel® Xeon® 可擴充處理器的每元效能與 AMD EPYC* 處理器的每元效能。

工作負載:LAMMPS*
結果:AMD EPYC 每元效能 = 基準線 1;Intel® Xeon® 可擴充處理器的每元效能 = 2.19 倍(越高越好)。
HPC 材料科學 – LAMMPS(越高越好):
AWS M5.24xlarge (Intel) 實例,LAMMPS 版本:2018-08-22(代碼:https://lammps.sandia.gov/download.html),工作負載:水 – 512K 粒子,Intel ICC 18.0.3.20180410,適用於 Linux* OS 的 Intel® MPI Library,版本 2018 Update 3 Build 20180411,48 個 MPI 階層,Red Hat* Enterprise Linux 7.5,核心 3.10.0-862.el7.x86_64,OMP_NUM_THREADS=2,每秒時步分數 137.5,由 Intel 於 2018 年 10 月 31 日測量。
AWS M5a.24xlarge (AMD) 實例,LAMMPS 版本:2018-08-22(代碼:https://lammps.sandia.gov/download.html),工作負載:水 – 512K 粒子,Intel ICC 18.0.3.20180410,適用於 Linux* OS 的 Intel® MPI Library,版本 2018 Update 3 Build 20180411,48 個 MPI 階層,Red Hat* Enterprise Linux 7.5,核心 3.10.0-862.el7.x86_64,OMP_NUM_THREADS=2,每秒時步分數 55.8,由 Intel 於 2018 年 11 月 7 日測量。
AMD 支援 AVX2 的變更(AMD 僅支援 AVX2,因此需要這些變更):
sed -i 's/-xHost/-xCORE-AVX2/g' Makefile.intel_cpu_intelmpi
sed -i 's/-qopt-zmm-usage=high/-xCORE-AVX2/g' Makefile.intel_cpu_intelmpi

工作負載:高效能 Linpack*
結果:AMD EPYC 每元效能 = 基準線 1;Intel® Xeon® 可擴充處理器的每元效能 = 4.15 倍(越高越好)。
HPC Linpack(越高越好):
AWS M5.24xlarge (Intel) 實例,HP Linpack 版本 2.2(https://software.intel.com/en-us/articles/intel-mkl-benchmarks-suite 目錄:benchmarks_2018.3.222/linux/mkl/benchmarks/mp_linpack/bin_intel/intel64),Intel ICC 18.0.3.20180410 搭配 AVX512,適用於 Linux* OS 的 Intel® MPI Library,版本 2018 Update 3 Build 20180411,Red Hat* Enterprise Linux 7.5,核心 3.10.0-862.el7.x86_64,OMP_NUM_THREADS=24,2 個 MPI 程序,分數 3152 GB/s,由 Intel 於 2018 年 10 月 31 日測量。
AWS M5a.24xlarge (AMD) 實例,HP Linpack 版本 2.2,(HPL 來源:http://www.netlib.org/benchmark/hpl/hpl-2.2.tar.gz:版本 2.2;使用 icc (ICC) 18.0.2 20180210 編譯與連結至 BLIS 程式庫版本 0.4.0;https://github.com/flame/blis;Addt’l 編譯器旗標:-O3 -funroll-loops -W -Wall –qopenmp;make arch=zen OMP_NUM_THREADS=8;6 個 MPI 程序。), Intel ICC 18.0.3.20180410 搭配 AVX2,適用於 Linux* OS 的 Intel® MPI Library,版本 2018 Update 3 Build 20180411,Red Hat* Enterprise Linux 7.5,核心 3.10.0-862.el7.x86_64,OMP_NUM_THREADS=8,6 個 MPI 程序,分數 677.7 GB/s,由 Intel 於 2018 年 11 月 7 日測量。

2

結果是根據 Intel 使用截至 2019 年 1 月 12 日的 AWS 定價(每小時的金額,標準 1 年期,無預付費用)所計算而得。
每元效能測試採用 AWS* EC2 R5 和 R5a 實例 (https://aws.amazon.com/ec2/instance-types/),比較 96 vCPU Intel® Xeon® 可擴充處理器的每元效能與 AMD EPYC* 處理器的每元效能。

工作負載:HammerDB* PostgreSQL*
結果:AMD EPYC 每元效能 = 基準線 1;Intel® Xeon® 可擴充處理器的每元效能 = 1.85 倍(越高越好)。
資料庫:HammerDB – PostgreSQL(越高越好):
AWS R5.24xlarge (Intel) 實例,HammerDB 3.0 PostgreSQL 10.2,記憶體:768GB,Hypervisor:KVM;儲存類型:EBS io1,磁碟容量 200GB,總儲存 200GB,Docker 版本:18.06.1-ce,Red Hat* Enterprise Linux 7.6,3.10.0-957.el7.x86_64,6400MB shared_buffer,256 個倉儲,96 名使用者。「NOPM」分數 439931,由 Intel 於 2018 年 12 月 11 日至 2018 年 12 月 14 日測量。
AWS R5a.24xlarge (AMD) 實例,HammerDB 3.0 PostgreSQL 10.2,記憶體:768GB,Hypervisor:KVM;儲存類型:EBS io1,磁碟容量 200GB,總儲存 200GB,Docker 版本:18.06.1-ce,Red Hat* Enterprise Linux 7.6,3.10.0-957.el7.x86_64,6400MB shared_buffer,256 個倉儲,96 名使用者。「NOPM」分數 212903,由 Intel 於 2018 年 12 月 20 日測量。

工作負載:MongoDB*
結果:AMD EPYC 每元效能 = 基準線 1;Intel® Xeon® 可擴充處理器的每元效能 = 2.84 倍(越高越好)。
資料庫:MongoDB(越高越好):
AWS R5.24xlarge (Intel) 實例,MongoDB v4.0,停用日誌,停用檔案系統同步,wiredTigeCache=27GB,maxPoolSize = 256;7 個 MongoDB 實例,14 個用戶端 VM,每 VM 1 個 YCSB 用戶端,每個 YCSB 用戶端 96 個執行緒,Red Hat* Enterprise Linux 7.5,核心 3.10.0-862.el7.x86_64,每秒操作分數 1229288,由 Intel 於 2018 年 12 月 10 日測量。
AWS R5a.24xlarge (AMD) 實例,MongoDB v4.0,停用日誌,停用檔案系統同步,wiredTigeCache=27GB,maxPoolSize = 256;7 個 MongoDB 實例,14 個用戶端 VM,每 VM 1 個 YCSB 用戶端,每個 YCSB 用戶端 96 個執行緒,Red Hat* Enterprise Linux 7.5,核心 3.10.0-862.el7.x86_64,每秒操作分數 388596,由 Intel 於 2018 年 12 月 10 日測量。
如需更多詳細資料,請造訪 www.intel.com.tw/benchmarks.

3

AWS M5.4xlarge (Intel) 實例,McCalpin Stream(OMP 版本),(來源:https://www.cs.virginia.edu/stream/FTP/Code/stream.c);Intel ICC 18.0.3 20180410 搭配 AVX512,-qopt-zmm-usage=high,-DSTREAM_ARRAY_SIZE=134217728 -DNTIMES=100 -DOFFSET=0 –qopenmp,-qopt-streaming-stores 一律 -o $OUT stream.c,Red Hat* Enterprise Linux 7.5,核心 3.10.0-862.el7.x86_64,OMP_NUM_THREADS:8,KMP_AFFINITY:proclist=[0-7:1],granularity=thread, explicit,分數 81216.7 MB/s,由 Intel 於 2018 年 12 月 6 日測量。
AWS M5a.4xlarge (AMD) 實例,McCalpin Stream(OMP 版本),(來源:https://www.cs.virginia.edu/stream/FTP/Code/stream.c);Intel ICC 18.0.3 20180410 搭配 AVX2,-DSTREAM_ARRAY_SIZE=134217728,-DNTIMES=100 -DOFFSET=0 -qopenmp -qopt-streaming-stores 一律 -o $OUT stream.c,Red Hat* Enterprise Linux 7.5,核心 3.10.0-862.el7.x86_64,OMP_NUM_THREADS:8,KMP_AFFINITY:proclist=[0-7:1],granularity=thread,explicit,分數 32154.4 MB/s,由 Intel 於 2018 年 12 月 6 日測量。
OpenFOAM 免責聲明:本產品未經 OpenCFD Limited、透過 www.openfoam.com 的 OpenFOAM 軟體製造商或經銷商,以及 OPENFOAM® 與 OpenCFD® 商標擁有者的核准或背書。

4

結果是根據 Intel 使用截至 2019 年 1 月 12 日的 AWS 定價(每小時的金額,標準 1 年期,無預付費用)所計算而得。
每元效能測試採用 AWS* EC2 M5 和 M5a 實例 (https://aws.amazon.com/ec2/instance-types/),比較 96 vCPU Intel® Xeon® 可擴充處理器的每元效能與 AMD EPYC* 處理器的每元效能。

工作負載:伺服器端 Java* 1 JVM
結果:AMD EPYC 每元效能 = 基準線 1;Intel® Xeon® 可擴充處理器的每元效能 = 1.74 倍(越高越好)。
伺服器端 Java(越高越好):
AWS M5.24xlarge (Intel) 實例,Java 伺服器效能標竿無 NUMA 繫結,2JVM,OpenJDK 10.0.1,Red Hat* Enterprise Linux 7.5,核心 3.10.0-862.el7.x86_64,每秒傳輸分數 101767,由 Intel 於 2018 年 11 月 16 日測量。
AWS M5a.24xlarge (AMD) 實例,Java 伺服器效能標竿無 NUMA 繫結,2JVM,OpenJDK 10.0.1,Red Hat* Enterprise Linux 7.5,核心 3.10.0-862.el7.x86_64,每秒傳輸分數 52068,由 Intel 於 2018 年 11 月 16 日測量。

工作負載:WordPress* PHP/HHVM*
結果:AMD EPYC 每元效能 = 基準線 1;Intel® Xeon® 可擴充處理器的每元效能 = 1.75 倍(越高越好)。
網站前端 WordPress(越高越好):
AWS M5.24xlarge (Intel) 實例,oss-performance/wordpress Ver 4.2.0;Ver 10.2.19-MariaDB-1:10.2.19+maria~bionic;工作負載版本':u'4.2.0;用戶端執行緒:200;PHP 7.2.12-1;perfkitbenchmarker_version="v1.12.0-944-g82392cc;Ubuntu 18.04,核心 Linux 4.15.0-1025-aws,TPS 分數 3626.11,由 Intel 於 2018 年 11 月 16 日測量。
AWS M5a.24xlarge (AMD) 實例,oss-performance/wordpress Ver 4.2.0;Ver 10.2.19-MariaDB-1:10.2.19+maria~bionic;工作負載版本':u'4.2.0;用戶端執行緒:200;PHP 7.2.12-1;perfkitbenchmarker_version="v1.12.0-944-g82392cc;Ubuntu 18.04,核心 Linux 4.15.0-1025-aws,TPS 分數 1838.48,由 Intel 於 2018 年 11 月 16 日測量。
如需更多詳細資料,請造訪 www.intel.com.tw/benchmarks

5

來源:TSO Logic / Intel 研究報告:「New Advances by Intel, Amazon Web Services, Drive Major Cloud Savings」(Intel 和 Amazon Web Services 的新進展可大幅節省雲端成本)。