利用具備第 2 代 Intel Xeon 可擴充處理器的 Amazon EC2 M5n 實例,以高達 1.72 倍的 Apache Spark 工作負載輸送量分析更多資料

Apache Spark

  • 以 1.57 倍的小型實例輸送量分析更多資料。

  • 中型實例輸送量的 1.42 倍。

  • 大型實例輸送量的 1.72 倍。

author-image

作者

Amazon Web Services M5n 系列實例功能Intel® Xeon®可擴充處理器

利用 Amazon EC2 M5n 系列實例第 2 代Intel Xeon可擴充處理器提升機器學習輸送量

隨著巨量資料持續成長,組織必須找到方法來整理並善用從這些資料中收集的經驗教訓,才能在市場上保持敏捷。在雲端執行資料分析會在 prem 管理上遇到麻煩,但是這會使您難以辨識選擇實例會對複雜資料分析工作負載的效能產生哪些影響。針對 Amazon EC2 上的 Apache Spark 工作負載,選擇由第 2 代 Intel Xeon 可擴充處理器啟用的 M5n 實例,可提供更高的輸送量,一次分類更多資料,更快提供深入見解。

在兩個機器學習實作的測試中,比較 Amazon EC2 實例,第 2 代 Intel Xeon 啟用了較新的 M5n 系列實例。

可擴充處理器的表現優於老舊的 M4 系列實例,Intel Xeon E5 v4 處理器,為 Apache Spark 工作負載提供高達 1.72 倍的資料輸送量。

無論您的機器學習工作負載需要小型、中型或大型實例大小,在較舊的 M4 實例中選擇具有第 2 代Intel Xeon可擴充處理器的 M5n 系列實例,可以分析更多資料,並更快提供可據以行動的洞見。

改善對小型實例的洞見時間

組織收集的所有資料只要能快速加以理解才有價值。舉例來說,客戶偏好預測和類似推斷必須即時運作,才能對業務產生影響,而這需要更新的技術才能更快取得成果。

圖 1。對於 Naéve Bayesian 分類與 HiBench 效能標竿套件的 k-means 叢集工作負載,相對傳輸量比較小實例 (8 vCPU/32GB RAM)。

在八個 vCPU 比較小型實例的測試中,顯示您選擇搭載第 2 代 Intel® Xeon® 可擴充處理器的 Amazon EC2 M5n 實例,為具備 Intel Xeon E5 v4 處理器的 Apache Spark 機器學習工作負載提供高達 1.57 倍的輸送量。

改善對中型實例的洞見時間

與小型實例一樣,比較具有 16 個 vCPU 的中型實例的測試顯示,搭載第 2 代 Intel® Xeon® 可擴充處理器的 Amazon EC2 M5n 實例改善了 Apache Spark 上的兩種機器學習實作, 在這種情況下,老舊 M4 實例的輸送量高達 1.42 倍。

圖 2。對於 Naéve Bayesian 分類的中等實例 (16 vCPU/64GB RAM) 的相對輸送量比較,以及 HiBench 效能標竿套件的 k-means 叢集工作負載。

改善對大型實例的洞見時間

測試顯示,大型實例尺寸(搭載 64 vCPU)的機器學習效能提升最為顯著,為 k-means Clustering 工作負載提供高達 1.72 倍的 M4 系列實例輸送量。

圖 3。對於 Naéve Bayesian 分類與 HiBench 效能標竿套件的 k-means Clustering 工作負載,大型實例 (64 vCPU/256GB RAM) 的相對輸送量比較。

這代表希望從資料中快速取得可據以行動的見解的組織,無論需要的實例大小,都能選擇由第 2 代 Intel Xeon 可擴充處理器啟用的升級 Amazon EC2 M5n 實例。」

瞭解更多資訊

若要在 Amazon EC2 M5n 系列實例上使用第 2 代 Intel Xeon 可擴充處理器開始部署 Apache Spark,請造訪 HTTP://intel.com/AWS

如需詳細測試詳細資訊,請造訪 HTTP://facts.pt/3Kjn66x

這個頁面的內容綜合了英文原始內容的人工翻譯譯文與機器翻譯譯文。本內容是基於一般資訊目的,方便您參考而提供,不應視同完整或準確的內容。如果這個頁面的英文版與譯文之間發生任何牴觸,將受英文版規範及管轄。 查看這個頁面的英文版。