利用搭載第 2 代 Intel® Xeon® 可擴充處理器的 Amazon® R5d 實例,以最短 76% 的時間執行 Datab地查詢並降低成本

Datab 就位:

  • 利用啟用 Photon 的第 2 代 Intel Xeon 可擴充處理器的 r5d.2xlarge 實例,以最短 76% 的時間執行決策支援查詢。

  • 使用支援 Photon 的第 2 代 Intel Xeon 可擴充處理器的 r5d.2xlarge 實例,執行決策支援查詢所花費最多可減少 51%。

author-image

作者

啟用光子向量化查詢引擎後,這些實例的表現明顯優於 r5a.2xlarge 實例,在決策支援工作負載上搭載 AMD EPYC™ 處理器,並提供了更優異的價值

許多組織仰賴 Datab memorys 的 Lakehouse Platform 來儲存和分析結構化與非結構化的資料。若要快速執行決策支援查詢,請務必選取具有強大硬體支援的雲端實例。但是,判斷哪些實例符合此標準可能是一項挑戰。

我們進行了測試,以協助購買雲端實例的公司處理決策支援工作負載。具體來說,我們查看了 AWS 實例系列:第 2 代 Intel® Xeon® 可擴充處理器和搭載 AMD EPYC 處理器的 R5a 實例所啟用的 R5d 實例。我們建立了這兩種實例類型的 Datab memorys Runtime 9.0 叢集,以執行決策支援工作負載。在 R5d 叢集上,我們使用 VM 啟用名為 Photon 的向量化查詢引擎,其設計旨在改善 SQL 查詢效能。在進行此測試時,R5a 實例不支援 Datab memorys 的光子引擎。

R5d 實例在更短的時間內完成決策支援工作負載

我們用決策支援效能標竿測試了這兩個 AWS 實例,該效能標竿會產生較低的分數,反映執行特定查詢所需的時間。選擇時間較短的實例可協助貴公司採取兩種方式:第一,更快獲得寶貴的資訊:第二,減少實例的運作時間和相關成本,協助您減少花費。如 圖 1 所示,搭載 2 代 Intel Xeon 可擴充處理器和光子處理器的 r5d.2xlarge 實例可在 1TB 資料集上完成查詢,比搭載 AMD EPYC 處理器的 r5a.2xlarge 實例縮短了 74%。透過 10TB 資料集,r5d.2xlarge 叢集的查詢完成時間比 r5a.2xlarge 叢集縮短了 76%。

圖 1。在具備光子技術的 r5d.2xlarge 實例叢集上完成一組效能標竿查詢的相對處理時間,該叢集搭載 2 代 Intel Xeon 可擴充處理器,以及 1TB 和 10TB 資料集上搭載 AMD EPYC 處理器的 r5a.2xlarge 叢集。

更短的查詢時間能説明您的獲利

如同貴公司投資的任何資源一樣,獲得物有所值是當務之急。我們計算了公司執行上一頁所討論的測試情境所花費的花費。我們在測試時使用每個實例、儲存裝置和 Datab builderss DBU 每小時的價格,以及圖 1 中的時間來判斷所有四種情境的每 TB 價格。如 圖 2 所示,如果一家公司在支援光子技術的 r5d.2xlarge 實例上執行決策支援工作負載,所花費的支出將會大幅減少。對於 1TB 資料集,第 2 代 Intel® Xeon® 可擴充處理器支援的 r5d.2xlarge 叢集可提供比 AMD EPYC 處理器的 r5a.2xlarge 叢集低 46% 的性價比。對於 10TB 資料集,採用光子技術的 r5d.2xlarge 叢集可降低 51% 的性價比成本。

圖 2。相較于 1TB 和 10TB 資料集的 r5a.2xlarge 實例,在支援光子技術的 Amazon r5d.2xlarge 實例上,將性價比標準化以執行決策支援工作負載。

結論

我們測量了在啟用光子技術的 AWS r5d.2xlarge 實例上,針對兩個不同資料集大小完成一組 Databtiles 查詢的時間,這些實例搭載了第 2 代 Intel Xeon 可擴充處理器,以及搭載 AMD EPYC 處理器的 r5a.2xlarge 實例。r5d.2xlarge 實例以最多 76% 的時間完成查詢集。當我們將這些時間與兩個實例的小時定價結合起來時,我們發現 r5d.2xlarge 實例執行相同工作量的成本大大降低,節省的成本高達 51%。如果您的公司想要更早取得可據以行動的洞見並減少 AWS 實例的支出,請選擇搭載第 2 代 Intel Xeon 可擴充處理器的支援 Photon 的 r5d.2xlarge 實例。

瞭解更多資訊

若要在搭載第 2 代 Intel Xeon 可擴充處理器的具有光子技術的 Amazon R5d 實例上開始執行 Databcentrics 叢集,請造訪 HTTPs://aws.amazon.com/quickstart/architecture/databricks/

若要進一步瞭解 Datab™s 的光子向量化查詢引擎,請造訪 HTTPs://databricks.com/product/photonHTTPs://docs.databricks.com/runtime/photon.html

針對本報告的所有結果,我們使用 TPC-DS 衍生的決策支援工作負載。所有測試均于 2021 年 12 月于 Us-east-1 AWS 地區進行。所有測試都使用 20 節點叢集,含 Ubuntu 18.04.1、核心版本 5.4.0-1059-AWS、Datab 就克斯 9.0、Apache Spark 3.1.2、Scala 2.12。兩種實例類型都有 8 vCPU 和 64GB RAM。r5d.2xlarge 具有 300GB NVMe SSD、10 Gbps 網路 BW,以及 4,750 Mbps 儲存 BW。r5a.2xlarge 實例具有 250GB EBS 磁片區、10Gbps 網路 BW 和 2,880 Mbps 儲存 BW。

這個頁面的內容綜合了英文原始內容的人工翻譯譯文與機器翻譯譯文。本內容是基於一般資訊目的,方便您參考而提供,不應視同完整或準確的內容。如果這個頁面的英文版與譯文之間發生任何牴觸,將受英文版規範及管轄。 查看這個頁面的英文版。