啟用光子向量化查詢引擎後,這些實例的表現明顯優於 r5a.2xlarge 實例,在決策支援工作負載上搭載 AMD EPYC™ 處理器,並提供了更優異的價值
許多組織仰賴 Datab memorys 的 Lakehouse Platform 來儲存和分析結構化與非結構化的資料。若要快速執行決策支援查詢,請務必選取具有強大硬體支援的雲端實例。但是,判斷哪些實例符合此標準可能是一項挑戰。
我們進行了測試,以協助購買雲端實例的公司處理決策支援工作負載。具體來說,我們查看了 AWS 實例系列:第 2 代 Intel® Xeon® 可擴充處理器和搭載 AMD EPYC 處理器的 R5a 實例所啟用的 R5d 實例。我們建立了這兩種實例類型的 Datab memorys Runtime 9.0 叢集,以執行決策支援工作負載。在 R5d 叢集上,我們使用 VM 啟用名為 Photon 的向量化查詢引擎,其設計旨在改善 SQL 查詢效能。在進行此測試時,R5a 實例不支援 Datab memorys 的光子引擎。
R5d 實例在更短的時間內完成決策支援工作負載
我們用決策支援效能標竿測試了這兩個 AWS 實例,該效能標竿會產生較低的分數,反映執行特定查詢所需的時間。選擇時間較短的實例可協助貴公司採取兩種方式:第一,更快獲得寶貴的資訊:第二,減少實例的運作時間和相關成本,協助您減少花費。如 圖 1 所示,搭載第 2 代 Intel Xeon 可擴充處理器和光子處理器的 r5d.2xlarge 實例可在 1TB 資料集上完成查詢,比搭載 AMD EPYC 處理器的 r5a.2xlarge 實例縮短了 74%。透過 10TB 資料集,r5d.2xlarge 叢集的查詢完成時間比 r5a.2xlarge 叢集縮短了 76%。
更短的查詢時間能説明您的獲利
如同貴公司投資的任何資源一樣,獲得物有所值是當務之急。我們計算了公司執行上一頁所討論的測試情境所花費的花費。我們在測試時使用每個實例、儲存裝置和 Datab builderss DBU 每小時的價格,以及圖 1 中的時間來判斷所有四種情境的每 TB 價格。如 圖 2 所示,如果一家公司在支援光子技術的 r5d.2xlarge 實例上執行決策支援工作負載,所花費的支出將會大幅減少。對於 1TB 資料集,第 2 代 Intel® Xeon® 可擴充處理器支援的 r5d.2xlarge 叢集可提供比 AMD EPYC 處理器的 r5a.2xlarge 叢集低 46% 的性價比。對於 10TB 資料集,採用光子技術的 r5d.2xlarge 叢集可降低 51% 的性價比成本。
結論
我們測量了在啟用光子技術的 AWS r5d.2xlarge 實例上,針對兩個不同資料集大小完成一組 Databtiles 查詢的時間,這些實例搭載了第 2 代 Intel Xeon 可擴充處理器,以及搭載 AMD EPYC 處理器的 r5a.2xlarge 實例。r5d.2xlarge 實例以最多 76% 的時間完成查詢集。當我們將這些時間與兩個實例的小時定價結合起來時,我們發現 r5d.2xlarge 實例執行相同工作量的成本大大降低,節省的成本高達 51%。如果您的公司想要更早取得可據以行動的洞見並減少 AWS 實例的支出,請選擇搭載第 2 代 Intel Xeon 可擴充處理器的支援 Photon 的 r5d.2xlarge 實例。
瞭解更多資訊
若要在搭載第 2 代 Intel Xeon 可擴充處理器的具有光子技術的 Amazon R5d 實例上開始執行 Databcentrics 叢集,請造訪 HTTPs://aws.amazon.com/quickstart/architecture/databricks/。
若要進一步瞭解 Datab™s 的光子向量化查詢引擎,請造訪 HTTPs://databricks.com/product/photon 與 HTTPs://docs.databricks.com/runtime/photon.html。
針對本報告的所有結果,我們使用 TPC-DS 衍生的決策支援工作負載。所有測試均于 2021 年 12 月于 Us-east-1 AWS 地區進行。所有測試都使用 20 節點叢集,含 Ubuntu 18.04.1、核心版本 5.4.0-1059-AWS、Datab 就克斯 9.0、Apache Spark 3.1.2、Scala 2.12。兩種實例類型都有 8 vCPU 和 64GB RAM。r5d.2xlarge 具有 300GB NVMe SSD、10 Gbps 網路 BW,以及 4,750 Mbps 儲存 BW。r5a.2xlarge 實例具有 250GB EBS 磁片區、10Gbps 網路 BW 和 2,880 Mbps 儲存 BW。