精通資料科學工作流程

這些專門設計的工作站結合大記憶體容量、連接多部裝置的多個擴充插槽,以及為滿足 Python 資料科學家和您這類資料科學家設計的精選 CPU。

常見問題集

選擇資料科學工作站時,必須考量兩個主要因素:您最常用哪些工具與技術,以及資料集的大小。

就資料科學架構而言,核心數越多,未必等於效能更高。超過 18 核心時,NumPy、SciPy 與 scikit-learn 的效能提升幅度有限。另一方面,HEAVY.AI(前身為 OmniSci)則可充分利用所有核心。

所有 Intel 技術資料科學工作站皆搭載 Intel® Core™、Intel® Xeon® W 與 Intel® Xeon® 可擴充處理器,在真實世界測試處理資訊科學工作負載的表現卓越。所有工作站皆提供同系列處理器最佳效能,因此記憶體容量成了最重要的選擇。

資料科學架構使得記憶體容量需求激增二至三倍。若要獲得基本的記憶體需求,請檢視您平常的資料集,然後乘以三倍。如果小於 512 GB 就夠用,桌上型電腦能讓您獲得優異的效能。如果資料集往往超過 500 GB,那麼不妨選擇記憶體超過 1.5 TB 的直立式電腦。

GPU 加速器在深度學習模型訓練與大規模深度學習推論方面大放異彩。然而,若是大量資料科學工作(資料準備、分析與傳統的機器學習),這些 GPU 將會閒置,因為適用於資料科學的 Python 程式庫多半以原生方式在 CPU 執行。您確實需要顯示卡才能驅動顯示器,但是不需要 GPU 裝置。

除非使用專用 VM 或裸機伺服器,否則雲端無法締造最佳效能。雲端執行個體雖然以單一節點的方式顯示,但是在後端的分散程度極高。您的工作負載與資料會分散到多個位置的多部伺服器。處理和記憶體因而延遲,使得執行時間表現變差。此外,透過遠端桌上型電腦處理大型資料集與圖形,並不是理想的體驗。

在單一電腦本機處理工作負載與資料,不僅效能更優異,工作體驗也更為順暢,反應速度也更快。

您雖然可以在雲端執行,但是在儲存裝置、記憶體與 CPU 之間移轉資料將耗費大量時間。如果您是專業人士,升級為 Intel® 資料科學筆記型電腦或中階桌上型電腦,皆可節省時間。我們特地測試搭載 Intel® Core™ 的資料科學筆記型電腦,並且明確規範規格,為學生、入門者和 AI 製造商提供了經濟實惠的選項,協助他們以開放原始碼 AI 工具開發及實驗。

您可以使用 Intel 最佳化的程式庫與發行版,在標準電腦加速執行 Python 資料科學工具。免費的 Intel AI Kit 內一應俱全。