AI 伺服器是什麼?
簡而言之,伺服器是指為使用者或企業提供特定服務的電腦,例如透過網際網路或其他連線方式存取資料庫或應用程式。AI 伺服器一詞是指專為處理 AI 工作負載需求而打造的伺服器。
從元件角度來看,AI 伺服器整合各種獨立硬體元素,包括:
- AI 處理器,包括通用 CPU
- AI 加速器,例如 FPGA、GPU 與專用 AI 硬體
- 網路技術,例如乙太網路與 Wi-Fi
- 支援所需周邊裝置的 I/O,例如 USB 與 Thunderbolt™ 連接埠
- 伺服器外殼,可以無風扇設計等多種形式支援應用需求
AI 伺服器為支援 AI 管道的各種工作負載,依照各式各樣需求而建構。這些需求可能包含以下這類考量:
- 處理能力:AI 硬體的選擇取決於目標工作負載需要什麼程度的運算功能。部分 AI 伺服器可利用獨立 CPU 架構發揮作用,尤其在利用整合式 AI 加速功能時更能發揮得淋漓盡致。要求較嚴苛的工作負載可能需要採用獨立加速器硬體,例如 GPU 或 FPGA。
- 網路與 I/O:網路與 I/O 功能提供了對 AI 伺服器使用案例極為重要的連線方式。需要哪些功能取決於 AI 工作負載需要何種連線能力、是否需要高效能網路,以及需要支援的周邊裝置種類與數量,例如物聯網感應器。
- 實體佔用空間與環境:AI 伺服器可部署於各種場所,而部署位置則透露了伺服器的外形規格與環境需求相關資訊。舉例而言,邊緣 AI 伺服器通常嚴格要求實體佔用空間必須小巧經濟,而且必須能承受熱氣、溫度、濕度或灰塵這類具挑戰性的物理條件。
對於許多設法善用 AI 力量的組織而言,成本效益與調整規模是關鍵考量。AI 伺服器必須儘量利用最高效的硬體配置,滿足工作負載需求,才能極致優化投資報酬率、達成業務需求,以及促進擴充性。
此外,AI 伺服器與 AI 電腦之間的差異也不容忽視。AI 電腦是終端使用者用來處理 AI 工作,或是與 AI 應用程式互動的運算裝置。另一方面,AI 伺服器主要連線至 AI 電腦在內的其他數位裝置,以實現各種服務與應用案例。
AI 伺服器的作用
AI 伺服器是 AI 技術整體環境重要的一環,而且用途在各行各業、使用案例與技術無所不在。這類伺服器負責視需要支援各種 AI 工作負載,從訓練到部署一手包辦。
部署於邊緣的精簡高效 AI 伺服器,在更靠近資料來源的位置執行電腦視覺這類 AI 作業。為了極致優化效率與部署靈活性,邊緣 AI 伺服器的設計通常不包含獨立 AI 加速硬體。邊緣 AI 工作負載通常是部署工作負載,相較於訓練或微調,運算需求通常較不嚴苛。FPGA 是一種 AI 處理器與加速器,特別適合邊緣 AI 伺服器,因為能源效率與重新配置能力得天獨厚,而且關鍵 AI 功能的效能速度更快。
內部部署環境與雲端資料中心的 AI 伺服器,包括深度學習伺服器,提供先進的運算功能,支援 AI 微調與訓練。這類伺服器也用於在這些環境支援部署工作負載,包括電腦視覺、聊天機器人與生成式 AI(GenAI)。為支援 AI 需求,包括部署於高效能運算(HPC)環境在內的 AI 伺服器,經常採用 GPU、FPGA 與專用的加速器產品等獨立硬體加速器。
AI 伺服器的效益
依照 AI 工作負載需求採用硬體元件打造的 AI 伺服器,為企業創造了各種效益,包括:
- 效能最佳化:所有 AI 工作負載的運算需求皆各不相同。依照這些需求打造 AI 伺服器架構,是讓成果符合成本效益的關鍵。 儘管如此,AI 工作負載為了實現符合需求的延遲與輸送量,系統需求也極為嚴苛。AI 伺服器是專為滿足這些需求而打造,而且經常為此運用 AI 加速器技術。
- 擴充性:大規模 AI 伺服器通常是滿足應用需求的必要條件,分散式邊緣部署或高效能運算環境尤其如此。若能精心建構 AI 伺服器架構,並且善用伺服器管理平台等軟體工具,就能為特定 AI 工作負載提升 AI 伺服器擴充性。
- 耗電量最佳化:為支援 AI 加強的工業作業方式、智慧城市計畫,或是金融預測或科學模擬等極為複雜的作業,通常必須以規模極大的方式部署 AI 伺服器。這些大規模部署,再加上必須大量處理 AI 管道,可能造成某些 AI 伺服器部署消耗大量能源,付出高昂的成本。 AI 伺服器硬體元件數量恰到好處,組織便可更妥善控制能源支出。此外,整合式 AI 加速與最佳化,不需要專門的硬體加速器,就能協助支援部分 AI 使用案例。
AI 伺服器解決方案
幾乎各產業與使用案例的每種 AI 應用案例,都需要用到某種伺服器。同樣地,伺服器在 AI 工作流程的每個階段都舉足輕重。因此,視工作負載需求而定,AI 伺服器解決方案各不相同。
為組織採購 AI 伺服器解決方案可採取多種形式,包括直接向 OEM 購買伺服器、與解決方案供應商合作,以及採取自行打造的策略,或取用眾多供應商現今供應的雲端 AI 伺服器。最適合您的策略取決於團隊的技能組合、預算、時機需求,以及使用案例整體的複雜度與擴充性需求。
AI 部署通常需要大型伺服器網路,因此伺服器管理技術也是制定高效 AI 伺服器策略的關鍵。部署各種伺服器管理工具與平台,即可實現深度可見度、即時監測與自動化作業。