執行摘要
Netflix 致力於轉型家庭娛樂,為 2.6 億訂閱者在任何裝置上提供確實可靠、量身打造的體驗。為達成此一目標,Netflix 必須利用包括由 Intel® Xeon® 處理器支援的 Amazon EC2 執行個體等進階技術,加速資料移動與 AI 工作負載。在與 Intel 合作下,Netflix:
- 微架構層級最佳化 Amazon 執行個體,提高效能並減少雲端支出。升級 EC2 執行個體後,Netflix 每 CPU 的效能提升了 3.5 倍,超出預期的線性擴充能力。1
- 使用 Intel® oneAPI 深度神經網路資料庫(oneDNN)和 Intel® 進階向量擴充指令集(Intel® AVX 512),在用戶需求較低的時段最佳化視訊編碼速度。Intel 解決方案顯著提升了每秒幀率編碼。
利用 AI 的強大力量,加速貫穿整個企業的應用。探索搭載 Intel® Xeon® 的 AI 能如何為您效勞。
挑戰
無論客戶的觀看裝置為何,Netflix 致力於提供順暢的隨選內容。這項流程需要針對支援用戶體驗的工作負載進行最佳化的多項微服務。部分後端微服務必須處理內容開發、渲染與編碼任務。在用戶端,Netflix 訂閱者需要量身定制的首頁視圖,從成千上萬的影片中識別並推薦最相關的內容。此外,Netflix 始終致力於為會員提供卓越的娛樂體驗和出色的串流品質,隨時隨地提供服務。
圖表代表各節點的 CPU 分佈。儘管分析發現各節點之間的流量分佈大致相等,但 CPU 計量指標卻顯示出不同的雙峰分佈模式。1
為了完成所有這些任務,Netflix 需要一個確實可靠、具高擴充性且 AI 就緒的雲端解決方案,並且需要進階工具簡化故障排除,已因應可能出現的問題。例如,Netflix 團隊在評估 Amazon EC2 執行個體效能時,發現了一個意外的延遲挑戰。他們需要一種有效的方法評估到 CPU 微架構層級的執行個體,加速工作負載,同時將雲端支出降至最低。
解決方案
為了提供訂閱者快速且量身打造的串流體驗,Netflix 運用了 Intel® Xeon® 處理器支援的 Amazon EC2 執行個體的性能。Netflix 的效能團隊與 Intel 密切合作,仔細研究軟體與可用硬體資源的互動,並識別瓶頸。Intel® VTuneTM Profiler 發現未充分利用處理器時間的程式碼片段。Intel® PerfSpect 透過評估微架構子系統和程式化序列,提供近一步的洞察。在這些工具的協助下,最終查明了 Java 虛擬機器一組指令集中的執行個體瓶頸。
此圖表生動呈現確定並解決真共享問題後顯著的延遲降低。1
透過使用搭載 Intel Xeon 處理器而非 GPU 的 Amazon 執行個體,Netflix 找到節省成本的方法,並利用每個執行個體完成多重任務。在觀看高峰時段,Amazon 執行個體可以將資源集中於串流服務。當使用者需求降低時,執行個體則可以將運算能力轉移至視訊編碼。
成果
憑藉 Intel 的支援,Netflix 成功識別執行個體的瓶頸,相較於在 Amazon EC2 的執行個體上,每個 CPU 的效能比初步輸送量提高了 3.5 倍。1 Netflix 同樣受益於平均和尾端延遲的顯著降低。2 Intel 已經解決了開放式 Java 開發工具組延遲的根源,其他運用 Java 工作負載的公司也能從 Netflix 的 CPU 最佳化方法中獲益。
「為了確定我們的客戶在使用串流服務的時候有最好的體驗,速度非常重要。」 利用 Intel 技術識別瓶頸,我們將 Amazon EC2 執行個體的性能提升近三倍,同時將雲端支出降至最低。– Netflix 效能工程師 Vadim Filanovsky
透過採用 Intel AVX 指令集的 oneDNN,Netflix 宣稱在每秒幀率編碼方面大幅提升,為所有裝置提供卓越的影片品質。
Netflix 利用搭載 Intel Xeon 處理器的 Amazon 執行個體,透過自動擴充功能,有效實現多種用途服務。借助 CPU 的效能,Netflix 成功降低了關鍵工作負載所需的執行個體數量,大幅降低整體雲端基礎架構支出。
解決方案摘要
- Intel® Xeon® 處理器
- Intel® oneAPI 深度神經
- 網路資料庫
- Intel® Deep Learning Boost
- 採用向量神經網路
- 指令集(VNNI)
- Intel® 進階向量
- 擴充指令集 512(Intel® AVX 512)
- Intel® VTune™ 分析工具
- Intel® PerfSpect
- Amazon EC2 執行個體