• <Intel.com 還有更多
Masthead Light

Intel® Xeon Phi™ 產品

高度平行處理,加速突破創新

高度平行處理應用的突破性效能

加速突破創新,請使用具有高度平行處理能力的 Intel® Xeon Phi™ 協同處理器。每一顆晶片都包進了超過一個 teraFLOPS (每秒一兆次浮點運算) 的雙精度峰值效能,這是任何 Intel® Xeon® 處理器最高的平行效能功耗比。1,2,3,4 現在,透過 x86 相容性,您可以思考「重複使用」而不是「重新編寫」程式碼。很多語言、工具及應用程式,都能順利執行,跨越全系列的 Intel® Xeon® 產品平台。

Intel® Xeon Phi™ 協同處理器:

單一程式設計模型,用在貴公司所有的程式碼

支援 Intel® 架構的程式語言、模型及工具,已有寬廣的價值鏈體系,而 Intel Xeon 處理器與 Intel Xeon Phi 協同處理器,都能利用這一切的資源。應用程式只要能在其中一種處理器產品上執行,也能在另一種產品上執行。這種一致性可以大幅減少軟體開發的複雜度。現有的應用程式將會需要調校,並且重新編譯,以達到最大的吞吐量,但是貴公司的開發者不會需要重新思考整個問題,或是精通新的工具,以及程式設計模型。他們反而可以重複使用現有的程式碼,並且維護一套共同的碼庫,只要使用熟悉的工具與方法。

多款協同處理器,適合不同的需求

Intel Xeon Phi 協同處理器提供多達 61 個核心、244 個執行緒,以及每秒 1.2 兆次浮點運算的效能,而且提供多樣配置選擇,解決不同的硬體、軟體、工作負載及效率需求。

Intel® Xeon Phi™ 協同處理器板卡

Intel® Xeon Phi™ 協同處理器 3100 產品

Intel® Xeon Phi™ 協同處理器 3100 產品提供卓越的平行處理效能。對於電腦運算受限的工作負載,例如蒙地卡羅模擬、Black-Scholes、HPL、LifeSc 及許多其他工作負載,這是極為優異的選擇。

查看產品規格 >

Intel® Xeon Phi™ 協同處理器板卡

Intel® Xeon Phi™ 協同處理器 5100 產品

Intel® Xeon Phi™ 協同處理器 5100 產品針對高密度運算最佳化,非常適合記憶體頻寬受限的工作負載,例如 STREAM,記憶體容量受限的工作負載,例如光線追蹤,或是兩者皆受限的工作負載,例如逆時移位 (RTM)。

查看產品規格 >

Intel® Xeon Phi™ 協同處理器板卡

Intel® Xeon Phi™ 協同處理器 7100 產品

Intel® Xeon Phi™ 協同處理器 7100 產品是特色功能最多、效能最高,而且記憶體容量最大的 Intel Xeon Phi 產品。本產品支援 Intel® 渦輪加速技術 1.0,只要散熱條件允許,在尖峰工作負載期間,可提高核心頻率。

查看產品規格 >

Intel® Xeon Phi™ 協同處理器板卡

效能大突破

掌握超過 1 TeraFLOPS (每秒一兆次浮點運算) 的雙精度峰值效能。1,2,3

比起僅搭載 Intel® Xeon® 處理器 E5 產品的伺服器,Intel® Xeon Phi™ 協同處理器可提供:

  • 對於高度平行處理應用,效能增加 2.5 倍1,5,6
  • 峰值每秒浮點運算次數 (FLOPS) 提高 3.2 倍1,3,7
  • 記憶體頻寬增加 2.2 倍1,8
  • 對於某些金融服務應用,效能改善 10 倍1,9
  • 每瓦效能增加 4 倍1,4

對於搭載 Intel® Xeon® 處理器 E5 產品的伺服器,只要加裝 Intel® Xeon Phi™ 協同處理器,即可提高伺服器密度,每個機架的每秒浮點運算次數增加高達 8 倍。1,3,10

 

Intel® Xeon Phi™ 協同處理器板卡

容易設計程式的 Intel® 架構

應用程式可以同時支援 Intel® Xeon 處理器與 Intel® Xeon Phi™ 協同處理器,因為兩者使用共同的語言、模型及工具,包括:

  • 熟悉且標準的開發工具:不需要學習新的語言或工具
  • Intel 的工具,像是 Intel ® Cluster Studio XE,以及其他廠商提供的許多工具
  • 普遍的方法,例如訊息傳遞介面 (Message Passing Interface)、OpenMP、Fortran 的 DO CONCURRENT*、Intel® Threading Building Blocks (Intel® TBB),以及 Intel® Cilk™ Plus

彈性靈活的執行

彈性靈活的運算模組

充分利用 Intel® Xeon Phi™ 協同處理器靈活的運算彈性:

  • 結合 Intel® Xeon® 處理器使用,加速處理高度平行的程式碼
  • 建置獨立的高效能運算節點,這款協同處理器可以有自己的 IP 位址,而且能夠獨立執行應用程式,不像基本的加速器

產品與效能資訊

open

1. 效能測試中使用的軟體與工作負載,可能只有針對 Intel 微處理器的效能最佳化。效能測試 (例如 SYSmark 與 MobileMark) 使用特定的電腦系統、元件、軟體、作業及功能進行評量。這些因素若有任何變更,可能會導致不同的結果。考慮購買時,為了協助您充分評估,您應該參考其他資訊及效能測試,包括該產品結合其他產品使用時的效能表現。如需詳細資訊,請參閱 www.intel.com/performance。

2. 這是根據計算理論峰值雙精度效能,以單顆協同處理器來看。16 DP FLOPS/時脈/核心 * 61 核心 * 1.238 GHz = 1.208 TeraFLOPS,亦即每秒 1.208 兆次浮點運算。

3. 其結果乃是根據 Intel 內部分析估計而得,僅供參考。系統硬體或軟體的設計或配置若有任何差異,都可能影響實際的效能。

4. 搭載 2 顆 Intel® Xeon® 處理器 E5-2670 的伺服器,相對於單顆 Intel® Xeon Phi™ 協同處理器 7120P (Intel 測得 DGEMM 效能功耗比分數是每秒 309 GF 使用 335 瓦,相對於每秒 829 GF 使用 195 瓦)。

5. 搭載 2 顆 Intel® Xeon® 處理器 E5-2600 產品的伺服器,相對於 Intel® Xeon Phi™ 協同處理器 (2.52 倍: 美國洛斯阿拉莫斯國家實驗室於 2012 年 6 月測得。2 顆 E5-2687 (8 核心,3.1 GHz) 相對於 1 顆尚未量產的 Intel® Xeon Phi™ 協同處理器 (60 核心,1.0 GHz),執行「分子動力學」應用。工作負載完成時間是 4 小時 7 分 10 秒,相對於 1 小時 38 分 16 秒) (2.53 倍: 中國石化於 2012 年 10 月測得。2 顆 E5-2680 (8 核心,2.7 GHz) 伺服器未安裝協同處理器,相對於同一台伺服器安裝 2 顆尚未量產的 Intel® Xeon Phi™ 協同處理器 (61 核心,1.091 GHz),執行「地震成像」應用。工作負載完成時間是 1342 秒,相對於 528.6 秒)。

6. 對於本文件提及的各項第三方效能標竿或網站,Intel 並不會控制或稽核其設計或執行。Intel 鼓勵所有的客戶參閱提及的網站,或是其他發佈類似評量效能標竿報告的網站,確認提及的效能標竿是否正確,並且反映出可購買系統的效能表現。

7. 計算理論峰值雙精度浮點數 (2 顆 Intel® Xeon® 處理器 E5-2670,8 核心、2.6 GHz,相對於 1 顆 Intel® Xeon Phi™ 協同處理器 7120P,61 核心、1.238 GHz)。

8. 搭載 2 顆 Intel® Xeon® 處理器 E5-2600 產品的伺服器,相對於 Intel® Xeon Phi™ 協同處理器 (2.2 倍,Intel 於 2012 年 10 月測得。2 顆 Intel® Xeon® 處理器 E5-2670 (8 核心,2.6 GHz) 相對於 1 顆 Intel® Xeon Phi™ 協同處理器 7120P (61 核心,1.238 GHz),執行 STREAM Triad 效能標竿,得到 79.5 GB/s 相對於 175 GB/s)。

9. 搭載 2 顆 Intel® Xeon® 處理器 E5-2600 產品的伺服器,相對於 Intel® Xeon Phi™ 協同處理器 (10.75 倍: Intel 於 2012 年 10 月測得。2 顆 E5-2670 (8 核心,2.6 GHz) 相對於 1 顆 Intel® Xeon Phi™ 協同處理器 SE10P (61 核心,1.1 GHz),執行「單精度蒙地卡羅模擬法」,得到每秒 45,501 個選擇,相對於每秒 489,354 個選擇 )

10. (Phi 每機架每秒浮點運算次數) 搭載 2 顆 Intel® Xeon® 處理器 E5-2670 的伺服器,相對於同一台 2 顆處理器的伺服器安裝 2 顆 Intel® Xeon Phi™ 處理器 7120P (計算理論峰值雙精度浮點數: 每秒 332.8 GF 相對於 ( 332.8 + ( 2 x 每秒 1208 GF)))。