產品與效能資訊
1相較於搭配 ResNet-50 影像分類處理量的前一代處理器,支援 Intel DL Boost 搭配 BF16 的第 3 代 Intel Xeon 可擴充處理器,AI 訓練效能最高達 1.93 倍。
新配置:1 個節點、4 x 第 3 代 Intel Xeon Platinum 8380H 處理器(正式生產前 28 個核心,250 W)搭載總記憶體 384 GB(24 x 16 GB,3,200 GHz)、800 GB Intel 固態硬碟 ResNet-50 v1.5、ucode 0x700001b、開啟 Intel 超執行緒技術、開啟 Intel 渦輪加速技術,以及執行 Ubuntu 20.04 LTS、Linux 5.4.0-26,28,29-generic。處理量:
https://github.com/Intel-tensorflow/tensorflow -b bf16/base, commit#828738642769358b388d8f615ded9c213f10c99a,Model Zoo:
https://github.com/IntelAI/models -b v1.6.1,ImageNet 資料集、oneDNN 1.4、BF16、BS=512、由 Intel 在 2020 年 5 月 18 日進行測試。
基本配置:1 個節點、4 x Intel Xeon Platinum 8280 處理器搭載 768 GB 總記憶體(24 x 32 GB、2,933 GHz)、800 GB Intel 固態硬碟、ucode 0x4002f00、開啟 Intel 超執行緒技術、開啟 Intel 渦輪加速技術、搭載 Ubuntu 20.04 LTS、Linux 5.4.0-26,28,29-generic、ResNet-50 v1.5。處理量:
https://github.com/Intel-tensorflow/tensorflow -b bf16/base, commit#828738642760358b388d8f615ded0c213f10c99a,Model Zoo:
https://github.com/intelai/models -b v1.6.1、ImageNet 資料集、oneDNN 1.4、FP32、BS=512、由 Intel 於 2020 年 5 月 18 日進行測試。
2相較於在 ResNet-50 使用 FP32 影像分類處理量的前一代處理器,支援 Intel DL Boost 的第 3 代 Intel Xeon 可擴充處理器,AI 推論效能高達 1.87 倍。
新配置:1 個節點、4 x 第 3 代 Intel Xeon Platinum 8380H 處理器(正式生產前、28 個核心、250 W)搭載 384 GB 總記憶體(24 x 16 GB,3,200 GHz)、800 GB Intel 固態硬碟、ucode 0x700001b、開啟 Intel 超執行緒技術、開啟 Intel 渦輪加速技術搭配 Ubuntu 20.04 LTS、Linux 5.4.0-26,28,29-generic、ResNet-50 v1.5。處理量:
https://github.com/Intel-tensorflow/tensorflow -b bf16/base, commit#828738642760358b388e8r615ded0c213f10c99a,Model Zoo:
https://github.com/IntelAI/models -b v1.6.1、ImageNet 資料集、oneDNN 1.4、BF16、BS=56、5 個執行個體、28 個核心/執行個體,由 Intel 於 2020 年 5 月 18 日進行測試。
基本配置:1 個節點、4 x Intel Xeon Platinum 8280 處理器搭載 768 GB 總記憶體(24 x 32 GB、2,933 GHz)、800 GB Intel 固態硬碟、ucode 0x4002f00、開啟 Intel 超執行緒技術、開啟 Intel 渦輪加速技術、搭載 Ubuntu 20.04 LTS、Linux 5.4.0-26,28,29-generic、ResNet-50 v1.5。處理量:
https://github.com/Intel-tensorflow/tensorflow -b bf16/base, commit#828738642760358b388d8f615ded0c213f10c99a,Model Zoo:
https://github.com/IntelAI/models -b v1.6.1、ImageNet 資料集、oneDNN 1.5、FP32、BS=56、4 個執行個體、28 個核心/執行個體、由 Intel 於 2020 年 5 月 18 日進行測試。
3自然語言處理期間,相較於在 BERT 的前一代處理器,支援 Intel DL Boost 搭配 BF16 的第 3 代 Intel Xeon 可擴充處理器,AI 訓練效能高達 1.7 倍。
新配置:1 個節點、4 x 第 3 代 Intel Xeon Platinum 8380H 處理器(正式生產前、28 個核心、250 W)搭載 384 GB 總記憶體(24 x 16 GB,3,200 GHz)、800 GB Intel 固態硬碟、ucode 0x700001b、開啟 Intel 超執行緒技術、開啟 Intel 渦輪加速技術搭配 Ubuntu 20.04 LTS、Linux 5.4.0-26,28,29-generic、BERT-Large (QA)。處理量:
https://github.com/Intel-tensorflow/tensorflow -b bf16/base, commit#828738642760358b388e8r615ded0c213f10c99a,Model Zoo:
https://github.com/IntelAI/models -b v1.6.1、Squad 1.1 資料集、oneDNN 1.4、BF16、BS=12,由 Intel 在 2020 年 5 月 18 日進行測試。
基本配置:1 個節點、4 x Intel Xeon Platinum 8280 處理器搭載 768 GB 總記憶體(24 x 32 GB、2,933 GHz)、800 GB Intel 固態硬碟、ucode 0x4002f00、開啟 Intel 超執行緒技術、開啟 Intel 渦輪加速技術、搭載 Ubuntu 20.04 LTS、Linux 5.4.0-26,28,29-generic、BERT-Large (QA)。處理量:
https://github.com/Intel-tensorflow/tensorflow -b bf16/base, commit#828738642760358b388d8f615ded0c213f10c99a,Model Zoo:
https://github.com/IntelAI/models -b v1.6.1,Squad 1.1 資料集、oneDNN 1.5,FP32、BS=12、由 Intel 於 2020 年 5 月 18 日進行測試。
4相較於採用 FP32 的處理器,支援 Intel DL Boost 搭配 BF16 的第 3 代 Intel Xeon 可擴充處理器,自然語言處理的 BERT 處理量高達 1.9 倍。
新配置:1 個節點、4 x 第 3 代 Intel Xeon Platinum 8380H 處理器(正式生產前、28 個核心、250 W)搭載 384 GB 總記憶體(24 x 16 GB,3,200 GHz)、800 GB Intel 固態硬碟、ucode 0x700001b、開啟 Intel 超執行緒技術、開啟 Intel 渦輪加速技術搭配 Ubuntu 20.04 LTS、Linux 5.4.0-26,28,29-generic、BERT-Large (QA)。處理量:
https://github.com/Intel-tensorflow/tensorflow -b bf16/base, commit#828738642760358b388e8r615ded0c213f10c99a,Model Zoo:
https://github.com/IntelAI/models -b v1.6.1、Squad 1.1 資料集、oneDNN 1.4、BF16、BS=32、4 個執行個體、28 個核心/執行個體,由 Intel 於 2020 年 5 月 18 日進行測試。
基本配置:1 個節點、4 x Intel Xeon Platinum 8280 處理器搭載 768 GB 總記憶體(24 x 32 GB、2,933 GHz)、800 GB Intel 固態硬碟、ucode 0x4002f00、開啟 Intel 超執行緒技術、開啟 Intel 渦輪加速技術、搭載 Ubuntu 20.04 LTS、Linux 5.4.0-26,28,29-generic、BERTLarge (QA)。處理量:
https://github.com/Intel-tensorflow/tensorflow -b bf16/base, commit#828738642760358b388d8f615ded0c213f10c99a,Model Zoo:
https://github.com/IntelAI/models -b v1.6.1,Squad 1.1 資料集、oneDNN 1.5、FP32、BS=32、4 個執行個體、28 個核心/執行個體,由 Intel 於 2020 年 5 月 18 日進行測試。