跳到主要內容
支援知識庫

Intel® Ethernet Fabric Suite軟體安裝指南

內容類型: 安裝與設定   |   文章 ID: 000059662   |   最近查看日期: 2021 年 09 月 09 日

下載Intel® Ethernet Fabric Suite基本套件 或Intel® Ethernet Fabric Suite FS 套件

本文提供開始安裝Intel® Ethernet Fabric Suite (Intel® EFS) 軟體的說明和資訊。

本節提供在管理節點或網狀架構主機節點上安裝Intel® Ethernet Fabric Suite軟體的資訊與程式。

您使用下列其中一種方法來安裝軟體:

  • TUI 功能表(建議使用)
  • CLI 指令
  • Intel 提供的 Linux* Distribution Software 套件

建議您使用 Install TUI 在管理節點上安裝Intel EFS軟體,然後使用 FastFabric 設定管理節點。

注意

如果沒有管理節點的正確配置,某些工具或應用程式可能無法運作。舉例來說,MPI 應用程式可能需要無密碼的 SSH,而某些 FastFabric 功能則取決於正確的 SNMP 設定。在Intel® Ethernet Fabric Suite (Intel® EFS) 軟體安裝後,使用 FastFabric TUI 或 CLI 指令設定管理節點至關重要。

在設定管理節點後,基本軟體可以使用 FastFabric TUI 或布建或無磁片啟動機制安裝在所有剩餘的主機上。

注意

如果您使用的是布建系統,請參閱布建系統隨附的檔。

在開始安裝之前,請執行下列操作:

  • 有關相容作業系統與所需作業系統 RPM 安裝先決條件的清單,請參閱 本文
  • 如需安裝前的需求,請參閱 本文
  • 若您想要 GPUDirect* 支援,請前往「軟體安裝指南」中的「下載與安裝 NVIDIA* 軟體(選用)」一節,包括導入NVIDIA_GPU_DIRECT。
  • 您已下載並解壓縮 IEFS 軟體套件。
  • 如果您透過 Install CLI 命令使用自訂安裝,請準備命令列選項。
  • 收集您要設定的每一個介面的 IP 位址和網路資料清單。

使用 INSTALL 命令列選項

基本與 FS 安裝的 ./INSTALL 命令來自下列目錄:

  • Intel 基本目錄 :IntelEth-Basic.DISTRO.VERSION
  • Intel FS 目錄 :IntelEth-FS.DISTRO.VERSION

語法
./INSTALL [-v|-vv] -R osver [-a|-n|-U|-u|-s|-O|-N|-i comp| -e comp] [-G] [-E comp] [-D comp] [--user-space] [--無-depcheck] [--rebuild] [--force] [--回答 keyword=value]

./INSTALL -C

./INSTALL -V

選項

  • 未選取任何選項:顯示Intel® EFS軟體 TUI。
  • -v: 提供冗長的記錄。記錄到 /var/log/iefs.log 檔案。
  • - vv: 提供非常冗長的除錯記錄。記錄到 /var/log/iefs.log 檔案。
  • -R osver: 強制安裝特定作業系統核心版本,而不是執行核心。
  • -a: 使用預設選項安裝所有上層協定 (ULP) 和驅動程式。
  • -n: 使用預設選項安裝所有 ULP 和驅動程式,但不會變更自動啟動選項。
  • -U: 升級/重新安裝所有目前安裝的 ULP 和具有預設選項的驅動程式,並且不會變更自動啟動選項。
  • -u: 使用預設選項卸載所有 ULP 和驅動程式。
  • -s: 啟用所有已安裝的軟體的自動啟動。
  • -O: 保留目前修改過的 rpm 組態檔案。
  • -N: 使用新的預設 rpm 設定檔案。
  • -i comp: 使用預設選項安裝給定的元件。此選項可在命令列中多次顯示。
重要

使用此命令根據現有 FS 升級或降級個別元件,將更新所有先前安裝的元件到正在安裝的個別元件版本。

  • -e comp: 使用預設選項卸載給定的元件。此選項可在命令列中多次顯示。
  • -E comp: 啟用特定元件的自動啟動。這個選項可以在命令列中 以 -D 或多次出現。
注意若要控制哪些已安裝的軟體是針對自動啟動設定的,請結合此選項與 -a、-n、-i、-e -U 選項。
  • -D comp: 停用給定元件的自動啟動。此選項可以在命令列 中以 -E 或多次顯示。
注意若要控制哪些已安裝的軟體是針對自動啟動設定的,請結合此選項與 -a、-n、-i、-e 和-U 選項。
  • --使用者空間:在安裝期間跳過核心空間元件。
  • --無須檢查:停用對作業系統依存關係的檢查。
  • --重建:強制重建核心模組 srpms。
  • --強制:強制安裝,即使分配不符合。使用此選項可能會導致未定義的行為。
  • --回答關鍵字=值:針對操作期間可能發生的問題提供解答。未詢問的答案會被忽略。答案無效會導致提示互動式安裝或使用非互動式安裝的預設值。

可能的問題

ARPTABLE_TUNNING調整大型網狀架構的核心 ARP 表格大小
ROCE_ON RoCE RDMA 傳輸
LIMITS_SEL資源限制選擇器

  • -C: 顯示支援的元件名稱清單。
  • -V: 輸出軟體的版本編號。
  • -G: 安裝 GPU 支援元件。

其他資訊

  • 支援的元件 (comp) 名稱:eth_tools、psm3、fastfabric、eth_rdma、openmpi_gcc_ofi、mpisrc、delta_debug
  • 支援的元件 (comp) 名稱別名:eth、mpi、psm_mpi
  • 適用于 -G (GPU) 安裝的元件:
    對於 RHEL*:iefs-kernel-updates-devel、iefs-kernel-updates-dkms、kmod-iefs-kernel-updates、iefs-kernel-updates-debuginfo、openmpi_gcc_cuda_ofi
    針對SLES*:iefs-kernel-updates-devel、iefs-kernel-updates-kmp-default、iefs-kernel-updatesdkms、openmpi_gcc_cuda_ofi
 使用 TUI 功能表進行安裝

您可以使用Intel® EFS軟體功能表安裝Intel® Ethernet Fabric Suite軟體基本和 FS 軟體套件。您為要設定的每一個介面,都有 IPV4 IP 位址和網路資料清單。

執行下列步驟以安裝Intel® EFS軟體。

謹慎

請勿在程式中間中斷作業。有些作業可能需要幾分鐘才能完成。

 

任務/提示行動
1在命令提示下,將目錄變更為安裝軟體套件的位置:
  • 如需基本內容, 請輸入 下列內容,然後 下 Enter:cd IntelEth-Basic.DISTRO.VERSION
  • 對於 FS, 請輸入 下列內容,然後 下 Enter:cd IntelEth-FS.DISTRO.VERSIONwhere DISTRO。版本是分配和 CPU。
2在命令提示下, 啟動 安裝腳本。

輸入 ./INSTALL按下 Enter鍵。

 
注意
  • 若要安裝具備 GPU 支援的 FS, 請使用 ./INSTALL -G
  • 若要安裝具有不同根目錄的 FS, 請使用 色根
  • 當 chroot 環境中的核心版本與主機的核心版本不同時,請使用 ./INSTALL -R 以目標作業系統核心版本強制安裝 FS。
3選擇 1) 安裝/卸載軟體類型 1.
4檢視要安裝的專案。接受預設值(無需採取任何動作)。
類型 N 請移至下一頁。
注意

如果您需要變更任何專案,請輸入與專案相關的字母與數位字元,以便在安裝或不安裝之間切換。

5開始 安裝。輸入 P以執行動作。
注意: 這可能需要幾分鐘的時間。
6準備要安裝的 OFA 版本版本...重建 OFA SRPM (a=all,每個 SRPM 的 p=提示,n=僅視需要而定?)
[n]:
進入 接受預設值。
注意

系統會在整個安裝過程中顯示需要您回應的提示。

7針對每一個系統提示...接受預設值 緊迫 進入 繼續。
注意

部分預設程式可能需要幾分鐘才能完成。

8當Intel® EFS自動啟動功能表顯示時,請檢閱專案。Intel 建議將所有 Autostart 選擇設為預設值。
注意

如果您需要變更任何專案,請 輸入 與專案相關的字母與數位字元,以便 在啟用 停用之間切換。

9執行 Intel® EFS Autostart 操作。輸入 P.
10針對每一個系統提示,「按下任何要繼續的金鑰...」按下任何鍵。
注意

安裝完成後,您會返回主功能表。

11離開 TUI 到命令提示。輸入 X.
12重新開機 伺服器。類型 重新 啟動 進入.
注意

請勿中斷重新開機程式。
根據您的作業系統,重新開機可能需要幾分鐘的時間。

13確認安裝成功。輸入 iefsconfig-V按 Enter 鍵
  使用 CLI 指令進行安裝

您可以使用 ./INSTALL 命令安裝Intel® Ethernet Fabric Suite軟體基本和 FS 軟體套件。

./INSTALL 命令有許多選項,包括安裝單一元件,以及啟用和停用元件的自動啟動。本節為您提供了預設安裝的說明,但您可以用特定選項來附加安裝命令,以進行更自訂的安裝。

您為要設定的每一個介面,都有 IPV4 IP 位址和網路資料清單。

執行下列步驟以安裝預設Intel® EFS軟體組態:

任務/提示行動
1在命令提示下, 將目錄變更 為位置
安裝軟體套件:
  • 如需基本內容,請輸入下列內容並按下 Enter鍵:
    cd IntelEth-Basic.DISTRO.VERSION
  • 對於 FS,請輸入下列內容並按下 Enter鍵:
    cd IntelEth-FS.DISTRO.VERSION, 其中 DISTRO。版本 是分配和 CPU。
2在命令提示下,啟動安裝腳本。

輸入 ./INSTALL-n按下 Enter
注意:

  • 若要安裝具備 GPU 支援的 FS,請使用 ./INSTALL-n-G。
  • 若要安裝具有不同根目錄的 FS, 請使用 色根
  • chroot 環境中的核心版本與主機的核心版本不同時,請使用 ./INSTALL -R 以目標作業系統核心版本強制安裝 FS。
3在命令提示下,重新開機伺服器。輸入重新開機按下 Enter
使用 Intel 提供的 Linux* Distribution 軟體套件進行安裝

Intel® Ethernet Fabric Suite (Intel® EFS) 軟體 FS 套件包含用於安裝Intel® EFS軟體的作業系統特定儲存庫。

本節提供使用 FS 封裝存放庫安裝的說明。

Intel 推出虛擬套件以促進 FS 安裝。

  • 搭載 ethmeta_ 的虛擬套件是 INSTALL 腳本中 FS 元件的元套件。安裝元套件將安裝對應的元件。
  • 預先安裝 ethnode_ 的虛擬套件是 HPC 節點上一般 FS 安裝的別名套件。

預設安裝選項

此安裝方法將安裝具有預設選項的Intel® EFS套件。若要安裝不同的選項,請在安裝前設定下列系統內容變數。

  • 可變名稱 :ETH_ARPTABLE_TUNING
    值:
    1 - 啟用大型網狀架構的調整核心 ARP 表格 (預設)
    0 - 停用調整大型網狀架構的核心 ARP 表格
  • 可變名稱 :ETH_ROCE_ON
    值:
    1 - 在支援的 NIC 上啟用 RoCE (預設)
    0 - 在支援的 NIC 上停用 RoCE
  • 可變名稱 :ETH_LIMITS_CONF
    值:
    1 - 啟用調整後的記憶體限制配置(預設)
    0 - 停用調整後的記憶體限制組態

Intel EFS套件內的存放庫

Intel EFS套件包含下列存放庫:
IEFS_PKGS: 包含在運算節點、管理節點或服務節點(例如儲存節點)上安裝的所有軟體。
IEFS_PKGS_CUDA: 包含在包含 NVIDIA* 卡的節點上需要安裝的所有軟體。

注意這兩個存放庫不能共存于任何節點。確保只有一個存在或已啟用。

安裝 腳本交互操作。

Intel 建議您不要將基於 yum/zypper 存放庫的安裝與腳本式安裝混合。這樣做可能會造成意外的行為。然而,您可以從一個安裝機制切換到另一個。

  • 從腳本式安裝切換為 yum/zypper 型安裝:
    客戶可隨時切換至 搭載 yum/zypper 的安裝。不需要採取特殊行動。若要切換到 搭載 yum/zypper 的安裝:如果腳本已部分或完整安裝了Intel® EFS,搭載 yum/zypper 的安裝將識別已安裝的套件,並在安裝期間將其跳過。
  • yum/zypper 型安裝切換到腳本式安裝:
    搭載 yum/zypper 的裝置的元和別名套件,對Intel® EFS套件有額外的依賴性。這可能會影響基於腳本的安裝,因為代碼直接使用 rpm 指令進行安裝,而 rpm 指令對封裝依存關係十分敏感。若要切換到腳本式安裝:因為您必須先移除元和別名套件,Intel 已改進 INSTALLscript 來處理此問題。使用 INSTALL-a,-U,-n 將切換到腳本式安裝。 INSTALL-u 將移除所有套件,包括元和別名套件。或者,您可以在啟動腳本式安裝之前,以 yum/zypper 指令手動移除元和別名套件。

將儲存庫部署到環境中

IntelEth-FS.-x86_64..tgz tar 套件包含用來安裝Intel® EFS軟體的存放庫。它還包括一個名為ethcreaterepo 的說明者腳本,該腳本可檢查並重建核心 rpms、建立本機存放庫,並建議在每個運算、管理和服務節點上安裝套件。

Intel 建議使用此腳本建立本機存放庫,確保為 GPU 支援需求建立正確的版本核心 rpms 和正確的存放庫。

舉例來說,如果 ETH_PKGS_CUDA 存放庫已經存在,而您想要將儲存庫替換為 ETH_PKGS, 則腳本會備份並移除ETH_PKGS_CUDA, 以防止 GPU 版本套件無意中安裝。

本地存放庫成功建立後,您可以根據組織需求將其轉移至企業存放庫,以便在節點之間共用。下列顯示 ethcreaterepo 的使用資訊:
使用:
ethcreaterepo [-G]
ethcreaterepo -i
ethcreaterepo──說明
為Intel® Ethernet Fabric Suite套件建立本機回購。
選項:
-G 建立具有 GPU 直接支援的回購 (要安裝,必須安裝 NVidia 驅動程式)
-i 顯示它將建立的回購資訊
--協助產生完整的協助文字
例子:
ethcreaterepo
ethcreaterepo -G
ethcreaterepo –i

腳本執行成功後,它將列出要安裝的套件。以下範例顯示 RHEL 的輸出:

Repo IntelEth-FS 成功建立。
請使用下列元件元元件來安裝Intel 乙太網路軟體
ethmeta_eth_tools:Intel 乙太網路 Eth Tools 的 Meta 套件
ethmeta_fastfabric:適用于 FastFabric 的 Intel 乙太網路 Meta 封裝
ethmeta_mpisrc:Intel 乙太網路 MPI 來源的 Meta 套件
ethmeta_openmpi_gcc_ofi:適用于 OpenMPI (ofi,gcc) 的 Intel 乙太網路 Meta 套件
ethmeta_openmpi_gcc_ofi_dkms:適用于 OpenMPI (ofi,gcc) 的 Intel 乙太網路 Meta 套件 (DKMS 版本)
ethmeta_openmpi_gcc_ofi_userspace:適用于 OpenMPI (ofi,gcc) 的 Intel 乙太網路 Meta 套件 (僅限使用者空間)
ethmeta_psm3:適用于 PSM3 的 Intel 乙太網路 Meta 套件
ethmeta_psm3_dkms:適用于 PSM3 (DKMS 版本) 的 Intel 乙太網路 Meta 套件
ethmeta_psm3_userspace:適用于 PSM3 的 Intel 乙太網路 Meta 封裝(僅限使用者空間)
為了促進安裝,Intel 為一般元件組合提供下列別名:
ethnode_mgmt:對管理節點有用。包含所有元件。
ethnode_mgmt_userspace:對容器有用。與eth_mgmt相同,只是使用使用者空間版本元件。
ethnode_mgmt_dkms:DKMS 版本 ethnode_mgmt。需要預先安裝 DKMS。
ethnode_compute:對運算和登入節點有用。包含管理以外的所有元件 (fastfabric)
ethnode_compute_userspace:對容器有用。與eth_compute相同,只是使用使用者空間版本元件。
ethnode_compute_dkms:DKMS 版本 ethnode_compute。需要預先安裝 DKMS。
ethnode_service:對服務節點有用。包含除 fastfabric 和 mpi 元件以外的所有元件。
ethnode_service_userspace:對容器有用。與eth_service相同,只是使用使用者空間版本元件。
ethnode_service_dkms:DKMS 版本 ethnode_service。需要預先安裝 DKMS。
安裝完成後,請執行 iefsconfig 來設定Intel 乙太網路軟體

在 Linux* 作業系統上使用 IEFS 存放庫

您可以在 Red Hat* Enterprise Linux* (RHEL*) 或 SUSE* Linux* Enterprise Server (SLES*) 上安裝Intel® Ethernet Fabric Suite軟體套件,使用 IEFS 封裝存放庫中所含的作業系統分配及其依存關係。您為要設定的每一個介面,都有 IPV4 IP 位址和網路資料清單。您的軟體套件已準備好安裝。

執行下列步驟以安裝預設Intel® Ethernet Fabric Suite軟體組態:

任務/提示行動
設定 IEFS 存放庫
1建立 本機存放庫。在命令提示下,輸入:ethcreaterepo。
2在需要 GPU 支援的節點上建立本機存放庫。
注意: 如果您在沒有 NVIDIA* 卡的節點上安裝 GPU 支援的套件,您可能會看到效能下降。

在命令提示下,輸入:ethcreaterepo-G
注意: 執行後,會提供建議的安裝命令。

3在每個節點上安裝Intel® EFS軟體。
如需特定Intel® EFS元件的套件清單,
請參閱Intel® EFS軟體元件到套件
映射。
類型 yum 安裝 在 RHEL 下,或 zypper 安裝 在 SLES 下,其中   是建議的別名 pkg (根據節點類型)。
注意

或者,您可以在布建腳本中插入安裝命令 (根據節點類型)。

設定 RDMA
4在命令提示下,開始   iefsconfig輸入 iefsconfig
5選取 2) 重新設定 Eth RDMA。類型 2.
6啟用 RoCE RDMA 傳輸 (ROCE_ON)?[y]: Enter鍵。
7資源限制選擇器 (0-7) [5]:根據網狀架構上執行的網狀架構大小和應用程式,按下 Enter或輸入另一個號碼。
8針對每個介面,設定 MTU 和心甘情願模式的優先流量控制配置介面現在?[y]:
MTU 值 [9000]:
流量控制設定,建議願意模式優先
流量控制...
關閉連結層級流程式控制制?[y]:
開啟韌體 DCB?[y]:
輸入 y 設定介面。
輸入 所需的 MTU 值。
下 Enter 以關閉連結層級流程式控制制。
Enter開啟韌體 DCB。
9重新開機 伺服器。類型 重新 啟動 進入.
注意

請勿中斷重新開機程式。視您的作業系統而定
重新開機可能需要幾分鐘的時間。

10確認安裝成功。輸入 iefsconfig-V按 Enter 鍵
使用 DKMS 安裝核心模組

在系統上安裝動態核心模組支援 (DKMS) 後,您可以使用 DKMS 支援安裝Intel® EFS核心模組,這樣一來,當核心更新發生時,您不需要重新安裝Intel® Ethernet Fabric Suite軟體。DKMS 框架將在核心更新期間自動重建核心模組。

重要

當您更新到新的主要作業系統版本時,核心模組重建可能無法運作。在這種情況下,您必須下載對應的Intel EFS並重新安裝。

先決條件

在執行下列步驟之前安裝 DKMS。

注意

Linux* 發行版本不提供 DKMS。您必須自行下載或安裝。例如,您可以從下列位置安裝:

按照安裝使用 TUI 功能表使用 CLI 指令安裝Intel® Ethernet Fabric Suite軟體中所述的說明進行安裝。當安裝腳本偵測到 DKMS 時,它將安裝 DKMS 版本套件。若要使用 IEFS 儲存庫進行安裝,請按照 安裝使用 Linux* Distribution Software Package中所述的說明,並選擇 dkms 版本套件進行安裝。

相關產品

本文章適用 1 產品。

免責聲明

這個頁面的內容綜合了英文原始內容的人工翻譯譯文與機器翻譯譯文。本內容是基於一般資訊目的,方便您參考而提供,不應視同完整或準確的內容。如果這個頁面的英文版與譯文之間發生任何牴觸,將受英文版規範及管轄。 查看這個頁面的英文版。