記憶體 ECC 可修正錯誤指南,以及何時觸發事件
處理已登入系統事件日誌 (SEL) 中的 ECC 可修正錯誤事件時需要遵循的步驟
ECC 可修正的錯誤表示特定雙直列記憶體模組 (DIMM) 在特定時間範圍內的臨界值溢出。
- 如果沒有災難性問題 (紫色死亡螢幕 (紫色螢幕死亡) 或意外重新開機),以及可修正的 ECC 錯誤,包括每 24 小時內每個 DIMM 位置的介面卡雙裝置資料修正 (ADDDC) 錯誤少於 10 個事件,則建議監測觸發事件的每個 DIMM 位置是否再次發生 ECC 錯誤
- 如果發生災難性問題 (紫色死亡螢幕 (紫色死亡畫面) 或意外重新開機),以及可修正的 ECC 錯誤,包括每個 DIMM 位置每 24 小時內發生超過 10 次事件的介面卡雙裝置資料修正 (ADDDC) 錯誤,建議按照以下步驟重新安裝每個 DIMM 位置:
筆記 |
錯誤修正代碼 (ECC) 錯誤是自我修正。根據記憶體的可靠性可用性服務 (RAS) 配置,整合式記憶體控制器 (IMC) 可能會讓受影響的 DIMM 離線。 |
對於不同的 Intel 伺服器平臺,其事件定義有一些差異,請參閱伺服器平臺的系統事件記錄疑難排解指南 | |
Intel 建議 下載 並更新系統 BIOS 至伺服器平臺的最新可用版本。 | |
如果系統是經 Nutanix* 企業雲端平臺認證的 Intel® 資料中心系統,請造訪 Nutanix* 生命週期管理器頁面。如需硬體與韌體相容性清單,請造訪 Nutanix* 硬體與韌體相容性頁面。 |