文章 ID: 000038234 內容類型: 錯誤訊息 最近查看日期: 2023 年 05 月 30 日

什麼是記憶體錯誤修正代碼 (ECC) 可修正的錯誤事件?

環境

Intel® Server Board產品系列與Intel® 伺服器系統產品系列

BUILT IN - ARTICLE INTRO SECOND COMPONENT
摘要

記憶體 ECC 可修正錯誤指南,以及何時觸發事件

描述

處理已登入系統事件日誌 (SEL) 中的 ECC 可修正錯誤事件時需要遵循的步驟

解決方法

ECC 可修正的錯誤表示特定雙直列記憶體模組 (DIMM) 在特定時間範圍內的臨界值溢出。

  • 如果沒有災難性問題 (紫色死亡螢幕 (紫色螢幕死亡) 或意外重新開機),以及可修正的 ECC 錯誤,包括每 24 小時內每個 DIMM 位置的介面卡雙裝置資料修正 (ADDDC) 錯誤少於 10 個事件,則建議監測觸發事件的每個 DIMM 位置是否再次發生 ECC 錯誤
  • 如果發生災難性問題 (紫色死亡螢幕 (紫色死亡畫面) 或意外重新開機),以及可修正的 ECC 錯誤,包括每個 DIMM 位置每 24 小時內發生超過 10 次事件的介面卡雙裝置資料修正 (ADDDC) 錯誤,建議按照以下步驟重新安裝每個 DIMM 位置:
    1. 關閉 系統電源並 移除 AC 電源線
    2. 識別 要重新安裝的 DIMM 位置,請參閱伺服器平臺 的技術產品規格 以識別 DIMM 位置
    3. 執行 已識別 DIMM 的重新座位
    4. 插入系統上有 AC 電源線與電源
    5. 觀察 24 小時,以瞭解 ECC 錯誤復發
    6. 如果 ECC 錯誤持續存在重新安裝的 DIMM 位置,則會產生傳送兩者均由 BMC Web 主控台產生的SEL除錯記錄給 Intel 客戶支援
筆記

錯誤修正代碼 (ECC) 錯誤是自我修正。根據記憶體的可靠性可用性服務 (RAS) 配置,整合式記憶體控制器 (IMC) 可能會讓受影響的 DIMM 離線。

對於不同的 Intel 伺服器平臺,其事件定義有一些差異,請參閱伺服器平臺的系統事件記錄疑難排解指南

Intel 建議 下載 並更新系統 BIOS 至伺服器平臺的最新可用版本。

如果系統是經 Nutanix* 企業雲端平臺認證的 Intel® 資料中心系統,請造訪 Nutanix* 生命週期管理器頁面。如需硬體與韌體相容性清單,請造訪 Nutanix* 硬體與韌體相容性頁面

額外資訊

相關產品

本文章適用於 154 產品

Intel® 伺服器系統 D50TNP1MHCRAC 運算模組
Intel® 伺服器系統 D50TNP1MHCRLC 運算模組
Intel® 伺服器系統 D50TNP1MHEVAC 運算模組
Intel® 伺服器系統 D50TNP2MFALAC 加速模組
Intel® 伺服器系統 D50TNP2MHSTAC 儲存模組
Intel® 伺服器系統 D50TNP2MHSVAC 管理模組
Intel® 運算模組 HNS2600BPB
Intel® 運算模組 HNS2600BPB24
Intel® 運算模組 HNS2600BPB24R
Intel® 運算模組 HNS2600BPBLC
Intel® 運算模組 HNS2600BPBLC24
Intel® 運算模組 HNS2600BPBLC24R
Intel® 運算模組 HNS2600BPBLCR
Intel® 運算模組 HNS2600BPQ
Intel® 運算模組 HNS2600BPQ24
Intel® 運算模組 HNS2600BPQ24R
Intel® 運算模組 HNS2600BPQR
Intel® 運算模組 HNS2600BPS
Intel® 運算模組 HNS2600BPS24
Intel® 運算模組 HNS2600BPS24R
Intel® 運算模組 HNS2600BPSR
Intel® 伺服器主機板 S2600STK
Intel® 伺服器主機板 S2600STS

這個頁面的內容綜合了英文原始內容的人工翻譯譯文與機器翻譯譯文。本內容是基於一般資訊目的,方便您參考而提供,不應視同完整或準確的內容。如果這個頁面的英文版與譯文之間發生任何牴觸,將受英文版規範及管轄。 查看這個頁面的英文版。