文章 ID: 000029671 內容類型: 錯誤訊息 最近查看日期: 2021 年 07 月 07 日

節點在重新開機期間發生數次當機

環境

機架規模設計直接

Centos73

BUILT IN - ARTICLE INTRO SECOND COMPONENT
摘要

分析為何節點在重新開機期間可能會多次當機 (Intel® Rack Scale Design Direct)

描述

各種程式 segfault (區段錯誤) 可能會顯示。 以下是作為範例提供的輸出:

{{{
2018-06-11T02:21:11.407233+02:00 jrc5065 核心:多瑪[22449]:segfault at 0 ip 00002b9380c262e9 sp 00007ffefc169c40 錯誤 4
2018-06-11T02:21:11.407405+02:00 jrc5065 核心:多瑪[22451]:segfault at 0 ip 00002ab0069dd2e9 sp 00007ffe41d38640 錯誤 4
2018-06-11T02:21:11.407490+02:00 jrc5065 核心:羅馬[22443]:segfault at 0 ip 00002b1b4fcde2e9 sp 00007ffdf555a0c0 錯誤 4
2018-06-11T02:21:11.407760+02:00 jrc5065 核心:多[22447]:segfault at 0 ip 00002b36481552e9 sp 00007ffd349e1bc0 錯誤 4
2018-07-10T15:17:56.674483+02:00 jrc5065 核心:systemd-udevd[1812]:segfault 于 672 47d ip 000055b97d97fd54 sp 00007ffeb37912d0 錯誤 6 in systemd-udevd[55b97d976000+4b000]
2018-07-10T15:17:56.728418+02:00 jrc5065 核心:systemd-udevd[1815]:segfault at 55b97d9aecf0 ip 000055b97d97bdf8 sp 00007ffeb37912d0 錯誤 7 in systemd-udevd[55b97d976000+4b000]
2018-07-10T15:17:56.903902+02:00 jrc5065 核心:systemd-udevd[1839]:segfault at 55b97d9aecf0 ip 000055b97d97bdf8 sp 00007ffeb37912d0 錯誤 7 in systemd-udevd[55b97d976000+4b000]
2018-07-10T15:17:56.932901+02:00 jrc5065 核心:systemd-udevd[1810]:segfault at 55b97d9aecf0 ip 000055b97d97bdf8 sp 00007ffeb37912d0 錯誤 7 in systemd-udevd[55b97d976000+4b000]
2018-07-10T15:17:56.979885+02:00 jrc5065 核心:systemd-udevd[1826]:segfault at 55b97d9aecf0 ip 000055b97d97bdf8 sp 00007ffeb37912d0 錯誤 7 in systemd-udevd[55b97d976000+4b000]
2018-07-10T15:17:57.273517+02:00 jrc5065 核心:systemd-udevd[1821]:segfault at 5 ip 00007ff4618ffcff sp 00007ffeb3790d00 錯誤 4 在 liblzma.so.5.2.2[7ff4618eb000+25000]
2018-07-10T15:17:57.273677+02:00 jrc5065 核心:systemd-udevd[1831]:segfault at 672 47d ip 000055b97d97fd54 sp 00007ffeb37912d0 錯誤 6 in systemd-udevd[55b97d976000+4b000]
2018-07-10T15:17:57.273750+02:00 jrc5065 核心:systemd-udevd[1835]:segfault at 7 ip 000055b97d97bdff sp 00007ffeb37912d0 系統-udevd 的錯誤 6[55b97d976000+4b000]
2018-07-10T15:17:57.277861+02:00 jrc5065 核心:systemd-udevd[1859]:segfault at 5 ip 00007ff4618ffcff sp 00007ffeb3790d00 錯誤 4 在 liblzma.so.5.2.2[7ff4618eb000+25000]
2018-07-10T15:18:42.602983+02:00 jrc5065 核心:mmoteote[6059]:segfault at fffffffffffee0bc ip 0000000004adfde sp 00007ffeb9a2b2c0 錯誤 7 in mmksh[400000+128000]
2018-07-10T15:19:26.350965+02:00 jrc5065 核心:runmmfs[5832]:segfault at f200f70 a ip 00007f713e553706 sp 00007ffcdc458328 錯誤 6,libc-2.17.so[7f713e422000+1b8000]
2018-07-10T15:21:21.926079+02:00 jrc5065 核心:mmoteote[16345]:segfault at fffffffffffee0bc ip 0000000004adfde sp 00007fff2e2f3d90 錯誤 7 in mmksh[400000+128000]
}}}

 

不過(系統事件記錄)中沒有任何顯示。

解決方法

如需一步協助,請與系統事件記錄1 和 sos 報告2 (可能/可用) 聯絡支援部門進行診斷。

1 如何解壓縮和讀取 Intel®伺服器主機板的系統事件記錄 (SEL)

2 sos 報告注意事項:
.這是一個公用程式,收集關於系統的組分和診斷資訊。
.首先必須透過「sudo apt-get install sosreport」指令安裝。
.安裝後將系統重新開機;然後,執行公用程式。

相關產品

本文章適用於 1 產品

這個頁面的內容綜合了英文原始內容的人工翻譯譯文與機器翻譯譯文。本內容是基於一般資訊目的,方便您參考而提供,不應視同完整或準確的內容。如果這個頁面的英文版與譯文之間發生任何牴觸,將受英文版規範及管轄。 查看這個頁面的英文版。