分析為何節點在重新開機期間可能會多次當機 (Intel® Rack Scale Design Direct)
各種程式 segfault (區段錯誤) 可能會顯示。 以下是作為範例提供的輸出:
2018-06-11T02:21:11.407233+02:00 jrc5065 核心:多瑪[22449]:segfault at 0 ip 00002b9380c262e9 sp 00007ffefc169c40 錯誤 4
2018-06-11T02:21:11.407405+02:00 jrc5065 核心:多瑪[22451]:segfault at 0 ip 00002ab0069dd2e9 sp 00007ffe41d38640 錯誤 4
2018-06-11T02:21:11.407490+02:00 jrc5065 核心:羅馬[22443]:segfault at 0 ip 00002b1b4fcde2e9 sp 00007ffdf555a0c0 錯誤 4
2018-06-11T02:21:11.407760+02:00 jrc5065 核心:多[22447]:segfault at 0 ip 00002b36481552e9 sp 00007ffd349e1bc0 錯誤 4
2018-07-10T15:17:56.674483+02:00 jrc5065 核心:systemd-udevd[1812]:segfault 于 672 47d ip 000055b97d97fd54 sp 00007ffeb37912d0 錯誤 6 in systemd-udevd[55b97d976000+4b000]
2018-07-10T15:17:56.728418+02:00 jrc5065 核心:systemd-udevd[1815]:segfault at 55b97d9aecf0 ip 000055b97d97bdf8 sp 00007ffeb37912d0 錯誤 7 in systemd-udevd[55b97d976000+4b000]
2018-07-10T15:17:56.903902+02:00 jrc5065 核心:systemd-udevd[1839]:segfault at 55b97d9aecf0 ip 000055b97d97bdf8 sp 00007ffeb37912d0 錯誤 7 in systemd-udevd[55b97d976000+4b000]
2018-07-10T15:17:56.932901+02:00 jrc5065 核心:systemd-udevd[1810]:segfault at 55b97d9aecf0 ip 000055b97d97bdf8 sp 00007ffeb37912d0 錯誤 7 in systemd-udevd[55b97d976000+4b000]
2018-07-10T15:17:56.979885+02:00 jrc5065 核心:systemd-udevd[1826]:segfault at 55b97d9aecf0 ip 000055b97d97bdf8 sp 00007ffeb37912d0 錯誤 7 in systemd-udevd[55b97d976000+4b000]
2018-07-10T15:17:57.273517+02:00 jrc5065 核心:systemd-udevd[1821]:segfault at 5 ip 00007ff4618ffcff sp 00007ffeb3790d00 錯誤 4 在 liblzma.so.5.2.2[7ff4618eb000+25000]
2018-07-10T15:17:57.273677+02:00 jrc5065 核心:systemd-udevd[1831]:segfault at 672 47d ip 000055b97d97fd54 sp 00007ffeb37912d0 錯誤 6 in systemd-udevd[55b97d976000+4b000]
2018-07-10T15:17:57.273750+02:00 jrc5065 核心:systemd-udevd[1835]:segfault at 7 ip 000055b97d97bdff sp 00007ffeb37912d0 系統-udevd 的錯誤 6[55b97d976000+4b000]
2018-07-10T15:17:57.277861+02:00 jrc5065 核心:systemd-udevd[1859]:segfault at 5 ip 00007ff4618ffcff sp 00007ffeb3790d00 錯誤 4 在 liblzma.so.5.2.2[7ff4618eb000+25000]
2018-07-10T15:18:42.602983+02:00 jrc5065 核心:mmoteote[6059]:segfault at fffffffffffee0bc ip 0000000004adfde sp 00007ffeb9a2b2c0 錯誤 7 in mmksh[400000+128000]
2018-07-10T15:19:26.350965+02:00 jrc5065 核心:runmmfs[5832]:segfault at f200f70 a ip 00007f713e553706 sp 00007ffcdc458328 錯誤 6,libc-2.17.so[7f713e422000+1b8000]
2018-07-10T15:21:21.926079+02:00 jrc5065 核心:mmoteote[16345]:segfault at fffffffffffee0bc ip 0000000004adfde sp 00007fff2e2f3d90 錯誤 7 in mmksh[400000+128000]
}}}
不過(系統事件記錄)中沒有任何顯示。
如需進一步協助,請與系統事件記錄1 和 sos 報告2 (可能/可用) 聯絡支援部門進行診斷。
1 如何解壓縮和讀取 Intel®伺服器主機板的系統事件記錄 (SEL)
2 sos 報告注意事項:
.這是一個公用程式,收集關於系統的組分和診斷資訊。
.首先必須透過「sudo apt-get install sosreport」指令安裝。
.安裝後將系統重新開機;然後,執行公用程式。