"mce: [Hardware Error]: Machine check events logged" appare in syslog. Cosa dovrei fare?

18

Ho installato l'ultima versione di OSSEC (2.8.1) e ho anche abilitato le notifiche via email. E sto ricevendo un sacco di questo tipo di notifiche che dicono che c'è un errore hardware e qualcosa su mce:

OSSEC HIDS Notification.
2015 Apr 04 20:09:22

Received From: Bath-Towel->/var/log/syslog
Rule: 1002 fired (level 2) -> "Unknown problem somewhere in the system."
Portion of the log(s):

Apr  4 20:09:21 Bath-Towel kernel: [ 1873.680872] mce: [Hardware Error]: Machine check events logged



 --END OF NOTIFICATION

Quindi cosa significa esattamente? Cosa significa mce? E questo apparente errore hardware è qualcosa di cui dovrei preoccuparmi?

Informazioni sul sistema operativo:

Description:    Ubuntu 14.10
Release:    14.10
    
posta Eric Carvalho 04.04.2015 - 21:37

1 risposta

21

Eccezione controllo macchina :

  

Un Machine Check Exception (MCE) è un tipo di hardware del computer   errore che si verifica quando l'unità di elaborazione centrale di un computer rileva a   problema hardware.

Il tuo computer ha riscontrato un errore hardware e il kernel ha registrato un evento in un buffer. È possibile utilizzare mcelog per registrare e visualizzare gli eventi di controllo della macchina. Dalla % man_de% manpage :

  

Le CPU X86 segnalano gli errori rilevati dalla CPU come eventi di controllo della macchina   (MCE). Questi possono essere corruzione dei dati rilevati nelle cache della CPU, in   memoria principale da un controller di memoria integrato, errori di trasferimento dei dati   sul front side bus o interconnessione CPU o altri errori interni.   Possibili cause possono essere radiazioni cosmiche, alimentatori instabili,   problemi di raffreddamento, hardware rotto, sistemi in esecuzione   specifica, o sfortuna.

     

La maggior parte degli errori può essere corretta dalla CPU mediante correzione interna degli errori   meccanismi. Gli errori non corretti causano eccezioni di controllo della macchina che   può uccidere processi o prendere dal panico la macchina. Un piccolo numero di corretti   gli errori di solito non sono motivo di preoccupazione, ma un gran numero può   indica un fallimento futuro.

     

Quando si verifica un errore corretto o ripristinato, il kernel x86 scrive a   registrazione che descrive l'MCE in un buffer circolare interno disponibile   attraverso il dispositivo / dev / mcelog. mcelog recupera errori da   / dev / mcelog, li decodifica in un formato leggibile dall'uomo e li stampa   sullo standard output o facoltativamente nel registro di sistema.

Se non hai notato alcun arresto anomalo, probabilmente l'errore è stato corretto correttamente. Tuttavia, ti consiglio di installare mcelog per tenere traccia di tali eventi:

sudo apt-get install mcelog

Gli eventi verranno registrati su mcelog . Puoi anche eseguire:

sudo mcelog --client

per interrogare il daemon /var/log/mcelog per gli errori.

    
risposta data Eric Carvalho 11.04.2015 - 23:22

Leggi altre domande sui tag