Come si interpretano i risultati HDD S.M.A.R.T?

54

Il mio portatile ha iniziato a diventare un po 'inaffidabile, e per qualche motivo ho iniziato a sospettare che il mio HDD stesse iniziando a fallire. Dopo un po 'di caccia su internet, ho trovato Utility Disco di Ubuntu nel menu Sistema e ho eseguito la diagnostica SMART lunga da questo.

Tuttavia, poiché la documentazione di Utility Disco è molto scarsa ( palimpsest ?), non sono sicuro di come interpretare i risultati:

Ad esempio, Leggi tasso di errore è superiore a 50 milioni (!), tuttavia la valutazione è valutata come "buona".

Quindi qualcuno dovrebbe spiegarmi come interpretare i risultati di questi test (in particolare i numeri Normalizzati, Peggiori, Soglia e Valore)? E magari dimmi cosa pensano dei risultati che ho ottenuto per il mio HDD? (Grazie)

    
posta Marty 07.01.2011 - 00:46

3 risposte

46

Hai una buona descrizione di come funziona SMART su wikipedia . Ma una rapida introduzione:

  • Valore: questo è il valore non elaborato riportato dal controller. Di solito è un valore facile da capire (come l'accensione delle ore o della temperatura), ma a volte non lo è (come il tasso di errore di lettura). Diversi produttori possono utilizzare diverse strutture e significati per questi dati.

  • Normalizzato: questo è il valore sopra riportato normalizzato, quindi un valore più alto è sempre migliore. Quindi una velocità di lettura / errore di 114 in è migliore di 113. Anche in questo caso, il modo in cui il disco rigido converte i dati grezzi in valori normalizzati è specifico del fornitore.

  • Peggiore: il peggiore valore normalizzato che il tuo lettore aveva in passato (dove 99 è probabilmente l'impostazione di fabbrica).

  • Soglia: quando il valore normalizzato è inferiore di questo valore, è probabile che l'unità non funzioni.

Quindi, il tuo disco rigido sembra essere ok. Il valore del tasso di errore di lettura non è il tempo in cui l'unità ha avuto esito negativo, ma alcune strutture dati che dipendono dal produttore del disco.

    
risposta data Javier Rivera 07.01.2011 - 09:38
21

Sì, generalmente il valore non elaborato per il tasso di errore di lettura non ha senso. I valori da tenere d'occhio sono il conteggio dei settori riallocato, il conteggio in sospeso e non correggibile offline. Quelli sono il numero di settori danneggiati che sono stati, sono in attesa di essere o non possono essere corretti, e i valori grezzi in generale hanno senso e sono il numero di settori.

Se la lettura di un settore fallisce, diventa in sospeso. La prossima volta che proverai a scrivere su quel settore, l'unità tenta di riscriverlo, e se funziona, tutto torna alla normalità. Se non è in grado di scrivere correttamente il settore, verrà riallocato il settore dal lotto di riserva. Se non può farlo (forse è già esaurito il pool di riserva?), Allora diventa offline_uncorrectable e prova a leggere o scrivere semplicemente errori.

    
risposta data psusi 07.01.2011 - 16:46
8

psusi lo inchioda.

Se leggi i fogli di dati (white paper) di seagate.com vedrai come sono fatti, testati e come funzionano veramente gli HDD. Non esiste un HDD perfetto, non lo è mai stato, non lo sarà mai, (cronologia e fatti). Nei tempi passati, dovevamo inserire i settori danneggiati nel controller HDD da un elenco sulla carta disponibile nella nuova casella dell'unità, quindi il controller li salta.

Le unità moderne hanno una correzione degli errori. Dal primo giorno i settori sono pessimi.

Quindi li mappano, questo significa che l'unità salta i settori danneggiati. Infatti sono "logicamente scambiati" - il settore cattivo viene mappato su un nuovo, buon, cilindro di ricambio (ha cilindri di riserva - pensa ai cilindri come tracce). Tutto ciò è trasparente per il mondo esterno, ad eccezione dell'utilità SMART.

Ogni produttore può fare ciò che desidera, quindi alcuni impostano il conteggio degli errori a zero, anche se potrebbero esserci 10 settori danneggiati non appena viene prodotta l'unità.

C'è una regola di 3 volte nel firmware del drive - legge un settore 3 volte e se tutte e 3 le volte è male allora può fare un "ricalibrare" al volo e leggere altre 3 volte. Se l'unità non è ancora funzionante, mapperà quel settore in uno dei settori di riserva. Questo è nel profondo del firmware, ma accade continuamente in background, tutto trasparente per l'utente.

Se il produttore sceglie di segnalare errori grezzi ogni volta che ci sono 3 cattive letture o dopo che la calibrazione è a loro. Quindi, come dice sopra, non è importante a meno che tu non abbia molte unità dello stesso tipo e tu veda alcune tendenze strane.

Punto 2: tutti gli HDD hanno errori di lettura naturali, puoi anche apprenderlo da Seagate, se vuoi. ma hanno tutti degli errori al volo. e vengono letti di nuovo, e di solito passano il test per gli errori CRC. se non l'unità cerca di scambiarlo. se si esegue il disco freddo, durerà a lungo e molti non esauriranno mai i cilindri di riserva. ma guarda come ti dice Psusi!

Sto scrivendo questo, su un vecchio PC, eseguendo uno dei primi HDD da 1 gb mai realizzati. ed è ancora buono (ho eseguito il backup) (nessuna mancanza di raffreddamento mai ...) il calore è il killer # 1 e le sovratensioni, gestisco un UPS. evviva e buona giornata. Spero che aiuti.  (mai visto un crash del disco rigido di DatA General? e riempire la stanza con una grande quantità di lana di alluminio, spunti di ricci? molto divertimento allora ... mai un momento di noia ...

    
risposta data jtgh 15.04.2014 - 17:21

Leggi altre domande sui tag