come da titolo sarei in cerca di consigli su come stimare lo stato di salute di un disco e di come poter analizzare a fondo (o almeno il più possibile) lo stato effettivo di salute.
da cosa è nato cosa?
ho preso un hdd da 4TB per il nas e il venditore mi ha detto "hey, ne ho un secondo, uguale, ma che ha errori nello smart, lo vuoi? te lo regalo". io allorchè ho detto "butta dentro che me lo testo.
è arrivato e aveva (da gnome-disks) 11 settori danneggiati. dopo una "veloce" (4h e rotti) passata con badblocks, i settori danneggiati erano diventati 0. leggendo meglio lo smart ho scoperto essere i settori che fanno parte del gruppo C5: Current Pending Sector Count, ovvero quei settori che sono in attesa di essere rimappati per capire qualcosa sul loro effettivo stato di salute.
l'iter che ci ho fatto dietro è stato tortuoso e ha visto in gioco sia linux (badblocks, smartmontools e gnome-disks) che windows (hdd regenerator e hd tune pro, anche se quest'ultimo non mi pare per nulla affidabile).
hdd regenerator ha "riparato" 8 settori, sempre secondo me facenti parte del gruppo in C5.
alla fine delle varie operazioni lo start si è resettato, bello e fresco come na rosa (unico parametro in aumento è il tasso di letture errate, ma c'è da dire che sta aumentando il valore RAW ma non si sta modificando il valore normalizzato, il che non è male) e tutti i programmi dicono che il disco gode di ottima salute.
ora, visto che io sono scettico anche delle mie idee, mi ci sono rimesso dietro, quasi da capo e facendo un veloce test con hd tune pro, in cui leggevo e basta i settori, ne è saltato fuori un altro come "conteggio settori correnti pendenti" (il solito C5).
arrivati a questo punto la mia diagnosi è che effettivamente vi sia un danno sulla superficie del disco, ma c'è un modo con cui io possa diagnosticare questo in automatico?
il tutto nasce dal fatto che con l'associazione devo testare decine di hd e non ho modo di tornarci a dietro a vedere che abbia fatto e se abbia fatto bene o male. so che badblocks segna i settori danneggiati, ma è lo stesso anche quando sono danneggiati per problemi software (ovvero quando la categoria C5 è riempita per un errore di scrittura e non per un errore fisico)?
ah il disco in questione era montato su un nas e sto cercando, con una scansione di badblocks, di arrivare a ritrovare dei settori morti: in teoria all'ultima scansione ne aveva trovati 4, non so se ora sia in grado di ritrovarli. in caso negativo farò un ulteriore passaggio per verificare che ritornino gli stessi e identici.
il tutto lo vorrò poi integrare qua: https://github.com/94-psy/Dejavu-Formatting-Tool
ora badblocks è già implementato, ma molti test sono necessari ancora e questo che sto facendo è uno dei tanti :pipp:
ogni suggerimento è ben accetto, soprattutto se rimanesse in ambito linux, che mi semplifica la vita :asd:
I miei appunti risalgono al 01/04/2012 e non ho più molta pratica.
smartmontools
heirloom-mailx
gsmartcontrol
Per sapere quanti cicli ha il nostro har disk digitiamo
sudo smartctl -a /dev/sda | grep Load_Cycle
Per avere delle informazioni più dettagliate, digitate
sudo smartctl -a /dev/sda
Se vuoi fare più scansioni e poi fare un paragone in automatico, la via più semplice è preparare uno script bash.
1: conservi tutti gli output
2: fai il grep delle righe ingriminate
3: confronti i risultati per capire se i settori danneggiati sono sempre gli stessi.
heirloom-mailx
è l'unico tool che non ho ancora testato. smartmontools lo uso assai e ho imparato a leggerlo grazie a
@Toshio :asd:
comunque ci sono dei risvolti: ho fatto riandare il tutto a balina come un coglione, altre 30h per un mezzo test (e nemmeno quello in realtà). badblocks a questo giro non ha trovato settori danneggiati, mi ha detto che è tutto ok e l'unico parametro smart che sta salendo in raw ma non peggiorando è "errori in lettura". tutto il resto è buono così.
inoltre ho visto che al precedente giro badblocks aveva trovato 4 settori danneggiati in lettura e basta :pipp:
io mi sto confondendo sempre di più :pipp:
appena hd tune finisce di fare le prove, testo heirloom-mailx che sono curioso di capire che faccia :)
Tieni presente che se trovi sempre errori diversi con lo stesso test sullo stesso campione, c'è una probabilità del 99,99% che sia meccanicamente andato.
per ora sto ottenendo sempre lo stesso errore. o meglio, lo stavo ottenendo. sto cercando di forzare la mano per riottenerlo ma non sta accadendo.
avevo errori di lettura del settore, che si traduce che in un generico 60% dei casi può essere il software che sminchia a scrivere e che il disco sia ok.
però la restante percentuale mi dice che ho problemi alla superficie del disco.
il fatto che gli errori di lettura, da quando ho il disco, siano in costante aumento può essere un campanello d'allarme ma anche no se non correlato ad altri fattori.
ora, il buon senso mi dice che se avessi un settore fisicamente danneggiato, io, con tutti i test, dovrei sempre risalire a quel settore o, o almeno ad una parte di essi (lavorando a basso livello e scansionando tutti i settori, mi aspetto questo, soprattutto se il conteggio dei settori che sono stati riallocati è pari a 0, ovvero nessun settore a scrittura pendente è stato identificato come danneggiato e quindi riallocato) e invece ottengo sempre risposte differenti sia in numero di settori danneggiati sia in posizione.
col procedere dei test il numero di settori con scrittura pendente è calato e non è più comparso, tanto che allo stato attuale, dopo diversi cicli sono ancora a 0. non so se andare a domani la situazione cambi, ma certo è che anche un altro giro con badblocks, completo questa volta, vorrei farlo
Si. Alla fine dovrai essere certo della ripetibilità dei test ed in seguito valutare quanto sia affidabile il disco. Se non riesci ad avere una ripetibilità, cade automaticamente l'affidabilità del disco.
esatto, infatti sto iniziando a sospettare che il problema, più che a livello di disco, sia a livello di scheda. ora, per poter dormire meglio, ho messo il disco nel nas, non l'ho montato nel volume e ho iniziato una sessione di badblocks. è molto più lento del fisso, ma può metterci anche una settimana che mi frega poco (in 11h ha fatto quasi un 20% del primo passaggio di scrittura).
durante questa sessione, il disco sta svolgendo anche un test smart. quello corto, dalla durata stimata di 2 minuti, dopo 9h era ancora al 90% e l'ho interrotto. quello esteso sta finendo.
durante questa sessione un settore è tornato a scrittura pendente, ma badblocks non ha rilevato errori in scrittura. appena finirà questo giro potrà capire se vi siano errori in lettura e se venissero resettati.
mi sto davvero facendo la fantasia che dopo 4 anni di uso in un nas, questo disco abbia la scheda morta :pipp:
Non ho esperienze positive con i Nas preconfezionati.
non so se fosse in un nas preconfezionato. so che è un WD red per nas da 4TB. però continua a dare questi problemini. ora devo attendere ore per vedere come va. tra qualche giorno torno a metterlo nel pc.
comunque temo che anche andando a cambiare scheda, il problema possa ripresentarsi (se fosse un problema di firmware? visto che solitamente il chip del bios è da spostare)
mi sa che lo metterò nel fisso e lo userò così :asd:
Bene... ti potrebbe servire modificare il timeout dell'hard disk, così non ci perdi molto tempo quando sarà giunta la sua ora :asd:
Per un disco sda, il file è questo /sys/block/sda/device/timeout
e memorizza il timeout in secondi.
Risultati sempre diversi, settori danneggiati ma non sempre gli stessi, nessun riallocamento, errori in lettura in aumento. Sunto corretto?
Comunque sì ho la tua stessa impressione potrebbe non essere fisicamente danneggiato il disco. Se si stesse sminchiando ad ogni passata dovrebbero aumentare i settori danneggiati, i riallocamenti, e neanche costantemente ( in maniera lineare) ma accellerando.
Ok, armiamoci di saldatore! :asd:
Citazione di: TonyWhite il 04 Gennaio 2021, 15:50:59
Bene... ti potrebbe servire modificare il timeout dell'hard disk, così non ci perdi molto tempo quando sarà giunta la sua ora :asd:
Per un disco sda, il file è questo /sys/block/sda/device/timeout
e memorizza il timeout in secondi.
ora è su nas, non so cosa sia possibile fare :asd:
Citazione di: Toshio il 04 Gennaio 2021, 18:12:00
Risultati sempre diversi, settori danneggiati ma non sempre gli stessi, nessun riallocamento, errori in lettura in aumento. Sunto corretto?
Comunque sì ho la tua stessa impressione potrebbe non essere fisicamente danneggiato il disco. Se si stesse sminchiando ad ogni passata dovrebbero aumentare i settori danneggiati, i riallocamenti, e neanche costantemente ( in maniera lineare) ma accellerando.
esatto. sostanzialmente quello.
solo che avrei trovato schede potenzialmente compatibili, ma cambiandole si risolve?
insomma, 30€ potrei anche spenderli, per un disco che mi hanno regalato
Valuta tu. È sempre una prova.
anche il nas ora conta un settore (badblocks ha quasi finito il primo passaggio in lettura e ancora 0 errori) a scrittura pendente, ma la salute la da come OK :asd:
comunque in circa 24h ha fatto un passaggio, ci vorrà fino a 4 giorni per fare tutti e 4 i passaggi :asd:
Si rovinerà per surriscaldamento prima di finire tutto? Seguiamo la vicenda del nostro eroe hard :lki:
nel fisso, che era in un bay senza ventilazione era a 40-41°C, nel nas ho due ventole è a 31°C :asd:
:badass:
Citazione di: 94-psy il 04 Gennaio 2021, 20:41:31
...
solo che avrei trovato schede potenzialmente compatibili, ma cambiandole si risolve?
insomma, 30€ potrei anche spenderli, per un disco che mi hanno regalato
...
WD red ma che modello è? E' un modello nuovo? E quanto costerebbe nuovo? Non facile determinare se ne valga la pena. Quanto è stato usato, ore di utilizzo? Da confrontare con l'MTBF https://en.wikipedia.org/wiki/Mean_time_between_failures non saranno molti 30 ma tante volte anche su pc interi molto vecchi non vale la pena spenderli, purtroppo, figuriamoci su un singolo componente. Potrebbe pure essere che la prossima settimana così all'improvviso cominciano ad accumularsi una caterva di errrori e sono 30 euri nel cesso.
Edit: Magari anche un link alle schede compatibili.
Citazione di: Toshio il 05 Gennaio 2021, 16:37:23
Citazione di: 94-psy il 04 Gennaio 2021, 20:41:31
...
solo che avrei trovato schede potenzialmente compatibili, ma cambiandole si risolve?
insomma, 30€ potrei anche spenderli, per un disco che mi hanno regalato
...
WD red ma che modello è? E' un modello nuovo? E quanto costerebbe nuovo? Non facile determinare se ne valga la pena. Quanto è stato usato, ore di utilizzo? Da confrontare con l'MTBF https://en.wikipedia.org/wiki/Mean_time_between_failures non saranno molti 30 ma tante volte anche su pc interi molto vecchi non vale la pena spenderli, purtroppo, figuriamoci su un singolo componente. Potrebbe pure essere che la prossima settimana così all'improvviso cominciano ad accumularsi una caterva di errrori e sono 30 euri nel cesso.
Edit: Magari anche un link alle schede compatibili.
direi modello vecchio: WD40EFRX-68WT0N0
comunque l'errore è già rientrato nuovamente :pipp:
E se provi a recuperare una scheda sana da un altro hard disk rotto?
di dischi rotti da 4TB non ne ho :pipp: dovrei provare a prenderne una su ebay a 30€ le vendono, però non so se siano effettivamente funzionanti :asd:
Su eBay mi sembrava di averne trovate a 20€ senza ss le schede. Se è come per i vecchi dischi PATA, non serve saldatore per cambiare scheda, solo cacciavite.
Citazione di: Buntolo il 06 Gennaio 2021, 16:19:19
Su eBay mi sembrava di averne trovate a 20€ senza ss le schede. Se è come per i vecchi dischi PATA, non serve saldatore per cambiare scheda, solo cacciavite.
ci avevo guardato l'altro giorno, ma su ebay cambiano spesso perchè non si sa quando uno mette in vendita la roba, quindi se mai ora si trova :)
comunque non saprei, tutti parlano di cambiare chip del bios. la scheda compatibile potenzialmente l'avreit rovata, devo aspettare che il disco finisca per poterlo smontare dal nas e leggere bene, poi potrei quasi provare. lo cambio alla brutto grugno e via nel nas a fare altri 4 giorni di formattazione a basso livello :asd:
Citazione di: 94-psy il 06 Gennaio 2021, 16:51:29
Citazione di: Buntolo il 06 Gennaio 2021, 16:19:19
Su eBay mi sembrava di averne trovate a 20€ senza ss le schede. Se è come per i vecchi dischi PATA, non serve saldatore per cambiare scheda, solo cacciavite.
ci avevo guardato l'altro giorno, ma su ebay cambiano spesso perchè non si sa quando uno mette in vendita la roba, quindi se mai ora si trova :)
comunque non saprei, tutti parlano di cambiare chip del bios. la scheda compatibile potenzialmente l'avreit rovata, devo aspettare che il disco finisca per poterlo smontare dal nas e leggere bene, poi potrei quasi provare. lo cambio alla brutto grugno e via nel nas a fare altri 4 giorni di formattazione a basso livello :asd:
https://www.ebay.it/i/184149068816
Cercale pure a meno dalla Cina magari. I nomi della scheda li puoi trovare qui o guardando sul PCB del tuo disco:
https://www.hdd-parts.com/14060217.html
Citazione di: Buntolo il 06 Gennaio 2021, 16:55:32
Citazione di: 94-psy il 06 Gennaio 2021, 16:51:29
Citazione di: Buntolo il 06 Gennaio 2021, 16:19:19
Su eBay mi sembrava di averne trovate a 20€ senza ss le schede. Se è come per i vecchi dischi PATA, non serve saldatore per cambiare scheda, solo cacciavite.
ci avevo guardato l'altro giorno, ma su ebay cambiano spesso perchè non si sa quando uno mette in vendita la roba, quindi se mai ora si trova :)
comunque non saprei, tutti parlano di cambiare chip del bios. la scheda compatibile potenzialmente l'avreit rovata, devo aspettare che il disco finisca per poterlo smontare dal nas e leggere bene, poi potrei quasi provare. lo cambio alla brutto grugno e via nel nas a fare altri 4 giorni di formattazione a basso livello :asd:
https://www.ebay.it/i/184149068816
Cercale pure a meno dalla Cina magari. I nomi della scheda li puoi trovare qui o guardando sul PCB del tuo disco:
https://www.hdd-parts.com/14060217.html
quando il disco finisce lo estraggo e guardo il modello della scheda preciso, perchè per ora non lo ho. poi, sinceramente, spenderei anche volentieri 30€ per sapere di avere il disco funzionante o almeno per provarci. nuovi costano 90 o più
EDIT: pare che i test smart non riesca a completarli, si fermano tutti al 90% :pipp:
EDIT2:
https://drive.google.com/file/d/1Fo__9-IgSBcjTHJukxSw3Uf5WgENKzxe/view?usp=sharing
lo stato di badblocks. il nas segna un nuovo settore a scrittura pendente ma badblocks ancora non ha trovato nulla e ha già fatto 3 passaggi completi :ysy:
in 62h :asd:
Ti avevo consigliato di recuperare una scheda usata per non comprarla.
Va bene, se per te ne vale la pena, ok :asd:
https://community.wd.com/t/difference-between-wd40efrx-68n32n0-and-wd40efrx-68wtono/222195 qui si parla del tuo modello (e di quello più nuovo). Dai un'occhiata. Edit: A 'sto giro i Red pare che non è che non è gli siano usciti bene-bene-bene ;D.
Mah... cambiarte il PCB non so se risolverà, però ti vedo lanciato in quella direzione quindi, speriamo.
Occhio che però la scheda indicata su ebay ha lo stesso codice però REV P1, una revisione successiva quindi. Non se sia compatibile.
@TonyWhite eh recuperarla mi è un po' difficile, non saprei dove rubare un hdd :asd:
@Toshio in realtà sono molto titubante. sto aspettando che il disco finisca per poter leggere bene i dati della scheda, ma non ho grosse speranze. ho più paura che cambio scheda, butto 30€ e mi trovo il culo deflorato per bene :pipp:
infatti per ora la mia volontà è di metterlo nel fisso, dove riesco e di tenerlo lì. archiviazione secondaria, di roba minore o boh.
poi prossima offerta, nuovo hdd da 4TB :asd:
Citazione di: 94-psy il 06 Gennaio 2021, 21:56:38
...
@Toshio in realtà sono molto titubante. sto aspettando che il disco finisca per poter leggere bene i dati della scheda, ma non ho grosse speranze. ho più paura che cambio scheda, butto 30€ e mi trovo il culo deflorato per bene :pipp:
infatti per ora la mia volontà è di metterlo nel fisso, dove riesco e di tenerlo lì. archiviazione secondaria, di roba minore o boh.
...
:ysy: Sì, archivazione secondaria finché funziona-funziona se smette amen, era regalato.. Fosse un aggiornamento, una "riparazione", che assicura un buona probabilità di successo ok... qui è veramente un "forse sì forse no".
solo che non saprei come riusarlo. nel nas avrebbe senso: ora ho due dischi da 3TB, un disco da 2TB e uno da 4TB. uso in totale 7TB. mettendo un disco da 4 al posto di quello da 2, arriverei a 10TB di spazio. nel fisso ho un raid 0 di due dischi SAS da 3TB e settimana ventura mi arrivano altri due hdd da 3TB l'uno e passo ad un raid 10 sempre da 6TB.
lo spazio vuoto nel nas era dedicato ad un ssd da 128GB come cache. ho scoperto dopo, quando il nas si è aggiornato, che avrebbe bisogno di 870GB di ssd :asd:
finchè regge anche lui, terrà botta :asd:
comunque da tutta questa fola è emerso che:
badblocks è affidabile e che abbinato ad una attenta lettura dello smart, si riesce a distinguere tra un errore fisico e un errore software.
quindi il tool di formattazione che sto editando, è valido come metodo di screening, devo cercare altri dischi morti per potervi rompere il cazzo :asd:
Citazione di: Buntolo il 06 Gennaio 2021, 16:19:19
Su eBay mi sembrava di averne trovate a 20€ senza ss le schede. Se è come per i vecchi dischi PATA, non serve saldatore per cambiare scheda, solo cacciavite.
Sono tutti avvitati, saldati non ne no mai trovati.
Citazione di: Cire il 07 Gennaio 2021, 08:42:48
Citazione di: Buntolo il 06 Gennaio 2021, 16:19:19
Su eBay mi sembrava di averne trovate a 20€ senza ss le schede. Se è come per i vecchi dischi PATA, non serve saldatore per cambiare scheda, solo cacciavite.
Sono tutti avvitati, saldati non ne no mai trovati.
in teoria serve il saldatore per sostituire il chip del bios e basta. che poi è la pistola ad aria calda perchè è un SOP-8 se non erro :pipp:
Citazione di: 94-psy il 07 Gennaio 2021, 09:31:20
in teoria serve il saldatore per sostituire il chip del bios e basta. che poi è la pistola ad aria calda perchè è un SOP-8 se non erro :pipp:
Ma se cambi l'intera scheda te ne sbatti.
Citazione di: 94-psy il 06 Gennaio 2021, 22:38:36
solo che non saprei come riusarlo. nel nas avrebbe senso: ora ho due dischi da 3TB, un disco da 2TB e uno da 4TB. uso in totale 7TB. mettendo un disco da 4 al posto di quello da 2, arriverei a 10TB di spazio. nel fisso ho un raid 0 di due dischi SAS da 3TB e settimana ventura mi arrivano altri due hdd da 3TB l'uno e passo ad un raid 10 sempre da 6TB.
[...]
Torrent
dipende dai dati che contiene il bios: se contenesse i dati smart, non mi importa sapere che le accensioni siano di più o di meno, ma se mai mi può importare se la scheda sostitutiva avesse registrato dei settori riallocati e quindi che mi variasse il comportamento del disco stesso :pipp:
per i torrent ho il nas :asd:
ha la download station ed è la cosa più comoda di sto mondo :asd:
Citazione di: 94-psy il 07 Gennaio 2021, 13:28:17
dipende dai dati che contiene il bios: se contenesse i dati smart, non mi importa sapere che le accensioni siano di più o di meno, ma se mai mi può importare se la scheda sostitutiva avesse registrato dei settori riallocati e quindi che mi variasse il comportamento del disco stesso :pipp:
per i torrent ho il nas :asd:
ha la download station ed è la cosa più comoda di sto mondo :asd:
Io ridarei di badblocks da capo e via.
comunque ho finalmente rimosso il disco dal nas. il risultato è stato che lo smart è tornano normale e che badblocks non ha avuto errori in nessun caso :asd:
Ok, incrocia i diti XD
ma il plurale di dito, non è mano? :pipp:
ho appena terminato i test su un hdd da 40GB sata con xp sopra. ho verificato con photorec che non vi siano rimasti dati e per ora pare di sì.
senza ricorrere alla camera bianca, voi cosa usereste per vedere se vi fossero ancora dei dati sopra? :pipp:
Farei una scansione con i programmi di recupero come photorec.
Se voglio eliminare definitivamente tutto, riempio l'hd di zeri e poi controllo con photorec.
Se non voglio riusare l'HDD lo smonto e graffio le superfici dei dischi con una lima.
ottimo, sono allora alquanto in linea, tranne la lima :asd:
(https://lh3.googleusercontent.com/-7PYQ8Bx6lTJkg8CSu-3tRwOK_iUaazqCuGsp_TEvbyRNt8JWDAJOe07uue1zEK51aWHv9Yyxq4BgHWDOj5Zqk6b2eX9rijThlVInfdEqGG7AuaxkgGWVbxRZh0bHjfBlqQuGj3gFFS7hGPru95EjM2v5oHhsNCixm1bMi8t0AYQ4NiqIrlvsjd-YAWfjaWwFNQXaKicxwYgYeTZiclR-pJyJcCgriPar9kDM-YIXPaxW3fSmT7e-2vI-qTbHcM3ABb0EwGqjz24uZP0XZsdI54LFfAgFZVnQ0LjS96NrWx14_mzFTiWBptjirL16pbyFnL0bZdYtFnsf14xcnhH7w6D7Ra_EOMVRlGvaG0kf7LK3oRy3cKqkjl_WWPMlcNxJcs3fbaSVBIC3RP3NuMe5NwJ-x8_8vTAw837E05DHaXgrCEvu9luZm97-R2SzmI2hG58JsmMWcjb0UMrzcUaSqew8IoSL2M4x4hWto3DnG5dfxrn0UloxJzdW9spYI94cy_At-rz6z7oaQ2g8cicH-xdt_kpRsPlKAGHM0MZJlG4_IOIatDEZakmzrHjBBT5DSHp_e9RD0XFASydA-Hi2CoLakq2RqWG-gcZL8_mYj98UWpSj4mrGLq7Hx02HDBhMEPiVI8lOlc4TPwTvwclKzdqXXuARr2jVvNlDiinkhEISsdSYUMN06FEBzZ7EQ=w711-h947-no?authuser=0)
potresti tenerli lucidi e farci uno specchio :pipp:
Buona idea, il tutto affogato nella resina.
https://www.amazon.it/Resina-epossidica-trasparente-Effetto-acqua/dp/B01NH4ZTTB/ref=sr_1_37?__mk_it_IT=%C3%85M%C3%85%C5%BD%C3%95%C3%91&dchild=1&keywords=resina+epossidica&qid=1610359833&sr=8-37
Inizio ad accumulare dischi allora.
mi hai dato un'idea fantastica sai? :pipp:
Diciamo un'idea condivisa.
Citazione di: 94-psy il 10 Gennaio 2021, 21:17:09
ho appena terminato i test su un hdd da 40GB sata con xp sopra. ho verificato con photorec che non vi siano rimasti dati e per ora pare di sì.
senza ricorrere alla camera bianca, voi cosa usereste per vedere se vi fossero ancora dei dati sopra? :pipp:
testdisk
Citazione di: Buntolo il 11 Gennaio 2021, 16:57:16
Citazione di: 94-psy il 10 Gennaio 2021, 21:17:09
ho appena terminato i test su un hdd da 40GB sata con xp sopra. ho verificato con photorec che non vi siano rimasti dati e per ora pare di sì.
senza ricorrere alla camera bianca, voi cosa usereste per vedere se vi fossero ancora dei dati sopra? :pipp:
testdisk
sto facendo andare anche quello