PDA

View Full Version : Perso RAID5 mdadm, aiuto x capire cosa sia successo.


Perseverance
15-03-2021, 13:32
Ho tre hardisk in raid5 con mdadm (filesystem XFS) messi in un pc adibito a nas con opensuse. Non ho mai avuto problemi in vita mia, ne ho installati svariati in questo modo, mai un problema a nessuno. Purtroppo è capitato a me. Non sò ancora di preciso cosa sia successo.

Cosa ho fatto:
Niente di che. L'avevo acceso per buttarci sopra della roba, funzionava perfettamente. È stato acceso per qualche ora nel pomeriggio e alla fine l'ho riavviato. Operazioni normali. Al nuovo reboot il disastro. Il boot andava in errore xkè non riusciva a trovare l'assembly raid dalla tabella fstab, ho commentato la riga incriminata e l'ho fatto ripartire. Al desktop mi rendo subito conto che c'è qualcosa che non và. Il raid non viene visto. MDADM dice che manca il superblocco su due dei tre dischi incriminati e quindi non può attivare il raid5, che a questo punto risulta corrotto.

Ho analizzato dei log, varie cose che neanche ricordo in questo momento, senza trovare una spiegazione logica dell'accaduto.

Gli hardisk sono in perfetta salute, il raid sembrava in perfetta salute anche prima del riavvio. Non ho idea di cosa sia successo. In questo momento ho staccato tutto e sto tendando di usare R-Studio facendo la scansione approfondita.

Buttando un occhio ai due hardisk "cancellati" vedo che sono identici anche nel firmware.
/dev/sda ST3000DM001-9YN166 CC4B *cancellato*
/dev/sdb ST3000DM001-1CH166 CC43
/dev/sdc ST3000DM001-9YN166 CC4B *cancellato*

Che sia un caso? Cioè mi si sono cancellati i settori iniziali di questi due hardisk identici nello stesso momento? Bug del firmware o cosa?

Chiedo consigli, pareri, vorrei approfondire questa cosa xkè mi sembra davvero impossibile quello che mi è successo in un attimo.

--edit--
Mi è presa la paura adesso, xkè penso a tutti quelli che ho installato e montato... non mi pare xò di aver mai usato questi hardisk che invece ho usato per me, quasi sempre per i clienti ho usato toshiba o hitachi e in qualche caso wdc.

piwi
15-03-2021, 18:00
Mi spiace, non si può stare mai tranquilli. L'unica esperienza "casalinga" che ebbi con il RAID-5 (2 TBytes X 4) è stata con un Array software creato con una qualche versione di Windows Server; finchè l'ho conservato ha lavorato bene, ma, in un caso, ci fu un qualche problema che portò ad un arresto non corretto della macchina ed al riavvio ... 48 ore di "risincronizzazione in corso ..." ... Ho finito per preferire altre soluzioni.

Gli ST3000DM001 s'erano fatti una brutta fama di unità inaffidabili. Chissà se ciò c'entra qualcosa.

Perseverance
15-03-2021, 19:12
Infatti sto leggendo su vari siti che questa serie è estremamente prona a corruzioni lato firmware, cache, perdita di dati e anche guasti fisici, in particolare sono i modelli 9YN166 a impazzire di più. Inoltre sono stati quei modelli coinvolti nel disastro ambientale della Thailandia quando avvenne quel maremoto-tsunami tragico del 2011.

Mentre i 1CH166 di fabbricazione cinese sembrerebbero solidi. Guardacaso :rolleyes: io sarei proprio la prova del nove!

Anche riguardando di nuovo i log di linux non c'è assolutamente niente di sospetto che possa essere accaduto. Sono sempre più sicuro che si è trattato di un guasto firmware a questo punto. Sarei curioso di sapere xò quale comando ata o combinazione di eventi ha partorito questo scempio.

------

R-Studio deve sempre finire la scansione, nel frattempo aspetto x vedere se riuscirà a trovare qualcosa

------

E dopo cosa faccio? Buttarli mi dispiace. Ho visto che esistono firmware updates sul sito seagate https://www.seagate.com/it/it/support/kb/barracuda-1tbdisk-platform-firmware-update-223651en/ xò anche una volta applicati vivrò col terrore che riaccada di nuovo quanto successo.

Per ora non so davvero cosa farne di questi hdd...

piwi
15-03-2021, 19:17
Recuperati i dati, puoi utilizzare quelle unità come "dischi a perdere". Io ne ho uno, proprio un 9YN166, preso credo nel 2013, magicamente integro dopo anni ed anni di lavoro sul mio desktop. Da quando ho appreso di quelle problematiche, però, l'ho relegato ad attività di backup.

Perseverance
15-03-2021, 21:46
Non riesco a recuperare un bel niente.

Hardware Upgrade Forum Database Error
Database Error Database error
The Hardware Upgrade Forum database has encountered a problem.

Please try the following:
  • Load the page again by clicking the Refresh button in your web browser.
  • Open the www.hwupgrade.it home page, then try to open another page.
  • Click the Back button to try another link.
The www.hwupgrade.it forum technical staff have been notified of the error, though you may contact them if the problem persists.
 
We apologise for any inconvenience.