PDA

View Full Version : Ubuntu 16: mdadm al riavvio perde il raid


FroZen
08-11-2021, 14:45
Ciao a tutti,

ci ho un problema alquanto fastidioso.

Serverino linux con software raid 1 fatto a suo tempo con mdadm. Ero alla 14 se non erro. Poi migrato a 16 senza problemi.

Mese scorso cambio i dischi del raid1: da 2x2TB a 2x8TB.

Benissimo.

Collego i due dischi in più al server (mantenendo inalterato il resto).

Creo software raid sui dischi nuovi.

Copio dal primo raid al secondo raid (nuovo). Tutto ok.

Scollego i dischi vecchi.

Al primo avvio linux si mette in modalità manutenzione.

Non trova il raid md0 (il vecchio era md127) creato inizialmente (tutorial su digital ocean "creare software raid su ubuntu 16").

:eek:

Tagliando la testa al toro: il raid 1 nuovo sui dischi nuovi viene perso ogni volta che riavvio la macchina.

I dati e le partizioni del primo giro sono rimaste, nel senso che se ricreo il raid (14 ore di riallineamento, già fatto almeno quattro volte :muro: ) e poi monto il tutto i dati li vedo e sono accessibili.

Come spiegato nella guida ho sistemato l'mdadm.conf rispetto all'ultimo raid creato (che ogni riavvio ricreo quindi cambia UUID), lanciato aggiornamneto initramfs e verificato che nel fstab compaia la riga di automount del raid md0 su mnt/md0 (che ogni volta va in errore, ovviamente).

Quindi non capisco perchè mdadm al riavvio si perda completamente e non recuperi il raid opportunamente referenziato nel mdadm.conf :muro: :muro: :muro: :muro: lanciare "mdadm --assemble --scan" non porta assolutamente a nessun processo attivo sotto /proc/mdadm, ogni volta sono costretto a rifare il --create con relative 14 ore di riallineamento dischi :cry:

Perseverance
16-11-2021, 20:59
Puoi controllare se la partizione GPT, che va a crearsi per forza con dischi da 8TB, viene corrotta al riavvio.

Nello stato di corruzione cosa succede se lanci da terminale sudo gdisk /dev/nomedeldiscoda8TB ?

Se ti dà errore di CRC o missing o corrupted o altri errori allora c'è un problema hardware che può dipendere o dal firmware del disco o dal bios buggato della mainboard. In passato ci sono state parecchie mainboard che piallavano la partizione GPT dei dischi se non trovavano alcun sistema operativo installato sui medesimi o nessun filesystem.

Se alla fine il problema è il firmware del disco non puoi farci niente, ma se invece il problema è la mainboard allora quando crei il RAID non devi farlo sui dischi grezzi /dev/sda per esempio, ma creare una partizione specifica flaggata col codice RAIDLinux eppoi credi l'arrai coi vari /dev/sda1 /dev/sdb1 etc... Così andrà bene all'eventuale bios buggato e sopravviverà ai riavvii.