PDA

View Full Version : RAID 5 con controller hw 2 dischi in stato defunct :(


kaboum
15-06-2006, 23:54
Ciao a tutti,
venerdì scorso ho fatto un grandissima cazzata e ora non so + dove sbattere la testa per risolvere il problema che ho provocato.

Vi riporto brevemente le specifiche della macchina, del controller e dei dischi su cui ho commesso il fattaccio.

La macchina è un IBM Xserver 345
Model-Type: 8670-12X

SO: Windows 2000 Server Sp4

Modello Controller Raid hardware installato: ServeRaid-5i (della IBM) livello firmware 6.00.31
Numero dischi: 6

Configurazione RAID utilizzata

Array A

3 dischi SCSI (U320) da 34715 MB ciascuno (modello ST336732LC della Seagate) in raid 5 filesystem NTFS
contenenti: SO + Programmi + Log di IIS

Array B

3 dischi SCSI (U320) da 70006 MB ciascuno (modello IC35L073UCDY10 della
Hitachi) in raid 5 filesystem NTFS
contenenti: Dati

Che cosa ho combinato?

Il giorno 09-06-2006 alle 12:25

A macchina spenta:

1) Inserisco un CD-ROM con una distro live linux

2) scollego 5 dischi (i 3 dell'array B e 2 dell'array A)

3) Avvio la macchina

4) In fase di POST (Power-on-self-test), durante il boot, il controller
RAID mi comunica che la configurazione memorizzata (2 drive logici con tre dischi ciascuno in raid 5) e quella attuale (1 solo disco dell'array A è attaccato) non coincidono e mi chiede che cosa voglio fare. Gli dico di
proseguire senza cambiare la configurazione (tasto F10)

5) La macchina parte tranquillamente con la distro live linux, faccio quello che volevo fare
6) Effettuo uno shutdown -h now

7) Riattacco i dischi

8) Riavvio la macchina. In fase di POST (Power-on-sel-test) il
conrtoller RAID mi comunica che 2 drive logici sono offline e 5 dischi
sono defunti. La macchina non parte +

9) Tramite il CD-ROM bootable con il software di gestione del controller RAID cerco di vedere graficamente quello che lo stesso controller mi diceva in fase di boot.
9.1) Riporto in stato on-line 2 dei 3 dischi in stato defunct dell'array B
9.2) effettuo il rebuild del 3 disco dell'array B in quanto è l'unica azione che posso effettuare dal menu contestuale su questo disco.
9.3) Si avvia la procedura di rebuild che dura circa 5 h.

10) Con varie distribuzioni live sia di linux sia windows faccio
partire la macchina sperando di accedere al drive logico dell'array B
tutti i tentativi sono stati fallimentari.

10.1- sotto linux se tento di lanciare una mount -t ntfs /dev/sda /media/sda ottengo orribili messaggi di errore su impossibilità di montatre l'ntfs
10.2- sotto windows ho provato:
10.2.1 DISKPART e se lancio un DISK LIST vedo solo un disco DISK 0 di dimensione 137 GB e se lo provo a portare in stato active dio me ne scampi e liberi l'unico volume che vede è quello del cd-rom :( quindi niente da fare
10.2.2 DISKCOMMANDER un utility di ERDCOMMANDER della Winternals vedo sempre il drive logico dell'array B ma se lancio la procedura di recupero dati al termine non trova un fico secco :( (piango tantissimo)

11) I dischi dell'array A continuano ad essere 2 in stato defunct ed 1 in
stato on-line. Non sono stati effettuati tentativi per ripristinarne lo
stato.

I dischi non hanno danni fisici e per quanto concerne l'array A dal
mio punto di vista si tratta di uno stato logico che il controller
RAID ha assegnato ai vari componenti in quanto danni fisici ai supporti non ce ne dovrebbero essere.

Leggendo la procedura riportata nel manuale della IBM (recuperabile anche online a http://www-1.ibm.com/support/docview.wss?uid=psg1MIGR-39144) peggio che andar di notte a luci spente!! Nessuna garanzia di recuperare i dati , e questa inquietante affermazione "For multiple DDD drives in a RAID 1 and RAID 5 array, data is lost.".

Sono disperato, mi sono dimagrito, sono pallido non so che pesci pigliare.

Ma i miei dubbi ancestrali restano i seguenti:

1- i dati nell'array B sono andati persi? Ad oggi, con le prove fatte, non ne ho avuto alcuna evidenza concreta ma il sospetto che i dati non ci siano più è forte ma non ho il coraggio di ammetterlo. Avete idea di qualche prova che mi dia la certezza della perdita dei dati

2- come si possono "resuscitare" quei 2 maledettissimi dischi dell'array A in stato defunct senza temere di perdere tutti i dati. In fondo i dischi sono integri.

PS.
Scusate lo sfogo, le sgrammaticature e tutti gli errori che potrete trovare in questo messaggio, ma sono veramente allo stremo.

PPS.
Non chidedetemi se ho un backup del contenuto dei dischi nell'array A perchè la risposta è no. L'unico backup che ho è un bkp parziale di una directory contenuta nel drive logico dell'array B.

PPPS.
Ho contattato ontrack mi chiedono per la diagnosi 190 € per il primo disco del RAID e il 50% per gli altri dischi, poi per il recupero un prezzo che va da un minio di 3500 a 5500 euro.

ciao,
kaboum

Iron67
16-06-2006, 13:17
Se ti può consolare, mi é già capitato di scollegare e ricollegare un array intero di dischi in RAID5 (in sistemi HP) senza avere nessun problema.
Infatti la configurazione dell'array é solitamente memorizzata sui dischi stessi: diversamente, in caso di quasto del controller, non sarebbe possibile riaccedere ai volumi logici esistenti nell'array collegato ad un nuovo controller.
Scollegare alcuni membri di una catena RAID non é una buona idea, e sopratutto non bisogna superare il quantitativo consentito dal "fault tollerance".

1) scollega tutti i dischi
2) Aggiorna il firmware del controller RAID
3) Resetta la configurazione del controller RAID
4) ricollega i dischi
5) Se non dovesse ancora funzionare, utilizza un controller di livello superiore compatibile con l'attuale

kaboum
16-06-2006, 14:02
Ciao Iron67,
prima di tutto grazie per la risposta.

2) Aggiorna il firmware del controller RAID

Non me la sento in quanto leggendo alcune delle note tecniche della IBM su come comportarsi in questi casi, è sempre sconsigliato di effettuare un upgrade del firmware del controller.

Scollegare alcuni membri di una catena RAID non é una buona idea, e sopratutto non bisogna superare il quantitativo consentito dal "fault tollerance".

Me ne sono reso conto e ne sto pagando le conseguenze :cry: . Porca tr..a

Ciao,
luca