PDA

View Full Version : Cluster windows, come fa chkdsk di una lun?


Tasslehoff
12-06-2010, 23:17
Domandina per chiunque abbia esperienza di cluster Windows e gestione di storage su san.
Ho dei server Windows 2003 in cluster, tra i gruppi di risorse ho delle lun residenti su una san FC e i filesystem creati su queste lun richiedono un chkdsk.

A volte succedere che a causa di un reboot (ad es per updates) queste lun non vengano montate con le loro rispettive unità in quanto necessitano di chkdsk (messaggio evidenziato nell'event viewer).
Il problema è che se le lun non sono montate, windows non mi permette di lanciare un chkdsk sulle stesse.

Insomma è il tipico caso di cane che si morde la coda :doh:

Ho notato che con un paio di riavii magicamente le lun vengono montate, però ho il sospetto che non venga fatto alcun check sul filesystem.
Vorrei trovare una soluzione definitiva, qualcuno sa come sbrogliare questa matassa? :confused:

Thx

Rhapsodyan [ITA]
13-06-2010, 14:39
Ciao, non mi sono chiare alcune cose:
-Le lun in questione sono presentate unicamente ai due nodi del cluster? Ovvero: le lun sono ad accesso esclusivo? Mi auguro di si se il filesystem è NTFS :D
-Il fatto che dopo un reboot le lun non vengono montate, mi fa pensare più ad un problema sul cluster che non chiude correttamente la comunicazione con il filesystem..
-Qual è la san in questione? Non ha un tool di gestione che ti permette di fare un checkdisk da lì?
-Se muovi il gruppo di risorse che contiene la lun sul nodo secondario prima di eseguire il riavvio del nodo, succede lo stesso?

Tasslehoff
13-06-2010, 15:17
;32288677']Ciao, non mi sono chiare alcune cose:
-Le lun in questione sono presentate unicamente ai due nodi del cluster? Ovvero: le lun sono ad accesso esclusivo? Mi auguro di si se il filesystem è NTFS :DTi confermo l'accesso esclusivo di quelle lun a quei due nodi, altrimenti il filesystem farebbe a dir poco i fuochi artificiali :D

-Il fatto che dopo un reboot le lun non vengono montate, mi fa pensare più ad un problema sul cluster che non chiude correttamente la comunicazione con il filesystem..Il problema è proprio su filesystem, quando viene fatto un reboot e si prova a mettere online le risorse del cluster corrispondenti a quelle due lun compare nell'event viewer un messaggio molto chiaro che dice che non possono essere messe online perchè i filesystem necessitano di chkdsk.
In questo momento sono proprio impossibilitato a collegarmi per fare un copy&paste del evento, domani avrò di nuovo accesso alle macchine.

-Qual è la san in questione? Non ha un tool di gestione che ti permette di fare un checkdisk da lì?E' un IBM DS5100, sui server invece ci sono due HBA Qlogic.
Fino a 2 gg fa stavano su un DS4300 sempre di IBM, ma il problema è lo stesso.
Il fatto è che il filesystem per la san (e quindi relativo software di gestione) è totalmente trasparente, la san giustamente non ha idea di quale filesyste tu crei sulle lun, oppure se le usi direttamente come block devices, quindi non esiste niente lato san che permetta di fare un controllo del filesystem creato sulla lun.

-Se muovi il gruppo di risorse che contiene la lun sul nodo secondario prima di eseguire il riavvio del nodo, succede lo stesso?Non ho provato a fare un switch dei nodi, per farlo dovrei chiedere le opportune autorizzazioni per un test di disaster recovery.
Mi aspetto che il comportamento sia simile, non conosco i più reconditi segreti del filesystem NTFS, però come tanti altri filesystem dovrebbe avere un qualche tipo di contatore che dopo un certo numero di mount richiede chkdsk oppure in corrispondenza di determinati eventi (es shutdown interrotto o corruzione di determinate aree del filesystem stesso).

In definitiva si tratta di un banale chkdsk, che per essere lanciato necessita che le lun siano online, ma dato che i filesystem di queste lun non sono perfettamente a posto il sistema le tiene offline :(
Su redhat o suse tutto è estremamente più semplice e lineare, filesystem con problemi --> unmount della lun --> fsck del device --> mount della lun, ma Windows non può lanciare chkdsk di una lun offline.