View Single Post
Old 28-03-2005, 18:25  
MM
Senior Member
 
L'Avatar di MM
 
Iscritto dal: Nov 1999
Città: Pistoia
Messaggi: 37436
PREMESSE IMPORTANTI
I DISCHI che vengono inseriti in una configurazione RAID possono essere di qualsiasi tipo e capacità: le diversità tra i dischi non comportano impedimenti all’implementazione di un RAID tra di essi.
E’ comunque bene tenere presente che, poiché l’array mette i dischi in stretta relazione tra loro:
- il disco più lento condizionerà le prestazioni velocistiche dell’intero array (i dischi più veloci saranno costretti ad attendere le risposte di quelli più lenti)
- le dimensioni totali dello spazio dedicato al RAID non sono la somma aritmetica delle capacità dei dischi, ma il più piccolo determinerà dette dimensioni. Vale a dire che lo spazio totale disponibile sarà uguale alla capacità del disco più piccolo, moltiplicata per il numero dei dischi impiegati

Detto questo è intuitivo che, per una configurazione ottimale, i dischi da impiegare dovranno essere di modello uguale o comunque appartenenti alla stessa generazione e tecnologia costruttiva.
Per quanto riguarda le dimensioni, se utilizziamo dischi di capacità diversa:
120 GB + 250 GB + 160 GB = 120 GB x 3 = 360 GB per il RAID (170 GB inutilizzati).
Mi pare ovvio che l’uso di dischi di dimensioni diverse è altamente sconsigliato, pur se fattibile, visto che si spreca una certa quantità di spazio.
Nelle valutazioni successive si prenderà comunque sempre in considerazione un array composto da dischi della stessa capacità.

ANNOTAZIONE: la scelta dei dischi spesso ricade su oggetti perfettamente identici, come versione e modello, due dischi “gemelli” come suol dirsi, proprio per avere la certezza della perfetta compatibilità.
Leggendo qua e là su internet però, ho raccolto qualche considerazione interessante proprio su questa questione.
In pratica, esperti sysadmin e addetti al settore, sulla base di esperienze dirette ed indirette, erano giunti alla conclusione che se due dischi sono perfettamente identici, aumentano le probabilità che si guastino insieme o comunque a distanza di poco tempo, vanificando i vantaggi del RAID.
Si tratta ovviamente di considerazioni di tipo statistico/probabilistico e sono quindi da prendere per quello che sono, ma senz’altro non sono prive di logica.


I PARAMETRI DEL RAID

A seconda del livello che si va ad implementare, ci sono parametri che è necessario valutare nel RAID.
Detti parametri, che variano a seconda del livello RAID, possono darci un’indicazione di quale sia il tipo di RAID più appropriato, oltre a indicare anche il livello di complessità ed il costo della configurazione scelta.

PRESTAZIONI
Per le prestazioni di un disco in una configurazione RAID è bene tener presente che queste possono essere significativamente diverse a seconda dell’operazione di lettura o scrittura che si va ad eseguire

Nel mirroring le prestazioni in scrittura saranno leggermente più lente del singolo disco, visto che i dati vengono scritti due volte. Non ci sarà un raddoppio del tempo, visto che comunque i dischi saranno collegati preferibilmente a canali diversi e quindi la trasmissione dati avverrà in contemporanea.
In lettura i dischi verranno invece utilizzati uno per volta, non essendoci necessità di leggerli entrambi, per cui eventuali richieste multiple potranno essere soddisfatte in tempi leggermente più brevi, potendo sfruttare entrambi i dischi contemporaneamente per leggere più archivi.

Con la tecnica dello striping le prestazioni in lettura e scrittura sono in pratica equivalenti e sono visibilmente superiori a quelle del singolo disco, potendo in entrambe le operazioni, distribuire o recuperare “pezzi” dello stesso archivio contemporaneamente

Con la tecnica dello striping con parità le prestazioni in lettura saranno leggermente più veloci rispetto a quelle di un RAID con striping senza parità. Le prestazioni in scrittura, al contrario saranno leggermente peggiori, a causa del fatto che per ogni dato scritto e distribuito sui dischi, il sistema dovrà calcolare e scrivere il “blocco di parità”, vale a dire la somma binaria dei dati scritti.


STORAGE EFFICIENCY
cioè il “rendimento” della configurazione RAID.

Come già detto è sempre consigliabile usare in un RAID dischi della stessa capacità, pena la perdita di parte dello spazio disponibile sui dischi più grandi.
Contemporaneamente è bene tener presente che, a seconda del livello di RAID che si configura, parte dello spazio verrà utilizzato per implementare la ridondanza, quindi non tutto lo spazio dei dischi sarà disponibile per i propri dati.

Detto questo, potremmo definire:
- capacità complessiva = somma delle capacità dei dischi
- capacità disponibile = la capacità gestibile dalla configurazione RAID
- capacità utilizzabile = la capacità utilizzabile dall’utente per i dati

Il rapporto tra la capacità complessiva e quella disponibile è in relazione alle dimensioni dei dischi, che si presume debba essere uguale, per evitare sprechi.
Il rapporto della capacità disponibile e della capacità utilizzabile esprime il “rendimento” del RAID e varia a seconda delle configurazioni.
Questo determina anche un rapporto di costo del RAID stesso, poiché a fronte dell’impiego di una certa capacità di dischi, spesso la capacità effettivamente utilizzabile è inferiore e quindi necessitano dischi più grandi o un maggior numero di dischi per ottenere uno spazio utilizzabile di una certa dimensione.
In pratica: rendimento = (capacità utilizzabile / capacità disponibile) * 100
Ogni configurazione RAID può avere “rendimento” diverso ed essere anche non costante, ma variabile a seconda del numero dei dischi impiegati.
In un RAID con mirroring, per esempio, la capacità utilizzabile sarà sempre e comunque la metà della capacità disponibile, poiché un disco viene utilizzato per duplicare il contenuto dell’altro e quindi il “rendimento” sarà del 50%.


TRASPORTABILITA’
Quella che potremo chiamare appunto trasportabilità non è un parametro “classico” delle configurazioni RAID, ma solo una valutazione sulla compatibilità dell’insieme RAID in relazione a sistemi diversi, qualora si presenti la necessità di trasferire detta configurazione.
E’ un parametro del tutto indipendente dal livello RAID utilizzato, ma in stretta relazione con l’hardware usato, in particolare con il controller.
E’ bene tenere presente che, in linea generale, l’array definito usando un controller non sarà generalmente gestibile da controller di altri costruttori e non sempre sarà gestibile da un controller dello stesso costruttore, ma di modello o release diversa da quello originario.
La buona notizia è che negli ultimi anni si è assistito ad un minimo di standardizzazione dei chipset dei controller e ne deriva una certa compatibilità tra essi e quindi la possibilità di migrare il RAID senza dover definirlo di nuovo e reinstallare il tutto.
Nel caso di trasferimento dei dischi in RAID su altro sistema o sostituzione di scheda madre del sistema attuale (per guasti o semplice upgrade), sarà necessario verificarne la compatibilità in questo senso e decidere il da farsi.
Per queste situazioni sarebbe comunque preferibile avere controller “aggiuntivi” su scheda PCI, i quali, trasportati sul nuovo sistema, continueranno a funzionare come in precedenza.
Per contro, generalmente detti controller hanno prestazioni inferiori e possono creare problemi di compatibilità o di conflitti, specie con controller integrati già presenti sulla scheda madre.

Per la "trasportabilità" di un array da un controller all'altro segnalo questo ottimo articolo di Tomshw
In ogni caso, prima di trasferire una configurazione RAID, è altamente consigliata la copia di backup dei propri dati (obbligatoria direi se i controller non sono compatibili).

ATTENZIONE: per i controller integrati sulle schede madri meno recenti, poiché il bios del controller è spesso strettamente legato al bios della scheda madre stessa, l'aggiornamento del bios generale potrebbe influire su quello del controller e quindi, in alcuni casi, inibire la lettura dell'array RAID. Si consiglia sempre di leggere attentamente le caratteristiche del nuovo bios da installare e tutte le avvertenze legate alla versione che si va ad installare


FAULT TOLERANCE
cioè tolleranza agli errori, ovverosia fino a che punto il livello RAID riesce a garantire la leggibilità o il recupero dei dati in caso di guasto di un disco. In linea di massima il guasto di un disco è tollerato da quasi tutti i livelli RAID e sarà possibile ripristinare il sistema funzionante dopo la sostituzione del disco guasto e la ricostruzione del suo contenuto.
In alcune configurazioni non sarà necessario arrestare il sistema che continuerà a funzionare, ma ci sarà un degrado evidente delle prestazioni durante il lavoro (ricalcolo della parità) e dopo la sostituzione del disco (fino alla completa ricostruzione dei dati contenuti).

Quanto sopra scritto si riferisce a guasti riguardanti i dischi, altra questione è quando il guasto riguarda il controller.
In questo caso la questione si fa più complessa e per ovviare a questo inconveniente, in alcuni casi, si opta per la soluzione del duplexing, vale a dire la ridondanza del sistema mirroring la si affianca ad una ridondanza fisica del controller, facendo in modo che i due dischi vengano gestiti da due controller distinti.
Ultimamente, con la migliore compatibilità dei controller tra loro, questo problema è comunque meno sentito


NOTA IMPORTANTE: il RAID non è l'ancora di salvezza che salva dalla perdita dei dati, poiché un guasto all'alimentatore che danneggi tutti i dischi, per esempio, porterà irrimediabilmente alla perdita dei dati.
Come scritto su storage review: il RAID non vi salva da eruzioni vulcaniche, intendendo appunto che il RAID garantisce il mantenimento dei dati per un guasto del disco dovuto al disco stesso, ma non protegge da eventi o fattori esterni.
Per questo il backup dei dati importanti è sempre necessario e consigliato ed è consigliato anche di effettuare detto backup su supporto esterno al sistema (anche CD e DVD sono supporti "esterni"), che non venga coinvolto in eventuali eventi catastrofici che dovessero danneggiare il sistema.

Ultima modifica di MM : 26-03-2009 alle 07:29.
MM è offline