Array di dischi con il RAID

lo storage delle informazioni è da sempre un punto critico nei processi aziendali. La criticità di tale processo verrà accentuata poi con l'entrata in vigore della legge sulla privacy e sul trattamento dei dati personali.

Occorre che i supporti di stoccaggio dei dati siano adeguatamente capienti, accessibili in ogni momento e, soprattutto, che siano affidabili.

A fronte di questo ritenete che il semplice salvataggio dei dati su hard disk sia sufficiente?
Le ultime tecnologie hanno aumentato nei dischi la capienza, la velocità e l’affidabilità abbattendone i costi, tant’è che ad oggi ognuno può avere dei dischi di grande formato per l’immagazzinamento dei dati ad un prezzo decisamente inferiore rispetto a qualche anno fa. La tecnologia Serial ATA (SATA) ad esempio, anche se meno affidabile di quella SCSI è comunque una tecnologia da consigliare a chi vuole un sistema di storage a basso costo.

Ma i dischi, che siano economici o no, che adottino le ultime tecnologie o tecnologie obsolete, hanno al loro interno parti meccaniche in movimento che con gli anni tendono ad usurarsi, che potrebbero presentare difetti di fabbricazione, che potrebbero subire shock, e che sono comunque soggetti a guasti.

Come possiamo allora fornire un supporto adeguato ai nostri dati?

Ci viene incontro la tecnologia RAID. Acronimo di Redundant Array of Inexpensive Disk, che in italiano si traduce con Vettore Ridondante di Dischi Economici, si basa sul concetto di insieme di dischi. Se io ho un disco, e mi si rompe, ho un fault del 100% e il sistema di storage è bloccato. Se ho sette dischi e se ne rompe uno ho un fault del 14.29% ed il sistema di storage continua a funzionare. Quindi in un insieme di dischi la perdita di un elemento ha un impatto ininfluente sulla funzionalità dell’insieme.

Metodi di RAID.

Esistono più metodi di RAID a seconda delal configurazione dei dischi. I più comuni sono quattro e consentono di soddisfare qualsiasi esigenza.

RAID 0

Questa configurazione è particolarmente indicata per applicazioni in realtà in cui bisogna favorire la capienza del disco a discapito della sicurezza dei dati. In pratica non viene applicata nessuna ridondanza dei dati per poter mantenere liberi il più possibile i dischi. Le applicazioni ideali di questa configurazione sono gli storage di repository di file che vengono sottoposti a regolare backup, come ad esempio, i documenti degli utenti. Qualora si guasti il disco basterà sostituirlo, rigenerando il RAID; successivamente poi occorrerà eseguire il restore dei file. Logicamente si avrà la perdita dei file salvati sul disco successivamente all’esecuzione dell’ultimo backup. Il RAID 0 si suddivide a sua volta in altri due metodi di configurazione, quello detto Striping e quello detto Spanning.

La configurazione Striping offre performances migliori ma può causare grosse perdite di spazio. In pratica consente di unire un un’unica unità logica, o Array, due o più dischi. La dimensione dell’unità logica sarà la somma delle dimensioni dei dischi che la compongono Qualora i dischi inseriti nell’Array non avessero la stessa dimensione il controller prenderà in considerazione la dimensione del disco più piccolo. Ad esempio, se configuriamo un Array di tre dischi da 9GB in RAID 0 Striping, otteniamo un Array di 27GB. Se configuriamo un Array di due dischi da 9 GB e uno da 1GB otteniamo un Array di 3GB. La porzione di spazio libero inutilizzato sui due dischi da 9 GB non può essere allocato ed è da considerarsi perso.

La configurazione Spanning consente invece di utilizzare tutto lo spazio a disposizione sui dischi, anche se di dimensioni differenti, ma a discapito delle prestazioni. Nell’esempio dell’Array composto da due dischi da 9GB e uno da 1GB otterremo così un Array di 19GB.

RAID 1

Detto anche Mirroring per la metodologia di ridondanza dei dati. E’ la configurazione che offre la miglior sicurezza per i dati a discapito della capienza complessiva dell’Array. Si possono configurare in RAID 1 solo gli Array composti da due dischi, la dimensione complessiva dell’Array sarà pari alla dimensione del disco più piccolo. La perdita di capacità sarà sempre superiore o uguale al 50% della capacità complessiva dei dischi. In sostanza il RAID 1 esegue una copia speculare dei dati sul disco in mirror. Quindi se configuriamo un Array di due dischi da 9GB otterremo un Array da 9GB. Se invece configuriamo un Array con due dischi, uno da 9GB e uno da 4.7GB otterremo un Array da 4.7GB. Qualora uno dei due dischi subisca un guasto i dati vengono presi dall’altro. Con alcune tecnologie è possibile sostituire il disco rotto senza spegnere il server, riducendo così i tempo di fermo macchina e di blocco del servizio a zero.

RAID 0+1

In pratica è la combinazione delle due configurazioni viste finora. Si generano due Array in RAID 0 striping e si configura un mirror trai due Array. Questa configurazione è applicabile solo a dischi di pari dimensione ed offre le prestazioni dello striping e la sicurezza della ridondanza mirroring.

RAID 5

Garantisce il miglior compromesso tra sicurezza dei dati e disponibilità di spazio, può essere applicata ad Array composti da tre o più dischi. Su ogni disco una parte dello spazio viene allocata per scrivere i dati di parità dei dischi nell’Array. La dimensione totale dell’Array sarà pari alla somma delle dimensioni dei dischi che lo compongono meno uno. In un Array di quattro dischi da 9GB la dimensione sarà pari a 27GB e l’allocazione di disco per i dati di controllo di parità sarà di 9GB. Qualora un disco subisca un guasto l’Array continua a funzionare calcolando i dati grazie al controllo di parità sugli altri dischi. Logicamente questa condizione implica un rallentamento nelle prestazioni dell’Array. Una volta sostituito il disco in fault il controller dell’Array provvede alla rigenerazione dei dati contenuti nel disco sfruttando i dati del controllo di parità immagazzinati negli altri dischi che compongono l’Array. Qualora dovessero guastarsi contemporaneamente due o più dischi i dati di parità contenuti nei dischi rimanenti non sarebbero sufficienti alla rigenerazione dei dati nei dischi in fault ed il contenuto dell’Array sarebbe perso.

L’opzione Hot Spare

Alcuni controller RAID hanno la possibilità di gestire i dischi di Hot Spare. Un disco Hot Spare non è altro che un disco di riserva, che resta in attesa. Al verificarsi di un fault su uno dei dischi del RAID il disco di Hot Spare viene integrato nel RAID in sostituzione di quello in fault ed il RAID inizia la rigenerazione. L’uso di dischi Hot Spare riduce il periodo di tempo che intercorre tra il verificarsi di un fault su un disco e la sua rigenerazione dopo la sostituzione, periodo questo in cui il RAID è scoperto dal fault tollerance ed il verificarsi di un nuovo fault significherebbe la perdita dei dati presenti nell’Array.

Come adottare una configurazione RAID?

Per adottare la configurazione RAID ci sono due modi. Quello più performante ed efficace è l’acquisto di un controller specializzato che gestisca tramite hardware gli Array. Questa è la soluzione sicuramente più dispendiosa ma garantisce alta affidabilità e prestazioni.

L’altro metodo consiste nel configurare gli Array via Software. I sistemi operativi Server Microsoft come Windows 2000 o Windows 2003 hanno la possibilità di gestire i RAID via software mediante Gestione Disco. Logicamente questo metodo è il più economico, in quanto non necessita di hardware specializzato e può utilizzare qualsiasi disco, ma è anche il meno performante ed il meno sicuro, in quanto gestito da software che si appoggiano al sistema operativo, in caso di un malfunzionamento di quest’ultimo i dischi in RAID, con l’esclusione di quelli in RAID 1, non saranno più accessibili. Con l’uso di hardware dedicato invece, anche in presenza di un malfunzionamento del sistema operativo, i dischi sono comunque accessibili, e non tutti i dati andrebbero persi.

Massimiliano PASQUALONI

Array di dischi con il RAID

Ultmim Articoli

Articoli più letti

Argomenti più popolari