DISCHI - RAID: piccola guida

Versione Completa   Stampa   Cerca   Utenti   Iscriviti     Condividi : FacebookTwitter
chri619
00venerdì 17 novembre 2006 08:15
smilep
chri619
00venerdì 17 novembre 2006 08:16
PREMESSA
Quanto segue non vuole essere "la Bibbia" del RAID, ne' sostituire le discussioni su di esso, ma solo una guida semplice e pratica per chi si avvicina a questo tipo di configurazione.

[Modificato da chri619 17/11/2006 8.17]

chri619
00venerdì 17 novembre 2006 08:17
Cos'è il RAID?

Il RAID, nella sua definizione originale, significa:
Redundant Array of Inexpensive Disks = Sistema ridondante di dischi economici
Questa definizione fa evidentemente riferimento al fatto che il RAID consente di ottenere determinate caratteristiche di sicurezza e velocità su sistemi "casalinghi" con dischi economici, prerogative un tempo riservate a sistemi professionali ben più costosi.
Si trova, qualche volta anche la definizione:
Redundant Array of Indipendent Disks = Sistema ridondante di dischi indipendenti
ma la definizione originale è la prima.

Al di là della definizione, il RAID è un sistema di “connessione logica” tra più dischi per ottenere determinati vantaggi, quali:
- la visione unica di tutto lo spazio disponibile
- l’aumento delle prestazioni in lettura/scrittura
- l’aumento della sicurezza dei propri dati

Definizioni generali del RAID
La caratteristica principale che identifica il RAID è l'array (tradotto letteralmente: raggruppamento, schieramento), quella struttura logica che definisce il collegamento logico dei dischi tra loro.
Il numero dei dischi ed il tipo di array definito identificano il livello RAID, la tipologia di RAID che andremo a definire.
A seconda del livello RAID che andremo a scegliere verranno implementate diverse tecniche per ottenere maggiori prestazioni o una maggiore sicurezza dei propri dati oppure entrambe le condizioni.

Per definire un RAID sarà necessario disporre di un controller, integrato nella scheda madre o su scheda PCI, il quale consentirà di collegare i vari dischi e di implementare uno o più livelli di RAID, a seconda del modello del controller stesso.

Una delle peculiarità di un RAID è la ridondanza, riferimento presente nella definizione stessa di questa tecnica di collegamento logico dei dischi.
Ridondanza, come è facile intuire, si riferisce ad una "eccedenza", ad una duplicazione delle informazioni esistenti, per consentirne comunque il recupero, in caso di guasti.
La ridondanza viene ottenuta con varie tecniche a seconda del livello di RAID definito:

- mirroring: (da mirror = specchio) consiste nella duplicazione sistematica dei dati da un disco ad un altro.
Ogni dato scritto su un disco viene scritto nello stesso modo e nella stessa posizione su un altro disco, ottenendo così una copia speculare del disco originale

- duplexing: (duplicazione) variante del sistema precedente nella quale si utilizzano, oltre che due dischi, due controller gemelli ognuno dei quali gestisce un solo disco. In questo caso si ottiene anche una protezione da un possibile guasto di un controller.

- parity: (controllo di parità; abbinato quasi sempre alla tecnica striping) al contrario del mirroring in questo caso, non si ha la doppia scrittura dei dati, ma la ridondanza viene ottenuta calcolando, per i dati originali scritti sui dischi, la somma binaria dei dati stessi e scrivendo quest’ultima a fronte delle informazioni originali.
Si ottiene così una "catena" (attraverso più dischi), tale che, in caso di mancata disponibilità di un "anello" della catena, il dato mancante è ricalcolabile tramite la somma di quelli esistenti.


In termini di prestazioni, l'incremento di queste, viene invece ottenuto con la tecnica dello

- striping: (dividere in strisce) tecnica che consiste la suddivisione di ogni file in blocchi di dimensioni prestabilite e nella scrittura di questi su dischi diversi. Questo consente, in fase di lettura/scrittura, di avere contemporaneamente letture/scritture su dischi diversi con intuibile miglioramento dei tempi di caricamento/scaricamento della memoria.


I livelli del RAID
Le varie configurazioni ottenibili in un sistema RAID sono chiamate "livelli" e generalmente indicate con numeri progressivi, che identificano il tipo di collegamento logico del RAID e le sue caratteristiche operative (mirroring, striping, etc.)
Oltre a questo esiste una ulteriore configurazione, non propriamente RAID ma che si avvicina a questa per l'approccio alla visione dei dischi, denominata JBOD

I livelli di RAID definiti ufficialmente vanno da 0 a 6 (esiste anche un un livello 7 sviluppato proprietariamente da un produttore hardware) e sono i cosiddetti "livelli semplici", in relazione al fatto che alcuni livelli sono combinabili tra loro per ottenere livelli RAID più complessi, generalmente detti "multipli" o "annidati".
Esempi classici sono le congigurazioni RAID 0+1 o 10
chri619
00venerdì 17 novembre 2006 08:18
I parametri del RAID

A seconda del livello che si va ad implementare, ci sono parametri che è necessario valutare nel RAID.
Detti parametri, che variano a seconda del livello RAID, possono darci un’indicazione di quale sia il tipo di RAID più appropriato, oltre a indicare anche il livello di complessità ed il costo della configurazione scelta.

PRESTAZIONI
Per le prestazioni di un disco in una configurazione RAID è bene tener presente che queste possono essere significativamente diverse a seconda dell’operazione di lettura o scrittura che si va ad eseguire

Nel mirroring le prestazioni in scrittura saranno leggermente più lente del singolo disco, visto che i dati vengono scritti due volte (anche se usando canali diversi, i dati verranno inviati contemporaneamente e quindi non si ha un raddoppio del tempo).
In lettura i dischi verranno invece utilizzati uno per volta, non essendoci necessità di leggerli entrambi, per cui eventuali richieste multiple potranno essere soddisfatte in tempi più brevi, potendo sfruttare entrambi i dischi contemporaneamente per leggere più archivi.

Con la tecnica dello striping le prestazioni in lettura e scrittura sono in pratica equivalenti e superiori a quelle del singolo disco, potendo in entrambe le operazioni, distribuire o recuperare “pezzi” dello stesso archivio contemporaneamente

Con la tecnica dello striping con parità le prestazioni in lettura saranno leggermente più veloci rispetto a quelle di un RAID senza parità. Le prestazioni in scrittura, al contrario saranno leggermente peggiori, a causa del fatto che per ogni dato scritto e distribuito sui dischi, il sistema dovrà calcolare e scrivere il “blocco di parità”, vale a dire la somma binaria dei dati scritti.


STORAGE EFFICIENCY
vale a dire il “rendimento” della configurazione RAID.

Bisogna innanzitutto chiarire una questione: in un RAID è sempre consigliabile utilizzare dischi di eguali dimensioni, poiché l’utilizzo dello spazio dei dischi avviene riferendosi al disco più piccolo impiegato ed utilizzando, sugli altri, la stessa capacità.
Vale a dire che lo spazio totale disponibile sarà uguale alla capacità del disco più piccolo, moltiplicato per il numero dei dischi impiegati, per cui, avendo dischi di dimensioni diverse, sui dischi più grandi vi sarà uno spreco di spazio che non sarà reso disponibile al RAID.
In pratica, se utilizziamo quattro dischi di dimensioni diverse:

20GB + 30GB + 20GB + 40GB = 20GB x 4 = 80 GB per il RAID (30 GB inutilizzati)
40GB + 40GB + 80GB + 60GB = 40GB x 4 = 160 GB per il RAID (60 GB inutilizzati)

Detto questo, potremmo definire:
- capacità complessiva = somma delle capacità dei dischi
- capacità disponibile = la capacità gestibile dalla configurazione RAID
- capacità utilizzabile = la capacità utilizzabile dall’utente per i dati

Il rapporto tra la capacità complessiva e quella disponibile è in relazione alle dimensioni dei dischi, che si presume debba essere uguale, per evitare sprechi.
Il rapporto della capacità disponibile e della capacità utilizzabile esprime il “rendimento” del RAID e varia a seconda delle configurazioni.
Questo determina anche un rapporto di costo del RAID stesso, poiché a fronte dell’impiego di una certa capacità di dischi, spesso la capacità effettivamente utilizzabile è inferiore e quindi necessitano dischi più grandi o un maggior numero di dischi per ottenere uno spazio utilizzabile di una certa dimensione.
In pratica: rendimento = (capacità utilizzabile / capacità disponibile) * 100
Ogni configurazione RAID può avere “rendimento” diverso ed essere anche non costante, ma variabile a seconda del numero dei dischi impiegati.
In un RAID con mirroring, per esempio, la capacità utilizzabile sarà sempre e comunque la metà della capacità totale (con dischi di uguali dimensioni), poiché un disco viene utilizzato per duplicare il contenuto dell’altro e quindi il “rendimento” sarà del 50%.

E’ evidente che non si ha convenienza ad usare dischi di dimensioni diverse, poiché lo spazio eccedente viene perduto e non risulta disponibile al RAID, riducendo ancora di più il rendimento di una qualsiasi configurazione.
Oltre a dischi di uguali dimensioni e comunque è consigliabile usare dischi uguali per le configurazioni RAID (modello e costruttore) o quanto meno dischi dello stesso livello tecnologico, poiché, così come accade per la capacità, anche per le prestazioni il disco più lento condizionerà l’intera configurazione.

TRASPORTABILITA’
Quella che potremo chiamare appunto trasportabilità non è un parametro “classico” delle configurazioni RAID, ma solo una valutazione sulla compatibilità dell’insieme RAID in relazione a sistemi diversi, qualora si presenti la necessità di trasferire detta configurazione.
E’ un parametro del tutto indipendente dal livello RAID utilizzato, ma in stretta relazione con l’hardware usato, in particolare con il controller.
E’ bene tenere presente che, in linea generale, l’array definito usando un controller non sarà generalmente gestibile da controller di altri costruttori e spesso non sarà gestibile nemmeno da un controller dello stesso costruttore, ma di modello o release diversa da quello originario.
Nel caso di trasferimento dei dischi in RAID su altro sistema o sostituzione di scheda madre del sistema attuale (per guasti o semplice upgrade), se si usa il controller integrato, probabilmente il RAID non verrà riconosciuto e con conseguente impossibilità di accedere alla lettura dei dati presenti sui dischi.
Per queste situazioni sarebbe preferibile avere controller “aggiuntivi” su scheda PCI, i quali, trasportati sul nuovo sistema, continueranno a funzionare come in precedenza.
Per contro, generalmente detti controller hanno prestazioni inferiori e possono creare problemi di compatibilità o di conflitti, specie con controller integrati già presenti sulla scheda madre.
Spesso, l’unica via percorribile e relativamente sicura è quella della copia di backup e della ricostruzione dell’array.

ATTENZIONE: per i controller integrati sulle schede madri, poiché il bios del controller è spesso strettamente legato al bios della scheda madre stessa, l'aggiornamento del bios generale potrebbe influire su quello del controller e quindi, in alcuni casi, inibire la lettura dell'array RAID. Si consiglia sempre di leggere attentamente le caratteristiche del nuovo bios da installare e tutte le avvertenze legate alla versione che si va ad installare


FAULT TOLERANCE
cioè tolleranza agli errori, ovverosia fino a che punto il livello RAID riesce a garantire la leggibilità o il recupero dei dati in caso di guasto di un disco. In linea di massima il guasto di un disco è tollerato da quasi tutti i livelli RAID e sarà possibile ripristinare il sistema funzionante dopo la sostituzione del disco guasto e la ricostruzione del suo contenuto.
In alcune configurazioni non sarà necessario arrestare il sistema che continuerà a funzionare, ma ci sarà un degrado evidente delle prestazioni durante il lavoro (ricalcolo della parità il lettura) e dopo la sostituzione del disco (fino alla completa ricostruzione dei dati contenuti).

Quanto sopra descritto si riferisce a guasti riguardanti i dischi, altra questione è quando il guasto riguarda il controller.
In questo caso la questione si fa più complessa e per ovviare a questo inconveniente, in alcuni casi, si opta per la soluzione del duplexing, vale a dire la ridondanza del sistema mirroring la si affianca ad una ridondanza fisica del controller, facendo in modo che i due dischi vengano gestiti da due controller distinti.

NOTA IMPORTANTE: il RAID non è l'ancora di salvezza che salva dalla perdita dei dati, poiché un guasto all'alimentatore che danneggi tutti i dischi, per esempio, porterà irrimediabilmente alla perdita dei dati.
Come scritto su storage review: il RAID non vi salva da eruzioni vulcaniche, intendendo appunto che il RAID garantisce il mantenimento dei dati per un guasto del disco dovuto al disco stesso, ma non protegge da eventi o fattori esterni.
Per questo il backup dei dati importanti è sempre necessario e consigliato ed è consigliato anche di effettuare detto backup su supporto esterno al sistema (anche CD e DVD sono supporti "esterni"), che non venga coinvolto in eventuali eventi catastrofici che dovessero danneggiare il sistema
chri619
00venerdì 17 novembre 2006 08:18
RAID hardware e RAID software

Il sistema RAID è generalmente legato all’uso di un controller specifico, integrato o su scheda aggiuntiva PCI.
Alcuni sistemi operativi, a partire da Windows NT, permettono di definire una configurazione RAID via software, utilizzando specifiche routine insite nel sistema operativo stesso.
I risultati sono paragonabili alle configurazioni hardware, anche se le prestazioni sono generalmente inferiori, certe volte anche in modo significativo.
Il motivo è evidente: tutte le operazioni che normalmente vengono demandate al controller e da questo gestite direttamente, nel caso del RAID software tutto il “lavoro” sarà a carico del sistema, del software e del processore, quindi questo si ripercuoterà sulle prestazioni generali del sistema
Riportando liberamente quanto letto su www.storagereview.com: un RAID software, in definitiva, non è una bellezza, ma per la sicurezza dei dati, meglio un RAID 1 via software che non avere niente.

In sintesi:

VANTAGGI
- costo: avendo un sistema operativo che consente il RAID software i costi aggiuntivi sono nulli (anche se, probabilmente, si dovrà verificare la necessità di aggiunta dischi)
- semplicità: non c’è bisogno di configurare alcun controller, ne’ di installare driver

SVANTAGGI
- prestazioni: saranno generalmente inferiori, a volte anche sensibilmente
- limitazione boot: poiché il sistema operativo, per gestire l’array, avrà bisogno di caricare le relative routine, il boot dall’array RAID non è possibile, ma sarà necessaria una partizione di boot indipendente dal RAID
- limitazione configurazioni: generalmente sono disponibili solo le configurazioni RAID dei livelli “0”, “1” o eventualmente anche “5”; non sono comunque disponibili livelli RAID “annidati”
- limitazione sistema operativo: l’array creato sarà riconosciuto solo dal sistema operativo che l’ha creato e non sarà disponibile ad altri (vedi sistemi multi boot); crash del sistema operativo potrebbero danneggiare l’integrità dell’array
- altre limitazioni: non sono generalmente disponibili possibilità di “hot spare” cioè sostituzione di dischi con il sistema in funzione; alcuni prodotti software (specie quelli per partizionamento) potrebbero non riconoscere il RAID o addirittura entrare in conflitto con detta configurazione;
chri619
00venerdì 17 novembre 2006 08:19
ATTIVAZIONE CONTROLLER
Impossibile scrivere dettagliatamente la procedura di attivazione e configurazione del RAID, poiché i particolari cambiano da un controller all’altro, da controller integrati o aggiuntivi su scheda PCI, da versioni del bios diverse.
Possiamo solo tracciare una linea da seguire per l’operazione di attivazione, rimandando i particolari al manuale del controller o della scheda madre (se controller integrato)
"Quando tutto il resto non funziona, provate a leggere il manuale di istruzioni" (da: "La legge di Murphy")

I controller integrati generalmente funzionano sia come controller per il RAID, sia come normali controller EIDE aggiuntivi, vale a dire che supporteranno sia dischi in configurazione RAID che dischi indipendenti (anche contemporaneamente)
I controller integrati vanno attivati dal bios della scheda madre (qualora non lo siano già); sulla configurazione del bios, a seconda della versione di questo, potremmo trovare varie possibilità di scelta:
- Disabled / Enabled
- Disabled / ATA / RAID
- un item Disabled / Enabled + un item ATA / RAID
Per tutte le scelte, come già detto, sarà possibile comunque utilizzare dischi indipendenti, è comunque sconsigliato attivare il controller in modo RAID quando non si ha configurazione RAID poiché aumentano i tempi di boot (il sistema cerca un RAID che non c’è e poi manda un messaggio che non lo ha trovato)
Per i livelli disponibili sul controller che avete a disposizione, integrato o su scheda aggiuntiva, verificate, sempre sul manuale.

In caso di controller su scheda PCI la procedura descritta non serve in quanto il controller viene riconosciuto separatamente, rispetto al bios della scheda madre.

COLLEGAMENTO FISICO DISCHI
I dischi andranno collegati ovviamente ai canali del controller RAID, ma, se si tratta di dischi P-ATA, dovranno essere collegati sullo stesso canale o su canali diversi?
Le prove specifiche da me effettuate non hanno evidenziato differenze sostanziali tra i due collegamenti, ma da più parti, su internet, si raccomanda di collegare i dischi su canali diversi, per migliorare le prestazioni.
Diciamo allora che, a scanso di problemi, se non ci sono controindicazioni, è preferibile collegare i dischi su canali diversi
Nel caso in cui si colleghino, per qualche motivo, entrambi allo stesso canale, è preferibile usare il primo: per esperienza il riconoscimento dell’array avviene più velocemente quando almeno un disco è presente sul primo canale.
Nel caso dei dischi S-ATA i problema dei canali non esiste poiché un canale SATA gestisce un unico disco

Sui canali PATA si può eventualmente anche aggiungere un altro disco come disco singolo, non configurato in RAID

CONFIGURAZIONE/ATTIVAZIONE ARRAY
Innanzitutto si tratta di definire l’ARRAY, per il collegamento logico dei dischi: generalmente si tratta di premere una combinazione di tasti all’avvio del sistema (CTRL+F / CTRL+H / …..leggere il manuale di istruzioni).
Una volta entrati nel menu di configurazione si sceglierà il tipo di RAID che vogliamo configurare e si identificheranno i dischi che vogliamo inserire nella configurazione del RAID
Si procede poi con il salvataggio dei dati di configurazione ed il sistema viene riavviato.
Al riavvio verificare che i dischi siano riconosciuti nel modo giusto, altrimenti procedere nuovamente, cercando di capire dove si sta sbagliando (il manuale sempre a portata di mano )

Per l’attivazione di un array con opzioni di striping è consigliato che i dischi siano “puliti”, vale a dire senza partizioni già esistenti, altrimenti il rischio è che queste vadano in conflitto con l’array stesso in fase di avvio del sistema

NOTA - Si sconsiglia di collegare unità ottiche a controller RAID, pur funzionanti come normali controller EIDE: si sono avuti casi di drastico degrado delle prestazioni delle unità stesse, probabilmente dovute ad una non perfetta compatibilità

STRIPING e STRIPE SIZE
Lo stripe size (o anche chunk size o block size) rappresenta il blocco, l’unità minima in cui viene diviso ogni file per la scrittura sui dischi in un RAID con caratteristiche di striping.
Non è da confondere con il cluster size che è un’unità di misura che identifica l’unità minima di allocazione del disco.
Sebbene lo stripe size influisca sulle prestazioni del RAID, non ci sono parametri certi o tabelle che consentano di definire una dimensione ottimale, ma a seconda delle situazioni di lavoro e dei tipi e dimensioni dei file, le cose potrebbero cambiare.
Stripe molto piccoli, possono, per certi aspetti migliorare la lettura dei file distribuendo i file anche piccoli su più dischi, ma peggiorano le prestazioni di posizionamento delle testine (costrette a cercare più pezzi su più dischi)
Con stripe molto grandi potremmo avere i file più piccoli scritti su un solo disco e quindi non si avrebbe il miglioramento delle prestazioni in lettura, ma per contro il controller potrebbe intanto utilizzare gli altri dischi per leggere altri file…….
Insomma, come si sarà capito una regola certa non esiste e qualche volta è necessario provare qualche combinazione diversa.
Di solito si sceglie un compromesso che dovrebbe, bene o male, coprire un po’ tutti i problemi, vale a dire ci si attesta su una dimensione di 32K o 64K, ma è solo un’indicazione e la disposizione stessa dei dischi sul sistema (RAID + dischi singoli), può suggerire di scegliere diversamente.
chri619
00venerdì 17 novembre 2006 08:19
PARTIZIONAMENTO
Il partizionamento di dischi in RAID (anche se in RAID 0), è identico a quello di un singolo disco, poiché il sistema riconosce il tutto come un unico disco.
I soli limiti possono esserci usando software che non vede i canali RAID o non riesce ad interpretare l’array configurato
Sistemi operativi come W2000 o XP, che permettono il partizionamento durante l’installazione, non avranno alcun problema a partizionare lo spazio disponibile come se fosse un solo disco
Nelle configurazioni striping 0 lo spazio riservato alle partizioni verrà distribuito su entrambi i dischi, mentre in quelle mirroring la partizione verrà duplicata sul secondo disco.


INSTALLAZIONE SISTEMA OPERATIVO
In caso di installazione del sistema operativo su disco singolo (riservando poi il RAID a programmi e/o dati), il problema non esiste: si installa il SO normalmente, poi si installano i driver per il riconoscimento del controller RAID e si procede normalmente (configurando i dischi in RAID indifferentemente prima o dopo l’installazione del sistema operativo)

L’installazione del SO direttamente sui dischi in RAID richiede invece alcune accortezze e ci sono differenze a seconda di quale SO si và ad installare.
Installando W98(SE), non ci sono particolari procedure da seguire, poiché riconosce regolarmente il controller e l’array e si dispone all’installazione (questo sui controller integrati, per gli aggiuntivi non ho provato)
Per installare W2000 o XP, invece, è necessario, sulla prima schermata azzurra che compare, premere “F6” per far sapere al SO che si vogliono installare driver di altri dispositivi
E’ necessario copiare i driver su un floppy (qualora il floppy non sia fornito insieme al controller), poiché il sistema operativo cercherà detti driver solo ed esclusivamente su floppy
N.B.: al momento che premete F6 non succede nulla, il floppy verrà richiesto in seguito

Riconosciuto il controller ed individuato l’array, si procede normalmente come per le installazioni su dischi singoli.
chri619
00venerdì 17 novembre 2006 08:20
RAID livello 0
Il RAID livello 0 o semplicemente RAID 0, non è propriamente una configurazione RAID a rigore di termini.
Il motivo di questo sta nel fatto che questo livello raid non prevede ridondanza, quindi la protezione per la perdita dei dati non è implementata in questa configurazione.
Utilizza la funzione di striping per distribuire i file nei dischi configurati e questo migliora le prestazioni di lettura/scrittura, fino ad incrementi reali valutabili intorno al 50%.
E’ bene tenere conto, comunque, che l’incremento delle prestazioni non sarà riferito all’intero sistema, ma alle sole operazioni di scambio dati con i dischi: nonostante il sistema possa sembrare più veloce in assoluto, in realtà le operazioni di calcolo e/o scambio tra processore e memoria rimarranno invariate.
Per contro, il guasto di un disco provoca la perdita totale del contenuto dei dischi configurati con questo livello di RAID e questo comporta che la configurazione sia piuttosto “fragile”, poiché le probabilità di perdita delle funzionalità sono statisticamente proporzionali al numero dei dischi impiegati.
Si tenga inoltre conto che il recupero, con appositi software, del contenuto dei dischi è pressoché impossibile, il che comporta, in caso di guasto, la perdita totale dei dati.

IMPORTANTE: l’attivazione dell’array per il RAID 0 è una procedura “distruttiva”, vale a dire che la definizione dell’array si sovrappone e vanifica qualsiasi altra suddivisione presente sui dischi.
Ne consegue che il contenuto dei dischi viene perduto con questa attivazione, ragion per cui è assolutamente necessario il salvataggio di eventuali dati presenti, prima di procedere alla definizione dell’array

IN SINTESI
Dischi min.: 2
Dischi max: quanti ne può gestire il controller
Ridondanza: nessuna
Fault tolerance: nessuna
Prestazioni: miglioramento delle operazioni di lettura e scrittura, valutabili intorno al 50%
Rendimento: 100%, tutta la capacità disponibile al RAID è utilizzabile per i dati

---------------------------------------------------------------------------------

JBOD
Il JBOD (Just a Bunch of Disks) è un sistema di configurazione dei dischi che non ha niente a che vedere con il RAID, ma gli assomiglia nel concetto di indirizzare, tramite un array, più dischi della stessa macchina.
A differenza del RAID 0 non implementa lo striping, ma si limita a “far vedere “ al sistema tutti i dischi disponibili, come se fosse un unico disco.
Solo ed esclusivamente in questa configurazione la capacità complessiva, disponibile ed utilizzabile sono equivalenti e corrispondono alla somma aritmetica della capacità dei singoli dischi.
In pratica l’array definisce una specie di collegamento logico tra i dischi, senza metterli in relazione tra loro, ma simulando una continuità tra un disco ed il successivo della catena.
La scrittura dei dati avviene senza alcuno “spezzettamento programmato” (come avviene con lo striping), anche se l’occupazione di spazio dei dischi viene comunque bilanciata: i file vengono distribuiti in modo che tutti i dischi abbiano, più o meno, la stessa percentuale di spazio occupato
L’unico vantaggio che comporta questa configurazione è quello di avere un unico disco logico da gestire, invece di più dischi
In caso di guasto di un disco l’array viene perso, ma i dati all’interno di ogni singolo disco (a parte eventualmente quello guasto) sono generalmente recuperabili, in quanto ogni disco contiene file completi.


IN SINTESI
Dischi min.: 2
Dischi max: quanti ne può gestire il controller
Ridondanza: nessuna
Fault tolerance: nessuna
Prestazioni: paragonabili al disco singolo
Rendimento: 100%, tutta la capacità dei dischi è vista dall’array ed è utilizzabile dall’utente; possibile utilizzo di dischi di capacità diverse, senza spreco di spazio
chri619
00venerdì 17 novembre 2006 08:20
RAID livello 1
Il RAID 1 è spesso definito semplicemente “mirroring” in quanto la tecnologia di ridondanza adottata è quella, appunto, del mirroring.
Con questa configurazione i dischi utilizzati sono sempre e comunque due, poiché per ogni disco viene costantemente aggiornata una sua copia speculare.
Un controller può gestire anche più dischi, ma ogni coppia di dischi (preferibilmente uguali, pena lo spreco dello spazio eccedente) è un RAID 1 a sé stante.
Le prestazioni sono, in generale, paragonabili a quelle del singolo disco, con lieve peggioramento in scrittura e lieve miglioramento (statistico) in lettura.
Il guasto di un disco non provoca la perdita di alcun dato poiché i dati sono esattamente replicati sul suo gemello.
Generalmente è comunque possibile avviare il sistema con un solo disco funzionante, in attesa di sostituire il disco guasto.
La ricostruzione dell’array avviene generalmente in fase di avvio del sistema, su richiesta del bios del controller che chiede se ricostruire o proseguire con un solo disco.

IMPORTANTE: l’attivazione dell’array per il RAID 1 non è una procedura distruttiva e l’array può essere definito anche usando un disco già esistente con installazione già effettuata (o addirittura si può installare prima su disco singolo e poi definire l’array e la duplicazione del disco in un altro)
Resta comunque il fatto che un salvataggio dei dati, per ogni evenienza, è sempre consigliabile.

IN SINTESI
Dischi min.: 2
Dischi max: quanti ne può gestire il controller, ma il RAID può essere definito solo per coppie di dischi
Ridondanza: duplicazione dei dati da un disco all’altro
Fault tolerance: tollera il guasto di un disco, con ricostruzione automatica dell’array su nuovo disco
Prestazioni: paragonabili al disco singolo
Rendimento: 50%, della capacità disponibile (due dischi) viene restituita solo quella di un disco
chri619
00venerdì 17 novembre 2006 08:20
RAID livello 2
Il RAID 2 è una configurazione ormai caduta in disuso per vari motivi.
Inoltre il sistema di ridondanza usato in questa configurazione proponeva nient’altro che il controllo ECC dei dati, feature già presente nei dischi attuali.
Per questo motivo non è più proponibile, ma soprattutto non esistono costruttori di controller per questa configurazione.

-----------------------------------------------------------------------------

RAID livello 3
Il RAID 3 utilizza la tecnica dello striping e per la sicurezza utilizza la tecnica del controllo di parità.
Lo striping, in questa configurazione, avviene a livello di Byte e nello stesso modo viene calcolata la parità, ovverosia quella somma binaria che consente, a ritroso, di ricalcolare il dato eventualmente mancante.
Utilizza un minimo di due dischi per i dati, più un disco dedicato alla memorizzazione dei Byte di parità.
Le prestazioni in lettura sono migliori del singolo disco, poiché i dati vengono letti da più dischi contemporaneamente, visto l’uso della tecnica di striping.
Le prestazioni in scrittura peggiorano, poiché per ogni operazione eseguita sui dati necessita del calcolo della parità, da scrivere sul disco dedicato a questa funzione.
Inoltre, poiché il disco dedicato alla parità è unico, questo costituisce anche una specie di collo di bottiglia che può limitare ulteriormente le prestazioni in scrittura.
Per assurdo, aumentando i dischi, le prestazioni in lettura migliorano e quelle in scrittura possono addirittura peggiorare.

La ricostruzione dell’array in caso di guasto di un disco può avvenire, a seconda delle caratteristiche del controller e del sistema, sia in avvio del sistema stesso o durante il normale funzionamento; ovviamente la ricostruzione “on line” degrada le prestazioni del sistema in modo sensibile.

I controller presenti nelle attuali MB non consentono generalmente questo tipo di RAID, ma sarà necessario l’acquisto di un controller specifico su scheda PCI.

IN SINTESI
Dischi min.: 3
Dischi max: quanti ne può gestire il controller
Ridondanza: calcolo e scrittura del Byte di parità su disco dedicato, per ogni dato scritto sui dischi riservati ai dati
Fault tolerance: tollera il guasto di un disco, con ricostruzione del contenuto su nuovo disco
Prestazioni: ottime in lettura, medie in scrittura (generalmente inferiori al disco singolo)
Rendimento: variabile, dal 67% nella configurazione minima, in aumento con l’aumentare dei dischi installati

---------------------------------------------------------------------------

RAID livello 4
Il RAID 4 utilizza la tecnica dello striping e per la sicurezza utilizza la tecnica del controllo di parità.
E’ in pratica la stessa configurazione del RAID 3, con la differenza che lo striping viene eseguito a livello di blocchi e non di singoli Byte.
Allo stesso modo il calcolo della parità viene eseguito a livello di blocco e scritto di conseguenza.

I controller presenti nelle attuali MB non consentono generalmente questo tipo di RAID, ma sarà necessario l’acquisto di un controller specifico su scheda PCI.

IN SINTESI
Dischi min.: 3
Dischi max: quanti ne può gestire il controller
Ridondanza: calcolo e scrittura della parità su disco dedicato, per ogni blocco scritto sui dischi riservati ai dati
Fault tolerance: tollera il guasto di un disco, con ricostruzione del contenuto su nuovo disco
Prestazioni: ottime in lettura, medie in scrittura (generalmente inferiori al disco singolo)
Rendimento: variabile, dal 67% nella configurazione minima, in aumento con l’aumentare dei dischi installati

---------------------------------------------------------------------------

RAID livello 5
Il RAID 5 utilizza la tecnica dello striping e per la sicurezza utilizza la tecnica del controllo di parità.
Ha in pratica le stesse funzionalità del RAID 4: striping a blocchi con calcolo e scrittura della parità per ogni blocco.
La differenza fondamentale, che lo distingue dal RAID 4 è che in questa configurazione non esiste il disco dedicato alla scrittura della parità, ma i blocchi di parità stessi vengono scritti su ognuno dei dischi usando la stessa tecnica dello striping.
Non si ha vantaggio in termini di spazio occupato dalla parità, in quanto lo spazio totale “sottratto” ai dati risulta essere sempre l’equivalente di un disco, ma si ottiene un miglioramento delle prestazioni in fase di scrittura eliminando il percorso obbligato per la scrittura della parità.
Per questo motivo è forse la più popolare delle configurazioni RAID in striping, tenendo anche conto che alcune MB avanzate implementano controller con il supporto RAID 5.

Per la ricostruzione dei dati in caso di guasto del disco, valgono le stesse considerazioni del RAID 3.

IN SINTESI
Dischi min.: 3
Dischi max: quanti ne può gestire il controller
Ridondanza: calcolo e scrittura della parità distribuito sugli stessi dischi su cui vengono scritti i dati
Fault tolerance: tollera il guasto di un disco, con ricostruzione del contenuto su nuovo disco
Prestazioni: ottime in lettura, medio/buone in scrittura (anche se inferiori al RAID 0)
Rendimento: variabile, dal 67% nella configurazione minima, in aumento con l’aumentare dei dischi installati

---------------------------------------------------------------------------------------

RAID livello 6
Il RAID 6 utilizza la tecnica dello striping e per la sicurezza utilizza la tecnica del controllo di parità con doppio calcolo e scrittura della parità stessa.
Ha le stesse caratteristiche e funzionalità del RAID 5 , con la sola differenza che la parità dei dati viene riportata due volte su dischi diversi (potremmo definirlo un "RAID5 plus").
Questo ovviamente aumenta la sicurezza dei dati, ma altrettanto ovviamente aumenta anche lo spazio occupato per la ridondanza.

Richiede un controller specifico, generalmente piuttosto costoso ed un minimo di 4 dischi.

Per la ricostruzione dei dati in caso di guasto del disco, valgono le stesse considerazioni del RAID 3.

IN SINTESI
Dischi min.: 4
Dischi max: quanti ne può gestire il controller
Ridondanza: calcolo e scrittura della parità doppio, distribuito sugli stessi dischi su cui vengono scritti i dati
Fault tolerance: tollera il guasto di due dischi, con ricostruzione del contenuto su nuovo disco
Prestazioni: ottime in lettura, medie in scrittura (generalmente inferiori al disco singolo)
Rendimento: variabile, dal 50% nella configurazione minima, in aumento con l’aumentare dei dischi installati
chri619
00venerdì 17 novembre 2006 08:21
RAID livello 7
Il RAID 7 utilizza la tecnica dello striping e per la sicurezza utilizza la tecnica del controllo di parità.
Ha le stesse caratteristiche e funzionalità del RAID 5, ma non rappresenta uno standard in quanto si tratta di una configurazione RAID “proprietaria”, vale a dire che è una configurazione implementata da Storage Computer Corporation.
Le configurazioni sono variabili e dipendenti dal tipo di implementazione e si basano su un controller specifico che gestisce in modo asincrono una certa quantità di cache, con processore dedicato per la gestione simultanea di un certo numero di processi, per aumentare le prestazioni in fase di scambio dati con i dischi
chri619
00venerdì 17 novembre 2006 08:22
RAID “annidati”
I cosiddetti RAID annidati sono configurazioni di RAID di un certo livello applicate a loro volta su una configurazione RAID di altro livello.
Questa tecnica consente di compensare “le mancanze” di un certo livello, con le peculiarità di un altro livello, combinando insieme i vantaggi che i due livelli offrono.
Non esistono tutte le combinazioni di abbinamento tra i vari livelli semplici di RAID, ma solo alcune, anche perché la combinazione di due livello di RAID simili non comporta alcun vantaggio.
Nel caso specifico valutiamo solo due configurazioni annidate (o multiple): il RAID 0+1 ed il RAID 1+0 (o semplicemente RAID 10); altre configurazione di RAID annidati sono molto complesse e costose e generalmente riservate a macchine aziendali di un certo livello.
Anche se a prima vista le due configurazioni possono sembrare identiche, in realtà sono diverse ed hanno caratteristiche di sicurezza diverse.

Come già detto, il RAID 0 ha caratteristiche di prestazioni appetibili, ma d’altra parte non supporta ridondanza e quindi nessuna protezione/sicurezza dei dati.
Per contro il RAID 1 offre una certa sicurezza, con la duplicazione dei dati, ma ha prestazioni paragonabili al disco singolo, se non, in certi casi, leggermente inferiori.
La combinazione dei due livelli RAID può abbinare la velocità e la sicurezza, tipiche dei due livelli, anche se, come è intuibile, il parametro che peggiora è quello dei costi.

---------------------------------------------------------------------

RAID livello 0+1
Partendo dalla configurazione di due dischi in RAID 0, si può definire una corrispondente coppia di dischi parallela, sempre configurata in RAID 0.
Le due coppie di dischi così configurate potranno essere a loro volta configurate in RAID 1, vale a dire che ognuna coppia di dischi in RAID 0 conterrà la copia speculare dell’altra.
Ne consegue che la configurazione minima per un RAID 0+1 sarà di 4 dischi e configurazioni superiori richiederanno in successione 6, 8, 10… etc. dischi.
In pratica, sfruttando la velocità fornita del RAID 0 si implementa la sicurezza replicando i dati su altri dischi, configurandoli in RAID 1.
Ovviamente, in questo caso l’impegno di risorse, tipicamente dischi, è notevole.
Il guasto di un disco provoca l’inaccessibilità al “ramo” contenente i dischi in RAID 0, ma la copia speculare in RAID 1 consentirà il recupero dei dati o anche il funzionamento del sistema (con prestazioni limitate ovviamente).

La ricostruzione dell’array in caso di guasto di un disco può avvenire come detto per il RAID1.

NOTA: non tutti i controller integrati nelle schede madri supportano questa configurazione, quindi sarà necessario verificare prima di scegliere questa soluzione. Una verifica è consigliata anche per un eventuale controller su scheda PCI.

IN SINTESI
Dischi min.: 4 (incrementi di 2 dischi minimo)
Dischi max: quanti ne può gestire il controller
Ridondanza: duplicazione dei dati con la tecnica del mirroring
Fault tolerance: tollera il guasto di un disco, con ricostruzione del contenuto su nuovo disco
Prestazioni: ottime in lettura e scrittura basandosi sulla tecnica dello striping
Rendimento: 50%, per ogni gruppo di dischi in striping verrà utilizzato un corrispondente gruppo di dischi per il mirroring

------------------------------------------------------------------------------

RAID livello 1+0( o RAID 10)
Partendo dalla configurazione di due coppie di dischi, ciascuna in RAID 1, si può definire tra le due coppie una configurazione RAID 0, che consente di “vedere” il tutto come se fosse un unico disco.
Per la configurazione minima valgono le stesse considerazioni espresse per il RAID 0+1, anche in merito all’impegno minimo di risorse.
In questo caso si effettua l’operazione contraria: si velocizza l’accesso con un RAID 0, l’accesso a dati già protetti con l’operazione di mirroring.
Questa configurazione però, a differenza della precedente, tollera il guasto anche di due dischi, purché questi, ovviamente, non facciano parte della stessa coppia di mirroring.

NOTA: non tutti i controller integrati nelle schede madri supportano questa configurazione, quindi sarà necessario verificare prima di scegliere questa soluzione. Una verifica è consigliata anche per un eventuale controller su scheda PCI.

IN SINTESI
Dischi min.: 4 (incrementi di 2 dischi minimo)
Dischi max: quanti ne può gestire il controller
Ridondanza: duplicazione dei dati con la tecnica del mirroring
Fault tolerance: tollera il guasto di due dischi purché non appartenenti alla stessa coppia
Prestazioni: ottime in lettura e scrittura basandosi sulla tecnica dello striping
Rendimento: 50%, ogni coppia di dischi inseriti in striping utilizza il mirroring per la replica dei dati
chri619
00venerdì 17 novembre 2006 08:22
CONSIDERAZIONI FINALI
Il RAID conviene? Conviene sempre o eventualmente, quando conviene?

Innanzitutto pare che ultimamente il RAID sia diventata un specie di moda, una di quelle cose che fa "tendenza" e molto spesso si legge di situazioni che non avrebbero alcuna necessità di una configurazione RAID.
Il RAID più "desiderato" è sempre il RAID 0 che permette effettivi e tangibili incrementi di prestazioni dei dischi, ma altrettanto spesso la situazione specifica di lavoro non richiederebbe questo tipo di configurazione, o addirittura, in certi casi, la sconsiglierebbe.
E' intuibile, anche senza prove specifiche, che il RAID 0 migliora le prestazioni dei dischi, ma non influisce sulle prestazioni degli altri componenti del sistema, per cui sarebbe ragionevole optare per questa soluzione solo in caso di uso intensivo dei dischi e non certo nei casi di utilizzo del sistema per calcoli complesi, ambiente in cui i vantaggi sarebbero nulli.
E' anche vero, però, che il RAID 0 è affetto da "fragilità", dovuta al fatto che il guasto di un disco pregiudica la leggibilità di tutti i dati contenuti nei dischi in RAID e che questa probabilità aumenta di pari passo con l'aumentare del numero dei dischi.
Un RAID 0 può essere consigliabile solo, come accennato, in caso di uso intensivo dei dischi, con utilizzo dei dischi in RAID come "archivi di transito", per poi parcheggiare i risultati delle elaborazioni su altri dischi al di fuori del RAID.
Quantomeno un RAID 0 presuppone salvataggi dei dati frequenti e su supporti affidabili, per evitare la perdita degli stessi

Per il RAID 1 le considerazioni sono diverse.
In effetti lo "spreco" di un disco per la sicurezza può essere giustificato solo in caso di un certo volume di dati e poco tempo a disposizione per le copie di salvataggio.
Attenzione però, il RAID 1"non vi salva da eruzioni vulcaniche", significando con ciò che una configurazione di questo tipo salva soltanto da guasti ad un disco, ma non da altri guai tipo scariche elettriche che potrebbero danneggiare l'intero sistema (per esempio).

Una configurazione che potrebbe sopperire alla sicurezza ed alla velocità, sarebbe senz'altro una configurazione RAID 5, o magari addirittura un RAID 0+1 (o 1+0), ma i costi sono superiori e la valutazione del rapporto costo/risultati è strettamente personale.
Resta il fatto che i salvataggi, in caso di dati importanti, debbono essere sempre eseguiti, se non si vuole rischiare o limitare i rischi al minimo.

Detto questo ognuno valuti se è il caso di attivare una configurazione RAID, se è conveniente, se la spesa maggiore ripaga in termini di prestazioni, di sicurezza o altro....

Se poi volete attivare il RAID per puro sfizio o semplicemente per provare come funziona, allora tutte le considerazioni precedenti sono ovviamente nulle
xvalentino
00venerdì 17 novembre 2006 18:43


smile8 chri [SM=g27811]
Questa è la versione 'lo-fi' del Forum Per visualizzare la versione completa clicca qui
Tutti gli orari sono GMT+01:00. Adesso sono le 18:10.
Copyright © 2000-2024 FFZ srl - www.freeforumzone.com