UN RAID (array ridondante di dischi indipendenti) combina più unità fisiche in un dispositivo di archiviazione virtuale che offre più spazio di archiviazione e, nella maggior parte dei casi, tolleranza agli errori, in modo che i dati possano essere ripristinati anche se uno dei dischi fisici non riesce.
Le configurazioni RAID sono organizzate in livelli come RAID 0, RAID 1, RAID 5, RAID 6 e RAID 10. I livelli RAID da 0 a 6 sono chiamati livelli standard. Le configurazioni RAID più comuni sono RAID 0 (striping, in cui i dati vengono suddivisi in blocchi memorizzati su dischi fisici diversi), RAID 1 (mirroring, in cui più copie di dati vengono archiviate su dischi separati per ridondanza), RAID 5 (parità distribuita, che include striping e memorizzazione delle informazioni di parità per il recupero degli errori) e RAID 6 (doppia parità).
Questo confronto guarda RAID 5 e RAID 10 in dettaglio.
RAID 10 | RAID 5 | |
---|---|---|
Caratteristica fondamentale | Strisce di specchi: combina lo striping e il mirroring per tolleranza di errore e prestazioni. | Strisce con parità |
Striping | Sì; i dati vengono striati (o divisi) in modo uniforme tra gruppi di dischi. Ogni gruppo ha 2 dischi che sono configurati come immagini speculari l'uno dell'altro. Quindi RAID 10 combina le funzionalità di RAID 0 e RAID 1. | Sì; i dati vengono striati (o divisi) in modo uniforme su tutti i dischi nell'impostazione RAID 5. Oltre ai dati, anche le informazioni di parità vengono memorizzate (una sola volta) in modo che i dati possano essere ripristinati se una delle unità fallisce. |
Mirroring, ridondanza e tolleranza ai guasti | Sì. Il mirroring dei dati rende il sistema RAID 10 tollerante agli errori. Se una delle unità non funziona, i dati possono essere ricostruiti rapidamente semplicemente copiando da altri dischi. | Nessun mirroring o ridondanza; la tolleranza agli errori si ottiene calcolando e memorizzando le informazioni sulla parità. Può tollerare l'errore di 1 disco fisico. |
Prestazione | Le letture sono veloci a causa dello striping. Le scritture sono anche veloci perché anche se ogni blocco di dati deve essere scritto due volte (mirroring), le scritture avvengono su 2 dischi diversi in modo che possano verificarsi in parallelo. Le informazioni sulla parità non devono essere calcolate. | Letture veloci a causa dello striping (dati distribuiti su molti dischi fisici). Le scritture sono un po 'più lente perché è necessario calcolare le informazioni di parità. Ma dal momento che la parità è distribuita, 1 disco non diventa un collo di bottiglia (come fa in RAID 4). |
applicazioni | Quando le prestazioni sono importanti per le letture e le scritture e quando è importante recuperare rapidamente dall'errore. | Buon bilanciamento di spazio di archiviazione efficiente, prestazioni decenti, resistenza ai guasti e buona sicurezza. RAID 5 è ideale per i server di file e applicazioni che dispongono di un numero limitato di unità di dati. |
Numero minimo di dischi fisici richiesti | 4 | 3 |
Disco di parità? | No; parità / checksum non vengono calcolati in una configurazione RAID 10. | Le informazioni sulla parità sono distribuite tra tutti i dischi fisici nel RAID. Se uno dei dischi non funziona, vengono utilizzate le informazioni di parità per recuperare i dati memorizzati su tale unità. |
vantaggi | Recupero rapido dei dati in caso di errore del disco. | Letture veloci; ridondanza economica e tolleranza ai guasti; è possibile accedere ai dati (anche se ad una velocità inferiore) anche mentre un'unità guasta è in fase di ricostruzione. |
svantaggi | L'utilizzo del disco è solo del 50%, quindi RAID 10 è un modo costoso per ottenere ridondanza dello storage rispetto alla memorizzazione delle informazioni sulla parità. | Il recupero dall'errore è lento a causa dei calcoli di parità coinvolti nel ripristino dei dati e nella ricostruzione dell'unità sostitutiva. È possibile leggere dal RAID mentre è in corso, ma le operazioni di lettura durante tale periodo saranno piuttosto lente. |
RAID 10 è anche chiamato RAID 1 + 0 o RAID 1 e 0. È un livello RAID nidificato, il che significa che combina due livelli RAID standard: RAID 0 e RAID 1. Diamo un'occhiata alle configurazioni di questi livelli RAID standard, così possiamo capire come viene costruito RAID 10.
Archiviazione dei dati in un'impostazione RAID 0 Archiviazione dei dati in una configurazione RAID 1Come mostrato sopra, RAID 0 utilizza lo striping, ovvero i dati vengono suddivisi in blocchi memorizzati su più dischi. Ciò aumenta notevolmente le prestazioni di lettura e scrittura in quanto i dati vengono letti e scritti in parallelo su tutti i dischi. Lo svantaggio di RAID 0 è che non esiste ridondanza o tolleranza ai guasti. Se una delle unità fisiche ha esito negativo, tutti i dati vengono persi.
RAID 1 risolve la ridondanza, quindi se una delle unità si guasta, è facile sostituirla copiando i dati dalle unità ancora funzionanti. Tuttavia, lo svantaggio di RAID 1 è la velocità perché non può sfruttare il parallelismo offerto da RAID 0.
Ora che capiamo come funzionano RAID 0 e RAID 1, diamo un'occhiata a come è configurato RAID 10.
La configurazione RAID 10 è una striscia di specchi.RAID 10, a.k.a. RAID 1 + 0 è una combinazione di RAID 1 e RAID 0. È configurato come una striscia di specchi. I dischi sono divisi in gruppi (di solito due); i dischi all'interno di ciascun gruppo sono immagini speculari l'uno dell'altro, mentre i dati sono striati su tutti i gruppi. Poiché sono necessari almeno due gruppi e ogni gruppo ha bisogno di almeno due dischi, il numero minimo di dischi fisici necessari per una configurazione RAID 10 è 4.
Ora diamo un'occhiata alla configurazione di RAID 5.
La configurazione RAID 5 utilizza lo striping con parità per fornire tolleranza di errore. I blocchi di parità sono distribuiti su tutti i dischi. Nell'immagine, i blocchi sono raggruppati per colore in modo da poter vedere quale blocco di parità è associato a quali blocchi di dati.RAID 5 utilizza le informazioni di parità, diversamente dai livelli RAID 0, 1 e 10. Per ciascuna combinazione di blocchi, che sono tutti memorizzati su dischi diversi, viene calcolato e memorizzato un blocco di parità. Ogni singolo blocco di parità risiede su un solo disco; tuttavia, i blocchi di parità vengono memorizzati in modo round robin su tutti i dischi. Ad esempio, non esiste un'unità fisica dedicata solo per i blocchi di parità (che è ciò che accade in RAID 4).
Considerando che i blocchi di dati sono a strisce su almeno due dischi e il blocco di parità è scritto su un disco separato, possiamo vedere che una configurazione RAID 5 richiede almeno 3 unità fisiche.
Sia RAID 5 che RAID 10 sono tolleranti ai guasti, ovvero i dati non vengono persi nemmeno quando uno o, nel caso di RAID 10, più di 1 - dei dischi fisici non riesce. Inoltre, sia RAID 5 che RAID 10 possono essere utilizzati quando viene sostituito il disco guasto. Questo è chiamato hot-swapping.
RAID 5 può tollerare l'errore di 1 disco. Le informazioni sui dati e sulla parità memorizzate sul disco guasto possono essere ricalcolate utilizzando i dati memorizzati sui dischi rimanenti.
In effetti, i dati sono accessibili e le letture sono possibili da un RAID 5 anche quando una delle unità non funziona e viene ricostruita. Tuttavia, tali letture saranno lente perché parte dei dati (la parte che era sull'unità guasta) viene calcolata dal blocco di parità anziché essere semplicemente letta dal disco. Anche il recupero dei dati e la ricostruzione del disco sostitutivo sono lenti a causa del sovraccarico del calcolo della parità.
RAID 10 offre un'eccellente tolleranza agli errori - molto meglio di RAID 5 - grazie alla ridondanza al 100% integrata nel suo design. Nell'esempio sopra, Disco 1 e Disco 2 possono entrambi fallire e i dati sarebbero ancora recuperabili. Tutti i dischi all'interno di un gruppo RAID 1 di una configurazione RAID 10 dovrebbero fallire perché ci sia una perdita di dati. La probabilità che 2 dischi nello stesso gruppo vengano a mancare è molto inferiore alla probabilità che due dischi non funzionino nel RAID. Ecco perché RAID 10 offre maggiore affidabilità rispetto a RAID 5.
Anche il ripristino da errore è molto più rapido e semplice per RAID 10, poiché è sufficiente copiare i dati dagli altri dischi nel RAID. I dati sono accessibili durante il recupero.
RAID 10 offre prestazioni fantastiche per letture e scritture casuali poiché tutte le operazioni si verificano in parallelo su unità fisiche separate.
RAID 5 offre anche ottime prestazioni di lettura a causa dello striping. Tuttavia, le scritture sono più lente a causa del sovraccarico del calcolo della parità.
Sia RAID 5 e RAID 10 sono hot-swappable, cioè, forniscono la possibilità di continuare a leggere dall'array anche quando viene sostituito un disco guasto. Tuttavia, nel caso di RAID 5, tali letture sono lente a causa del sovraccarico del calcolo della parità. Ma per RAID 10, tali letture sono veloci come lo sono durante il normale funzionamento.
Altri vantaggi di RAID 10 sono:
Gli svantaggi di RAID 10 sono:
I vantaggi di RAID 5 includono:
Gli svantaggi di RAID 5 includono:
Considerando i pro e i contro, RAID 10 è utile nelle applicazioni in cui le prestazioni sono importanti non solo per le letture ma anche per le scritture. RAID 10 è anche più adatto di RAID 5 nelle applicazioni in cui è fondamentale mantenere le prestazioni durante il ripristino degli errori quando uno dei dischi non funziona.
RAID 5 offre un equilibrio salutare di archiviazione efficiente, prestazioni decenti, resistenza ai guasti e buona sicurezza. È la configurazione RAID più diffusa per dispositivi NAS aziendali e server aziendali. RAID 5 è ideale per i server di file e applicazioni che dispongono di un numero limitato di unità di dati. Se il numero di dischi fisici nel RAID è molto grande, la probabilità che almeno uno di essi non funzioni è più alta. Quindi un RAID 6 potrebbe essere un'opzione migliore perché utilizza due dischi per memorizzare la parità.