La sigla RAID è un acronimo sotto il quale si nascondono diverse tecniche atte, perlopiù, a gestire in modo elastico e sicuro una serie di dischi di archiviazione in un unico volume: la sigla, che sta per “Redundant mAtrice of Independent Disks”, si può tradurre in modo comprensibile come un insieme di dischi indipendenti in un volume ridondante anche se, come vedremo, la ridondanza non è obbligatoria in senso stretto.
Di RAID qui a Macitynet ne parliamo abbastanza spesso: non sono pochi i dischi esterni che ne fanno uso, così come praticamente tutti i NAS che hanno (almeno) due dischi: nel dettaglio il RAID è una tecnologia, che si applica allo stesso modo tanto nei dischi meccanici quanto in quelli a stato solido, sia a livello hardware (con schede apposite) che software.
È interessante il RAID per l’utente Mac? Molto, perché le esigenze di spazio continuano ad aumentare, e con esso la necessità di registrare i dati in più dischi, in modo da evitare la perdita completa in caso di rottura: spesso molte soluzioni commerciali propongono un sistema RAID già preconfezionato, e proprio per questo è utile capirne la natura per meglio adattarla alle nostre esigenze.
Partiamo dalle basi
Prima di parlare dettagliatamente del RAID, dei Tipi e della ridondanza, meglio chiarire alcuni concetti di base: un disco è un apparecchio hardware nato per immagazzinare i dati e può essere utilizzato in vari modi ma nessun sistema operativo utilizza il disco direttamente, lo fa utilizzando i “Volumi”, dove sono effettivamente registrati documenti e cartelle.
La differenza tra dischi e volumi è molto astratta e soprattutto labile ma fondamentale: un volume non ha una corrispondenza in un disco, perché può essere la somma di più dischi, ma anche una sola parte, dato che un disco può contenere più volumi. Come facciamo quindi a capirci? Basta guardare la questione da un punto di vista elementare: i dischi sono un elemento fisico, i volumi li decide l’utente, in piena libertà, in base alle proprie esigenze e alle caratteristiche del sistema operativo.
Confusi? È più semplice di quello che sembra.
Quando acquistate un Mac, al suo interno trovate tipicamente un solo disco (a parte il Mac Pro, che per il momento lasciamo stare) che dopo l’installazione iniziale riporta due volumi al suo interno, quello che utilizzate (e vedete) di default e un secondo volume, che macOS chiama “di ripristino” e che serve a inizializzare il primo in caso di necessità, tipicamente nascosto.
Quando utilizziamo un disco esterno USB, ad esempio, vediamo il volume, che in questo caso corrisponde al disco. Ma grazie a Utility Disco, macOS può “partizionare” il disco per creare altri volumi, funzione utile ad esempio quando vogliamo avviare il Mac con Windows, utilizzando BootCamp.
Il RAID fa la stessa cosa, ma al contrario: invece che creare più volumi dentro un disco, mette più dischi dentro un volume, serve un po’ di astrazione ma concretamente il processo è semplice e molto interessante.
I primi due tipi
Dato che quando si parla di RAID si parla di una tecnologia, che al suo interno presenta diverse soluzioni, è bene introdurre il concetto di Tipo, un termine che è da intendersi come un modo in cui i dischi lavorano tra loro.
Il primo tipo, o modalità, che incontriamo è il RAID 0 (zero, chiamato anche striping), probabilmente quello più anomalo di tutti, perché è l’unico che non prevede una ridondanza effettiva. Nel RAID 0 due o più dischi operano per creare un unico volume logico (ad esempio, due dischi da 8 TB creano un unico volume da 16 TB), che è quello che vede l’utente.
Rispetto a due volumi separati (uno per disco) questa soluzione ha il vantaggio che lettura e scrittura avvengono in contemporanea sui due dischi, grazie ad un controller che gestisce la ripartizione dei dati, offrendo maggiore velocità (verrebbe da dire il doppio della velocità, ma nella realtà non è così, l’incremento è del 50% in più del disco singolo), oltre al fatto che è molto più comodo gestire un volume unico che due volumi distinti.
Tutto bello? Insomma: un sistema che divide i dati in due o più dischi è molto fragile, perché tipicamente alla rottura di uno di questi è probabile che l’intero archivio risulti danneggiato (perché appunto i file sono scritti un po’ qua e un po’ la) e il rischio di rottura sul volume raddoppia rispetto ad un disco solo.
Il secondo tipo, anch’esso molto comune, è il RAID 1 (chiamato anche mirroring): questo è in grado di offrire una vera e propria ridondanza, perché i dati sono letti e scritti in egual modo tra i due dischi, che risultano sempre e in ogni momento identici.
Sostanzialmente funziona così: nel caso di un case esterno con due dischi in RAID 1, l’utente utilizza il primo volume, mentre il sistema scrive in automatico nel secondo in tempo reale. Se si rompe il primo disco, il sistema seleziona in automatico il secondo disco per l’utente (che non si accorge di nulla) e gli fa usare quello sino a che il primo disco non è sostituito con uno nuovo di pari capacità, ricostruendo il tutto e ritornando alla situazione principale.
Il RAID 1 è perfetto per quelle realtà che non possono supportare il fermo macchina, dato che il RAID 1 lascia gli utenti operare comunque nel mentre che la riparazione o sostituzione è effettuata.
Il lato negativo del RAID 1 rispetto al RAID 0 è che la capacità dei dischi è dimezzata (il che li rende più costosi) e anche la lettura e scrittura è più lenta, perché se il RAID 0 opera sulla metà dei dati, il RAID 1 opera sulla totalità, oltre a perdere qualche centesimo di secondo per controllare la sincronizzazione, stando quindi sulla velocità del disco più lento.
Attenzione
Una volta creato un RAID, al suo interno possiamo creare quanti volumi vogliamo, usabili localmente o in rete da Mac o PC, scegliendo la giusta formattazione a seconda del tipo di uso. Il tipo di RAID qui non incide sull’usabilità, che è la stessa, ma solo sul come l’hardware usa i dischi.
Attenzione però anche a non confondere il RAID 1 con un sistema di backup, sarebbe un errore molto grave: se è vero che i dati sono scritti in due parti, le due parti sono del tutto identiche, il che significa che se eliminate (o modificate) un documento nel primo disco, tale modifica sarà ripetuta pari pari nel secondo disco. Un backup è tipicamente molto diverso, perchè di solito offre uno storico, con la conservazione dei dati originali oltre a quelli modificati ed eliminati.
Inutile dirlo, perché a questo punto l’avrete già capito, che entrambi i sistemi RAID hanno bisogno di almeno due dischi, di più se vogliamo affrontare tipi di RAID anche più complessi: non ha senso parlare di RAID con un solo disco, anche in presenza di più volumi.
Complessità
Come abbiamo visto i due tipi principali (e più semplici) di RAID offrono caratteristiche complementari (velocità nel primo, sicurezza nel secondo): dato che da una parte i sistemi professionali di archiviazione hanno più di due dischi, si è iniziato da subito a studiare nuovi modi di creare sistemi RAID che offrissero entrambe le soluzioni.
Per qualche tempo si è usato il RAID 3: più dischi fornivano un unico volume dato dalla loro somma meno uno (quattro dischi da 10 TB, ad esempio, fornivano un volume da 30 TB), dato che l’ultimo disco era destinato alla parità, nel senso che interveniva per garantire il corretto funzionamento anche nel caso uno dei dischi risultasse danneggiato (sino al suo ripristino).
La sua evoluzione si chiama RAID 5, un sistema più intelligente che suddivide dati e parità tra tutti i dischi, offrendo lo stesso livello di garanzia del RAID 3, ma senza il collo di bottiglia del disco di ridondanza (perché i dati di ridondanza sono appunto suddivisi tra i dischi). Questo sistema è oggi molto diffuso nei sistemi generici medio piccoli e medio grandi (con almeno quattro dischi) perché offre sicurezza, ridondanza e una velocità accettabile, che cresce mano a mano che cresce il numero dei dischi.
Laddove i RAID 2 e 4 non sono più utilizzati (e il RAID 3 molto raramente), il RAID 5 è certamente il più diffuso e moderno, a patto di avere un numero di dischi sufficiente a crearlo: se il numero di dischi è solo due, la scelta ricade tipicamente sul RAID 1 per questioni di sicurezza, o sul RAID 0 qualora non sia necessaria la ridondanza e si abbia un sistema di backup esterno (perché i dati vanno sempre messi almeno in due parti).
La botte piena e la moglie ubriaca
Nei sistemi qui sopra abbiamo parlato dei diversi tipi di RAID come sono gestiti in teoria, presentando pregi e difetti di ogni situazione senza però contare sul fatto che, tipicamente, per motivi di costo e capacità totale, i sistemi RAID oggi sono basati ancora su dischi meccanici, e probabilmente sarà così per qualche anno ancora.
Diversamente dai dischi a stato solido, però, i dischi meccanici hanno il problema del calore (quando sono a pieni giri) e della vibrazione, che nei sistemi a molti dischi, nonostante i sistemi antivibrazione inseriti nei modelli pensati per i sistemi RAID (tipicamente i WD RED e WD GOLD di Western Digital, che recentemente ha introdotto anche la versione SSD di WD RED, IronWolf di Seagate e N300 di Toshiba), il problema non è da sottovalutare. Se i dischi inseriti non sono dello stesso taglio e il NAS o il case che li ospita non li gestisce in modo perfetto, una vibrazione asincrona può diminuire la loro vita e aumentare i problemi di danneggiamento dei settori.
Per questo, ad esempio, in alcuni sistemi molto grandi è stato introdotto il RAID 6, che è una variante del RAID 5 dove uno dei dischi è dedicato alla parità, in aggiunta alla parità distribuita (qui la differenza con RAID 3).
In alternativa, è possibile utilizzare tipi di RAID più complessi, chiamati Annidati: qui si va su un piano ancora più astratto perchè il RAID non è basato sui dischi ma sui set. Facciamo un esempio così forse è più chiaro.
Abbiamo detto che il RAID 0 offre maggiore velocità del RAID 1 ma minor sicurezza: possiamo quindi creare due set identici, dati da due gruppi di RAID 0 e mettere questi due set in RAID 1, in modo che la rottura di uno o più dischi sia ampiamente supportata con una velocità molto interessante, a patto che le diverse rotture non siano sparse tra i gruppi di RAID 0.
Se abbiamo quattro dischi da 5 TB, otterremo un set da 10 TB ridondato, una quantità inferiore rispetto ad un RAID 5, che offrirebbe sicuramente di più ma che supporta la rottura di un solo disco, mentre nel RAID 0+1 (così è chiamato) le rotture possono essere diverse e il sistema è comunque prestante anche se ritardiamo con le riparazioni.
È comune anche il sistema opposto, chiamato RAID 1+0 (oppure RAID 10) dove la ridondanza è gestita dai gruppi base a RAID 1, messi poi in un sistema RAID 0: il vantaggio qui è che il sistema supporta ancora più rotture del RAID 0+1, ma con una criticità maggiore perché ogni rottura, se non opportunamente assistita, può annullare l’intero archivio (perché il RAID 0 vive solo se vivono tutte le parti, per cui se si rompono due dischi che apparengono ad un RAID 1, tutto crolla).
Cambiare no, ricominciare si
Al di la dei sistemi RAID 0 e 1, che sono abbastanza comuni anche nelle unità esterne locali o di rete (NAS) a due dischi, per gli altri tipi di RAID di solito ci si affida ad un tecnico che abbia esperienza e ci sappia indicare il tipo giusto. È giusto comunque conoscere a grandi linee che cosa sta succedendo all’interno del disco, del server o del NAS che abbiamo acquistato e partecipare attivamente alle scelte tecnologiche, seppure volontariamente qui abbiamo semplificato alcune delle problematiche.
Ricordiamo inoltre che il gioco dei RAID, passateci il termine, è tipicamente gestito da un controller hardware, incluso nel sistema e che fa solo questo, oltre a garantire la parità dei dati. Il cambio di tipo di RAID è sempre possibile, ma tipicamente questo prevede la formattazione di tutti i dischi, che per volumi molto consistenti (con diversi TB di spazio) potrebbe necessitare anche di diverse ore, date dalla formattazione e dalla ricostruzione del RAID.
macOS propone anche un sistema di RAID software, gestito interamente dal sistema operativo, nel quale due o più volumi sono inclusi in un unico volume RAID, 0 o 1, anche senza un controller dedicato. Tale soluzione è molto delicata e, in tutta onestà, è da sconsigliare se non come puro esperimento: qualsiasi problema rischia di compromettere il RAID, anche un semplice aggiornamento software, con la perdita dei dati: meglio affidarsi ad una soluzione esterna con un controller hardware.
Allo stesso modo i sistemi RAID disponibili non sono sempre tutti: i RAID 0 e 1 sono molto comuni, anche su più di due dischi, e anche il RAID 5 lo è abbastanza nei sistemi più nuovi, mentre il RAID 6 è più raro e lo stesso si dica per quelli annidati. I RAID 2, 3 e 4 si usano molto poco e spesso sono ignorati dalle case madri. Ovviamente alcuni tipi di RAID (come RAID 5 ad esempio) sono vincolati da un numero disponibile di dischi, tipicamente da 4 in su e raramente più di 14).