V souvislosti s představením RAID řadiče pro IDE disky jsme si popsali dva (resp. tři) základní typy RAID polí – RAID 0, RAID 1 a hybridní RAID 10. Pokud jste článek nečetli, doporučuji tak ještě učinit, protože následující popis dalších typů RAID polí z něj částečně vychází.
Již v letech 1988/89 popsal Berkeleyho výzkumný tým šest základních typů (levelů) RAID polí. Účelem diskových polí je dosáhnout vyšší kapacity, rychlejšího přístupu k datům a zajistit spolehlivost uložených dat.
RAID 2 pouze přidává do základního RAID 0 pole dodatečnou ochranu dat pomocí ECC korekce (Error Checking and Correction). Vyžaduje však podporu ze strany pevných disků, proto se tato metoda komerčně nijak výrazněji nerozšířila.
RAID 3 opět vychází ze “stripped” pole, používá však praktičtější metodu ochrany dat – ukládá paritní informace na vyhrazený disk. Na ostatní disky jsou data ukládána v malých “proužcích” (na úrovni bajtů). Z každého disku v poli je vždy pro každý bit na stejné pozici (v bajtu) vypočítána parita (funkcí XOR – exclusive OR) a uložena na “paritní disk”. Při výpadku jednoho disku je pak možné z dat uložených na zbývajících discích a paritních informací dopočítat ztracená data (po výměně vadného disku za nový). Proces dopočítání ztracených dat si samozřejmě vyžádá nějaký čas a hlavně výpočetní výkon, takže po dobu rekonstrukce dat je výkon celého systému poněkud snížen a stejně tak jeho schopnost vytvářet paritní informace. výkon RAID 3 trpí při zápisu nutností přečíst paritní data z vyhrazeného disku a znovu je na něj uložit. Zápis je tak o něco pomalejší a paritní disk je limitujícím členem RAID 3. Při čtení je výkon RAID 3 vyšší než při použití jediného disku, protože data jsou čtena paralelně z několika disků najednou, podobně jako u RAID 0 pole. Pouze v případě aplikací vyžadujících krátké úseky dat (typicky databáze) není výkon RAID 3 o mnoho vyšší ve srovnání s jediným diskem.
Jak funguje výpočet parity je vidět v následujíc tabulce. Řádky odpovídají bajtům uloženým na jednotlivých discích, parita je počítána ve sloupcích pro každý jednotlivý bit.
RAID 4 se velmi podobá předchozímu RAID 3. Také používá dva nebo více disků pro uložení informací a jeden vyhrazený disk pro uložení paritních informací. Používá však dostatečnou velikost “proužku” pro uložení celého záznamu (pracuje na úrovni bloků). To umožňuje přistupovat k uloženým informacím nezávisle, což je výhodné pro čtení velkého množství malých bloků dat (např. pro databázové systémy). Stále ale trpí stejným problémem při zápisu jako RAID 3.
RAID 5 je oblíbeným typem diskového pole, protože překonává některé nedostatky RAID 3 a 4. Stejně jako ony, je i u RAID 5 ukládána paritní informace, nikoli však na jeden vyhrazený disk, ale je rozložena na všech discích v poli. Zápis je proto rychlejší než na RAID 3 nebo 4, nicméně stále je při zápisu třeba přečíst paritní informace, přepočítat je a znovu uložit. Ve srovnání s RAID 0 je tedy zápis v RAID 5 o něco pomalejší. Výkon při čtení je možné optimalizovat nastavením velikosti bloku ukládaných dat pro aplikaci, která je nejčastěji používána. Chyba disku a jeho výměna za nový opět způsobí zpomalení systému v důsledku dopočítávání ztracených dat. Cena RAID 3, 4 a 5 polí je prakticky stejná, vždy potřebujete jeden disk navíc pro uložení paritních informací.
RAID 6 je posledním (nehybridním) diskovým polem. Podobně jako RAID 5 využívá rozprostření paritních informací na všech discích v poli, vytváří však dvě nezávisle vypočtené paritní informace. RAID 6 je díky tomu nejspolehlivější a i při výpadku dvou disků lze data znovu zrekonstruovat. Rychlost čtení je srovnatelná s RAID 5, avšak zápis je o něco pomalejší, protože je nutné vypočítat a uložit dvě sady paritních informací. Také cena RAID pole je o něco vyšší, používá se proto jen tam, kde je kladen opravdu maximální důraz na spolehlivost a přístupnost dat.
O hybridních (kombinovaných) typech RAID polí a srovnání jednotlivých typů si povíme příště.
Již v letech 1988/89 popsal Berkeleyho výzkumný tým šest základních typů (levelů) RAID polí. Účelem diskových polí je dosáhnout vyšší kapacity, rychlejšího přístupu k datům a zajistit spolehlivost uložených dat.
RAID 2 pouze přidává do základního RAID 0 pole dodatečnou ochranu dat pomocí ECC korekce (Error Checking and Correction). Vyžaduje však podporu ze strany pevných disků, proto se tato metoda komerčně nijak výrazněji nerozšířila.
RAID 3 opět vychází ze “stripped” pole, používá však praktičtější metodu ochrany dat – ukládá paritní informace na vyhrazený disk. Na ostatní disky jsou data ukládána v malých “proužcích” (na úrovni bajtů). Z každého disku v poli je vždy pro každý bit na stejné pozici (v bajtu) vypočítána parita (funkcí XOR – exclusive OR) a uložena na “paritní disk”. Při výpadku jednoho disku je pak možné z dat uložených na zbývajících discích a paritních informací dopočítat ztracená data (po výměně vadného disku za nový). Proces dopočítání ztracených dat si samozřejmě vyžádá nějaký čas a hlavně výpočetní výkon, takže po dobu rekonstrukce dat je výkon celého systému poněkud snížen a stejně tak jeho schopnost vytvářet paritní informace. výkon RAID 3 trpí při zápisu nutností přečíst paritní data z vyhrazeného disku a znovu je na něj uložit. Zápis je tak o něco pomalejší a paritní disk je limitujícím členem RAID 3. Při čtení je výkon RAID 3 vyšší než při použití jediného disku, protože data jsou čtena paralelně z několika disků najednou, podobně jako u RAID 0 pole. Pouze v případě aplikací vyžadujících krátké úseky dat (typicky databáze) není výkon RAID 3 o mnoho vyšší ve srovnání s jediným diskem.
Jak funguje výpočet parity je vidět v následujíc tabulce. Řádky odpovídají bajtům uloženým na jednotlivých discích, parita je počítána ve sloupcích pro každý jednotlivý bit.
Bit 0 | Bit 1 | Bit 2 | Bit 3 | Bit 4 | Bit 5 | Bit 6 | Bit 7 | |
Disk 1 | 0 | 1 | 0 | 0 | 1 | 0 | 1 | 0 |
Disk 2 | 1 | 1 | 1 | 0 | 1 | 0 | 0 | 0 |
Disk 3 | 0 | 1 | 0 | 1 | 0 | 0 | 0 | 1 |
Parita | 1 | 1 | 1 | 1 | 0 | 0 | 1 | 1 |
RAID 4 se velmi podobá předchozímu RAID 3. Také používá dva nebo více disků pro uložení informací a jeden vyhrazený disk pro uložení paritních informací. Používá však dostatečnou velikost “proužku” pro uložení celého záznamu (pracuje na úrovni bloků). To umožňuje přistupovat k uloženým informacím nezávisle, což je výhodné pro čtení velkého množství malých bloků dat (např. pro databázové systémy). Stále ale trpí stejným problémem při zápisu jako RAID 3.
RAID 5 je oblíbeným typem diskového pole, protože překonává některé nedostatky RAID 3 a 4. Stejně jako ony, je i u RAID 5 ukládána paritní informace, nikoli však na jeden vyhrazený disk, ale je rozložena na všech discích v poli. Zápis je proto rychlejší než na RAID 3 nebo 4, nicméně stále je při zápisu třeba přečíst paritní informace, přepočítat je a znovu uložit. Ve srovnání s RAID 0 je tedy zápis v RAID 5 o něco pomalejší. Výkon při čtení je možné optimalizovat nastavením velikosti bloku ukládaných dat pro aplikaci, která je nejčastěji používána. Chyba disku a jeho výměna za nový opět způsobí zpomalení systému v důsledku dopočítávání ztracených dat. Cena RAID 3, 4 a 5 polí je prakticky stejná, vždy potřebujete jeden disk navíc pro uložení paritních informací.
RAID 6 je posledním (nehybridním) diskovým polem. Podobně jako RAID 5 využívá rozprostření paritních informací na všech discích v poli, vytváří však dvě nezávisle vypočtené paritní informace. RAID 6 je díky tomu nejspolehlivější a i při výpadku dvou disků lze data znovu zrekonstruovat. Rychlost čtení je srovnatelná s RAID 5, avšak zápis je o něco pomalejší, protože je nutné vypočítat a uložit dvě sady paritních informací. Také cena RAID pole je o něco vyšší, používá se proto jen tam, kde je kladen opravdu maximální důraz na spolehlivost a přístupnost dat.
O hybridních (kombinovaných) typech RAID polí a srovnání jednotlivých typů si povíme příště.