Funkčnost, rozhraní a technologie pevných disků
Podíváme se na princip fungování, popis rozhraní a technologie pevných disků, aby vás nemohly zaskočit odborné termíny a mohli jste se orientovat ve specifikacích i v možnostech spolupráce se základní deskou a tvorbě RAID polí. Doplněno o 2 kapitoly o SSD.
Kapitoly článku:
SMART
Technologie SMART, dnes vlastní snad každému desktopovému disku, byla od roku 1992 vyvíjena firmou IBM pod názvem PFA (Predictive Failure Analysis). Šlo o snahu dokázat pomocí sledování chování disku určit jeho stav a nebezpečí možného selhání. Technologie PFA měla úspěch a vyústila ve známý SMART (Self-Monitoring, Analysis and Reporting Technology).
SMART tedy sleduje práci disku a všímá si údajů jako počet vadných sektorů, použití ECC, čas potřebný k roztočení ploten, teploty nebo i celkového výkonu disku. Pokud některá z těchto hodnot klesne pod prahovou hodnotu, pak již disk není podle SMART v kondici a může selhat. To ale neznamená, že disk nemůže selhat i bez varování a naopak není nikde řečeno, že SMARTem odepsaný pevný disk nebude ještě několik let bez problémů fungovat.
Ohledně spolehlivosti disku se můžeme setkat s parametrem MTFB (Mean Time Between Failures). Jedná se o střední dobu mezi poruchami a udává se typicky v hodinách provozu. Problémem je, že někteří výrobci tento parametr uvádějí, jiní nikoliv.
RAID
RAID (Redundant Array of Independent/Inexpensive Disks, Vícenásobné diskové pole nezávislých/levných disků) pole se ze serverové oblasti díky pokroku a snížení pořizovací ceny již dávno dostaly do dosahu běžných uživatelů, alespoň co se týče základních konfigurací. Už od dob řadičů Ultra ATA/66 tak můžeme zapojit více disků do konfigurací, které nám umožní zvýšit rychlost, zvýšit spolehlivost, nebo rovnou obojí.
RAID řadič pro PATA od Promise
První verzí na ráně je RAID 0, kdy se dva nebo více disků zapojí do tzv. stripping módu. V tomto módu řadič rozděluje data na ‘proužky’, jež poté střídavě rozděluje mezi disky. To znamená, že například 1GB soubor se střídavě zapíše na dva disky, tedy na každý 512 MB. Díky tomu můžeme dosáhnout podstatně vyššího výkonu (zdaleka však ne dvojnásobného), ale na druhou stranu také dvakrát vyšší pravděpodobnosti ztráty dat, protože havárie jednoho disku nevyhnutelně znamená ztrátu veškerých dat (pokud se je samozřejmě nepodaří následně zachránit; taková záchrana však často nemusí být ani možná). Omezení také plyne z toho, že je nanejvýš vhodné použít stejné typy disků, či alespoň stejné kapacity, jinak bude celková velikost pole omezena na dvojnásobek kapacity menšího z disků.
RAID 1 je další druh pole označované jako mirroring – zrcadlení. Již z názvu lze tedy uhodnout, že při využití dvou disků se jeden použije pouze jako záloha - na oba se tedy zapisují identická data. RAID 1 tedy slouží pouze pro zvýšení bezpečnosti a museli byste mít opravdovou smůlu, aby vám oba disky odešly naráz. To sice není vlivem možné poruchy zdroje ani zdaleka nemožné, avšak to je již jiná písnička. Omezení zde jsou v podstatě stejná jako u RAID 0 – ideální je použití stejně rychlých disků o stejné kapacitě, aby se navzájem zbytečně neomezovaly.
Kombinací RAID 0 a 1 získáme pole RAID 0+1 (někdy je také nazýváno jako RAID 01), které kombinuje výhody obou typů polí. Je tedy rychlé a bezpečné, avšak pro jeho sestavení potřebujeme minimálně čtyři pevné disky, protože vzniklé pole RAID 0 budeme dále zrcadlit.
Dalším typem je RAID 10 (1+0), který je naprosto stejný jako předešlé řešení, pouze při jeho sestavování postupujeme obráceně. Nejprve budeme obě dvojice disků zrcadlit a následně nad nimi vytvoříme stripované RAID 0. Celé spojení poskytuje největší výkon mezi zabezpečenými typy polí a navíc poskytuje odolnost proti ztrátě až poloviny z celkové počtu připojených disků.
Kromě RAID polí může váš řadič (nebo také OS) podporovat tzv. spanning, což je prosté spojení několika pevných disků do logického celku. Data jsou tedy ukládána nejprve na první disk a až dojde k jeho zaplnění, bude se pokračovat na disk druhý atd. Jiný název pro spanning je JBOD (Just a Bunch Of Disks). Výhodou tohoto řešení je bezesporu skutečnost, že pro vytvoření není třeba použití stejně velkých disků - data totiž nejsou ukládána prokládaně. Spanning se ale vyplatí spíše těm uživatelům, kteří potřebují ukládat soubory obřích velikostí a to je dnes v době terabajtových disků už tak trochu pasé.
Existují i další druhy RAID polí, avšak u domácích počítačů se téměř nenasazují. Patří mezi ně například RAID 2, coby převlečený RAID 0 s přidanou korekcí v podobě Hammingova kódu, což je jedna z forem ECC (Error Checking and Correction). Jeho nevýhodou je nutná podpora ze strany disku a poměrně vysoká pořizovací cena.
Dálší typ RAID 3 rovněž využívá stripping, ale i sofistikovaný způsob ukládání paritních informací, které jsou vypočítávány pomocí logické operace XOR (exkluzivní OR) neboli nonekvivalence. Ukládání těch informací, které při havárii jednoho disku umožňují rekonstrukci veškerých dříve uložených dat, je poté realizováno na další a k tomu vyčleněný disk. Výhodou je tedy nutnost vyčlenění pouze jednoho disku, protože u jiných typů polí může být počet vyšší. Tato skutečnost je ale zároveň největší nevýhodou zmiňovaného řešení. Paritnímu disku je totiž také přezdíváno anglickým termínem „Bottleneck“ (Hrdlo láhve), protože právě on je nejslabším a zároveň také nejvytíženějším místem celého spojení. Paritní informace na něj musí být zapisovány vždy, za jakýchkoliv okolností. Jeho životnost tak bude s rostoucím opotřebením zákonitě rychle klesat.
RAID 3 v akci – acnc.com
Podobným řešením je také pole RAID 4, které se v mnohém podobá předchozímu řešení. Rozdíl je ale v tom, že data nejsou stripována po bitech (jako u RAID 3) ale rovnou po celých blocích a stejně tak i paritní informace, čímž lze dosáhnout vyššího výkonu při čtení velkého počtu malých souborů, což se hodí především u databázových systémů. U takových totiž není RAID 3 zrovna nejvýhodnějším řešením.
Nevýhoda v podobě úzkého hrdla láhve u RAID 4 ale stále přetrvává a tento problém řeší až RAID 5, kde žádný disk navíc nefiguruje – paritní informace jsou ukládány střídavě po všech discích napříč celým polem, ovšem vždy na jiné datové úložiště, než na které jsou originální data zapisována. Tato skutečnost také může za vyšší výkon spojení a jeho oblibu u většiny uživatelů. Nevýhodou je, že pole s úspěchem odolává pouze poruše jednoho z připojených disků.
Dalším standardizovaným typem je pole RAID 6, které přináší mnohem vyšší odolnost proti výpadku, protože je parita vypočítávána hned dvakrát (pokaždé odlišným způsobem) a následně ukládána opět mezi všechny připojené disky. Při výpadku dvou disků pak není problém vše zcela přesně opravit. Z pohledu rychlosti čtení můžeme říci, že ta je ekvivalentní RAID 5. Při zápisu je ale dosažený výkon daleko menší právě kvůli nutnosti dvakrát vypočítávat paritní informace. Nevýhodu představuje nutnost použití specializovaného a často také velmi drahého řadiče.
Nestandardní typy RAID
Kromě zmíněných typů diskových polí se můžeme setkat také s mnoha jinými, jež nemusí představovat obecně přijatý standard, ale mohou být pouze registrovanou obchodní značkou té či oné společnosti, která s danou technologií přišla na trh.
Typickým příkladem je typ RAID 7, za jehož vznikem stojí společnost Storage Computer Corporation. Principem vychází přímo z polí RAID 3 a 4, avšak do hry přidává navíc vyrovnávací cache paměť. Díky tomu je pak celý systém jako celek daleko rychlejší (při čtení i zápisu). Zmíněné výhody jsou však draze vykoupeny příliš vysokou pořizovací cenou především díky použití speciálního procesoru určeného ke složitým výpočtům v rámci celého pole v reálném čase.
Mezi další možnosti, jak nestandardně spojit pevné disky, patří také tzv. RAID 30 (3+0). Jednotlivé stripované větve v něm ale netvoří zrcadla, nýbrž jsou vzájemně propojena pomocí RAID 3. Opačným postupem získáme RAID 03 (0+3).
Takto můžeme tvořit různé kombinace – např. RAID 50, 51, 53 či 60. Z této řady však vybočuje jedno velmi zajímavé řešení, které nemůžeme nezmínit – RAID 100 (10+0). Můžeme si ho představit jako diskové pole RAID 10, nad kterým je dále vytvořeno další prokládané pole RAID 0.
Pro vytvoření diskového pole RAID 50 potřebujeme celkem 6 pevných disků – acnc.com
V souvislosti s diskovými poli se můžeme také setkat s pojmem hot-spare, který označuje technologii dovolující minimalizovat časový interval, během kterého je pole „oslabené“. Uvažujme například RAID 5, jemuž právě odešel jeden z disků. Co se stane dále? V podstatě nic. Bezpečnost dat zůstane neovlivněna a činnost systému bude zcela v pořádku pokračovat dále.
Poznámka: Tato situace není zdaleka tak nereálná, jak se zdá. Stačí jeden vadný zdroj a přepětí v systému udělá své.
Zmíněné pole RAID (5) ustojí pouze výpadek jednoho z disků. Co se tedy stane, pokud v mezičase, než dorazí k serveru technik, dojde k výpadku dalšího z disků? Všechna uložená data budou ztracena. U systému s hot-spare bude k systému automaticky připojen záložní pevný disk, na který budou následně chybějící data dopočítána. Takový záložní disk je možné sdílet mezi více druhy polí, pokud jsou v daném počítači přítomna.
Přehled diskových polí RAID | ||||
Režim | Spolehlivost | Výkon při čtení | Výkon při zápisu | Minimální počet disků |
RAID 0 | žádná | velmi dobrý | velmi dobrý | 2 |
RAID 1 | vysoká | velmi dobrý | dobrý | 2 |
RAID 2 | dobrá | velmi dobrý | dobrý | podle zapojení * |
RAID 3 | dobrá | sekvenční dobrý transakční velmi slabý | sekvenční dobrý transakční slabý | 3 |
RAID 4 | dobrá | sekvenční dobrý transakční dobrý | sekvenční dobrý transakční slabý | 3 |
RAID 5 | dobrá | sekvenční dobrý transakční velmi dobrý | přijatelný | 3 |
RAID 6 | vysoká | velmi dobrý | slabý | 4 |
* nejčastěji se používá konfigurace s celkem 14 pevnými disky – 10 datových a 4 pro samoopravné kódy
Poznámky: Maximální počet připojených disků závisí na konkrétních řadiči RAID. Transakční výkon je důležitý především pro databázové aplikace.
Speciální typy disků
Nakonec si uvedeme už jen pojmy RAM Disk a SSD. Využití RAM jako pevného disku je myšlenka v podstatě tak stará jako PC samo. Využívala se již v 80. letech, avšak v dnešní podobě se spíše jedná o zařízení v podobě PCI karty, které na sobě má sloty pro SDRAM (SDR, DDR), do nichž zasunete moduly, připojíte je nejlépe k rozhraní Serial ATA 3Gb/s a již si můžete užívat rychlost limitovanou pouze možnostmi rozhraní a nulový hluk. Avšak jednak je to velmi nákladné a kapacitou omezené řešení a také je jasné, že po ztrátě napájení dojde i ke ztrátě dat. Proto musí tato zařízení na sobě nést ještě akumulátor starající se o oživování buněk, který však nevydrží věčně. Příkladem takového produktu může být Gigabyte i-RAM, avšak ten dokáže nést pouze 4 GB paměti a navíc je omezen pouze připojením SATA 1,5 Gb/s.
Právě proto je dnes lepší na takovéto záležitosti raději zapomenout a počkat si na okamžik, až začnou být opravdu zajímavé disky SSD - Solid State Drive/Disk. SSD v oblasti PC nejsou nic jiného než flash paměti spojené do jednoho zařízení s rozhraním SATA, které se dají jednoduše využít jako malý, energeticky nenáročný, rychlý a zcela tichý "pevný disk". Jedinou a největší překážkou tak zůstává jejich cena, avšak i ta se v průběhu času zlepšuje. SSD diskům se věnujeme podrobně v dalších kapitolách.
Shrnutí
- SMART - Self-Monitoring, Analysis and Reporting Technology - technologie pro analýzu kondice pevných disků a vůbec jejich monitorování
- PFA - Predictive Failure Analysis - předchůdce SMARTu od IBM
- RAID - Redundant Array of Independent Disks - způsob zapojení alespoň dvou pevných disků dovolující zvýšení výkonu, spolehlivosti, nebo obojího
- Spanning - jinými slovy JBOD (Just a Bunch Of Disks) - zapojení disků, jejichž kapacita se pouze spojí v jednu logickou jednotku
- ECC - Error Correcting Code - slouží k zachování celistvosti dat při jejich přesunech
- Stripping (prokládání) – technika umožňující rozdělit jeden souvislý datový blok (soubor) mezi více datových úložišť za účelem zvýšení rychlosti přístupu
- Mirroring (zrcadlení) – zápis stejných dat na další disk pro zvýšení jejich bezpečnosti
- Hot-spare – technologie obstarávající automatické připojení záložního disku k systému při poruše jednoho disku z RAID pole
- RAM Disk - využívá SDRAM moduly k emulaci pevného disku - rychlé, tiché, ale drahé, s nízkou kapacitou a nebezpečím jednoduché ztráty dat - spíše pro speciální účely
- SSD - Solid State Disk - využívá Flash paměti - rychlé, tiché, dostatečná kapacita a dobrý potenciál do budoucna