Technologie: S.M.A.R.T.
4.8.2003, Jan Vítek, článek
Již dlouho se setkáváme v popisech pevných disků s technologií SMART. K čemu nám vlastně slouží a je vůbec potřeba? Základní odpovědi najdete v tomto článku.
Kapitoly článku:
- Technologie: S.M.A.R.T.
- SMART a praxe
V roce 1992 začala firma IBM vybavovat své 3.5" pevné disky technologií PFA (Predictive Failure Analysis - analyza budouciho selhani), která periodicky měřila a sledovala vlastnosti chování pevných disků, jako například bezpečnou výšku hlaviček nad magnetickou záznamovou vrstvou, a při detekci nebezpečných hodnot poslala operačnímu systému varování. Technologie byla natolik kvalitní a přínosná, že se dočkala uznání a vyústila ve známý standard SMART (Self-Monitoring, Analysis and Reporting Technology - volně přeloženo jako technologie, která slouží k monitorování, analyzování a hlášení chyb). Technologie SMART se stala standardem jak pro disky s IDE rozhraním, tak pro SCSI disky.
Jakými způsoby se může disk vůbec poškodit? Vzhledem k technologii SMART jsou to dva hlavní způsoby - předvídatelné a nepředvídatelné. Nepředvídatelně se disk poškodí (jak jinak) bez předchozího varování a zařazujeme mezi ně poškození statickou elektřinou, mechanická poškození v důsledku špatného zacházení, nebo poškození pájených částí disku vlivem nadměrného tepla. Na druhou stranu předvídatelná poškození jsou hlavně mechanického rázu a celkově tvoří asi 60% všech poruch pevných disků. Designéři disků po léta sledovali příčiny, důsledky a průběhy mechanických poškození, aby poté byli schopni mnoha problémům předcházet výrobou kvalitnějších produktů, které jsou na samé hranici výkonu a selhání, nebo alespoň před problémy včas varovat, právě za pomoci technologie SMART.
Hlavní oblasti poškození, která jsou předvídatelná:
Pevný disk předá informace o stavu disku přes operační systém nainstalované SMART aplikaci, která informuje, případně upozorní uživatele na překročení mezních hodnot.
Tab. 1 - Tabulka selhání a jejich důsledků
Pozn.: Na další stráne najdete příklady praktického využití této technologie.
Jakými způsoby se může disk vůbec poškodit? Vzhledem k technologii SMART jsou to dva hlavní způsoby - předvídatelné a nepředvídatelné. Nepředvídatelně se disk poškodí (jak jinak) bez předchozího varování a zařazujeme mezi ně poškození statickou elektřinou, mechanická poškození v důsledku špatného zacházení, nebo poškození pájených částí disku vlivem nadměrného tepla. Na druhou stranu předvídatelná poškození jsou hlavně mechanického rázu a celkově tvoří asi 60% všech poruch pevných disků. Designéři disků po léta sledovali příčiny, důsledky a průběhy mechanických poškození, aby poté byli schopni mnoha problémům předcházet výrobou kvalitnějších produktů, které jsou na samé hranici výkonu a selhání, nebo alespoň před problémy včas varovat, právě za pomoci technologie SMART.
Hlavní oblasti poškození, která jsou předvídatelná:
- Výška diskových hlaviček nad mediem: Pakliže se výska letu diskové hlavičnky nad plotnou disku postupně snižuje, šance kolize hlavičky s plotnou se zvyšuje. To má obvykle fatální následky v podobě znehodnocení části plotny.
- Počet vadných sektorů: Stává se, že pevný disk nepřečte ze z daného sektorů data hned napoprvé a musí proto čtení opakovat. Jestliže však počet pokusů překročí mezní hranici, označí se tento sektor jako špatný. Starší disky tyto sektory jednoduše přestanou používat a moderní disky mají v zásobě tzv. záložní sektory, na které obsah vadného sektoru přesunou. Výrobce tak chytře zakryje špatné sektory, které se uživateli nezobrazí ani po důkladné kontrole povrchu disku. Opravy tedy neprobíhají tedy na úrovni operačního systému, ale na úrovni logiky disku. SMART ovšem tyto operace zaznamenává a pokud je jejich počet příliš vysoký, pak označí disk jako nespolehlivý.
- Použití ECC a počet chyb: ECC (Error Correction Code - kód pro opravu chyb) je další nutnost, která vznikla díky posouvání miniaturizačních limitů pevných disků. Z praxe je známé, že lepší je mít rychlejší disk a akceptovatelné množství chyb, které opraví ECC, než stoprocentně bezchybný disk, který je pomalý. Pokud se ovšem ECC používá příliš často, snižuje se výkon a disk patrně není v pořádku
- Čas potřebný k roztočení ploten: Změny v tomto času indikují poškozený motor disku.
- Teplota: Zvýšená teplota disku, měřená podle interních teplotních čidel, ukazuje problémy s motorem, nebo ložisky disku.
- Datová propustnost: Snížená datová propustnost je průvodním jevem předchozích problémů.
Pevný disk předá informace o stavu disku přes operační systém nainstalované SMART aplikaci, která informuje, případně upozorní uživatele na překročení mezních hodnot.
Tab. 1 - Tabulka selhání a jejich důsledků
Pozn.: Na další stráne najdete příklady praktického využití této technologie.