Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

ATi Radeon 9700 - král mezi grafickými čipy III.

1.8.2002, Zdeněk Kabát, článek
ATi Radeon 9700 - král mezi grafickými čipy III.
Jistě jste již všichni nedočkaví tohoto posledního dílu našeho seriálu o nejvýkonnějším čipu současnosti, ATi Radeon 9700. Předešlé dvě části obsahovaly specifikace a popis architektury čipu, paměti a pipeline a dnes přichází kromě technologie HyperZ III a VideoShaderu výkonnostní testy! A protože je v některých testech výkon i třikrát vyšší než u GeForce4 Ti4600, máme tu nového krále!
Kapitoly článku:
  1. ATi Radeon 9700 - král mezi grafickými čipy III.
  2. VideoShader a srovnávací testy
  3. Výkonnostní testy - pokračování
Odkazy na další části seriálu:

ATi Radeon 9700 – král mezi grafickými čipy I.
ATi Radeon 9700 – král mezi grafickými čipy II.

HyperZ III



Jednou z nejdůležitějších technologií Radeonu 9700 je zcela jistě HyperZ třetí generace. Tento systém slouží k úspoře šířky pásma a tím zvyšuje výkon nejen renderování. HyperZ III se skládá ze tří částí - hierarchické Z (hierarchical Z), Z-komprese (Z Compression) a rychlé uvolnění Z (Fast Z Clear).

Většina z Vás jistě ví, že každý objekt, polygon a pixel má kromě klasických souřadnic ještě speciální, která vyjadřuje "hloubku" bodu, nebo-li vzdálenost od pozorovatele. Tento parametr se ukládá do Z-bufferu a je použit k tomu, aby grafický čip určil, které předměty jsou před jinými. Problém je v tom, že zápis a čtení Z-bufferu je velice náročné na šířku pásma, čímž se stává slabým místem ve výkonu. Technologie HyperZ slouží k úspoře šířky pásma využívané Z-bufferem a zvýšit tak výkon.

Tradiční 3D akcelerátor zpracovává každý polygon nezávisle na zbytku celkové scény. Pokud nebere grafický čip ohled na ostatní objekty, tak použije na každý polygon textury a stíny. Každý pixel či polygon ale musí být zkontrolován a porovnám se Z-bufferem, aby bylo zjištěno zda-li je viditelný či nikoliv. Tato kontrola ale probíhá až když jsou pixely osvětleny a "potaženy" texturou.

Pokud se při této kontrole z-bufferu pixel ukáže jako "vrchní" (překryje nějaký stávající pixel) nahradí překrytý pixel v zadním bufferu (back buffer) a z-buffer se aktualizuje. Pokud je naopak zjištěno, že se tento pixel nachází za nějakým existujícím, pak se žádné změny nekonají. Takto se může stát, že je některý pixel několikrát překreslen. Nakonec se zadní buffer překopíruje do předního a scéna je zobrazena.

A překreslování pixelů je jedním z hlavních konzumentů šířky pásma. Engine zpracovávající jednotlivé polygony samozřejmě není schopen určit, který pixel je schovaný a který je vpředu. Výsledkem toho je, že je vykreslováno až o 300% polygonů více než je třeba. A proto jsou vyvíjeny technologie, které tomuto problému zamezují (např. Kyro II) a jednou z nich je HyperZ III.

HyperZ III ovšem neeliminuje základ těchto potíží (překreslování), ale až jejich důsledek, tedy častý přístup do Z-bufferu. Zvyšuje tak efektivitu všech přístupů, které jsou prováděny za účelem kontroly polohy jednotlivých pixelů.


Obr. 15 - HyperZ III - hierarchické Z
klikněte pro zvětšení

Prvním komponentem technologie HyperZ III je hierarchické Z. Tato metoda rozdělí Z-buffer na bloky pixelů, které mohou být rychle zkontrolovány, zda-li budou v konečném obraze viditelné. Jestli je zjištěno, že bude celý blok skrytý, tak se vyřadí a renderovací jednotka zpracuje další. Pokud jsou některé části bloku viditelné, tak se rozdělí na menší bloky, které jsou poté zpracovávány znovu. Na konci jsou všechny neviditelné pixely vyřazeny a obraz je zaslán do pixel shaderu. Díky technologii Early Z jsou jednotlivé bloky Z-bufferu dále rozdělovány až na samostatné pixely (bloky jsou 8x8, 4x4, 2x2 a 1 pixel).


Obr. 16 - HyperZ III - Z-komprese
klikněte pro zvětšení

Druhou částí je Z-komprese, která díky bezztrátovému algoritmu komprimuje data zasílaná do Z-bufferu. HyperZ III dosahuje minimálního kompresního poměru 2:1, v některých případech až 4:1. Pracuje i s FSAA, kde při 6x SuperSamplingu se může poměr pohybovat kolem 24:1. Proto se ATi vytahuje minimální ztrátou výkonu při FSAA.


Obr. 17 - HyperZ III - Fast Z Clear
klikněte pro zvětšení

Fast Z Clear je technika rychlého vyprazdňování Z-bufferu mezi jednotlivými renderovanými snímky. Tato technologie je příhodná při použití vysokých rozlišení, kdy je Z-buffer plný informací o jednotlivých pixelech. Například při rozlišení 1600x1200 musí být každý snímek zapsána do Z-bufferu data k vyčištění o přibližné velikosti 7,7MB. Díky Fast Z Clear je ale k vyčištění bufferu třeba pouze 1/64 tohoto množství dat a rapidně se tak zvyšuje rychlost.
Doporučujeme náš velký přehled desktopových grafických čipů.