Technologie: nVidia GeForce 7800 GTX
22.6.2005, Zdeněk Kabát, článek
Další evoluce v grafickém je světě je na pořadu dne. Nová rodina GeForce 7 je uvedena představením hi-endového čipu GeForce 7800GTX, který kromě masivního paralelismu vyniká i pokročilou architekturou.
Kapitoly článku:
- Technologie: nVidia GeForce 7800 GTX
- GeForce 7800 GTX - specifikace a technologie
- Jádro G70 - architektura 3D pipeline
- Vertex a pixel pipeline, ROP
- Optimalizované shadery, HDR, transparentní AA
- Grafická karta, spotřeba a závěr
Specifikace GeForce 7800 GTX
Dříve mi vždy zůstával nad novými specifikacemi GPU rozum stát, ale v posledních letech se již nejedná ani v grafickém trhu o žádné revoluce. Přeci jen vybudovat novou architekturu stojí miliony dolarů, takže když máte k dispozici starší, komplexní, tak sice nepřijdete s ničím extra, ale máte možnost optimalizovat již dobře fungující čip. Toho se držela i nVidia, ovšem změny v pipeline se samozřejmě také konají.
Zajímavou věcí je změna názvosloví. Mnozí po zaslechnutí tajemného označení G70 tušili, že by se mohlo jednat o zbrusu nový čip, jehož architektura ještě výrazně předčí stávající rodinu NV40. Ovšem není všechno zlato, co se třpytí. Naopak GeForce 7 je logickým pokračování používané obchodní značky a znamená mimo jiné sedmou generaci grafických karet nVidia.
Zde jsou specifikace novinky:
ATi Radeon X800XL | ATi Radeon X850XT PE | nVidia GeForce 7800 GTX | nVidia GeForce 6800 Ultra | |
Grafické jádro | R430 | R480 | G70 | NV40 |
Výrobní proces | 110nm | 130nm | 110nm | 130nm |
Počet tranzistorů | 160 milionů | 160 milionů | 302 milionů | 222 milionů |
Frekvence jádra | 400MHz | 540MHz | 430MHz | 400MHz |
Frekvence paměti | 500MHz (1GHz DDR) | 590MHz (1,18GHz DDR) | 600MHz (1,2GHz DDR) | 550MHz (1,1GHz DDR) |
Velikost paměti | 256MB/512MB | 256MB | 256MB | 256MB/512MB |
Paměťová sběrnice | 256-bit GDDR3 | 256-bit GDDR3 | 256-bit GDDR3 | 256-bit GDDR3 |
Propustnost pamětí | 32,0 GB/s | 37,8 GB/s | 38,4 GB/s | 35,2 GB/s |
Pixel fillrate | 6,4 Gpixel/s | 8,6 Gpixel/s | 6,9 Gpixel/s | 6,4 Gpixel/s |
Texel fillrate | 6,4 Gpixel/s | 8,6 Gpixel/s | 10,3 Gpixel/s | 6,4 Gpixel/s |
Pixel pipeline | 16x1 | 16x1 | 24x1 | 16x1/32x0* |
Textur za průběh | 16 | 16 | 16 | 16 |
Vertex shadery | 6 | 6 | 8 | 6 |
Podpora DirectX | 9.0b SM2 | 9.0c SM3 | 9.0c SM3 | |
Způsob FSAA | 2x/4x/6x sparse sample AA, Temporal AA | 2x/4x RGMS, 8x (4xRGMS+2xSS) | 2x/4x RGMS, 8x (4xRGMS+2xSS) | |
Úspora šířky pásma | HyperZ HD | LMA III | LMA III | |
Barevná komprese | 6:1 | ? | ? | |
Z-komprese | 8:1 (až 48:1 při 6xFSAA) | ? | ? | |
Optimalizace obrazu | SmoothVision HD | IntelliSample 4.0 | IntelliSample 3.0 | |
Možnost Multi-GPU | CrossFire | SLI | SLI | |
Rozhraní | AGP/PCIe x16 | AGP/PCIe x16 | PCIe x16 | AGP/PCIe x16 |
* - možnost zapsat 32 pixelů za takt je daná duální ROP jednotkou - v případě absence barevné hodnoty se použije C ROP jednotka, která se za normálních okolností stará o Z-hodnotu i barvu, jen na zapsání pixelu do Z-bufferu nebo stencil bufferu. Protože Z ROP zapíše další pixel, je to u 16 jednotek celkem 32.
nVidia samozřejmě zveřejňuje ještě dlouhý seznam vlastností čipu a použitých technologií, kde se můžete ve stručnosti dozvědět základní fakta. Ovšem vzhledem k tomu, že ho lze najít na stránkách nVidie, mi přišlo zbytečné ho přepisovat. Všechny důležité informace jsou v článku rozebrány.
Čtyři základní body, na kterých staví architektura GeForce 7 jsou:
- Nový optimalizovaný engine pro Shader Model 3.0
- High Dynamic Range (HDR) osvětlení
- Transparentní antialiasing
- Technologie SLI pro Multi-GPU zapojení
Klíčových technologií, které se vytahují svými marketingovými názvy, je několik. nVidia používá pro architekturu nové rodiny název CineFX 4.0 a navazuje tak na své grafické čipy počínaje GeForce FX. CineFX zahrnuje veškeré operace se shadery (podpora Shader Modelu 3.0) a s texturami. Oproti GeForce 6 má mít nový GPU až dvakrát vyšší výkon, nVidia udává dokonce neuvěřitelných 200 GFLOPs (miliard operací v plovoucí desetinné čárce).
Dalším bodem architektury GeForce 7800 GTX je IntelliSample 4.0. Ten zajišťuje správu antialiasingu a anizotropního filtrování. GeForce 7 podporuje klasické metody vyhlazování z předchozích grafických čipů (2x/4x Rotated Grid MultiSampling, 8x RGMS + RGSS), ale navíc přidává i metodu transparentního MultiSamplingu (viz dále). Anti-aliasing zvládá i hardwarovou gamma korekci. Anizotropní filtrování zůstává na maximální hodnotě 16x 128-Tap. Podporovány jsou také komprese barev, Z-Bufferu, textur a normálových map.
GeForce 7 dále obsahuje optimalizovanou technologii UltraShadow II, která má za úkol optimalizaci stínů. Programátor si tak může vybrat "hloubku scény" (okrajové Z-souřadnice), ve které budou stíny vykreslovány. Toto je velmi intenzivně využito např. v Doomu 3, kde je stínování velmi důležité.
Nechybí ani podpora technologie PureVideo. Jedná se o speciální engine pro hardwarovou akceleraci multimedií, a to konkrétně MPEG-2 a WMV9 (High Definition WMV). Dále umí PureVideo provádět různé post-processing efekty jako je de-interlacing, inverse 2:2 a 3:2 pull-down apod., nechybí ani nativní podpora HDTV výstupu.
SLI - souhra dvou GeForce 7800 GTX
Samozřejmě i u nových GeForce 7 naváže nVidia na svou technologii SLI (Scalable Interface Link), která jí přinesla již mnoho úspěchů. Díky speciálnímu konektoru na "hřbetě" karty je možné uvnitř systému s dvěma PCIe sloty propojit dvě stejné grafické karty GeForce 7800 GTX a dosáhnout tak vyššího renderovacího výkonu. Obě karty se ve vykreslování buď střídají, nebo je scéna dynamicky rozdělována na dvě části, které jsou následně podle náročnosti přiděleny oběma kartám.
Dvojice GeForce 6800GT v SLI
SLI má výhodu, že v některých hrách výrazně zvyšuje výkon (pro nVidii je klíčový hlavně 3DMark :-), což ji řadilo se dvěma GeForce 6800 Ultra k suverénně nejvýkonnějšímu řešení na trhu. Nevýhoda je ale v tom, že některé hry nejsou podporovány a nárůst výkonu je pak nulový. Navíc jsou kvůli SLI omezeny jisté efekty, jako je např. bloom ("rozpíjení" silně osvětlené oblasti) nebo blur ("rozmazání" zapříčiněné rychlým pohybem).