ATi Radeon X800 - grafická (r)evoluce
10.5.2004, Zdeněk Kabát, článek
Přibližně 3 týdny po vypuštění GeForce 6800 vrací kanadská ATi Technologies úder - Radeon X800 vyvíjený pod kódovým označením Loki je na světě. V jádru je čip sice podobný předchozím, ale přichází navíc s masivním paralelismem (až 16 pixel pipeline), novou technologií 3Dc a úpravami v paměťovém řadiči a FSAA. V článku najdete detaily o nové "tajné zbrani" ATi.
Kapitoly článku:
- ATi Radeon X800 - grafická (r)evoluce
- Jádro R420 a architektura pipeline
- Zpracování geometrie a HyperZ HD
- Pixel shader
- SmoothVision HD
- 3Dc komprese
- Grafická karta a spotřeba
- Verze Radeonu X800, závěr
Jádro R420
Začněme hezky od píky, tedy jádrem. Nebudu chodit kolem horké kaše a řeknu rovnou, že architektonických rozdílů mezi R300 a R420 je pomálu a tkví hlavně v masivním paralelismu, úpravách v paměťovém řadiči a FSAA a v nové technologii 3Dc. Jinými slovy, jedná se o Radeon 9800 v novém, mnohem luxusnějším kabátku.
Radeon X800 je prvním hi-endovým GPU, který je vyráběn 0,13mikronovým procesem, třetím v pořadí celkově (po RV350 a RV360). Nyní, když má již ATi novou výrobu vyzkoušenou, může bez problémů přejít na tento proces i u velkých čipů, včetně 160-milionové R420. Jak víte, Radeon 9700 byl ještě vyráběn na jistotu za pomocí 0,15mikronového procesu. Čipy dále využívají low-k technologie s označením Black Diamond (poprvé u RV360) a jsou produkovány v balení FC-BGA.
Obr. 2 – Čipy R420
Radeon X800 tedy obsahuje 160 milionů tranzistorů, má proto jistou výhodu oproti obrovské GeForce 6800 s 222 miliony. Rozdíl 40% tranzistorů na stejném procesu znamená i jinou velikost čipu, ovšem vzhledem k odlišným výrobním technologiím nebude rozdíl přesně 40%. Výhoda menšího počtu tranzistorů tkví hlavně v tom, že se vejde na jeden wafer více čipů (= větší výtěžnost) a že GPU bude produkovat méně ztrátového tepla a bude chladnější. K chlazení a spotřebě se dostaneme ještě dále.
Ještě se podívejme na taktovací frekvence, se kterými novinka od ATi přichází na trh. V porovnání s GeForce 6800 jsou výrazně vyšší – Radeon X800 Pro poběží na 475MHz, zatímco verze X800 XT bude taktována na 520MHz. Procentuálně to vychází o +19%, resp. +30% více než u nVidie, což se velmi projevuje na pixel fillrate, tedy rychlosti, s jakou jsou vykreslovány pixely.
Dále obsahuje R420 několik shodných rysů s NV40 – SIMD/MIMD architekturu, 6 vertex shader jednotek, až 16 pixel pipeline ve skupinkách po čtyřech, 2 pixel shadery v každé pipeline a 4-cestný křížový paměťový řadič pro paměti GDDR3. Jednotlivými položkami se budu zabývat podrobně níže.
Architektura 3D pipeline
Zde je základní schéma celé pipeline grafického čipu R420. S podobným schématem jsme se mohli setkat již u R300, zde je základní rozdíl v rozšířeném masivním paralelismu (6 vertex enginů, 16 pixel pipeline).
Obr. 3 – Schéma kompletní 3D pipeline R420
Stejně jako u GeForce 6800 jsou pixel pipeline Radeonu X800 rozděleny do 4 čtveřic, proto jsou někdy nazývány quad-pipelines. To poskytuje výhodu, kterou jsem zmiňoval již u NV40. Vezměme si, že ze 160 milionů tranzistorů na čipu připadá největší část právě oněm 16 pixel pipeline. U každé polovodičové výroby existuje určité procento „zmetků“, tedy špatně vyrobených čipů. Velká plocha připadající na renderovací pipeline znamená, že většina chyb se bude koncentrovat právě do této oblasti.
Architektura založená na quad-pipelines dovoluje vzít určitou čtveřici a vypnout ji. Znamená to, že všechny R420 budou vyráběny s 16 pipeline a podle toho, jak se jejich výroba vyvede, budou prodávány jako různé modely Radeonu X800 – „Pro“ s 12 pipeline, „XT“ s 16 pipeline a nepochybuji o tom, že se objeví i model s osmicí renderovacích jednotek.
ATi je průkopníkem této strategie, protože Radeon 9700 a 9800 obsahují na rozdíl od rodiny NV3x pevně dané pipeline. Proto byly špatně vyrobené R300 prodávány jako Radeony 9500, což dávalo velkou naději overclockerům a tweakerům. Je totiž možné, že chyba není tak velká, aby byla znatelná ve výkonu, stabilitě či obraze, a u R300 bylo možné vypnuté pipeline aktivovat i softwarově. Přestože se způsob vypínání pipeline u X800 trochu změnil, stále je velká šance, že se podaří tento systém obejít.
Ještě krátce zmíním systém, jakým je renderovaná scéna přiřazovaná k jednotlivým pixel pipeline. Celá scéna je rozdělena na dlaždice, které jsou zároveň zpracovávány v jednotlivých čtveřicích pipeline (každá dlaždice v jedné čtveřici). Protože je u R420 dvakrát více skupinek renderovacích jednotek, scéna se rozděluje na menší dlaždice než u předchozích modelů.
Začněme hezky od píky, tedy jádrem. Nebudu chodit kolem horké kaše a řeknu rovnou, že architektonických rozdílů mezi R300 a R420 je pomálu a tkví hlavně v masivním paralelismu, úpravách v paměťovém řadiči a FSAA a v nové technologii 3Dc. Jinými slovy, jedná se o Radeon 9800 v novém, mnohem luxusnějším kabátku.
Radeon X800 je prvním hi-endovým GPU, který je vyráběn 0,13mikronovým procesem, třetím v pořadí celkově (po RV350 a RV360). Nyní, když má již ATi novou výrobu vyzkoušenou, může bez problémů přejít na tento proces i u velkých čipů, včetně 160-milionové R420. Jak víte, Radeon 9700 byl ještě vyráběn na jistotu za pomocí 0,15mikronového procesu. Čipy dále využívají low-k technologie s označením Black Diamond (poprvé u RV360) a jsou produkovány v balení FC-BGA.
Obr. 2 – Čipy R420
Radeon X800 tedy obsahuje 160 milionů tranzistorů, má proto jistou výhodu oproti obrovské GeForce 6800 s 222 miliony. Rozdíl 40% tranzistorů na stejném procesu znamená i jinou velikost čipu, ovšem vzhledem k odlišným výrobním technologiím nebude rozdíl přesně 40%. Výhoda menšího počtu tranzistorů tkví hlavně v tom, že se vejde na jeden wafer více čipů (= větší výtěžnost) a že GPU bude produkovat méně ztrátového tepla a bude chladnější. K chlazení a spotřebě se dostaneme ještě dále.
Ještě se podívejme na taktovací frekvence, se kterými novinka od ATi přichází na trh. V porovnání s GeForce 6800 jsou výrazně vyšší – Radeon X800 Pro poběží na 475MHz, zatímco verze X800 XT bude taktována na 520MHz. Procentuálně to vychází o +19%, resp. +30% více než u nVidie, což se velmi projevuje na pixel fillrate, tedy rychlosti, s jakou jsou vykreslovány pixely.
Dále obsahuje R420 několik shodných rysů s NV40 – SIMD/MIMD architekturu, 6 vertex shader jednotek, až 16 pixel pipeline ve skupinkách po čtyřech, 2 pixel shadery v každé pipeline a 4-cestný křížový paměťový řadič pro paměti GDDR3. Jednotlivými položkami se budu zabývat podrobně níže.
Architektura 3D pipeline
Zde je základní schéma celé pipeline grafického čipu R420. S podobným schématem jsme se mohli setkat již u R300, zde je základní rozdíl v rozšířeném masivním paralelismu (6 vertex enginů, 16 pixel pipeline).
Obr. 3 – Schéma kompletní 3D pipeline R420
Stejně jako u GeForce 6800 jsou pixel pipeline Radeonu X800 rozděleny do 4 čtveřic, proto jsou někdy nazývány quad-pipelines. To poskytuje výhodu, kterou jsem zmiňoval již u NV40. Vezměme si, že ze 160 milionů tranzistorů na čipu připadá největší část právě oněm 16 pixel pipeline. U každé polovodičové výroby existuje určité procento „zmetků“, tedy špatně vyrobených čipů. Velká plocha připadající na renderovací pipeline znamená, že většina chyb se bude koncentrovat právě do této oblasti.
Architektura založená na quad-pipelines dovoluje vzít určitou čtveřici a vypnout ji. Znamená to, že všechny R420 budou vyráběny s 16 pipeline a podle toho, jak se jejich výroba vyvede, budou prodávány jako různé modely Radeonu X800 – „Pro“ s 12 pipeline, „XT“ s 16 pipeline a nepochybuji o tom, že se objeví i model s osmicí renderovacích jednotek.
ATi je průkopníkem této strategie, protože Radeon 9700 a 9800 obsahují na rozdíl od rodiny NV3x pevně dané pipeline. Proto byly špatně vyrobené R300 prodávány jako Radeony 9500, což dávalo velkou naději overclockerům a tweakerům. Je totiž možné, že chyba není tak velká, aby byla znatelná ve výkonu, stabilitě či obraze, a u R300 bylo možné vypnuté pipeline aktivovat i softwarově. Přestože se způsob vypínání pipeline u X800 trochu změnil, stále je velká šance, že se podaří tento systém obejít.
Ještě krátce zmíním systém, jakým je renderovaná scéna přiřazovaná k jednotlivým pixel pipeline. Celá scéna je rozdělena na dlaždice, které jsou zároveň zpracovávány v jednotlivých čtveřicích pipeline (každá dlaždice v jedné čtveřici). Protože je u R420 dvakrát více skupinek renderovacích jednotek, scéna se rozděluje na menší dlaždice než u předchozích modelů.