Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

ATi Radeon X1000 - pohled na architekturu

5.10.2005, Zdeněk Kabát, článek
ATi Radeon X1000 - pohled na architekturu
ATi dnes vstoupilo do další etapy své historie a představilo řadu grafických čipů nové generace Radeon X1000, které jsou postaveny na moderní architektuře a pokryjí celé cenové spektrum. Podíváme se detailně na uspořádání 3D pipeline a všechny novinky.

Paměťový řadič



Jednou z nejzajímavějších věcí na architektuře R520 je její paměťový řadič, který doposud nebyl k vidění u žádného paměťového čipu. Předem prozradím, že ohledně propustnosti nemusíte žádné zázraky čekat, protože externí sběrnice je stále 256-bitová (ovšem i zde došlo ke změně). Podívejte se na základní schéma interní sběrnice, nazvané ring bus.

Pozn.: Pokud jste se prokousali až sem, rád bych, abyste napsali do diskuse, zda-li ponechat anglické "ring bus", nebo používat obrat "prstencová sběrnice". Někomu se to může příčit.




Ač se to na první pohled nezdá, tak ring bus zjednodušuje architekturu grafického čipu a také dovoluje používat vyšší frekvence. Zajímavé je, že obvody řadiče jsou částečně programovatelné, takže upgradem ovladačů je možné vylepšit a optimalizovat jeho práci. Těžko říct, na jaké úrovni se optimalizue a jak velký dopad na výkon může tento faktor mít.

Základem interní sběrnice je dvojice 256-bitových "prstenců", ze kterých každý směřuje opačným směrem. Právě tento fakt zaručuje nižší latence, protože kdybych přirovnal sběrnice k hodinám, tak dostat se ze 3 hodin na 12 nemusí znamenat 3/4 kružnice, ale jen 1/4 (proti směru ručiček).




Data tedy putují po prstencové sběrnici, na které se nalézají tzv. ring stop. Ty zajišťují zápis do externí paměti a čtení z ní s tím, že z každého směřují "ven" dva kanály. Dále se na sběrnici nacházejí "klienti". Klientem může být jakákoliv část čipu, která potřebuje přístup do paměti, tedy pixel a vertex shadery, render back-ends, display engine atd., je jich opravdu mnoho.

Způsob dodávání dat je také poměrně zajímavý. Pokud si klient vyžádá data z externí paměti, vyšle dotaz do paměťového řadiče a ten žádost předá danému ring stopu, který je s daným čipem propojen. Když jsou data z paměti načtena, jsou poslána nejkratší cestou po prstenci do ring stopu, který je nejblíže klientovi a z toho jsou klientem načtena.

Mezi jednotlivými klienty jsou data předávána prostřednictvím mezipamětí na čipu, tedy texture, color a Z/stencil cache a případně díky vláknům, která rozděluje dispatch procesor.




Další výhodou nového řadiče je komunikace s externí pamětí. Pamatujete, že u dřívějších Radeonů byly paměťové čipy na PCB seřazeny vždy po dvojicích? U Radeonu X1800 tomu tak není a když se podíváte na grafickou kartu, jsou umístěny de facto sólově. To neznamená nic jiného, než že je na řadič připojen každý zvlášť a není použito zapojení 4x64-bit, ale 8x32-bit.

Dále si můžete všimnout, že na kartě může být maximálně 8 čipů a přesto je jedna z dostupných kapacit pro Radeon X1800XT 512MB. Z toho vyplývá, že tato karta bude využívat 512Mbit čipy, které se zatím na žádné grafice neobjevily. Uvidíme, jak to bude s jejich dostupností na frekvenci 750MHz.



K paměťovému řadiči se vztahuje ještě jedno schéma - cache R520 je plně asociativní, což v některých případech může zvýšit výkon v hrách. Zatímco dříve byla cache mapována přímo (Direct Mapped) nebo byla N-asociativní, tzn. do každého řádku mohlo být zapisováno jen z některých míst externí paměti, u R520 je plně asociativní a cache může tedy zapisovat a číst z libovolného místa v paměti. Toto platí pro všechny typy cache v čipu - texture, color a Z/stencil.


Význam nového řadiče



Nový paměťový řadič by měl přinést výhody hlavně v náročných nastaveních, kdy protéká čipem nejvíce dat z paměti a do paměti. Mluvíme zde o vysokých rozlišeních od 1600x1200 výše, zapnutém FSAA (4x/6x, Temporal, Adaptive AA) a anizotropním filtrování (8x/16x). V těchto případech avizuje ATi až dvakrát vyšší výkon oproti předchozí generaci.




ATi nabízí ve svých materiálech dva grafy, kde demonstruje dopad FSAA na výkon ve Far Cry a Battlefield 2. Zatímco GeForce 7800GTX zaznamenává v rozlišení 1600x1200x při 4x FSAA propad výkonu na 62%, resp. 53%, u Radeonu X1800XT je to při 6x FSAA jen na 72%, resp. 71%. Těžko ale věřit marketingovému oddělení.