AMD Radeon HD 6900: Cayman v rybníku
29.12.2010, Petr Štefek, technologie
V dnešním článku se podíváme na zbrusu nový grafický čip AMD Cayman, jenž reprezentuje značný evoluční krok a základ architektury budoucnosti, na které bude AMD v dalších letech stavět další generace grafických karet.
Kapitoly článku:
- AMD Radeon HD 6900: Cayman v rybníku
- Změna VLIW architektury – méně je někdy více
- Cayman a GPU computing
- Paralelní grafický engine a ROPs
- Závěr
Na čipy z dílen AMD jsme čekali již nějaký ten měsíc a na internetu je provázely různé spekulace. Čip AMD Cayman má přestavovat naprostý high-end společnosti a budeme jej vídat v Radeonech HD 6900. Předchozí levnější a méně výkonné čipy Barts nalezneme v mainstreamových kartách Radeon HD 6800. Velkým překvapením je, že ač AMD slibovalo a podle původních návrhů se spekulovalo o 32nm výrobním procesu pro dražší čip, tak z něj nakonec sešlo. Na vině jsou problémy s výrobou, která by neměla ani zdaleka dostačující výtěžnost. Je velmi pravděpodobné, že AMD s tímto výrobním procesem kalkulovalo, a tak současné čipy Cayman nemusí tak úplně odpovídat původnímu návrhu. Vše se ale muselo podřídit 40nm procesu, který jsou pro současné grafické čipy s velkým množstvím tranzistorů stropem.
Cayman je čipem, jehož plocha dosahuje 389 mm2 a je tedy skoro o jednu třetinu větší než levnější Barts a pouze o přibližně 15 % větší než Cypress (počet tranzistorů vzrostl o 23 %). Největším šokem bude zřejmě počet stream procesorů, kterých je v čipu Cayman přítomno pouze 1536, což je o 64 méně než v případě plně vyzbrojeného čipu Cypress v Radeonu HD 5870. Počet ROPS zůstává také nezměněn (32). Změnu nepřinese ani teoretický výpočetní výkon, jenž zůstává na hodnotě 2.7 TFlops. Menší nárůst v počtu jednotek vysledujeme v případě texturování, kde nově k dispozici 96 jednotek. Je tedy jasné, že AMD chce bodovat zvýšením efektivity práce Caymanu.
Každý se nyní jistě ptá, jaké jsou ty nejpodstatnější změny, které čipy Cayman přináší. Není jich málo, ač je AMD nijak zvlášť neprezentuje. Už několik generací čipů AMD jsme zvykli, že pro konečný počet stream procesorů musíme násobit každý jednotlivý procesor 5, jelikož čipy AMD měli v každém výpočetním procesoru pětici jednotek (5D) a architektura jako taková byla principielně VLIW (Very Long Instruction Word). S touto architekturou jsme se kromě čipů AMD mohli setkat i před mnoha lety v GeForce 5000, kde se ovšem příliš neblýskla. Čipy jednoduše nepracovaly příliš efektivně.
AMD nyní přichází s úpravou svých jednotek z 5D na 4D architekturu (také VLIW) a rozdíly nespočívají pouze v ubrání jedné jednotky, ale máme zde funkčně zcela jinak přizpůsobenou ALU (Arithmetic Logic Unit). Více o této zásadní proměně si řekneme v samostatné kapitole, kde si srovnáme odcházející grafické jádro Cypress s novým Caymanem.
Schéma jádra Cayman
Další neméně podstatnou novinkou jsou úpravy na geometrické výpočetní části, kterou nyní můžeme považovat za paralelní výpočetní geometrickou výpočetní částí. Zní to složitě, ale AMD našlo recept na zvýšení efektivity zpracování geometrie, což je v přímém porovnání s čipy Nvidia GF1x0 více než nutná záležitost. Při masivním nasazení teselace čipy AMD na konkurenci hodně ztrácejí. Pro AMD je tedy jedině dobře, že se hry s podporou teselace na trhu prozatím neobjevují, tedy alespoň ne takové, které by z této zbrusu nové funkce DirectX 11 profitovaly. Více si opět povíme v samostatné kapitole.
Mimo jiné se s architekturou Cayman dostane i na nové typy vyhlazování a vylepšený management napájení pro případ přetížení karty vlivem špiček v odběru. Sbohem tak můžete dát týraní karet v MSI Combustoru, což recenzenti karet s oblibou dělají, přestože takto naměřený výsledek nevypovídá naprosto o ničem. AMD nám dává na talíře také nový typ vyhlazování EQAA, který pracuje na principu MSAA s částečným využitím hodnot ve vzorcích. Tento režim ale není nijak zvlášť zajímavý a budeme se mu věnovat jen okrajově. Pro zastánce kvalitního Anti-Aliasingu je zde stále jedinou možností SSAA (Super-Sampling Anti-Aliasing).
Pokud se podíváme na srovnání staršího Radeonu HD 5870 a zbrusu nového Radeonu HD 6970, tak nám do oka pravděpodobně padnou především změny v oblasti kapacity paměti, kde má nový Radeon k dispozici standardně 2 GB paměti. Paměti také standardně pracují na taktu přes 5 GHz. AMD nijak zvlášť nezapracovalo na spotřebě samotného čipu, a tak TDP zůstalo na poměrně slušné hodnotě 190 W, což je podstatně méně, než kolik poptávají čipy Fermi v plné náloži.
Proměnou prošel i texel fillrate, který je podstatně vyšší díky vyššímu počtu texturovacích jednotek. Poněkud mě mrzí fakt, že v kolonce výrobního procesu není 32 nm, ale bohužel se podle všech informací zdá, že Nvidia a AMD se posunou rovnou na 28nm výrobní proces, a to ne dříve než ke konci roku 2011. Je tedy pravděpodobné, že pro dosahování vyšší výkonů se dočkáme karet s více čipy Fermi a Cayman.
Cayman je čipem, jehož plocha dosahuje 389 mm2 a je tedy skoro o jednu třetinu větší než levnější Barts a pouze o přibližně 15 % větší než Cypress (počet tranzistorů vzrostl o 23 %). Největším šokem bude zřejmě počet stream procesorů, kterých je v čipu Cayman přítomno pouze 1536, což je o 64 méně než v případě plně vyzbrojeného čipu Cypress v Radeonu HD 5870. Počet ROPS zůstává také nezměněn (32). Změnu nepřinese ani teoretický výpočetní výkon, jenž zůstává na hodnotě 2.7 TFlops. Menší nárůst v počtu jednotek vysledujeme v případě texturování, kde nově k dispozici 96 jednotek. Je tedy jasné, že AMD chce bodovat zvýšením efektivity práce Caymanu.
Každý se nyní jistě ptá, jaké jsou ty nejpodstatnější změny, které čipy Cayman přináší. Není jich málo, ač je AMD nijak zvlášť neprezentuje. Už několik generací čipů AMD jsme zvykli, že pro konečný počet stream procesorů musíme násobit každý jednotlivý procesor 5, jelikož čipy AMD měli v každém výpočetním procesoru pětici jednotek (5D) a architektura jako taková byla principielně VLIW (Very Long Instruction Word). S touto architekturou jsme se kromě čipů AMD mohli setkat i před mnoha lety v GeForce 5000, kde se ovšem příliš neblýskla. Čipy jednoduše nepracovaly příliš efektivně.
AMD nyní přichází s úpravou svých jednotek z 5D na 4D architekturu (také VLIW) a rozdíly nespočívají pouze v ubrání jedné jednotky, ale máme zde funkčně zcela jinak přizpůsobenou ALU (Arithmetic Logic Unit). Více o této zásadní proměně si řekneme v samostatné kapitole, kde si srovnáme odcházející grafické jádro Cypress s novým Caymanem.
Schéma jádra Cayman
Další neméně podstatnou novinkou jsou úpravy na geometrické výpočetní části, kterou nyní můžeme považovat za paralelní výpočetní geometrickou výpočetní částí. Zní to složitě, ale AMD našlo recept na zvýšení efektivity zpracování geometrie, což je v přímém porovnání s čipy Nvidia GF1x0 více než nutná záležitost. Při masivním nasazení teselace čipy AMD na konkurenci hodně ztrácejí. Pro AMD je tedy jedině dobře, že se hry s podporou teselace na trhu prozatím neobjevují, tedy alespoň ne takové, které by z této zbrusu nové funkce DirectX 11 profitovaly. Více si opět povíme v samostatné kapitole.
Mimo jiné se s architekturou Cayman dostane i na nové typy vyhlazování a vylepšený management napájení pro případ přetížení karty vlivem špiček v odběru. Sbohem tak můžete dát týraní karet v MSI Combustoru, což recenzenti karet s oblibou dělají, přestože takto naměřený výsledek nevypovídá naprosto o ničem. AMD nám dává na talíře také nový typ vyhlazování EQAA, který pracuje na principu MSAA s částečným využitím hodnot ve vzorcích. Tento režim ale není nijak zvlášť zajímavý a budeme se mu věnovat jen okrajově. Pro zastánce kvalitního Anti-Aliasingu je zde stále jedinou možností SSAA (Super-Sampling Anti-Aliasing).
Pokud se podíváme na srovnání staršího Radeonu HD 5870 a zbrusu nového Radeonu HD 6970, tak nám do oka pravděpodobně padnou především změny v oblasti kapacity paměti, kde má nový Radeon k dispozici standardně 2 GB paměti. Paměti také standardně pracují na taktu přes 5 GHz. AMD nijak zvlášť nezapracovalo na spotřebě samotného čipu, a tak TDP zůstalo na poměrně slušné hodnotě 190 W, což je podstatně méně, než kolik poptávají čipy Fermi v plné náloži.
Proměnou prošel i texel fillrate, který je podstatně vyšší díky vyššímu počtu texturovacích jednotek. Poněkud mě mrzí fakt, že v kolonce výrobního procesu není 32 nm, ale bohužel se podle všech informací zdá, že Nvidia a AMD se posunou rovnou na 28nm výrobní proces, a to ne dříve než ke konci roku 2011. Je tedy pravděpodobné, že pro dosahování vyšší výkonů se dočkáme karet s více čipy Fermi a Cayman.