Novinky ve světě GPU: leden 2013
31.1.2013, Petr Štefek, článek
V tomto článku si shrneme poslední zajímavé novinky ze světa grafických čipů za leden roku 2013, ať už se jedná o mobilní grafiku v tabletech, nebo tu desktopovou, kterou využíváme i pro akcelerování různých aplikací.
Kapitoly článku:
- AMD Radeon HD 8000 – Nové? Ne, recyklované!
- AMD Radeon HD 8000M – nové mobilní grafiky
- Nvidia GT 730M/710M – přeznačování v zeleném táboře mobilních GPU
- Nvidia Tegra 4 GPU – lepší než grafika iPadu 4
- AMD Catalyst 13.1 – evoluce a odstraňování chyb
Nvidia nezahálí a chystá pro svět tabletů a podobných zařízení novinku v podobě další generace SoC Tegra s pořadovým číslem 4. Z novinek již víme, že Tegra 4 bude mít na palubě čtvero jader ARM Cortex A15 na frekvenci 1.9 GHz a páté jádro pro lehčí úkoly na 700-800 MHz. Vlastnosti Tegra 4, co se týká CPU části, nebude zřejmě nikdo považovat za poddimenzované, ale rozhodně zde nemůžeme zapomenout na GPU část, která také velkým skokem oproti předchozí generací Tegra 3.
Zřejmě největším zklamáním nastupující generace je zřejmě fakt, že Nvidia se rozhodla využít neunifikované architektury, která plně nepodporuje OpenGL ES 3.0. Podle společnosti se architektura GPU Tegra 4 lépe hodí pro typ aplikací, které budou na trhu dostupné po dobu životnosti této platformy. Otázkou je, zda se jedná o alibismus, nebo fakt. Uvidíme, s čím přijde konkurence.
Samozřejmě Tegra 4 GPU nebude zcela revoluční základ a grafika bude mít s předchozí generaci mnoho společného, ale v zásadě to vůbec nevadí. Prozatím není k dispozici hloubkový pohled na architekturu Tegra 4, takže se budeme muset spokojit se základy.
Tegra 4 disponuje 72 výpočetními grafickými jádry, které jsou do značné míry nezávislé a mohou zpracovávat jak skalární, tak vektorové operace. Teď se podíváme, jak šel čas, respektive vývoj, této platformy. Tegra 2 disponovala jednou Vec4 vertex shader jednotkou (4 jádra) a jednou Vec4 pixel shader jednotkou (4 jádra). Tegra 3 šla dále pouze v počtu pixel shaderů a zdvojnásobila počet jader (8). Tegra 4 bude mít 6 Vec4 vertex jednotek (tzn. 24 jader) a 4 3-deep Vec4 pixelové jednotky (48 jader). Poslední generace má tedy 6-krát více AL jednotek než předchozí Tegra 3 a rovněž tyto jednotky běží na vyšší frekvenci než u předchozí generace (520 MHz).
Nvidia se chlubí tím, že Tegra 4 GPU bude mít teoreticky větší výpočetní výkon než konkurenční PowerVR SGX 554MP4 v SoC Apple A6X určeným pro iPad 4. Podle všeho je klíčovou vlastností a konkurenční výhodou vyšší frekvence a nikoli plocha samotného jádra, což je dobrá zpráva. Špatná zpráva je ale absence unifikované architektury a podpory OpenGL ES 3.0. Nvidia prozatím nemá finální frekvence pro Tegra 4, ale nechala se slyšet, že finálně budou frekvence takové, aby Tegra 4 porazila konkurenční A6X ve všem od 3D her po známý GL Benchmark. Na internetu kolují výsledky Tegra 4 v GLBenchamrku, ale podle Nvidie to neodpovídá aktuálnímu výkonu poslední revize.
Nvidia slibuje další vylepšení, co se týká GPU části, což bude zahrnovat vyhlazování (multisampling) a také kompresi frame bufferu (color a z). Nebude zde ale podpora 24-bit z a ztenčil se počet operací (limitem zůstává 16 bitů na pixel). Maximální rozlišení, které Tegra 4 podporuje bude trošku nesmyslných 4K x 4K, což je 4násobné zvětšení pixelů na plochu. Pokud se ptáte, kde toto rozlišení půjde využít, tak snad ve spojení s novými 4K televizory při přehrávání videa, ale nejsem si jist, jestli je tohle klíčová vlastnost nové SoC. Další novinky zahrnují podporu FP16 filtrace a blendingu v hardware SoC.
Zřejmě největším zklamáním nastupující generace je zřejmě fakt, že Nvidia se rozhodla využít neunifikované architektury, která plně nepodporuje OpenGL ES 3.0. Podle společnosti se architektura GPU Tegra 4 lépe hodí pro typ aplikací, které budou na trhu dostupné po dobu životnosti této platformy. Otázkou je, zda se jedná o alibismus, nebo fakt. Uvidíme, s čím přijde konkurence.
Samozřejmě Tegra 4 GPU nebude zcela revoluční základ a grafika bude mít s předchozí generaci mnoho společného, ale v zásadě to vůbec nevadí. Prozatím není k dispozici hloubkový pohled na architekturu Tegra 4, takže se budeme muset spokojit se základy.
GeForce ULP (2012) | PowerVR SGX 543MP2 | PowerVR SGX 543MP4 | PowerVR SGX 544MP3 | PowerVR SGX 554MP4 | GeForce ULP (2013) | |
Platforma | Tegra 3 | A5 | A5X | Exynos 5 Octa | A6X | Tegra 4 |
Počet SIMD | 3 | 8 | 16 | 12 | 32 | 18 |
MADs na 1 SIMD | 4 | 4 | 4 | 4 | 4 | 4 |
Počet MADs | 12 | 32 | 64 | 48 | 128 | 72 |
GFLOPS výkon (std. frekvence) | 12.4 GFLOPS | 16.0 GFLOPS | 32.0 GFLOPS | 51.1 GFLOPS | 71.6 GFLOPS | 74.8 GFLOPS |
Tegra 4 disponuje 72 výpočetními grafickými jádry, které jsou do značné míry nezávislé a mohou zpracovávat jak skalární, tak vektorové operace. Teď se podíváme, jak šel čas, respektive vývoj, této platformy. Tegra 2 disponovala jednou Vec4 vertex shader jednotkou (4 jádra) a jednou Vec4 pixel shader jednotkou (4 jádra). Tegra 3 šla dále pouze v počtu pixel shaderů a zdvojnásobila počet jader (8). Tegra 4 bude mít 6 Vec4 vertex jednotek (tzn. 24 jader) a 4 3-deep Vec4 pixelové jednotky (48 jader). Poslední generace má tedy 6-krát více AL jednotek než předchozí Tegra 3 a rovněž tyto jednotky běží na vyšší frekvenci než u předchozí generace (520 MHz).
Nvidia se chlubí tím, že Tegra 4 GPU bude mít teoreticky větší výpočetní výkon než konkurenční PowerVR SGX 554MP4 v SoC Apple A6X určeným pro iPad 4. Podle všeho je klíčovou vlastností a konkurenční výhodou vyšší frekvence a nikoli plocha samotného jádra, což je dobrá zpráva. Špatná zpráva je ale absence unifikované architektury a podpory OpenGL ES 3.0. Nvidia prozatím nemá finální frekvence pro Tegra 4, ale nechala se slyšet, že finálně budou frekvence takové, aby Tegra 4 porazila konkurenční A6X ve všem od 3D her po známý GL Benchmark. Na internetu kolují výsledky Tegra 4 v GLBenchamrku, ale podle Nvidie to neodpovídá aktuálnímu výkonu poslední revize.
Nvidia slibuje další vylepšení, co se týká GPU části, což bude zahrnovat vyhlazování (multisampling) a také kompresi frame bufferu (color a z). Nebude zde ale podpora 24-bit z a ztenčil se počet operací (limitem zůstává 16 bitů na pixel). Maximální rozlišení, které Tegra 4 podporuje bude trošku nesmyslných 4K x 4K, což je 4násobné zvětšení pixelů na plochu. Pokud se ptáte, kde toto rozlišení půjde využít, tak snad ve spojení s novými 4K televizory při přehrávání videa, ale nejsem si jist, jestli je tohle klíčová vlastnost nové SoC. Další novinky zahrnují podporu FP16 filtrace a blendingu v hardware SoC.