Nvidia GF100 alias Fermi - bližší informace
21.1.2010, Petr Štefek, technologie
Dnešní článek přináší bližší informace o nové architektuře GF100 společnosti Nvidia. Nemusíte se bát, protože se nebude jednat pouze o kopírování PR informací, ale nad vším se řádně zamyslíme a vše si rozebereme.
Kapitoly článku:
Fermi alias GF100 je zvláštní a jeho architektura se hodí spíše pro GPGPU výpočty než pro hry samotné. To potvrzují i teorie, kdy Fermi původně mělo být GPGPU čipem, pro který nebyl dostatečně velký trh a Nvidii se nedařilo ho v této oblasti prosadit. Samotný čip tedy vzala a upravila tak, aby byl zároveň dobrý hardwarový rasterizér. Nasvědčovalo by tomu mnoho faktů, mezi které patří nízký počet jader z jednoho waferu (cca 100 jader – za předpokladu 100% výtěžnosti).
Pokud vezmete do úvahu, že byste prodávali jeden takový akcelerátor za několik tisíc dolarů pro profesionální trh, tak vám to příliš nevadí. Jakmile se ovšem z drahého čipu stane srdce „obyčejné“ grafické karty, tak máte zaděláno na problém. Vyrábíte málo drahých jader a potřebujete uvést kartu se srovnatelných výkonem a cenou srovnatelnou s konkurencí. GPGPU trh nám díru nezacelí (Tesla by musela mít mnohem vyšší prodeje – nicméně se jí postupně daří lámat počateční nedůvěru vědeckých institucí a firem ke GPGPU).
GF100 umí akcelerovat raytracing, ale ne natolik rychle, aby bylo možno prohlašovat, že jej zvládá real-time. Demo ukazované Nvidií, kde mimochodem figuruje také nové Ferrari 458 Italia, nedokáže rozchodit ani při rychlosti 1 FPS. Samozřejmě se jedná o velmi komplexní demo z hlediska raytracingu, takže je možné, že jednodušší scény by Fermi zvládlo podstatně rychleji. Každopádně je zde vidět velký pokrok (až 3x vyšší výkon) oproti minulé generaci GeForce GTX 200. Demo samotné ovšem používá mix rasterizace a raytracingu, což je také cesta budoucnosti, kdy vybrané hry mohou využívat raytracing jen z části.
Důležitou devizou GF100 je také možnost současného provozování několika kernelů (pro PhysX, DirectCompute atd.), které bylo už u minulé generace karet, ale zde narozdíl od starších generací díky většímu rozparcelování čipu na 16 SM už nemusí čekat, až ostatní dokončí úlohu a může s volným SM okamžitě přepnout na potřebný výpočet pod PhysX nebo DirectCompute. Výsledkem je vyšší výkon ve hrách - potažmo všech aplikacích využívajících výše zmiňovaných rozhraní.
Samozřejmě zde bude podpora pro CUDA, kde budete moci akcelerovat podporované aplikace, kterých v reálném životě není mnoho, ale najdete mezi nimi třeba Photoshop. Mezi další výhody můžeme už klasicky počítat technologie PureVideo HD a 3D brýle pro neobvyklý zážitek z hraní (pozor na epilepsii). Nvidia tedy Fermi uvádí nejen jako herní kartu, ale také jako GPGPU akcelerátor.
Pokud vezmete do úvahu, že byste prodávali jeden takový akcelerátor za několik tisíc dolarů pro profesionální trh, tak vám to příliš nevadí. Jakmile se ovšem z drahého čipu stane srdce „obyčejné“ grafické karty, tak máte zaděláno na problém. Vyrábíte málo drahých jader a potřebujete uvést kartu se srovnatelných výkonem a cenou srovnatelnou s konkurencí. GPGPU trh nám díru nezacelí (Tesla by musela mít mnohem vyšší prodeje – nicméně se jí postupně daří lámat počateční nedůvěru vědeckých institucí a firem ke GPGPU).
GF100 umí akcelerovat raytracing, ale ne natolik rychle, aby bylo možno prohlašovat, že jej zvládá real-time. Demo ukazované Nvidií, kde mimochodem figuruje také nové Ferrari 458 Italia, nedokáže rozchodit ani při rychlosti 1 FPS. Samozřejmě se jedná o velmi komplexní demo z hlediska raytracingu, takže je možné, že jednodušší scény by Fermi zvládlo podstatně rychleji. Každopádně je zde vidět velký pokrok (až 3x vyšší výkon) oproti minulé generaci GeForce GTX 200. Demo samotné ovšem používá mix rasterizace a raytracingu, což je také cesta budoucnosti, kdy vybrané hry mohou využívat raytracing jen z části.
Důležitou devizou GF100 je také možnost současného provozování několika kernelů (pro PhysX, DirectCompute atd.), které bylo už u minulé generace karet, ale zde narozdíl od starších generací díky většímu rozparcelování čipu na 16 SM už nemusí čekat, až ostatní dokončí úlohu a může s volným SM okamžitě přepnout na potřebný výpočet pod PhysX nebo DirectCompute. Výsledkem je vyšší výkon ve hrách - potažmo všech aplikacích využívajících výše zmiňovaných rozhraní.
Samozřejmě zde bude podpora pro CUDA, kde budete moci akcelerovat podporované aplikace, kterých v reálném životě není mnoho, ale najdete mezi nimi třeba Photoshop. Mezi další výhody můžeme už klasicky počítat technologie PureVideo HD a 3D brýle pro neobvyklý zážitek z hraní (pozor na epilepsii). Nvidia tedy Fermi uvádí nejen jako herní kartu, ale také jako GPGPU akcelerátor.