Snová karta v testu: jaký výkon má přetaktovaný TITAN RTX?

20.12.2018, Jan Vítek, aktualita

NVIDIA na začátku tohoto měsíce představila svou nejlepší desktopovou kartu, a sice TITAN RTX, která nabízí plnotučný čip TU102. Ten už byl otestován, a to přetaktovaný s využitím vodního chlazení.

Jak už dobře víme, nový TITAN RTX jde tak trochu proti proudu, a to v tom smyslu, že oproti předchozímu modelu nabízí vyšší výkon za nižší cenu, zatímco nové GeForce mají vyšší výkon, ale také i podstatně vyšší ceny. TITAN RTX se totiž bude prodávat za 2500 dolarů, což je o 500 méně než v případě TITAN V, což je pochopitelné vzhledem k tomu, že nová karta využívá o trošku menší čip složený z nižšího počtu tranzistorů (i tak je celkově výkonnější). Na druhou stranu ale nabízí 24 GB paměti GDDR6 oproti 12 GB GDDR5X, takže nám z toho prostě vychází, že NVIDIA dokázala cílovou skupinu zákazníků kupující karty TITAN potěšit i cenou, což se jí v případě herních GeForce nepodařilo.

Podívejme se nyní na to, jak se TITAN RTX předvedl v 3DMarku. Jeho 12nm čip Turing TU102 má tedy plnou výbavu, a to je 6 GPC, čili 72 SM a v nich celkem 4608 CUDA jader. Vedle nich tu máme také 576 jader Tensor a 72 RT, ale ta se v těchto testech nijak nepředvedla. Výchozí takty GPU jsou 1350 až 1770 MHz a paměti GDDR6 na 384bitové sběrnici pracují na efektivních 14 GHz, takže nabídnou 672 GB/s.

Díky tomu všemu karta nabízí v FP32 hrubý výkon 16,2 TFLOPS, zatímco TITAN V dosáhl 15 TFLOPS, zatímco neobsahoval žádná jádra RT, která zde poskytnou výkon 11 GRays/s či s ostatním hardwarem 84 biliónů RTX-OPS. Zde se bude hodit i vysvětlení toho, jak NVIDIA vůbec počítá výkon RTX-OPS. V případě samotných jader RT je to celkem jasné, tam jde o to, kolik virtuálních paprsků světla, které se ohýbají, lámou a odrážejí, dokáže karta simulovat za jednu sekundu, takže z toho pak máme hodnotu Rays/s.

V případě RTX-OPS je to ale daleko složitější, protože to je v podstatě jen jakýsi index kombinující výkon v FP32, INT32, TFLOPS v ray tracingu a TFLOPS v FP16 na jádrech Tensor. Vzorec je ten, že RTX-OPS = (TFLOPS FP32 * 0,8) + (TIPS INT 32 * 0,28) + (TFLOPS RT * 0,8) + (TFLOPS Tensor * 0,2). Z toho vyplývá, že největší důraz je v tomto indexu kladen na výkon jader RT. Výkon CUDA v FP32 se sice také násobí 0,8, ovšem vzhledem k tomu, že třeba taková GeForce RTX 2080 Ti Founders Edition má výkon 14 TFLOPS v FP32 a 100 TFLOPS na jádrech RT, výsledný index je z více než poloviny tvořen právě jejich výkonem. Platí pak, že její RTX-OPS je 77,9 jako výsledek 11,2 + 3,92 + 40 + 22,8 dle uvedeného vzorce.

Co se týče provedených testů, o nichž informují VideoCardz, ty byly provedeny na TITAN RTX s takty 2070 MHz na GPU a s 2025MHz paměťmi, což posunulo jejich propustnost na 778 GB/s a ani oněch 300 MHz navíc v případě GPU nebylo k zahození.

To přineslo v 3DMark Fire Strike skóre 31.862 bodů celkově a 41.109 bodů pro grafiku. Přetaktovaná GeForce RTX 2080 Ti na 2175 MHz (GPU) a 2025 MHz (paměti) dokáže ve stejném testu dosáhnout grafického skóre kolem 40.000 bodů, takže více CUDA jader na TITANu je znát, nicméně pro hráče je samozřejmě nesmysl pořizovat si TITAN RTX, když mu 2080 Ti zařídí jen o trošku nižší výkon za ani ne poloviční cenu.

Zdroj: VideoCardz