Architektura Ampere: jak NVIDIA vylepšila výkon nových GeForce?

9.9.2020, Jan Vítek, článek

Grafické karty NVIDIA generace Ampere představují největší výkonnostní skok po mnoha letech a my nyní čekáme na to, zda na něj bude společnost AMD schopna zareagovat. To si ale můžeme ukrátit článkem o samotné architektuře Ampere.

Kapitoly článku:

Architektura Ampere: jak NVIDIA vylepšila výkon nových GeForce?
Co se skrývá pod chladičem: konfigurace, CUDA, výkon
Ray tracing, DLSS a paměti GDDR6X

NVIDIA nás dokázala dokonale překvapit, neboť do poslední chvíle se jí povedlo utajit pravdu o výbavě nových karet RTX 3000 generace Ampere. Sama dobře ví, že informace o nich unikají především od různých AIB výrobců, které lze těžko uhlídat, takže pokud chce něco utajit, musí mlčet i před nimi. A to je těžké, když AIB firmy či jiní výrobci podílející se na celém procesu musí už předem vědět, na čem pracují a musí mít k dispozici vzorky.

Právě díky tomu jsme se mohli dopředu dozvědět třeba o novém 12pinovém napájecím konektoru, podobě chladiče pro referenční verze a také o většině specifikací. Ovšem zatímco například kapacitu pamětí a šířku sběrnice NVIDIA kvůli výše uvedenému prostě nemá šanci utajit, pravou konfiguraci nových GPU pod pokličkou udržet může, neboť do nich nikdo nevidí. My jsme se přitom předem dozvěděli, že nové GeForce RTX využívají polovinu CUDA jader, než ve skutečnosti mají, takže je zřejmé, že je NVIDIA ve verzích pro vývoj karet v AIB společnostech či jiných nechala deaktivované.

A není divu, že si NVIDIA dala takovou práci se skrytím této skutečnosti, neboť jde o hlavní trumf, s nímž Ampere přichází na trh. Je tu sice jeden zakopaný pes, ovšem v praxi to přesto vypadá na velice dobré řešení, které jistě lidem z AMD přidělalo hodně vrásek na čele.

Společně s opravdovým počtem CUDA jader pro FP32 tak NVIDIA logicky do poslední chvíle utajila i skutečný výkon karet, samozřejmě i cenu, o níž se předem s nikým nemusela bavit a otázky také existovaly o použitém výrobním procesu, z nějž se nakonec vyklubala 8nm technologie firmy Samsung.

Model	NVIDIA GeForce RTX 3070	NVIDIA GeForce RTX 3080	NVIDIA GeForce RTX 3090
GPU	Ampere GA104-300	Ampere GA102-200	Ampere GA102-300
Výrobní proces	Samsung 8nm	Samsung 8nm	Samsung 8nm
Velikost čipu	395,2 mm²	628,4 mm²	628,4 mm²
Počet tranzistorů	17,4 miliard	28 miliard	28 miliard
CUDA jádra	5888	8704	10496
TMU / ROP	?	272 / 96	?
Tensor / RT	184 / 46	272 / 68	328 / 82
Základní takt	1500 MHz	1440 MHz	1400 MHz
Turbo	1730 MHz	1710 MHz	1700 MHz
FP32	20 TFLOPs	30 TFLOPs	36 TFLOPs
RT TFLOPS	40 TFLOPs	58 TFLOPs	69 TFLOPs
Tensor-TOPS	163 TOPs	238 TOPs	285 TOPs
Paměti	8 GB GDDR6	10 GB GDDR6X	24 GB GDDR6X
Sběrnice	256-bit	320-bit	384-bit
Propustnost na pin	14 Gbps	19 Gbps	19,5 Gbps
Celková propustnost	448 Gbps	760 Gbps	936 Gbps
TDP	220 W	320 W	350 W
Cena	$499 US	$699 US	$1499 US
Dostupnost	říjen 2020	17. září 2020	24. září 2020

Specifikace nových RTX 3090, 3080 a 3070 jsou už téměř celé známé a my se můžeme nejdříve zaměřit na samotné čipy. Ty se samy o sobě zmenšily, zatímco počet tranzistorů výrazně narostl, takže je otázka, jak je to vůbec s novým 8nm procesem Samsungu, neboť dle těchto údajů to nevypadá jen na trochu vylepšený 10nm proces, ale uvidíme.

Čip GA102 je o více než 100 mm² menší než TU102, přičemž počet tranzistorů je vyšší o téměř 10 miliard. Téměř jej tak dohání GA104 se 17,4 miliardami (vs. 18,6 mld.), přičemž kontrast mezi velikostí čipů je zřejmý: 395 vs. 754 mm². Hustota tranzistorů je tak v porovnání s 12nm FinFET firmy TSMC mnohem vyšší, a to odhadem asi o 80 %. Čip TU102 byl dle velikosti a počtu tranzistorů vyroben s hustotou 24,7 MT/mm² (MT - milion tranzistorů), zatímco GA102 dosahuje 44,6 MT/mm².

výrobci už ukazují své RTX 3000

Ovšem ani to by zdaleka nestačilo, aby mohl třeba čip GA104 nabídnout 5888 CUDA jader, neboť to je mnohem více, než obsahuje jakákoliv verze z hlediska počtu tranzistorů složitějšího čipu TU102 (max. 4608 CUDA). I z toho je zřejmé, že NVIDIA musela nějakým způsobem zasáhnout do architektury, zvláště když se musí počítat i s vyšším výkonem jader RT a Tensor. A my už víme, jaký způsob využila.

Vedle toho všeho je navíc podstatný i ten fakt, že RTX 3080 jako nástupkyně RTX 2080, a to dle označení i ceny, se dle použitého čipu GA102 posunula v hierarchii o stupeň výš. Využívá pochopitelně osekanou verzi tohoto GPU, ale i tak obsahuje 83 % CUDA jader z čipu GA102-300.

A pokud dáme dohromady vylepšenou architekturu s efektivně dvojnásobným počtem CUDA jader, větší čip s podstatně vyšší hustotou tranzistorů, nové výkonnější paměti a stejnou cenu, máme tu čtyři hlavní důvody pro oprávněné nadšení z nové generace firmy NVIDIA.

Toto nadšení ale může velice rychle opadnout, pokud se ukáže, že nových GeForce bude do konce roku opravdu velký nedostatek. Odkazovaná zpráva na serveru TweakTown totiž tvrdí, že 8nm proces má v této době příliš nízkou výtěžnost a NVIDIA se kvůli ní zdráhá nechat Samsung výrobu řádně rozjet, než se chybovost sníží. Zda je to pravda, to nevíme, ale nesporné je to, že v současné době NVIDIA nad AMD drží výkonnostní nadvládu a nepociťuje z jeho strany tlak. To dobře ilustruje její 80% podíl na trhu se samostatnými grafickými kartami.

Na druhou stranu lze říci, že nové RTX 3000 konkurují v podstatě všemu, respektive odsouvají všechny předchozí modely do pozadí zájmu. Pouze takový zákazník, který je sice dobře informovaný, ale není ochoten si počkat (anebo je z hlediska výkonu nihilista), může mít dnes zájem o grafické karty z řad RTX 2000, GTX 1600 či AMD Navi. Jedinou možností je ulovit novou kartu za velice zajímavou cenu, což jsou spíše výjimky, jako spatřená MSI GeForce RTX 2080 Ti GAMING X TRIO za 23 tisíc. Ceny klesat mohou, ale spíše se lze připravit na to, že RTX 2000 spíše postupně zmizí z trhu a výhodnou nabídku do té doby představovat nebudou. Ještě je tu také bazar, ovšem to už je kapitola sama pro sebe. My nyní načneme také novou kapitolu, ale ta už bude o architektuře generace Ampere.