Architektura Ampere: jak NVIDIA vylepšila výkon nových GeForce?
9.9.2020, Jan Vítek, článek
Grafické karty NVIDIA generace Ampere představují největší výkonnostní skok po mnoha letech a my nyní čekáme na to, zda na něj bude společnost AMD schopna zareagovat. To si ale můžeme ukrátit článkem o samotné architektuře Ampere.
Kapitoly článku:
- Architektura Ampere: jak NVIDIA vylepšila výkon nových GeForce?
- Co se skrývá pod chladičem: konfigurace, CUDA, výkon
- Ray tracing, DLSS a paměti GDDR6X
NVIDIA nás dokázala dokonale překvapit, neboť do poslední chvíle se jí povedlo utajit pravdu o výbavě nových karet RTX 3000 generace Ampere. Sama dobře ví, že informace o nich unikají především od různých AIB výrobců, které lze těžko uhlídat, takže pokud chce něco utajit, musí mlčet i před nimi. A to je těžké, když AIB firmy či jiní výrobci podílející se na celém procesu musí už předem vědět, na čem pracují a musí mít k dispozici vzorky.
Právě díky tomu jsme se mohli dopředu dozvědět třeba o novém 12pinovém napájecím konektoru, podobě chladiče pro referenční verze a také o většině specifikací. Ovšem zatímco například kapacitu pamětí a šířku sběrnice NVIDIA kvůli výše uvedenému prostě nemá šanci utajit, pravou konfiguraci nových GPU pod pokličkou udržet může, neboť do nich nikdo nevidí. My jsme se přitom předem dozvěděli, že nové GeForce RTX využívají polovinu CUDA jader, než ve skutečnosti mají, takže je zřejmé, že je NVIDIA ve verzích pro vývoj karet v AIB společnostech či jiných nechala deaktivované.
A není divu, že si NVIDIA dala takovou práci se skrytím této skutečnosti, neboť jde o hlavní trumf, s nímž Ampere přichází na trh. Je tu sice jeden zakopaný pes, ovšem v praxi to přesto vypadá na velice dobré řešení, které jistě lidem z AMD přidělalo hodně vrásek na čele.
Společně s opravdovým počtem CUDA jader pro FP32 tak NVIDIA logicky do poslední chvíle utajila i skutečný výkon karet, samozřejmě i cenu, o níž se předem s nikým nemusela bavit a otázky také existovaly o použitém výrobním procesu, z nějž se nakonec vyklubala 8nm technologie firmy Samsung.
Model | NVIDIA GeForce RTX 3070 | NVIDIA GeForce RTX 3080 | NVIDIA GeForce RTX 3090 |
GPU | Ampere GA104-300 | Ampere GA102-200 | Ampere GA102-300 |
Výrobní proces | Samsung 8nm | Samsung 8nm | Samsung 8nm |
Velikost čipu | 395,2 mm2 | 628,4 mm2 | 628,4 mm2 |
Počet tranzistorů | 17,4 miliard | 28 miliard | 28 miliard |
CUDA jádra | 5888 | 8704 | 10496 |
TMU / ROP | ? | 272 / 96 | ? |
Tensor / RT | 184 / 46 | 272 / 68 | 328 / 82 |
Základní takt | 1500 MHz | 1440 MHz | 1400 MHz |
Turbo | 1730 MHz | 1710 MHz | 1700 MHz |
FP32 | 20 TFLOPs | 30 TFLOPs | 36 TFLOPs |
RT TFLOPS | 40 TFLOPs | 58 TFLOPs | 69 TFLOPs |
Tensor-TOPS | 163 TOPs | 238 TOPs | 285 TOPs |
Paměti | 8 GB GDDR6 | 10 GB GDDR6X | 24 GB GDDR6X |
Sběrnice | 256-bit | 320-bit | 384-bit |
Propustnost na pin | 14 Gbps | 19 Gbps | 19,5 Gbps |
Celková propustnost | 448 Gbps | 760 Gbps | 936 Gbps |
TDP | 220 W | 320 W | 350 W |
Cena | $499 US | $699 US | $1499 US |
Dostupnost | říjen 2020 | 17. září 2020 | 24. září 2020 |
Specifikace nových RTX 3090, 3080 a 3070 jsou už téměř celé známé a my se můžeme nejdříve zaměřit na samotné čipy. Ty se samy o sobě zmenšily, zatímco počet tranzistorů výrazně narostl, takže je otázka, jak je to vůbec s novým 8nm procesem Samsungu, neboť dle těchto údajů to nevypadá jen na trochu vylepšený 10nm proces, ale uvidíme.
Čip GA102 je o více než 100 mm2 menší než TU102, přičemž počet tranzistorů je vyšší o téměř 10 miliard. Téměř jej tak dohání GA104 se 17,4 miliardami (vs. 18,6 mld.), přičemž kontrast mezi velikostí čipů je zřejmý: 395 vs. 754 mm2. Hustota tranzistorů je tak v porovnání s 12nm FinFET firmy TSMC mnohem vyšší, a to odhadem asi o 80 %. Čip TU102 byl dle velikosti a počtu tranzistorů vyroben s hustotou 24,7 MT/mm2 (MT - milion tranzistorů), zatímco GA102 dosahuje 44,6 MT/mm2.
výrobci už ukazují své RTX 3000
Ovšem ani to by zdaleka nestačilo, aby mohl třeba čip GA104 nabídnout 5888 CUDA jader, neboť to je mnohem více, než obsahuje jakákoliv verze z hlediska počtu tranzistorů složitějšího čipu TU102 (max. 4608 CUDA). I z toho je zřejmé, že NVIDIA musela nějakým způsobem zasáhnout do architektury, zvláště když se musí počítat i s vyšším výkonem jader RT a Tensor. A my už víme, jaký způsob využila.
Vedle toho všeho je navíc podstatný i ten fakt, že RTX 3080 jako nástupkyně RTX 2080, a to dle označení i ceny, se dle použitého čipu GA102 posunula v hierarchii o stupeň výš. Využívá pochopitelně osekanou verzi tohoto GPU, ale i tak obsahuje 83 % CUDA jader z čipu GA102-300.
A pokud dáme dohromady vylepšenou architekturu s efektivně dvojnásobným počtem CUDA jader, větší čip s podstatně vyšší hustotou tranzistorů, nové výkonnější paměti a stejnou cenu, máme tu čtyři hlavní důvody pro oprávněné nadšení z nové generace firmy NVIDIA.
Toto nadšení ale může velice rychle opadnout, pokud se ukáže, že nových GeForce bude do konce roku opravdu velký nedostatek. Odkazovaná zpráva na serveru TweakTown totiž tvrdí, že 8nm proces má v této době příliš nízkou výtěžnost a NVIDIA se kvůli ní zdráhá nechat Samsung výrobu řádně rozjet, než se chybovost sníží. Zda je to pravda, to nevíme, ale nesporné je to, že v současné době NVIDIA nad AMD drží výkonnostní nadvládu a nepociťuje z jeho strany tlak. To dobře ilustruje její 80% podíl na trhu se samostatnými grafickými kartami.
Na druhou stranu lze říci, že nové RTX 3000 konkurují v podstatě všemu, respektive odsouvají všechny předchozí modely do pozadí zájmu. Pouze takový zákazník, který je sice dobře informovaný, ale není ochoten si počkat (anebo je z hlediska výkonu nihilista), může mít dnes zájem o grafické karty z řad RTX 2000, GTX 1600 či AMD Navi. Jedinou možností je ulovit novou kartu za velice zajímavou cenu, což jsou spíše výjimky, jako spatřená MSI GeForce RTX 2080 Ti GAMING X TRIO za 23 tisíc. Ceny klesat mohou, ale spíše se lze připravit na to, že RTX 2000 spíše postupně zmizí z trhu a výhodnou nabídku do té doby představovat nebudou. Ještě je tu také bazar, ovšem to už je kapitola sama pro sebe. My nyní načneme také novou kapitolu, ale ta už bude o architektuře generace Ampere.