NVIDIA začala nabízet nové karty Tesla V100s

26.11.2019, Jan Vítek, aktualita

Aktualizováno: Na akci Supercomputing 2019 se objevila řada novinek a mezi nimi také karty NVIDIA Tesla s označením V100s. Jde opravdu o novinku, o kterou se ovšem NVIDIA zatím nebyla ochotna moc podělit.

Označení nové verze karet má asi zřejmě evokovat využití slova Super v moderních verzích herních GeForce. Na Supercomputing 2019 se ovšem objevilo označení NVIDIA V100s, kvůli němuž by si nejeden návštěvník mohl myslet, že výrobci prostě jen lákají na systémy vybavené několika kartami V100s. Dle Anandtechu ale má být V100s či V100S opravdu nová karta.

Jensen Huang dle dostupných informací měl tyto nové karty na dané akci představit, ale nakonec se o nich ve své dvouhodinové prezentaci pro tisk a partnery NVIDIE vůbec nezmínil. Ti už ale měli vytisknuté transparenty a samotné karty se ukazovaly v prezentovaných systémech, přičemž NVIDIA nikomu nesdělila, aby nové V100s zase ukryl a neukazoval.

V100s jsou oproti původním Teslám V100 rozlišeny už vizuálně, neboť zelenou barvu na nich nahradila zlatá. Zajímavé však je, že i na nových kartách je prosté označení V100, kvůli čemuž se tak ani neví, zda se má správně psát V100s nebo V100S.

Jde ale především o tom, co je skryto pod chladičem a čím se nová verze liší od staré a to se zjistit dosud nepodařilo. Alespoň ne přesně, takže můžeme zatím říci jen to, že nová verze má mít rychlejší paměti HBM2. Možná že jsou tedy rozdíly tak malé, že se NVIDIA nakonec rozhodla nové karty nepředstavovat a prostě je jen vyslat do oběhu, ale uvidíme.

Tesla V100 je také již dva a půl let stará karta využívající ještě GPU Volta, přičemž novější Tesla T4 s Turingem je výrazně slabší. Dá se tak očekávat, že NVIDIA v horizontu cca půl roku představí novou Teslu s GPU Ampere.

Aktualizace: NVIDIA nyní už odhalila i specifikace nové Tesly V100s, která skutečně získala rychlejší paměti. Vybavena je 32 GB HBM2 na 4096bitovém rozhraní s taktem 553 MHz, což je efektivně 1106 MHz oproti 876 MHz původní verze. Propustnost se tak zvedla z 900 GB/s na 1134 GB/s.

Takty GPU zmíněny nebyly, ovšem něco se změnit muselo, protože se dozvíme o výkonu 8,2 TFLOPS v FP64, zatímco starší verze měla 7 TFLOPS. V FP32 je to pak 16,4 TFLOPS oproti 14 TFLOPS a v DL-Ops to dělá 130 TFLOPS vs. 112 TFLOPS. TDP zůstalo na 250 W.

Zdroj: Anandtech