Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

NVIDIA A2: akcelerátor pro edgovou umělou inteligenci

9.11.2021, Jan Vítek, aktualita
NVIDIA A2: akcelerátor pro edgovou umělou inteligenci
NVIDIA si na svou podzimní GTC nepřipravila žádné průlomové novinky z hlediska nových AI či grafických architektur, ale hardwaru představila dost, a to včetně akcelerátorů A2 založených na generaci Ampere. 
NVIDIA A2 nemůžeme pokládat jako low-end vycházející z výpočetních a ne herních verzí čipů Ampere, jaké využívají známé A100 a A30, ale o tom více později. Jde o malé a úsporné karty zaměřené na nasazení pro AI inference v edge computingu a můžeme je pokládat za moderní náhradu akcelerátoru NVIDIA T4, který měl stejné určení a také přišel ve stejném HHHL formátu, čili s poloviční výškou a délkou karty. 
 
 
Server Anandtech tak může mluvit o amperifikaci akcelerátorové nabídky firmy NVIDIA a my se můžeme podívat na dostupné specifikace: 
 
NVIDIA Axxx ML akcelerátory
  A100 A30 A2
FP32 CUDA Cores 6912 3584 1280
Tensor Cores 432 224 40
Boost Clock 1,41GHz 1,44GHz 1,77GHz
Memory Clock 3,2Gbps HBM2e 2,4Gbps HBM2 12,5Gbps GDDR6
Memory Bus Width 5120-bit 3072-bit 128-bit
Memory Bandwidth 2,0TB/sec 933GB/sec 200GB/sec
VRAM 80GB 24GB 16GB
Single Precision 19,5 TFLOPS 10,3 TFLOPS 4,5 TFLOPS
Double Precision 9,7 TFLOPS 5,2 TFLOPS 0,14 TFLOPS
INT8 Tensor 624 TOPS 330 TOPS 36 TOPS
FP16 Tensor 312 TFLOPS 165 TFLOPS 18 TFLOPS
TF32 Tensor 156 TFLOPS 82 TFLOPS 9 TFLOPS
Rozhraní NVLink 3
12 Links
PCIe 4.0 x16 +
NVLink 3 (4 Links)
PCIe 4.0 x8
GPU GA100 GA100 GA107
Počet tranzistorů 54,2 mld. 54,2 mld. ?
TDP 400W 165W 42-60W
Výrobní proces TSMC 7N TSMC 7N Samsung 8nm
Formát SXM4 SXM4 HHHL-SS PCIe
Architektura GPU Ampere Ampere Ampere
 
Jak můžeme vidět, jde o další produkt založený na GPU GA107, čili z herní verze Ampere, na kterou ale v případě desktopových karet stále ještě čekáme (GeForce RTX 3050), zatímco takové mobilní verze už jsou tu od května. Je tak zřejmé, že tato karta bude využívat paměti GDDR6, a to na 128bitovém rozhraní, ovšem se slušnou kapacitou 16 GB. Výkon přitom dosahuje slušných 4,5 TFLOPS, ale vzhledem k nasazení herního GPU není divu, že tu chybí hardware pro adekvátní výkon v FP64, v nichž je karta velice pomalá a velká sláva to není ani v TOPS či FP16 Tensor a TF32 Tensor. Na druhou stranu si tato karta vezme maximálně jen 60 W, anebo také jen 42 W díky možnosti konfigurace.
 
NVIDIA A2 je již nabízena na trhu, ale jako obvykle se nedozvíme její cenu, neboť o tom se NVIDIA v případě serverového hardwaru nešíří.