NVIDIA A2: akcelerátor pro edgovou umělou inteligenci

9.11.2021, Jan Vítek, aktualita

NVIDIA si na svou podzimní GTC nepřipravila žádné průlomové novinky z hlediska nových AI či grafických architektur, ale hardwaru představila dost, a to včetně akcelerátorů A2 založených na generaci Ampere.

NVIDIA A2 nemůžeme pokládat jako low-end vycházející z výpočetních a ne herních verzí čipů Ampere, jaké využívají známé A100 a A30, ale o tom více později. Jde o malé a úsporné karty zaměřené na nasazení pro AI inference v edge computingu a můžeme je pokládat za moderní náhradu akcelerátoru NVIDIA T4, který měl stejné určení a také přišel ve stejném HHHL formátu, čili s poloviční výškou a délkou karty.

Server Anandtech tak může mluvit o amperifikaci akcelerátorové nabídky firmy NVIDIA a my se můžeme podívat na dostupné specifikace:

NVIDIA Axxx ML akcelerátory
	A100	A30	A2
FP32 CUDA Cores	6912	3584	1280
Tensor Cores	432	224	40
Boost Clock	1,41GHz	1,44GHz	1,77GHz
Memory Clock	3,2Gbps HBM2e	2,4Gbps HBM2	12,5Gbps GDDR6
Memory Bus Width	5120-bit	3072-bit	128-bit
Memory Bandwidth	2,0TB/sec	933GB/sec	200GB/sec
VRAM	80GB	24GB	16GB
Single Precision	19,5 TFLOPS	10,3 TFLOPS	4,5 TFLOPS
Double Precision	9,7 TFLOPS	5,2 TFLOPS	0,14 TFLOPS
INT8 Tensor	624 TOPS	330 TOPS	36 TOPS
FP16 Tensor	312 TFLOPS	165 TFLOPS	18 TFLOPS
TF32 Tensor	156 TFLOPS	82 TFLOPS	9 TFLOPS
Rozhraní	NVLink 3 12 Links	PCIe 4.0 x16 + NVLink 3 (4 Links)	PCIe 4.0 x8
GPU	GA100	GA100	GA107
Počet tranzistorů	54,2 mld.	54,2 mld.	?
TDP	400W	165W	42-60W
Výrobní proces	TSMC 7N	TSMC 7N	Samsung 8nm
Formát	SXM4	SXM4	HHHL-SS PCIe
Architektura GPU	Ampere	Ampere	Ampere

Jak můžeme vidět, jde o další produkt založený na GPU GA107, čili z herní verze Ampere, na kterou ale v případě desktopových karet stále ještě čekáme (GeForce RTX 3050), zatímco takové mobilní verze už jsou tu od května. Je tak zřejmé, že tato karta bude využívat paměti GDDR6, a to na 128bitovém rozhraní, ovšem se slušnou kapacitou 16 GB. Výkon přitom dosahuje slušných 4,5 TFLOPS, ale vzhledem k nasazení herního GPU není divu, že tu chybí hardware pro adekvátní výkon v FP64, v nichž je karta velice pomalá a velká sláva to není ani v TOPS či FP16 Tensor a TF32 Tensor. Na druhou stranu si tato karta vezme maximálně jen 60 W, anebo také jen 42 W díky možnosti konfigurace.

NVIDIA A2 je již nabízena na trhu, ale jako obvykle se nedozvíme její cenu, neboť o tom se NVIDIA v případě serverového hardwaru nešíří.