NVIDIA A2: akcelerátor pro edgovou umělou inteligenci
9.11.2021, Jan Vítek, aktualita
NVIDIA si na svou podzimní GTC nepřipravila žádné průlomové novinky z hlediska nových AI či grafických architektur, ale hardwaru představila dost, a to včetně akcelerátorů A2 založených na generaci Ampere.
NVIDIA A2 nemůžeme pokládat jako low-end vycházející z výpočetních a ne herních verzí čipů Ampere, jaké využívají známé A100 a A30, ale o tom více později. Jde o malé a úsporné karty zaměřené na nasazení pro AI inference v edge computingu a můžeme je pokládat za moderní náhradu akcelerátoru NVIDIA T4, který měl stejné určení a také přišel ve stejném HHHL formátu, čili s poloviční výškou a délkou karty.
Server Anandtech tak může mluvit o amperifikaci akcelerátorové nabídky firmy NVIDIA a my se můžeme podívat na dostupné specifikace:
NVIDIA Axxx ML akcelerátory | |||||
A100 | A30 | A2 | |||
FP32 CUDA Cores | 6912 | 3584 | 1280 | ||
Tensor Cores | 432 | 224 | 40 | ||
Boost Clock | 1,41GHz | 1,44GHz | 1,77GHz | ||
Memory Clock | 3,2Gbps HBM2e | 2,4Gbps HBM2 | 12,5Gbps GDDR6 | ||
Memory Bus Width | 5120-bit | 3072-bit | 128-bit | ||
Memory Bandwidth | 2,0TB/sec | 933GB/sec | 200GB/sec | ||
VRAM | 80GB | 24GB | 16GB | ||
Single Precision | 19,5 TFLOPS | 10,3 TFLOPS | 4,5 TFLOPS | ||
Double Precision | 9,7 TFLOPS | 5,2 TFLOPS | 0,14 TFLOPS | ||
INT8 Tensor | 624 TOPS | 330 TOPS | 36 TOPS | ||
FP16 Tensor | 312 TFLOPS | 165 TFLOPS | 18 TFLOPS | ||
TF32 Tensor | 156 TFLOPS | 82 TFLOPS | 9 TFLOPS | ||
Rozhraní | NVLink 3 12 Links |
PCIe 4.0 x16 + NVLink 3 (4 Links) |
PCIe 4.0 x8 | ||
GPU | GA100 | GA100 | GA107 | ||
Počet tranzistorů | 54,2 mld. | 54,2 mld. | ? | ||
TDP | 400W | 165W | 42-60W | ||
Výrobní proces | TSMC 7N | TSMC 7N | Samsung 8nm | ||
Formát | SXM4 | SXM4 | HHHL-SS PCIe | ||
Architektura GPU | Ampere | Ampere | Ampere |
Jak můžeme vidět, jde o další produkt založený na GPU GA107, čili z herní verze Ampere, na kterou ale v případě desktopových karet stále ještě čekáme (GeForce RTX 3050), zatímco takové mobilní verze už jsou tu od května. Je tak zřejmé, že tato karta bude využívat paměti GDDR6, a to na 128bitovém rozhraní, ovšem se slušnou kapacitou 16 GB. Výkon přitom dosahuje slušných 4,5 TFLOPS, ale vzhledem k nasazení herního GPU není divu, že tu chybí hardware pro adekvátní výkon v FP64, v nichž je karta velice pomalá a velká sláva to není ani v TOPS či FP16 Tensor a TF32 Tensor. Na druhou stranu si tato karta vezme maximálně jen 60 W, anebo také jen 42 W díky možnosti konfigurace.
NVIDIA A2 je již nabízena na trhu, ale jako obvykle se nedozvíme její cenu, neboť o tom se NVIDIA v případě serverového hardwaru nešíří.