NVIDIA Tesla M40 a M4: Maxwell pro strojové učení

12.11.2015, Jan Vítek, aktualita

Vedle modulu Jetson TX1 si NVIDIA připravila také nové akcelerátory Tesla M40 a M4. Ty jsou určeny pro datová centra a zaměřují se také na oblast hlubokých neuronových sítí a strojového učení, kde se má nyní odehrávat revoluce.

Šéf NVIDIE Jen-Hsun Huang podotkl, že začal závod ve vývoji autonomní a samostatně se učící umělé inteligence důležité pro další pokrok v automobilismu nebo zdravotnictví, což umožnil nástup moderního hardwaru, který poskytuje potřebný výkon. Tam patří i nový modul Jetson TX1 a nyní představené akcelerátory Tesla M40 a M4, které mají společné to, že jsou založeny na architektuře Maxwell používané již rok herními grafickými kartami.

Nicméně již před dvěma měsíci NVIDIA představila první karty Tesla založené na architektuře Maxwell, tedy Tesla M60 a M6 určené pro GRID a založené na čipech GM204. Nyní jde o karty využívající čipy GM200 a GM206, které dostaly označení Hyperscale Accelerator. Všechny čtyři jsou určené pro strojové učení, na něž se NVIDIA více zaměřuje od minulého roku nabízejíc Tesla Accelerated Computing Platform.

NVIDIA Tesla M40 Accelerator je založen na nejlepším GPU Maxwell, tedy GM200 s 3072 CUDA jádry, 192 TMU a 96 ROP. Tato karta pracuje na max. 1140 MHz a vybavena je 12 GB paměti GDDR5 na 6 GHz se 384bitovou sběrnicí (propustnost 288 GB/s). Jejím maximem je 7 TFLOPS (FP32), ovšem v double precision (FP64) je to pouze 0,21 TFLOPS, ale to se o Maxwellech ví již dlouho. Tento nepoměr mají změnit až GPU další generace Pascal. TDP této karty je 250 W a chlazení se bude spoléhat na samotný server a jeho systém.

Tesla M4 je s GM206 značně slabší a má pouze 1024 CUDA jader, 64 TMU a 32 ROP, pracuje na max. 1075 MHz a má 4 GB GDDR5 na 5,5 GHz a 128bitové sběrnici (88 GB/s). Pokud se předchozí karta tedy blíží svými specifikacemi TITANu X, pak toto je profesionální bratříček GeForce GTX 960. Tato karta má konfigurovatelné TDP od 50 do 75 W a nabízí výkon 2.2 TFLOPS (FP32) a 0,07 TFLOPS (FP64).

Nyní má tedy NVIDIA v nabídce následující moderní hardware Tesla:

	NVIDIA Tesla M60	NVIDIA Tesla M40	NVIDIA Tesla M6	NVIDIA Tesla M4	NVIDIA Grid K2	NVIDIA Grid K1
GPU	GM204	GM200	GM204	GM206	GK104	GK104
GPU jádra	2048 x 2 - 4096 CUDA	3072 CUDA	1536 CUDA	1024 CUDA	1536 x 2 - 3072 CUDA	192 x 4 - 768 CUDA
Paměti	16 GB GDDR5 (8 GB x 2)	12 GB GDDR5	8 GB GDDR5	4 GB GDDR5	8 GB GDDR5 (4 GB x 2)	16 GB DDR3 (4 GB x 4)
Sběrnice	256bit x 2	384bit	256bit	128bit	256bit x 2	64bit
Max. počet uživatelů	36	určeno pro Deep Learning	18	určeno pro Deep Learning	32	16
H.264 (1080P @ 30 FPS) streamy	2-32	určeno pro Deep Learning	1-16	určeno pro Deep Learning	2-12	1-8
Formát	Dual-Slot PCI-Express	Dual Slot PCI-Express (pasivní chlazení)	MXM karta	Single Slot PCI-Express (nízký profil, pasivní chlazení)	Dual-Slot PCI-Express	Dual-Slot PCI-Express
TDP	300W	250W	100W	50-75W	225W	130W

Zdroj: NVIDIA