NVIDIA Tesla M40 a M4: Maxwell pro strojové učení
12.11.2015, Jan Vítek, aktualita
Vedle modulu Jetson TX1 si NVIDIA připravila také nové akcelerátory Tesla M40 a M4. Ty jsou určeny pro datová centra a zaměřují se také na oblast hlubokých neuronových sítí a strojového učení, kde se má nyní odehrávat revoluce.
Šéf NVIDIE Jen-Hsun Huang podotkl, že začal závod ve vývoji autonomní a samostatně se učící umělé inteligence důležité pro další pokrok v automobilismu nebo zdravotnictví, což umožnil nástup moderního hardwaru, který poskytuje potřebný výkon. Tam patří i nový modul Jetson TX1 a nyní představené akcelerátory Tesla M40 a M4, které mají společné to, že jsou založeny na architektuře Maxwell používané již rok herními grafickými kartami.
Nicméně již před dvěma měsíci NVIDIA představila první karty Tesla založené na architektuře Maxwell, tedy Tesla M60 a M6 určené pro GRID a založené na čipech GM204. Nyní jde o karty využívající čipy GM200 a GM206, které dostaly označení Hyperscale Accelerator. Všechny čtyři jsou určené pro strojové učení, na něž se NVIDIA více zaměřuje od minulého roku nabízejíc Tesla Accelerated Computing Platform.
NVIDIA Tesla M40 Accelerator je založen na nejlepším GPU Maxwell, tedy GM200 s 3072 CUDA jádry, 192 TMU a 96 ROP. Tato karta pracuje na max. 1140 MHz a vybavena je 12 GB paměti GDDR5 na 6 GHz se 384bitovou sběrnicí (propustnost 288 GB/s). Jejím maximem je 7 TFLOPS (FP32), ovšem v double precision (FP64) je to pouze 0,21 TFLOPS, ale to se o Maxwellech ví již dlouho. Tento nepoměr mají změnit až GPU další generace Pascal. TDP této karty je 250 W a chlazení se bude spoléhat na samotný server a jeho systém.
Tesla M4 je s GM206 značně slabší a má pouze 1024 CUDA jader, 64 TMU a 32 ROP, pracuje na max. 1075 MHz a má 4 GB GDDR5 na 5,5 GHz a 128bitové sběrnici (88 GB/s). Pokud se předchozí karta tedy blíží svými specifikacemi TITANu X, pak toto je profesionální bratříček GeForce GTX 960. Tato karta má konfigurovatelné TDP od 50 do 75 W a nabízí výkon 2.2 TFLOPS (FP32) a 0,07 TFLOPS (FP64).
Nyní má tedy NVIDIA v nabídce následující moderní hardware Tesla:
Zdroj: NVIDIA
Nicméně již před dvěma měsíci NVIDIA představila první karty Tesla založené na architektuře Maxwell, tedy Tesla M60 a M6 určené pro GRID a založené na čipech GM204. Nyní jde o karty využívající čipy GM200 a GM206, které dostaly označení Hyperscale Accelerator. Všechny čtyři jsou určené pro strojové učení, na něž se NVIDIA více zaměřuje od minulého roku nabízejíc Tesla Accelerated Computing Platform.
NVIDIA Tesla M40 Accelerator je založen na nejlepším GPU Maxwell, tedy GM200 s 3072 CUDA jádry, 192 TMU a 96 ROP. Tato karta pracuje na max. 1140 MHz a vybavena je 12 GB paměti GDDR5 na 6 GHz se 384bitovou sběrnicí (propustnost 288 GB/s). Jejím maximem je 7 TFLOPS (FP32), ovšem v double precision (FP64) je to pouze 0,21 TFLOPS, ale to se o Maxwellech ví již dlouho. Tento nepoměr mají změnit až GPU další generace Pascal. TDP této karty je 250 W a chlazení se bude spoléhat na samotný server a jeho systém.
Tesla M4 je s GM206 značně slabší a má pouze 1024 CUDA jader, 64 TMU a 32 ROP, pracuje na max. 1075 MHz a má 4 GB GDDR5 na 5,5 GHz a 128bitové sběrnici (88 GB/s). Pokud se předchozí karta tedy blíží svými specifikacemi TITANu X, pak toto je profesionální bratříček GeForce GTX 960. Tato karta má konfigurovatelné TDP od 50 do 75 W a nabízí výkon 2.2 TFLOPS (FP32) a 0,07 TFLOPS (FP64).
Nyní má tedy NVIDIA v nabídce následující moderní hardware Tesla:
NVIDIA Tesla M60 | NVIDIA Tesla M40 | NVIDIA Tesla M6 | NVIDIA Tesla M4 | NVIDIA Grid K2 | NVIDIA Grid K1 | |
GPU | GM204 | GM200 | GM204 | GM206 | GK104 | GK104 |
GPU jádra | 2048 x 2 - 4096 CUDA | 3072 CUDA | 1536 CUDA | 1024 CUDA | 1536 x 2 - 3072 CUDA | 192 x 4 - 768 CUDA |
Paměti | 16 GB GDDR5 (8 GB x 2) | 12 GB GDDR5 | 8 GB GDDR5 | 4 GB GDDR5 | 8 GB GDDR5 (4 GB x 2) | 16 GB DDR3 (4 GB x 4) |
Sběrnice | 256bit x 2 | 384bit | 256bit | 128bit | 256bit x 2 | 64bit |
Max. počet uživatelů | 36 | určeno pro Deep Learning | 18 | určeno pro Deep Learning | 32 | 16 |
H.264 (1080P @ 30 FPS) streamy | 2-32 | určeno pro Deep Learning | 1-16 | určeno pro Deep Learning | 2-12 | 1-8 |
Formát | Dual-Slot PCI-Express | Dual Slot PCI-Express (pasivní chlazení) | MXM karta | Single Slot PCI-Express (nízký profil, pasivní chlazení) | Dual-Slot PCI-Express | Dual-Slot PCI-Express |
TDP | 300W | 250W | 100W | 50-75W | 225W | 130W |
Zdroj: NVIDIA