Společnost Microsoft představila druhou generaci svého AI procesoru Maia 200. Ten je určen především pro inferenci AI algoritmů, a to dost efektivně.
Co je RTX AI
Web Světhardware.cz přináší velký přehled o NVIDIA RTX AI ve vašem počítači a popisuje spolehlivou a bezpečnou cestu, jak si na svém počítači vytvořit lokální umělou inteligenci.
V oblasti AI máme několik řešení na bázi GPU, přičemž trhu vévodí zejména společnost Nvidia, existují ale také specializované procesory, které se vyvíjí samotné firmy s datovými centry, jako je Meta, Google, Amazon nebo Microsoft. A právě Microsoft nyní představuje novou generaci procesorů Maia 200, které jsou určené zejména pro inferenci AI algoritmů. Nemíří tedy na trénování algoritmů umělé inteligence, v tomto přenechává roli spíše Nvidii, zaměřuje se ale na co nejefektivnější běh těchto výsledných algoritmů. Novinka je tak vyrobena pomocí 3nm procesu TSMC a optimalizována je především na výpočty v FP4 a FP8.
Systém je vybaven 216 GB paměti HBM3e s propustností 7 TB/s a nechybí ani 272 MB on-chip paměti SRAM. Celý čip Maia 200 má 140 miliard tranzistorů a v FP4 slibuje výkon 10 PFLOPS, v FP8 je to pak 5 TFLOPS. Pokud jde o spotřebu, TDP byla stanovena na 750 W. Ve výsledku tak v FP4 překonává konkurenční AWS Trainium3 4násobně, v FP8 pak 2násobně.
Maia 200 by měla být vhodná např. na běh modelu GPT-5.2 od OpenAI a vylepšit výkon na dolar pro služby Microsoft Foundry a Microsoft 365 Copilot. Ačkoli má vyšší spotřebu než předchozí generace, díky výrazně vyššímu výkonu má být lepší o 30 % v poměru výkonu na dolar. Procesory jsou už instalovány v americkém datacentru u Des Moines v Iowě.