Společnost AMD rozšiřuje svoje pole působnosti na poli AI akcelerátorů. Uvádí nový model Instinct MI350P pro PCIe slot.
Dalším střípkem společnosti AMD směrem dopředu v oblasti umělé inteligence je AI akcelerátor Instinct MI350P, což je karta do slotu PCIe Gen5 x16 a je určena pro standardní vzduchem chlazené servery. Mělo by jít o cenově efektivní řešení tam, kde je potřeba výkonných AI čipů, ale není potřeba obrovských racků a dedikované GPU platformy. I tak je ale možné párovat v systému až 8 takových karet. Určené jsou především pro inferenci AI modelů.
Postaveny jsou na architektuře CDNA4 a ve výrobě se používá mix 3nm a 6nm technologií pro různé části čipu. Ten má 128 CU, což je dvojnásobek toho, co má běžný herní Radeon RX 9070 XT. Je zde tedy 8192 stream procesorů a 512 Matrix Cores. Ve výsledku tu máme 73 miliard tranzistorů.
Zatímco RX 9070 XT vrcholí taktem 2,97 GHz, zde jde o nižších 2,2 GHz, takže výkon nebude až dvojnásobný a např. v FP32 se dostal ze 48,7 TFLOPS na 72 TFLOPS. Tím překonává GeForce RTX 5080 s 56,3 TFLOPS. Stinnou stránkou je ale spotřeba, která činí 600W TBP, tedy ještě o 25 W více než u RTX 5090 se 104,8 TFLOPS. Konfigurovat se dá nicméně až ke 450 W a spotřebu snížit. Zajímavostí je i to, že má 2slotové pasivní chlazení. Pokud jde o napájení, využit je konektor 12V-2x6.
Toto je ale karta zejména pro AI nasazení, takže více než FP32 bude zajímavý spíše výkon 4600 TFLOPS v MXFP4 nebo 2,3 PFLOPS s FP16 (Structured Sparsity). V INT8 je pak výkon 2,3 POPS, resp. 4,6 POPS v závislosti na řídkosti matic. Karta má 128 MB LLC paměti a 144 GB HBM3E, která běží na 4096bitové sběrnici a dosahuje vysoké datové propustnosti 4 TB/s.