Čipy pro trénování AI nedělá jen Nvidia. Své čipy má i společnost Amazon, která před několika dny představila novou generaci čipů Trainium3.
I když má na trhu s čipy pro trénování AI společnost Nvidia téměř monopol, nějaká ta konkurence přece jen existuje. Docela se začalo dařit AMD s čipy Instinct, existují ale i další řešení, která si vyvíjí velké cloudové společnosti pro sebe. Mezi ně patří např. Amazon, který před několika dny odhalil novou generaci čipů Trainium3. Ty jsou vyráběny pomocí 3nm procesu a Amazon na jejich základě vytváří servery Trainium3 UltraServer (přesněji Amazon EC2 Trn3 UltraServer). Ty se skládají ze 144 čipů Trainium3 a dosahují velmi vysokého výkonu 362 PFLOPS s datovým typem FP8.
Oproti obdobným serverům s čipy Trainium2 dosahují 4,4krát vyššího výkonu a 4krát vyšší efektivity. Také paměťová propustnost je 4násobná. Servery se pak dají využít nejen k inferenci AI algoritmů, ale také pro jejich náročnější trénování. Na serverech běží open-weight model GPT-OSS a proti předchozí generaci s tímto modelem dosahuje novinka 3krát vyšší propustnosti a 4násobného zrychlení odezvy. Pokud zákazník bude potřebovat opravdu hodně vysoký výkon, lze vytvářet obří systémy EC2 UltraClusters 3.0, které mohou obsahovat až 1 milion čipů Trainium3, což je 10krát vyšší počet než u předchozí generace.
Na čipech Trainium fungují už společnosti jako Anthropic, Karakuri, Metagenomi, NetoAI, Ricoh nebo Splash Music, kde podle Amazonu proti alternativám ušetří až 50 % nákladů. AI společnost Decart pak na čipech Trainium3 u své generativní AI pro obraz a video dosahuje 4krát rychlejšího generování obsahu při polovičních nákladech u GPU.
Amazon se současně dívá už i do budoucna. Trainium4 je už ve vývoji a mělo by dosáhnout 6násobného výkonu v FP4, 3násobného v FP8 a dalšího 4násobného zvýšení paměťové propustnosti. Architektura bude podporovat i technologii Nvidia NVLink Fusion, takž bude možné kombinovat několik různých architektur.