DeepSeek-R2 má zpoždění kvůli neúspěšnému tréninku na čipech Huawei. Vrací se k Nvidii

USA chtějí být nezávislé na Číně, Čína chce být nezávislá na USA. V případě tréninku AI DeepSeek-R2 je to bod pro USA. Na čipech Huawei se totiž nový systém nedaří trénovat.

Reklama

Poslední dobou se státy snaží zvýšit svou technologickou soběstačnost, vidíme to např. mezi USA a Čínou. Pokud jde o trénování AI, USA nechtějí do Číny vyvážet své AI akcelerátory, aby Čína neměla v této oblasti tak rychle náskok, i když limity poslední dobou povolily a AMD i Nvidia získaly licence na vývoz výkonných GPU. Jenže i v Číně jsou tendence oprostit se od závislosti na tomto hardwaru a chtějí mít vlastní. Jenže to se zatím moc nedaří. Ačkoli tato země vede např. v technologiích pro akumulátory nebo solární energii, pokud jde o vývoj hardwaru, jako jsou CPU nebo GPU, je na tom zatím docela bledě, i když i zde dochází k významným vylepšením. Nový model DeepSeek-R2 tak měl být představen v květnu a být trénován na AI čipech společnosti Huawei (jak již bylo řečeno, čínská vláda odrazuje místní firmy od používání karet Nvidia H20). Nestalo se tak však.

Ačkoli se původně tvrdilo, že DeepSeek-R1 byl natrénován na dvou tisícovkách karet Nvidia H800 za 5,6 mil. USD, nakonec se ukázalo, že firma měla přístup k 50 tisícům karet architektury Hopper (zhruba 10 tisíc H800, 10 tisíc H100 a 30 tisíc H20). Bohužel pro DeepSeek se přechod na čipy Huawei nepovedl. Výkony byly nestabilní, software měl své mouchy a hodně to kazilo také pomalé síťové spojení. Vývojáři se tak museli chtě nechtě vrátit k Nvidii a trénovat pomocí karet zeleného týmu. Na inferenci nicméně čipy Huawei postačují, takže běh natrénovaných AI systémů už nyní běží na čínském hardwaru. Trénování jako mnohem náročnější operace ale stále běží s pomocí amerického hardwaru a uvidíme, jak dlouho bude tento stav ještě trvat.

Reklama

Komentáře