Zpět na článek

Diskuze: AMD a Intel spolu vytvářejí instrukce ACE, maticové násobení pro AI úlohy

Nejsi přihlášený(á)

Pro psaní a hodnocení komentářů se prosím přihlas ke svému účtu nebo si jej vytvoř.

Rychlé přihlášení přes:

bRUM23
bRUM23
Level Level
Operační systém: Linux
dnes 09:20

Komentáře tohoto uživatele máš zablokované.

Myslím, že hlavně zajímavá je geneze ACE.

Bylo tady AVX 512 které adoptovala AMD od Intel, ale ten jej nemohl využívat (protože Big Little).
AVX 512 je kombajn, co umožňuje na jeden takt spočítat (8 FP64 operací, nebo 16 FP32 operací, nebo 32 FP16operací.) Avšak pokud by měl počítat moderní AI typy jako je FP4, pořád to bude jen 32 operací za takt, protože nižší typy se budou řešit pomocí FP16, takže pro AI zátěž nepoužitelné.

Intel začal vyvíjet AVX10.1 a AVX10.2, která má umožnit běh stejného kódu na P-Core i E-core. Jednoduše, když přijde požadavek na 512bit , který není v E-core implementovaný spočte se na více průchodů.

k tomu tady byla technologie VNNI, která má odbourat nevýhodu AVX512 při práci s malýmí typy... tj. na jeden průchod spočtou 64 FP8 operací místo 32.

Intel se musí vzdát svojí technologie Intel AMX (dot-product nasobeni matic -> inspirovaná technologií nVidia tensor)

a přejít na outer-product násobení matic ( Apple AMX, AMD CDNA, ARM)
Ukázalo se že outer-product pro procesory škálovatelnější, plošně úspornější a nevyžaduje tak složité přesouvání dat.

Teď všechny ingredience zabalili do jednoho balení ACX a kde kombinuji kompatibilitu Big Little, plus daleko širší škálu (AI) datových typů a přidávají akceleraci maticového násobení. Současně zachovávají z velké části křemík pro AVX512 a tedy kompatibilitu.

Křemík pro AVX512 byl tedy upgradován a bude moci plnohodnotně plnit roli velmi slušně výkoného NPU, kde narozdíl od stávajícího přístupu, kdy výrobci přidávali zvlášt NPU obvod.

(Jenomže co s tím, když mu u paticových desktopů nechají pomalé dva kanály do RAM ?! :( což pro tenhle druh zátěže ten potenciál účinně zabije)

Ternary Mind
Ternary Mind
Level Level
20. 6. 2026 11:16

Komentáře tohoto uživatele máš zablokované.

Láska spojuje

Reklama
jivy
jivy
Level Level
Procesor: Intel
Operační systém: PC
Grafická karta: NVIDIA
20. 6. 2026 11:05

Komentáře tohoto uživatele máš zablokované.

Tady je názorný příklad vývoje v oblasti x86 čipů, který jde proti zpětné kompatibilitě. Na jednu stranu je to logické, ale zároveň to jasně ukazuje i cestu pro Arm.

gepard2
gepard2
Level Level
20. 6. 2026 13:18

Komentáře tohoto uživatele máš zablokované.

@jivy Proč by to mělo jít proti zpětné kompatibilitě? Prostě přibude další instrukční sada, ta bude navíc. Ne? Kdyby nebyla, bude se to počítat klasicky, jako doposud. Tedy nic nekompatibilního. Jen na to bude specializovaný, rychlejší, obvod.

jivy
jivy
Level Level
Procesor: Intel
Operační systém: PC
Grafická karta: NVIDIA
včera 13:36

Komentáře tohoto uživatele máš zablokované.

@gepard2 Správně.
Jenže pokud bude nějaký SW tuto instrukci výrazně využívat, tak se PC se starším CPU výrazně zpomalí, i když může jít o jinak výkonný HW.
Aby bylo jasno, já proti takovému vývoji nic nemám, ale uvedl jsem to kvůli debatě ohledně Armu, kdy tady někteří varovali, že by to znamenalo problémy se zpětnou kompatibilitou. Takže podobný problém, byť v menší míře mohou mít i procesory x86.

gepard2
gepard2
Level Level
včera 19:16

Komentáře tohoto uživatele máš zablokované.

@jivy Že budou starší CPU o to pomalejší je jasné, ale přece kvůli tomu nestopneme vývoj nových instrukčních sad? Toto tady bylo odjakživa a je to správně. Starší CPU holt pojedou pomaleji a staré nepojedou prakticky vůbec. Staré Pentium vs Pentium MMX, příchod instrukcí SSE, AVX a podobně. Je jasné, že 10 let staré CPU bude pomalejší. Máte pokročilý výrobní proces pro nový CPU. Můžete tam nacpat více jader a můžete tam přidat i specializovaný obvod. Přínos specializovaného obvodu v každém jádře je větší, jak více jader. Proto se to dnes takto dělá.

Balounek
Balounek
Level Level
dnes 08:12

Komentáře tohoto uživatele máš zablokované.

@jivy To je ale dopředná kompatibilita.

Reklama
Reklama