Zpět na článek

Diskuze: Apple údajně testuje 3nm procesor M3 Max s 16 jádry CPU a 40 jádry GPU

Nejsi přihlášený(á)

Pro psaní a hodnocení komentářů se prosím přihlas ke svému účtu nebo si jej vytvoř.

sonofthebit
sonofthebit
Level Level
9. 8. 2023 09:45

Komentáře tohoto uživatele máš zablokované.

L1 instrukční cache ..... Zen 4 = 32 kB ..... M2 = 192 kB ........ 6x víc!!!
L2 cache........­.............. Zen 4 = 1 MB....... M2 = 16 MB ......... 16x víc!!!!
Dekodér instr. ............. Zen 4 = 4 ins/takt.... M2 = 8 instr/takt .. 2x víc
Výpočetní INT jednotky Zen 4 = 4+1 ALU .. M2 = 6+2 ALU ..... o 60% víc
FP jednotky skalár ........ Zen 4 = 2x .......... M2 = 4x .............. o 100% víc
FMA/SIMD jednotky ...... Zen 4 = 2x256-bit M2 = 4x 128-bit ... cca rovina
ROB .............­.............­.... Zen 4 = 320 ......... M2 = 630 ........... 2x víc!!!

IPC .... M2 má o 56% vyšší IPC jak AMD Zen 4 ..... což dožene až někdy v 2029 Zen 7 (pokud do té doby AMD nezkrachuje kvůli zániku x86).
A to Apple má v CPU už několik let i jednotku AMX pro násobení matic přes neveřejné custom ARM instrukce, což znamená kvůli context switchingu že to musí umět i ty menší e-jádra (jejich AMX jednotka je sdílená pro 4 jádra a má 1/4 výkonu té AMX z velkých P-jader). O tomto si může x86 nechat zdát nejmíň 10 let (Intel je rád že s novýma AVX10 udělá konečně pořádek ve vektorech mezi P-jádry a E-jádry, o instrukcích pro matice si může nechat zdát, ostatně ani licenční Cortex jádra ještě nemají AMX, což by mělo přijít s rozšířením SVE -> SME relativně brzy, možná už příští rok, protože SME a SME2 už bylo zveřejněno). Tohle mimochodem znamá že Apple v podstatě udává krok a vede vývoj ARM platformy, protože jejich custom instrukce převádí do public instrukcí dostupných všem ARM vývojářům.

A to nejlepší je, že letošní Apple M3 bude úplně nová a ještě brutálnější architektura než M2.

kutil05
kutil05
Level Level
9. 8. 2023 11:17

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Potom ale nechápu, jak je možné, že ve srovnání CPU výkonu M2 ultra dosahuje jen na AMD 5950X. Něco tady nesedí.

Milan Šurkala
Milan Šurkala
SHW SHW
Operační systém: PC
Procesor: AMD
Grafická karta: NVIDIA
9. 8. 2023 12:23

Komentáře tohoto uživatele máš zablokované.

@kutil05 Protože tam má chyby a (asi záměrná) opomenutí. AMD má 1 MB L2 cache na jádro, jenže těch jeho uváděných 16 MB u Applu je pro všechna P-jádra dohromady, takže 2 MB na jádro. Tedy ne 16krát více, ale jen 2krát. E-jádra mají 1 MB na jádro. Dále opomněl (záměrně?) zmínit poslední úroveň cache. Základní M2 má 16+4MB L2 cache a 8MB L3 cache, celkem 28 MB cache. 8jádrový Ryzen 7 7700X má 8MB L2 + 32MB L3, celkem 40 MB cache. Takže žádné 16násobky pro Apple se nekonají.

kutil05
kutil05
Level Level
9. 8. 2023 13:02

Komentáře tohoto uživatele máš zablokované.

@kutil05 Protože tam, kde nestačí argumenty, si někteří ohýbají realitu.

Akuh
Akuh
Level Level
9. 8. 2023 11:50

Komentáře tohoto uživatele máš zablokované.

@sonofthebit No... ale nějak to na výkonu nevydím ... ten test je sice rok starej, ale stále bych asi řekl průkaznej, protože nějaký optimalizace asi byly na všech platformách...
https://www.phoronix.com/review/apple-m2-linux/15

Nejsem nijak velkej fanoušek x86, ocenil bych aby se i s ARM sebraly a táhly do ... a nahradilo je něco s otevřenou ISA

kutil05
kutil05
Level Level
9. 8. 2023 12:00

Komentáře tohoto uživatele máš zablokované.

@Akuh RISC-V je otevřenější, ale tím pádem taky chybí dobré návrhy jader. Ani tu práci na ISA nikdo zadarmo neudělá. Jen ISA nestačí a jádra RISC-V v opravdu výkonné variantě prostě nejsou. A to nezmiňuji Open-RISC, o kterém ani většina vůbec neví.

Akuh
Akuh
Level Level
9. 8. 2023 22:52

Komentáře tohoto uživatele máš zablokované.

@Akuh Žádn´é a tím pádem. Tam není kauzalita že by nebyly návrhy jader protože je to otevřené. Ty zatím chybý protože tu je od roku 2015, zatímco ARM 1985 (pro uplnost OpenRISC od 2000). Bejt tu RISC-V s armem v obráceným pořadí, dost možná by žádnej arm nebyl.
To že je otevřený ISA totiž nijak neimplikuje že musej bejt otevřený i jádra. Tedy u RISC-V s BSD licencí ISA, zatímco OpenRISC byl tuším pod LGPL, která je jaksi nepříjemě virální.
Ostatně to lze pozorovat na tom že OpenRISC skutečně měl tebou zmíněný problém, ale RISC-V ho nemá právě díky jiné licenci, což lze vidět na tom že i když vzácně, ale lze vidět už relativně výkonné CPU na to jak je to mladá platforma, ale do dohnání ARM to má ještě bohužel daleko, ale blíží se.
V zařízeních třeba https://pine64.com/product/pinetab-v-10-1-8gb-128gb-risc-v-based-linux-tablet-with-detached-backlit-keyboard/

kutil05
kutil05
Level Level
9. 8. 2023 23:25

Komentáře tohoto uživatele máš zablokované.

@Akuh Berkley RISC architektur vzniklo celkem kolem 20. O většině z nich lidi od počítačů vesměs nikdy ani neslyšeli. Co se týká ARMu ano je starší ale v té době se objevily další i z rodiny Berkley a rychle se z nich staly výkonné architektury, což pro ARM neplatilo. RISC-V nemá k dispozici tolik financí, to je jasné, ale zase vstoupla do světa rovnou už jako modernější a se zkušenostmi z návrhu předešlých. Tím že je tedy ARM dost podobná, by portace neměla být větší problém.

Z existujícich jader k licenci:
Andes Technology Corporation nabízí několik různých sérií jader s volitelným rozšířením instrukční sady, včetně možností pro návrh vícejádrových systémů:
Série N(X) zahrnuje jak 32bitová jádra (N), tak i 64bitová (NX). Délka pipeline (zřetězené linky) je různá, od dvoustupňové u jádra N22 až po osmistupňovou u N45. Jádro NX27V podporuje vektorové rozšíření RISC-V neboli sadu “V”.
Série D(X) nabízí jádra s instrukční sadou “P”, která podporuje operace SIMD, a na výběr jsou opět jádra 32bitová (D) i 64bitová (DX).
Série A(X) se zaměřuje na aplikační procesorová jádra s podporou Linuxu a délkou pipeline od pěti do osmi stupňů. Dále nabízí podporu operací s plovoucí desetinnou čárkou a jednotku pro správu paměti (MMU).

Původem česká společnost Codasip s.r.o. (dnes součást skupiny Codasip GmbH) v lednu 2016 uvedla na trh historicky první komerční jádro založené na RISC-V (Codix) a dnes má v nabídce několik sérií vestavěných i aplikačních procesorových jader RISC-V. Jádra od Codasipu jsou navržena v proprietárním jazyce CodAL a firma je vyvíjí s pomocí patentované technologie a vlastního návrhového nástroje zvaného Codasip Studio.
Série L nabízí minimalistická 32bitová jádra s nízkou spotřebou, pipeline o délce tří nebo pěti stupňů a volitelným rozšířením pro operace s plovoucí desetinnou čárkou.
Série H nabízí 64bitová vestavěná jádra s vysokým výkonem. Volitelně je opět k dispozici rozšiřující sada pro operace s desetinnou čárkou.
Série A obsahuje 64bitová jádra, která podporují Linux a lze je rozšířit o instrukční sadu “P”. Jádra mají sedmistupňovou pipeline, podporu operací s desetinnou čárkou (FPU) a správu paměti (MMU). Verze jader rodiny A s příponou -MP navíc obsahují cache (vyrovnávací paměti) L1 a L2 a nabízejí podporu pro vícejádrový systém o maximálním počtu čtyř jader.
Jádro uRISC-V, které je součástí nástroje Codasip Studio, slouží ke vzdělávacím a výukovým účelům.

Společnost SiFive začala prodávat v květnu 2017 jednodeskový počítač kompatibilní s Arduinem a postavený na RISC-V procesoru Freedom E310. Táž společnost oznámila v říjnu 2017 dokončení návrhu čtyřjádrového 64bitového procesoru U54-MC Coreplex, který je navržen pro taktovací kmitočet 1,5 GHz a na kterém bude možné spustit plnohodnotný desktopový operační systém, například Linux. V únoru 2018 tato společnost spustila prodej jednodeskového počítače HI-Five Unleashed. Společnost SiFive momentálně nabízí tři hlavní řady produktů:
Série E zahrnuje 32bitová vestavěná jádra s dvou- až osmistupňovou pipeline. Nejpokročilejší z této série je čtyřjádrový procesor E76-MC.
Série S zahrnuje 64bitová vestavěná jádra s dvou- až osmistupňovou pipeline. Nejpokročilejší z této série je S76-MC.
Série U představuje nabídku 64bitových aplikačních jader o délce pipeline 5–12 stupňů. Varianty U54 a U74 jsou k dispozici ve vícejádrové verzi. Superskalární jádro U84 nabízí nejvyšší výkon z této série.
Intelligence X280 je aplikační jádro odvozené ze série U, které navíc podporuje vektorové rozšíření „V“.

Otevřená jádra RISC-V
Kalifornská univerzita v Berkeley vyvinula řadu procesorových jader RISC-V s využitím jazyka Chisel:
64bitové jádro Rocket vhodné pro kompaktní zařízení s nízkou spotřebou, jako je přenosná osobní elektronika.
64bitové superskalární jádro Berkeley Out of Order Machine (BOOM) s instrukční sadou RV64GC, určené jak pro osobní počítače, tak i pro superpočítače a databázové servery.
Pět návrhů 32bitového procesoru Sodor, které slouží primárně pro studentské projekty.
PULPino (Riscy a Zero-Riscy), projekt Spolkové vysoké technické školy v Curychu / Boloňské univerzity. Jádra PULPino implementují jednoduchou instrukční sadu RV32IMC pro mikrokontroléry (Zero-Riscy) nebo výkonnější sadu RV32IMFC s rozšířením pro zpracování digitálního signálu (DSP).

Společnost Western Digital vyvinula několik vlastních RISC-V jader pod názvem SweRV Cores a poskytla je volně pod otevřenou licencí prostřednictvím CHIPS Alliance. Komerční podporu těchto jader poskytuje ve spolupráci s Codasipem. Jádra SweRV cílí na výkonné vestavěné systémy a implementují základní sadu RV32IMC:
SweRV Core EH1 je dvouvláknové superskalární jádro s devítistupňovou pipeline.
SweRV Core EH2 je superskalární jádro se dvěma hardwarovými vlákny a devítistupňovou pipeline.
SweRV Core EL2 je minimalistické jednovláknové jádro se čtyřstupňovou pipeline.

Na výběr tedy je. Osobně bych zrovna této architektuře úspěch přál. Ale zatím to je slabota, na to kolik variant vlastně existuje.

Akuh
Akuh
Level Level
10. 8. 2023 00:19

Komentáře tohoto uživatele máš zablokované.

@Akuh Ano RISC-V vstoupily do vyspělejších vod, to řeší že nemusí dělat inkrementální vývoj ve všem a řadu věcí přeskočit, ale ani zdaleka to udělat nemůžou u všeho. Jak jsou na tom s podobou s ARMem popravdě nevím. Rozhodně ale nepůjde jen o to přepsat v dokumentaci ARM na RISC-V. Množství variant nevypovídá nic o tom jak jsou výkonné. Prostě vývoj furt žere čas. To že s později znamená že znají zkratky, ale ne že mají portál do cíle.

Zajímavá bude ale i čína, která myslím bude do RISC-V šlapat pořádně, aby si zvedla odolnost proti obchodní válce s USA.

Mimochodem, pomalu naskakuje i qualcomm
https://arstechnica.com/gadgets/2023/08/qualcomm-one-of-arms-biggest-customers-starts-a-risc-v-joint-venture/?comments=1&comments-page=1

kutil05
kutil05
Level Level
10. 8. 2023 00:39

Komentáře tohoto uživatele máš zablokované.

@Akuh To je pravda, šířku jádra a další věci z toho popisu vyčíst nejde. Já to uvedl hlavně proto, aby bylo vidět a upřímně jsem byl sám překvapený, kolik variant jde licencovat. Ta šíře záběru je veliká. A tím víc mne mrzí, jak pomalu se rozšiřuje. A tou podobností či snadností myslím to, že je určitě jednodušší přepsat kód z ARM než z x86-64.

coremar
coremar
Level Level
9. 8. 2023 16:31

Komentáře tohoto uživatele máš zablokované.

@sonofthebit 6x víc, 16x víc, 2x víc, 0,6x víc, 2x víc, 2x víc.... A jen o 56% vyšší IPC.... To je pro ten Apple ještě výrazně horší, než kdybyste to napsal jak to je doopravdy 😀

kutil05
kutil05
Level Level
9. 8. 2023 17:09

Komentáře tohoto uživatele máš zablokované.

@coremar Patrně jen tapetuje bezduše informace a nepočítá. A když počítá, tak jen to co vyznívá z jeho hlediska dobře.

kutil05
kutil05
Level Level
9. 8. 2023 17:11

Komentáře tohoto uživatele máš zablokované.

@coremar Ale zajímalo by mne ještě jedno, marně zjišťuji, co je míněno ROB

kutil05
kutil05
Level Level
9. 8. 2023 17:50

Komentáře tohoto uživatele máš zablokované.

@coremar Děkuji až tak hluboko do tajů nových CPU nevidím, ale už z názvu je jasné, k čemu je. Zrovna toto u odlišných architektur moc srovnávat nejde.

tokrcz
tokrcz
Level Level
9. 8. 2023 18:14

Komentáře tohoto uživatele máš zablokované.

@sonofthebit A k čemu je to všechno dobré, když na tom neběží Linux ani Windows? O prvním vím, že se něco chystá pro M1, ale je to klasická reverzní piplačka. Osobně se nehodlám zamykat do jablečného ekosystému :-)

Reklama
Reklama