Zpět na článek

Diskuze: MediaTek Dimensity 9300 příliš "peče", firma to přehnala s výkonnostním cílem

Nejsi přihlášený(á)

Pro psaní a hodnocení komentářů se prosím přihlas ke svému účtu nebo si jej vytvoř.

Rychlé přihlášení přes:

del42sa
del42sa
Level Level
15. 9. 2023 07:35

Komentáře tohoto uživatele máš zablokované.

divím se upřímně každému, kdo s tím pošukem Son_of_the_bit ztrácí čas ....

kutil05
kutil05
Level Level
15. 9. 2023 11:36

Komentáře tohoto uživatele máš zablokované.

@del42sa Když mám čas, někdy mne to baví.

sonofthebit
sonofthebit
Level Level
16. 9. 2023 13:34

Komentáře tohoto uživatele máš zablokované.

@kutil05 Copak del42sa? Koukám že na jiném webu vedeš pod články "sofistikované diskuse" o odpovídající chovancovi jedličkova ústavu = tady na SHW ti holt pšenka nepokvete :DDD

bison
bison
Level Level
12. 9. 2023 11:06

Komentáře tohoto uživatele máš zablokované.

MediaTek priniesol na trh mobilný plnotučný 4 jadrový procesor ktorý má jediný problém a to vysokú spotrebu, ARM architektúra tak ukazuje svoje skutočné prednosti, kto chce výkon ARM potrebuje veľkú batériu a veľký chladič a je po mobilnom zariadení. Príbeh o nízkej spotrebe a vysokom výkone nám trošku zhorkol.

sonofthebit
sonofthebit
Level Level
12. 9. 2023 11:41

Komentáře tohoto uživatele máš zablokované.

@bison Vysoká spotřeba u mobilu je třeba 1 W navíc. Pokud mobil typicky má 5 W TDP tak 6W už bude způsobovat throttling a přehřívání.

Taková AMD zvedla TDP z 125W (Zen 3) na pěkných 170W (Zen 4). Jo to je úplnej vzor úspornosti :D

Bratrstvo kočičí pracy z DDiitu furt trolí jak jsou AMD CPU efektivnější jak Apple M1.... a já pořád čekám kdy AMD a Intel konečně začnou dělat CPU do mobilních telefonů. Že by něměli zájem o 409 miliard USD z mobilního trhu? Přece jenom je to 5x víc peněz než jsou ze serverů. Že by byli tak hloupí a nešáhli si pro easy money? Minimálně Intel si pamatuje jak dostal pres prsty když se snažil nacpat x86 do mobilů a pak ještě jednou si sám nafackoval když se snažil postavit výpočetní GPU na x86 (aneb Larrabee).

Naposled si AMD spálila pracky když dodala mobilní GPU pro Samsung Exynos 2200 a byl z toho z hlediska spotřeby nejhorší mobilní SoC na trhu a chudák Samsung byl nucen komplet zrušit výrobu Exunosů přejít na Snapdragony od Qualcommu protože Exynos 2200 se nedal použít ani pro sekundární trhy mimo USA. Takže AMD neumí udělat ani úsporné GPU, natož aby vykonaly zázrak a udělali úsporné CPU na instrukční sadě z roku 1978 která už z principu nemůže být nikdy úsporná (aneb CISC-to-RISC překlad uvnitř každého moderního x86 CPU).

kutil05
kutil05
Level Level
12. 9. 2023 19:33

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Jsou různé kategorie úsporných CPU. Úsporný procesor znamená něco jiné v mobilu, desktopu či serveru. V desktopu je důležitý jednovláknový výkon do 8 až 16 jader což je hi-end, v serveru je dnes 16 jader low-end. A od toho se odvíjí odlišné takty a porce energie na jádro.

sonofthebit
sonofthebit
Level Level
13. 9. 2023 07:26

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Všera odhalený iPhone 15 Pro umí HW raytracing, dostal více GPU jader (5->6) a umí upscaling pomocí NPU jednotky (obdoba Nvidia DLSS), to je naprostá paráda.

AAA gaming na iPhonu 15 Pro, běží na tom nejnovější Assasin Creed, Resident Evil atd. a kupa čistě konzolových (PS5 a XBSX) her. On totiž procesorově ten iPhone 15 Pro má dosahovat minimálně 2800 pts v GB6 ST, což je jako Zen 4 na 6 GHz. V all core loadu pak 7500 - 8000 pts GB6 MT, což už vydrtí desktopové 8-jádrové Zen 1 a v podstatě vyrovná desktopové Zen 2 Ryzen 3700X 8-jádra/16-vlákna. A co má PS5 a XBSX za CPU? Přece 8c/16t Zen 2, navíc ořezaný o FPU výkon. Takže iPhone teď má větší CPU výkon jak last gen konzole.

Co se týče grafického výkonu, tak iPhone 14 Pro měl 2 TFlops (což je víc jak PS4 se 1.8 TFlops).
Takže iPhone 15 Pro když má 20% víc výpočetních jednotek, tak bude dosahovat min 2.4 TFlops, cca 10% hodí vylepšená architektura takže zhruba 2.6 TFlops (PS5 má 10 TFlops). Jenže HW raytracing je 4x rychlejší než SW raytracing (a PS5 neumí HW raytracing) plus DLSS upscaling taky zvyšuje výkon cca 2x..... a najednou iPhone 15 Pro v moderních AAA titulech bude dávat dost podobný výkon jako nenažrané konzole od AMD (PS5 a XBSX).

Apple rozjel AAA gaming na iPhone, což znamená že teď bude dostupná většina AAA titulů i pro notebooky a desktopy s M3 ARMy Přičemž se dá předpokládat že MS taky začne tlačit aby AAA gamesy jely na Windsown 11 for ARM, takže tu máme lavinový efekt. A to je smrt pro ten hnusnej monopolní zmetek, kterej už v roce vzniku 1978 byl zaostalá sračka (x86).

- Apple M3 .............. 6 TFlop/12 TFlop a bude výkonově drtit konzole se 10 TFlop
- Apple M3 Pro ...... 12/24 Tflop už bude drtit NV 3070 Ti se 22 TFlop
- Apple M3 Max ..... 24/48 Tflop už posvačí 3090 Ti se 40 TFLop
- Apple M3 Ultra ..... 48/96 Tflop už bude konkurovat 4090
- M3 Extreme .......... 96/192 Tflop bude 2x výkonnější jak 4090 a bude konkurovat 5090, která vyjde bůhvíkdy

kutil05
kutil05
Level Level
13. 9. 2023 08:19

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Rozbor toho výkonu jsem četl a víceméně u té grafiky odpovídá nárůstu počtu jednotek. U CPU nikdo neví, protože Apple podrobnější popis jádra neuveřejnilo. A ten RT není moc s čím srovnat, napsali jen, že doposud u Apple jel RT na shaderech a nyní má své jednotky a měl by být 4x rychlejší. Ale co vím, nikdo jiný RT na telefonech nemá, takže moc není s čím srovnávat.
Z logiky věci herní grafiky jsou násobně efektivnější než CPU a přotom si berou desítky a stovky Wattů, takže telefon nemůže být výkonnější než desktop i než NTB běžné konstrukce, nemá na to dost energie, ani by se neuchladil.

kutil05
kutil05
Level Level
13. 9. 2023 08:22

Komentáře tohoto uživatele máš zablokované.

@sonofthebit A co se týká těch M3 už ten základ je vycucaný z prstu, zatím nikdo mimo Apple, neví, jaký bude mít výkon a ten zbytek automaticky počítá se stejnými takty a 100 % škálování, což se nikdy neděje a vícejádrové CPU ani nemají stejné takty, pokud mají třeba 4x a víc jader. Takže možná tak vlhký sen.

kutil05
kutil05
Level Level
13. 9. 2023 08:43

Komentáře tohoto uživatele máš zablokované.

@sonofthebit "Taková AMD zvedla TDP z 125W ­(Zen 3­) na pěkných 170W ­(Zen 4­). Jo to je úplnej vzor úspornosti :D" Bylo by taky fajn porovnat to s nárůstem výkonu. Jinak mlátíš prázdnou slámu.

AMD Ryzen™ 9 7950X-16 / 32-Up to 5.7GHz/4.5GHz-170W-DDR5-5.2GHz(6.0GHz)
AMD Ryzen™ 9 5950X-16 / 32-Up to 4.9GHz/3.4GHz-105W-DDR4-3.2GHz

už jen na pouhých základních taktech 1,32x větší MT výkon - na ST díky turbu 1,163x a propustnost 1,625x (5,2 GHz) nebo 1,875x. To jsou solidní nárůsty. Reálně v tom není započítané IPC nebo AVX512.

sonofthebit
sonofthebit
Level Level
13. 9. 2023 09:22

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Dobře, pojďme to srovnat:
- AMD Ryzen 7730U s TDP 15W ......... ST 1680 pts ........ MT 6639 pts
- Apple iPhone 14 Pro TDP 5 W .......... ST 2519 pts ......... MT 6382 pts

https:­/­/browser.geekbench.com­/processors­/amd­-ryzen­-7­-7730u
https:­/­/browser.geekbench.com­/ios_devices­/iphone­-14­-pro

Výsledek je, že iPhone výkonově drtí to nejlepší co x86 umí nasadit do TDP 15W ultrabooků (AMD Ryzen 7730U). iPhone 15 má MT přeš 7000 pts, a ten výkon dosahuje při 4-5W TDP.

Nyní uvidíme AAA herní tituly na Applích ARMech a velmi brzy i na ARM Linuxu a ARM Windowsech. Paráda. x86 je mrtvá.

Tech-boy.lukas
Tech-boy.lukas
Level Level
12. 9. 2023 09:32

Komentáře tohoto uživatele máš zablokované.

dle "Son_of_the_bit" revoluční army, tento stale throttluje aby dal šanci už prehistorickým x86 cpu 🤣

sonofthebit
sonofthebit
Level Level
12. 9. 2023 10:19

Komentáře tohoto uživatele máš zablokované.

@Tech-boy.lukas Mediatek 9300 throttluje, protože jeho CPU, GPU a NPU má celkově vyšší spotřebu než tradičních 5W. No to je tragédie že si 8-jádro ARM vezme dokonce 7W.

Myslím že by okamžitě měli přejít na x86, kde 8-jádro Ryzen 7800X si vezme bežně přes 120W. Takový telefon s x86 Ryzenem by se dal používat jako plotýnkový vařič :D

Teď vážně. 4x Cortex X4 v telefonu je masakr (8xALU+3xBranch s IPC o 31% vyšším jak Zen 4). To spíš odpovídá nějakému čipu pro NTB nebo tablety. Při frekvenci 3.5 GHz ta X4 bude dávat 2200 pts v Geekbench 6, což 4x 2200 = 8 800 pts.

K tomu 4x Cortex A720 (4xALU+2xBranch), což sice střední jádro, ale má to větší IPC jak starý hi-end A77, nebo-li IPC nad AMD Zen 2 a někde blízko AMD Zen 3. Samozřejmě je to malé a extrémně úsporné (spotřeba cca 700 mW při 2.4 GHz a 3nm). Tahle A720 na 2.8 GHz dá zhruba 1100 pts GB6, takže 4x 1100 =4400 pts.

Celkem 13 200 pts v GB6 což vydrtí i 6-jádrový Ryzen 7600 se spotřebou přes 100W. Dobrý no, mobil bude drtit předražené x86 desktopy. Mediatek se zřejmě rozhodl zaútočit na Apple a překonat jej v MT.
___________________________________________
BTW:
8-jádro Zen 2 Ryzen 3700X ..... ST 1 132 pts ........ MT 5 843 pts
8-jádro Zen 2 Ryzen 3700X ..... ST 1 639 pts ....... MT 8 101 pts
8-jádro Zen 2 Ryzen 3700X ..... ST 2 163 pts ........MT 10 304 pts
8-jádro Zen 2 Ryzen 3700X ..... ST 2 708 pts ...... MT 15 189 pts

https://browser.geekbench.com/processors/amd-ryzen-7-1800x
https://browser.geekbench.com/processors/amd-ryzen-7-3700x
https://browser.geekbench.com/processors/amd-ryzen-7-5800x
https://browser.geekbench.com/processors/amd-ryzen-7-7800x3d

Z čehož plyne že mobilní telefon výkonově vydrtí desktopové 8-jádra Zen 3 a to včetně MT i jednovláknového ST výkonu. Masakr a konec x86. To musí vidět všichni co mají oči a alespoň tři zbývající mozkové buňky nespálené nadměrnou konzumací kari.

Milan Šurkala
Milan Šurkala
SHW SHW
Operační systém: PC
Procesor: AMD
Grafická karta: NVIDIA
12. 9. 2023 10:54

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Ale no tak, bavíme se tu o mobilních CPU a Vy vytáhnete desktopový 7800X? Co tak vzít mobilní 8jádro? 8jádrový Ryzen 7 7730U má např. 15W TDP.

Pavel Matějka
Pavel Matějka
Level Level
12. 9. 2023 11:44

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Dělají se i 6W x86 procesory, pardon, SoC.

sonofthebit
sonofthebit
Level Level
12. 9. 2023 11:58

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Dobře, pojďme to srovnat:
- AMD Ryzen 7730U s TDP 15W ......... ST 1680 pts ........ MT 6639 pts
- Apple iPhone 14 Pro TDP 5 W .......... ST 2519 pts ......... MT 6382 pts

Takže výsledek........... iPhone při 3x nižší spotřebě dá v ST neskutečnej výprask NTB s 8-jádrem, přičemž MT prohraje jen o prsa korejky.

A to pominu fakt, že Ryzen je 8-jádro a má 16 vláken, kdežto ten iPhone má jen 2x velký jádra a jen 4x malé, tedy 6-jádro bez SMT (pouhých 6 vláken). Každopádně dnes odhalený iPhone 15 už dá tomuhle Ryzenu naprdel i v MT, takže zesměšnění x86 je jisté. Otázka je jen jak bude velké.

A letošní Androidí Samsung S23 dá naprdel v ST tomu Ryzenu taky:
- Samsung S23 ...... GB6 ST 1878 pts ............. MT 4973 pts

https://browser.geekbench.com/processors/amd-ryzen-7-7730u
https://browser.geekbench.com/ios_devices/iphone-14-pro

https://browser.geekbench.com/android_devices/samsung-galaxy-s23-ultra

sonofthebit
sonofthebit
Level Level
12. 9. 2023 12:14

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Intel Atom N200, parodie na procesor co má TDP 6W:
- 4c/4t ..... ST 1041 ........ MT 1966

Aneb typická ukázka x86 v praxi: 2x až 2,5x horší výkon x86 při o 20% vyšší spotřebě (oproti ARM).
Tenhle Inteláckej zmetek by v úspornosti vyklepnul i Didaktik M.

https://browser.geekbench.com/v6/cpu/2186006

Milan Šurkala
Milan Šurkala
SHW SHW
Operační systém: PC
Procesor: AMD
Grafická karta: NVIDIA
12. 9. 2023 12:15

Komentáře tohoto uživatele máš zablokované.

@sonofthebit To, co jste napsal, je sice hezké, ale vůbec neřeší to, na co jsem narážel.

Jsem tu vedle Vás asi jediný, kdo si myslí, že ARM to nakonec vyhraje i v desktopové oblasti. Nicméně kvůli tomu nebudu proti mobilnímu ARMu stavět 120W x86. O to mi jde. Já neříkám, že je x86 lepší, ale jen to, že je blbost stavět srovnání x86 vs ARM na srovnávání mobilního a desktopového 120W procesoru, aby to vyšlo záměrně ještě mnohem hůř, než jak to ve skutečnosti je.

sonofthebit
sonofthebit
Level Level
12. 9. 2023 14:05

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Co se vám zase nelíbí?

Nelíbí se vám výsledky 15W Ryzenu 7730U, který jste sám navrhoval jako férové srovnání? Hele za to může fyzika, CPU co je dělaný na 100W prostě omezením na 15W nemůže logicky podávat stejný výkon jako na těch 100W kdy dosahuje daleko vyšších frekvencí. To je prostě drsná realita kdy nejlepší x86 15W TDP procák dostane nakládačku od mobilního telefonu.

Já nemůžu za to, že AMD a Intel díky zaostalé x86 dělají jen žravé křápy.
To je snad každému středoškolákovi jasné, že když všechny moderní CPU jsou vnitřně RISC, tak ta HW emulace CISC instrukční sady x86 prostě bude stát navíc tranzistory, spotřebu, peníze a vývoj navíc, zbytečné komplikace atd.

Pročpak asi ARM u vývoje 64-bit ARMv8 se rozhodl zahodit zpětnou kompatibilitu a vyvinul pro 64-bit úplně jinou instrukční sadu, která nemá s tou původní ARMv7 skoro nic společného? Protože na ISA setsakramentsky záleží.

Milan Šurkala
Milan Šurkala
SHW SHW
Operační systém: PC
Procesor: AMD
Grafická karta: NVIDIA
12. 9. 2023 14:16

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Co se mi nelíbí? Že jste si do srovnání vzal 120W desktopový Ryzen a ne mobilní 15W. Výsledky 15W Ryzenu vůči ARMu tady vůbec neřeším. Je úplně jedno, zda je horší nebo lepší než ARM, o to tady v diskuzi vůbec nejde. Jediné, co se mi nelíbí, je to, až abyste podpořil Váš oblíbený ARM, tak jste mobilnímu procesoru předhodil do srovnání desktopový Ryzen a ne aspoň trochu adekvátní mobilní verzi. Ty tři odstavce jste napsal úplně zbytečně, protože se vůbec netýkají toho, o co mi šlo :-)

sonofthebit
sonofthebit
Level Level
12. 9. 2023 14:49

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Vám přijde normální že mobilní telefon v ST výkonu vydrtí 3 roky starý Zen 3 desktop CPU co boostuje na 5 GHz? Mě to přijde naopak velmi neobvyklé a zajímavé srovnání.

BTW Nemám žádnou oblíbenou ISA. Mě je úplně jedno jestli ta lepší ISA se jmenuje ARM, RISC-V nebo třeba Karel-G. Nebudu přece zbožňovat x86 když objektivně a technicky vzato je to sračka co tady už nejmíň 20 let nemá co dělat.

Pavel Matějka
Pavel Matějka
Level Level
13. 9. 2023 06:34

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Ten váš ARM miláček skončí možná stejně s x86, tedy správněji amd64. Zvyšování cen ARM licencí a USA sankce nutí spoustu firem k urychlení vývoje RISC-V. Třeba se do toho teď opravdu opřou, co my víme...

sonofthebit
sonofthebit
Level Level
13. 9. 2023 07:45

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Já jsem především fanoušek Jima Kellera, takže čekám na jeho RISC-V procák Ascalon se 6xALU. Díky tomuto tlaku ze strany RISC-V bude donucen celý ARM ekosystém zůstat low-margin tam kde je.

Otázka jestli kupovat akcie ARMu, který dnes vstupuje na burzu (IPO). Vydělávat sice moc nebude, ale zase bude masivně růst (x86 chcípne), takže jeho akcie porostou (ale dost možná až po skončení recese která nás čeká). Každopádně to vypadá že nakonec dobro (RISC) zvítězí nad zlem (CISC). Sice se zpožděním 20 let, ale i tak je to dobře.

kutil05
kutil05
Level Level
13. 9. 2023 08:35

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Hezké srovnávat ALU jednotky a takty. Jenže v CPU jsou i FPU / vektorové jednotky a v těch má ZEN4 těžce navrch + takty které žádný ARM ještě neměl. ARM je efektivní, má-li vyladěný SW. Ale to je vše. Četl jsem celé obsáhlé recenze Aplere Altra, což jsou ARM Neoverse N1 - tedy 5 ALU na jádro, jenže pouze 2x 128 bit vektory a zabili to malou L3 která má pro 64 a 80 Q verze 32 MB tedy 0,5 a 0,4 MB na jádro a pro M 96 a 128 jader pouze 16 MB tedy 0,1666 a 0,125 na jádro. Cože je komické, když obě varianty mají 2 MB L2 na jádro tedy víc než kolik vychází L3. A to ten výkon zabilo. Kde se víc počítá a méně přenáší data, umí to ZEN 2 EPYC 64 jader porazit. Pokud ale jsou třeba datové toky, je to přesně naopak. Ta architektura ja tak na 32 jader na taktu řekneme 3,5 GHz, tam by to výkon mělo lepší a využitelný. Ale 32 jádrová varianta (je na tom nejlíp z hlediska L3 i RAM) má jediné provedení 1,7 GHz. Procesor k doplnění ceníku asi, jinak nanic. Celý potenciál promrhali blbě organizovanou cache. A 96 a 128 jádrové verze úplně postrádají smysl. Ten výkon je použitelný jen na cloud, ale na HTPC se nehodí, tam doslova jádra navíc překáží.

kutil05
kutil05
Level Level
13. 9. 2023 08:49

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Prostě ARM i x86-64 jsou doma někde jinde a z toho důvodu moc nejde je přímo porovnávat. Za stejných podmínek tedy tentýž ale optimalizovaný a překompilovaný SW na míru a při stejné porci energie už by něco srovnat šlo. Ale ne jiné světy. To je jako srovnávat kamion a závodní auto jen proto, že mají stejných 500 koní výkonu. Ale reálně ho podají úplně jinak. Kamion není tak rychlý, ale utáhne desítky tun nákladu. A tady to je stejné.

kutil05
kutil05
Level Level
13. 9. 2023 09:03

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Když čtu architektonické změny jednotlivých generaci ARM, všímám si jedné věci. Zlepšují dekodéry, predikci (to asi všechny CPU obecně) a někdy přidají ALU. Ale na FPU / vektory sáhnou málokdy. Co se ale zpravida a narozdíl od x86 nebo i Fujitsu či IBM nedočtu, jsou šířky sběrnic, výkony Load/Store jednotek a reálně se stává, že ten papírový výkon tam je jen za ideálních podmínek, ale v reálu spíš tak napůl. Ta jádra jsou úsporná, protože někde na něčem šetří a už dávno ten rozdíl v dekodérech, kterým se rádi ohání příznivci ARM ohání není tak důležitý - třeba 8 dekodérů ARM proti 4 u x86, nevím, o kolik může těch osm být jednodušších, aby zabraly méně tranzistorů... ARM jádro pro telefon a ARM jádro superpočítače není totéž a jeho okolí - cache, sběrnice a RAM už vůbec ne, to je jiný svět. Procesor aby to široké jádro využil optimálně musí takříkajíc volně dýchat, jinak se dusí a plný výkon dá jen chvilkama. A právě to rozbor Altry jasně ukázal. Na papíře by pomocí ALU Fujstsu A64FX s jeho 48 jádry na 2 GHz měla altra 64 jader na 3 GHz roztrhat. Ale v reálu se to nestane, protože A64FX má na jádro 4x256 bit vektory a tomu uzpůsobenou komunikaci po sběrnici. Altra jen 2x128 bit.

sonofthebit
sonofthebit
Level Level
13. 9. 2023 09:46

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Ty hloupé přirovnání x86 vs ARM ke kamionu a závodnímu autu. To je spíš server (kamion) a závodní auto (desktop).

X86 vs. ARM je něco jako typ pohonu/motoru:
- CISC x86 je něco jako parní lokomotiva - ve své době super, ale s účinností 5% je to dnes naprostý nesmysl provozovat.
- RISC ARM je něco jako TDI - účinost 40%, spotřeba 3,8 litru v Tiguanu 4x4, naprostá paráda

Technicky vzato každý x86 CPU od Pentium PRO a AMD K5 jsou vnitřně RISC jádra co ten odpornej a zastaralej x86 CISC musí HW emulovat, aneb překládat CISC instrukce do RISCových microOps. Tohle ví každej středoškolák. Každému kdo má IQ větší než 70 musí dojít, že ten CISC balast komplikuje vývoj, stojí hromadu tranzistorů a ty navíc zvyšují spotřebu. CISC je zlo co mělo být už 20 let v muzeu.

kutil05
kutil05
Level Level
13. 9. 2023 10:00

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Až na to že tyto rozdíly se dávno setrřely od chvíle, kdy dekodér mikroinstukcí mají i RISC procesory, tak šup hezky zas do školy. Možná jen to srovnání bych trochu změnil protože je vidět, že ani ARM v serverech neumí totéž co zavedené x86-64. ARM se ty velké turbodiesely snaží nahradit větším počtem menších. Ale neumí je dobře spojit. To co jim v mobilech při 8 jádrech funguje se v 64. a více jádrech dusí a nedokáže ten teoretický výkon ukázat.

sonofthebit
sonofthebit
Level Level
13. 9. 2023 10:07

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Ty seš komik.
1) ARM Neoverse N1 nemá 5x ALU, ale má 3xALU+1x Branch
- možná si to pleteš s ARM Neoverse V1, která má 4xALU + 2xBranch
- nebo s V2 která má 6xALU+2xBranch
- jediné jádro co má 5x ALU je Intel Golden Cove, ale to není ARM
- nebo počítání do deseti je na tebe příliš těžká záležitost :D

2) L3 cache není v serverech až tak důležitá. L3 cache je pro sdílení dat mezi jádry a to při 128-jádrech CPU a třeba 32 klientech (každý si pronajme 4 jádra pro svoji virtuálku) takové sdílení dat odpadá (naopak je třeba izolovat). Takže tyto cloud servery těží z velké privátní L2 cache.

3) Prej malá L3 cache zabila výkon :D Jo a proto 64-jádrovej Graviton 3 dává těžce naprdel 64-jádrovému AMD EPYC, nebo 128-jádrová ARM Ampere Altra dává naprdel 64c/128t AMD Epycu.

4) Prej slabé FPU/SIMD jednotky :D ARM má naprosto nejdokonalejší SIMD instrukce na světě, revoluční SVE umožňující masivní 2048-bit vektory/registry. x86 je tragicky zaostalá na 512-bit, přičemž stejně Intel i AMD to vnitřně rozkládají na 256-bit. Proto Japonci postavili čistě CPU-only superpočítač na ARM procesorech a SVE instrukcích. ARM Fujitsu A64FX je v super počítači Fugaku, což je druhý nejvýkonější superpočítač na světě. Žádný superpočítač čistě na x86 neexistuje, pročpak asi? :D

sonofthebit
sonofthebit
Level Level
13. 9. 2023 10:17

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Tys asi ve škole chyběl když probíral rozdíl mezi dekodéry CISC-to-mOPs a RISC-to-mOPs. To se pak není čemu divit že ti chybí základní znalosti :D

Zkus tedy vysvětlit, ty setřenej rozdíle, jak dekoduješ 10 x86 instrukcí za takt, když každá x86 instrukce muže mít 1-15 bajtů. To je nějakých 640 kombinací kde ty instrukce můžou začínat, a pro 20 instrukcí už je to 2680 kombinací. Třeba takovej ARM nebo RISC-V na tohle nepotřebuje žádné tranzistory, prostě si sáhne na 20. instrukci která leží přesně na 20x 4 bajtu v paměti.

Neboj, já ti to chybějící středoškolské vzdělání doplním a vysvětlím :D

Milan Šurkala
Milan Šurkala
SHW SHW
Operační systém: PC
Procesor: AMD
Grafická karta: NVIDIA
13. 9. 2023 10:23

Komentáře tohoto uživatele máš zablokované.

@sonofthebit "Celý potenciál promrhali blbě organizovanou cache. A 96 a 128 jádrové verze úplně postrádají smysl. Ten výkon je použitelný jen na cloud, ale na HTPC se nehodí, tam doslova jádra navíc překáží."

Proč postrádají smysl? Tak to je snad o tom určení, ne? Ono se to musí kvůli vysokému počtu jader hodit na HPC? Pokud je to procesor určený pro cloud, a svou cloudovou funkci plní dobře (hodně jader pro VM, nízká spotřeba), tak byl úkol splněn velmi dobře.

sonofthebit
sonofthebit
Level Level
13. 9. 2023 10:36

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Fujitsu ARM A64FX nemá 4x256 jak mylně uvádíš, ale 2x512-bit revoluční SVE. Podpora SVE je zde zásadní, protože součástí SVE jsou i volitelné instrukce pro násobení matic. To je tajemství výkonu A64FX a proč mobilní telefony s SVE2 se výkonem nepřibližují Fujitsu (tyto instrukce nemají implementované, zatím). ARM pracuje na SME a SME instrukcích přímo pro násobení matic (mají separátní registry, tak jako má Apple implementované v jeho AMX). To je to o čem si x86 s jeho AVX512 může zatím nechat zdát sny.

kutil05
kutil05
Level Level
13. 9. 2023 10:58

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Na schématech to je vždy jako 4x256 i v materiálech o tom tak Fujitsu píše.

sonofthebit
sonofthebit
Level Level
13. 9. 2023 10:58

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Proto ARM dělá 3 druhy jader dle SIMD výkonu:

1) Neoverse V2 se 4x 128-bit SVE2 pro HPC
2) Neoverse V2 se 2x 128-bit SVE2 pro high-response cloud
3) Neoverse N2 se 2x 128-bit SVE2 pro streaming a non-critical cloud

Ono i ta N2, což je Cortex A715 s IPC mezi AMD Zen 2 a 3, není rozhodně nic pomalého (přičemž spotřeba je ve stovkách mW),
Graviton 3 je ve dvou verzích 1) a 2) přičemž Amazon začal jako první osazovat tu slabší verzi (je menší a lehčí na odladění výroby, vyšší výtěžnost).

Otázka je kde je Graviton 4, přece jen Nvidia Grace s jádrem V2 na 4nm se už dávno dodává a G4 s V2 jádry zatím nikde. Možná ladí 3nm výrobu. Ostatně G3 taky byl první serveorvý CPU na 5nm TSMC skoro rok před AMD Zen 4. S G4 na 3nm předběhnou AMD Zen 5 opět o rok.

kutil05
kutil05
Level Level
13. 9. 2023 11:06

Komentáře tohoto uživatele máš zablokované.

@sonofthebit https://www.anandtech.com/show/16315/the-ampere-altra-review

Dělali i test 128 jádrové verze, ta dopadla blbě právě z uvedených důvodů.

https://www.anandtech.com/show/16979/the-ampere-altra-max-review-pushing-it-to-128-cores-per-socket

Závěr je asi takový, že pro velké ARM procesory je potřeba dobře optimalizovaná zátěž a nehodí se na vše, zatímco x86-64 jsou univerzální ale za cenu větší spotřeby.

kutil05
kutil05
Level Level
13. 9. 2023 11:13

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Řekl bych že ty širší vektory jsou SW záležitost a procesor je podobně jako ZEN 4 umí i na užších jednotkách. Co ve světě procesorů nějak výjimečné není. Řešeny tak byly už některé první koprocesory, které plnou šířkou řešily jen často užívané instrukce a ty další dělily do více průchodů. Tedy reálně v FPU všechny výpočetní operace trvají víc taktů a týká se to i ALU, jen některé širší trvají déle. V podstatě ti inženýři ví které instrukce se vyplatí udělat na méně taktů a které ne.

kutil05
kutil05
Level Level
13. 9. 2023 11:18

Komentáře tohoto uživatele máš zablokované.

@sonofthebit Ty stovky mW jsou hodně relativní. U toho Altra Q80-33 máte 80 jader na 3,3 GHz a TDP 250 W. Dělit umíte, že?

Reklama
Reklama