Komentáře

mm
mm
Level Level
25. 8. 2025 20:12

Komentáře tohoto uživatele máš zablokované.

no a když už jsem byl v té analýze, nechal jsem si srovnat oba články. Jak tento, pod který píši, tak i ten původní na který se autor odkazuje. zde je výsledek:

🔍 Klíčové rozdíly a zjednodušení
1. Zjednodušená interpretace „rental price per GPU per hour“
Wccftech uvádí, že Morgan Stanley použil průměrnou hodnotu $10.5/hod jako referenční „rental price“ pro srovnání různých akcelerátorů.
Svět Hardware tuto hodnotu prezentuje jako reálnou tržní cenu, což může být zavádějící – ve skutečnosti se ceny výrazně liší podle typu GPU, poskytovatele a konfigurace.
2. Zjednodušené hodnocení ziskovosti AMD
Wccftech uvádí, že AMD MI300X má negativní marži -64 %, ale zároveň uznává, že AMD „má skvělý hardware“ a „intenzivně pracuje na softwarové optimalizaci“.
Svět Hardware však tuto informaci interpretuje jako jednoznačný důkaz ztrátovosti, bez zmínky o kontextu nebo vývoji softwaru.
3. Chybějící nuance ohledně metodiky
Wccftech zmiňuje, že Morgan Stanley použil modelové 100MW AI továrny pro srovnání různých platforem (NVIDIA, AMD, Google, AWS).
Svět Hardware neuvádí, že se jedná o hypotetický model, což může vést čtenáře k dojmu, že jde o reálný provozní benchmark.
📌 Shrnutí
Aspekt Wccftech (originál) Svět Hardware (překlad)
Rental price Průměrná hodnota pro srovnání Prezentována jako reálná tržní cena
AMD ziskovost Negativní, ale s výhledem na zlepšení Jednoznačně ztrátová bez kontextu
Metodika studie Hypotetický model 100MW AI továren Není jasně uvedeno, že jde o model
Softwarové optimalizace Zmíněny jako klíčový faktor pro výkon Nezohledněny v interpretaci

mm
mm
Level Level
25. 8. 2025 20:04

Komentáře tohoto uživatele máš zablokované.

celý tenhle článek mi připadá divný a studie účelově psaná. Nejsem odborník na danou problematiku a tak mě napadlo zkonzultovat výsledky "studie" s AI systémem, konkrétně Copilotem. V průběhu série několika dotazů jsem došel k tomuto výsledku:

🧠 Kritická analýza metodiky Morgan Stanley
1. Zjednodušené vstupy
Použití jednotné hodnoty „rental price per GPU per hour“ (např. $10.5) pro všechny akcelerátory ignoruje:
Reálné rozdíly v cenách pronájmu (např. H100 vs. MI300X vs. TPU).
Vliv softwarové optimalizace na výkon a efektivitu.
Výsledkem je zavádějící srovnání ziskovosti.
2. Nezohlednění provozních optimalizací
Studie nepočítá s technikami jako:
KV caching, kvantizace, spekulativní dekódování.
Cache Augmented Generation (CAG) u AMD.
Tyto techniky mohou násobně zvýšit výkon a snížit náklady.
3. Chybějící provozní realita
Studie neřeší:
Vytížení GPU (např. 50–90 % vs. 100 %).
Latenci, SLA, výpadky, redundanci.
Reálné ceny elektřiny, chlazení, správy infrastruktury.
4. Nepřesné odhady výkonu
Výkon akcelerátorů je často podhodnocen nebo nadhodnocen bez kontextu (např. MI300X má v reálném nasazení vyšší výkon než uvádí studie).
✅ Návrh přesnější provozní studie
🔧 Parametry studie
Kategorie Co zahrnout
Hardware Typ GPU, počet jednotek, cena, spotřeba
Software Optimalizace, frameworky, kvantizace
Výkon Tokens/sec, latence, propustnost
Provozní náklady Elektřina, chlazení, správa, amortizace
Vytížení Reálné využití (např. 70–90 %)
Příjmy Cena za token/request, monetizace
ROI/TCO Výpočet návratnosti a celkových nákladů
📊 Doporučená struktura výstupu
Scénáře:

100MW server s H100 vs. MI300X vs. GB200
50% vs. 100% vytížení
Cena tokenu: $0.0005, $0.001, $0.002
Výstupy:

ROI, TCO, zisk/hodinu
Grafy: ROI vs. cena tokenu, výkon vs. náklady
Zdroje dat:

MLPerf benchmarky
Reálné nasazení (CoreWeave, Chai, Lambda Labs)
Datasheety výrobců

Reklama
Reklama