no a když už jsem byl v té analýze, nechal jsem si srovnat oba články. Jak tento, pod který píši, tak i ten původní na který se autor odkazuje. zde je výsledek:
🔍 Klíčové rozdíly a zjednodušení 1. Zjednodušená interpretace „rental price per GPU per hour“ Wccftech uvádí, že Morgan Stanley použil průměrnou hodnotu $10.5/hod jako referenční „rental price“ pro srovnání různých akcelerátorů. Svět Hardware tuto hodnotu prezentuje jako reálnou tržní cenu, což může být zavádějící – ve skutečnosti se ceny výrazně liší podle typu GPU, poskytovatele a konfigurace. 2. Zjednodušené hodnocení ziskovosti AMD Wccftech uvádí, že AMD MI300X má negativní marži -64 %, ale zároveň uznává, že AMD „má skvělý hardware“ a „intenzivně pracuje na softwarové optimalizaci“. Svět Hardware však tuto informaci interpretuje jako jednoznačný důkaz ztrátovosti, bez zmínky o kontextu nebo vývoji softwaru. 3. Chybějící nuance ohledně metodiky Wccftech zmiňuje, že Morgan Stanley použil modelové 100MW AI továrny pro srovnání různých platforem (NVIDIA, AMD, Google, AWS). Svět Hardware neuvádí, že se jedná o hypotetický model, což může vést čtenáře k dojmu, že jde o reálný provozní benchmark. 📌 Shrnutí Aspekt Wccftech (originál) Svět Hardware (překlad) Rental price Průměrná hodnota pro srovnání Prezentována jako reálná tržní cena AMD ziskovost Negativní, ale s výhledem na zlepšení Jednoznačně ztrátová bez kontextu Metodika studie Hypotetický model 100MW AI továren Není jasně uvedeno, že jde o model Softwarové optimalizace Zmíněny jako klíčový faktor pro výkon Nezohledněny v interpretaci
celý tenhle článek mi připadá divný a studie účelově psaná. Nejsem odborník na danou problematiku a tak mě napadlo zkonzultovat výsledky "studie" s AI systémem, konkrétně Copilotem. V průběhu série několika dotazů jsem došel k tomuto výsledku:
🧠 Kritická analýza metodiky Morgan Stanley 1. Zjednodušené vstupy Použití jednotné hodnoty „rental price per GPU per hour“ (např. $10.5) pro všechny akcelerátory ignoruje: Reálné rozdíly v cenách pronájmu (např. H100 vs. MI300X vs. TPU). Vliv softwarové optimalizace na výkon a efektivitu. Výsledkem je zavádějící srovnání ziskovosti. 2. Nezohlednění provozních optimalizací Studie nepočítá s technikami jako: KV caching, kvantizace, spekulativní dekódování. Cache Augmented Generation (CAG) u AMD. Tyto techniky mohou násobně zvýšit výkon a snížit náklady. 3. Chybějící provozní realita Studie neřeší: Vytížení GPU (např. 50–90 % vs. 100 %). Latenci, SLA, výpadky, redundanci. Reálné ceny elektřiny, chlazení, správy infrastruktury. 4. Nepřesné odhady výkonu Výkon akcelerátorů je často podhodnocen nebo nadhodnocen bez kontextu (např. MI300X má v reálném nasazení vyšší výkon než uvádí studie). ✅ Návrh přesnější provozní studie 🔧 Parametry studie Kategorie Co zahrnout Hardware Typ GPU, počet jednotek, cena, spotřeba Software Optimalizace, frameworky, kvantizace Výkon Tokens/sec, latence, propustnost Provozní náklady Elektřina, chlazení, správa, amortizace Vytížení Reálné využití (např. 70–90 %) Příjmy Cena za token/request, monetizace ROI/TCO Výpočet návratnosti a celkových nákladů 📊 Doporučená struktura výstupu Scénáře:
100MW server s H100 vs. MI300X vs. GB200 50% vs. 100% vytížení Cena tokenu: $0.0005, $0.001, $0.002 Výstupy:
ROI, TCO, zisk/hodinu Grafy: ROI vs. cena tokenu, výkon vs. náklady Zdroje dat: