Svět hardware

Level

1. 10. 2019 19:04

Komentáře tohoto uživatele máš zablokované.

@alien105cz Kdysi nebyly zas tak velké rozdíly mezi kvalitou jednotlivých jader, tzn. tato funkce neměla smysl.

A navíc Microsoft měl v tomto svázané ruce - tohle by nikdy nefungovalo bez toho, aniž by Intel/AMD binovali jádra a procesor následně údaje o kvalitě jader předal OS.
Nejdříve museli v AMD/Intelu začít binovat jádra, až pak mohl Microsoft něco takového spustit.

dom324

Level

24. 9. 2019 23:26

Komentáře tohoto uživatele máš zablokované.

@minduton To vždy záleží na konkrétní aplikaci.
Pokud máte program, který nezvládne pořádně vytížit všechny prostředky v jádře (protože jsou instrukce špatně paralelizovatelné), můžete pomocí SMT dostat škálování 180-190%, respektive nějakých 350-360% u 4 way SMT (konkrétní čísla jsou odhad).
Naopak program, který jde výborně paralelizovat a vytěžuje skoro všechny prostředky v jádře, při zapnutí SMT zpomalí, protože se bude muset o prostředky dělit s jiným programem - navíc bude trpět sníženou přesností predikce větvení. Proto zapnutím SMT většinou utrpí single thread výkon.

Dost záleží na tom, jak AMD upraví jádro. Pokud 4 way SMT není jen drb, hádal bych, že bude přidáno více exekučních jednotek - aby potenciální výkon získatelný skrz SMT byl ještě vyšší.

dom324

Level

24. 9. 2019 19:33

Komentáře tohoto uživatele máš zablokované.

@del42sa Normálně bych tomu taky moc nevěřil, ale tenhle "drb" o čtyřcestném SMT koluje vzduchem už hodně dlouho a přišel z různých zdrojů. Úplně bych ho nezatracoval.

dom324

Level

9. 4. 2019 21:40

Komentáře tohoto uživatele máš zablokované.

@Cemada Path Tracing je ještě minimálně o level náročnější než Ray Tracing. Tady je více informací o obou technikách https://www.youtube.com/watch?v=SrF4k6wJ-do

dom324

Level

16. 1. 2019 19:25

Komentáře tohoto uživatele máš zablokované.

@wrah666 Naopak. Každý kdo si kdy hrál v Blenderu ví, že hlavní vlastností materiálu je jeho roughness (opak lesklosti) - když vytváříte jakýkoliv materiál, roughness hraje zdaleka největší roli a musíte ji nastavit správně. A jeho nastavení není nijak složité, naopak, stačí pohnout s jediným sliderem.
Všechny programy jako je Blender, Maya nebo i enginy od Pixaru využívají PBR (Physically based rendering), což znamená, že každý materiál má své vlastnosti, stejně jako v běžném světě.

Disney před nějakou dobou "vynalezlo" Principled shader - když jste doteď tvořili materiál, museli jste použít několik shaderů a nakombinovat je spolu. Principled shader zastane práci všech shaderů (myšleno základních shaderů potřebných pro tvorbu realistických materiálů), umožňuje vytvořit jakýkoliv materiál právě podle jeho fyzikálních vlastností. A umí toho opravdu hoodně. Pokud se chcete dozvědět co tahle vychytávka umí, vřele doporučuji video od Blender Guru.

Jensen všude tvrdí, jak RT je vstupenka do reálnější grafiky, ale vše co zatím představili jsou jen přehnané odlesky. Jak psal pan Vítek v článku, chybí jim jakékoliv nedokonalosti, šmouhy.

dom324

Level

16. 1. 2019 19:14

Komentáře tohoto uživatele máš zablokované.

@danno Demo z Metra, které nVidia ukazovala, mělo mít právě RT global illumination - podle mě to demo bylo velmi slabé a ze všech zatím představených bylo nejhorší, to mělo ke global illimination hoodně daleko.

dom324

Level

17. 1. 2019 18:56

Komentáře tohoto uživatele máš zablokované.

@asip80 Jo, Ambilight navazuje lepší atmosféru a šetří oči (není tak velký kontrast mezi obrazovkou a pozadím).

dom324

Level

12. 11. 2018 17:29

Komentáře tohoto uživatele máš zablokované.

Výkonnostní údaje z původní prezentace byly více něž zavádějící, protože Intel na systémech s Epycy vypnul HT :) Udělali to proto, protože jejich 48C slepenec by měl s HT moc vysokou spotřebu, a tak má HT vypnuté. No a pro "férové" porovnání je přece nutné vypnout HT i na Epycích, že :)
Intel vypnutí HT uváděl v poznámkách na konci prezentace.

Dá se předpokládat, když v původní prezentaci testovali s vypnutým HT, tak v tomhle dodatku taky. Tudíž Intel uměle zpomalil Epycy o x%.

dom324

Level

23. 10. 2018 20:37

Komentáře tohoto uživatele máš zablokované.

Čína má už tak gigantický problém se světelným znečištěním, proč ho ještě nezvětšit :) Naprosto stupidní nápad, který by ostatní vlády měly číňanům zarazit.

dom324

Level

23. 10. 2018 20:34

Komentáře tohoto uživatele máš zablokované.

@wrah666 Je to tak jak píšete, při XOC na LN2 se dělá "validace", což je zkrátka zjištění při jak vysoké frekvencí zvládne najet Windows + CPU-Z. Jakákoliv sebemenší zátěž by systém shodila, dokonce ani to CPU-Z nebylo stabilní - kdyby na té ploše zůstali déle jak minutu, systém by na 100% zamrzl.

Samotné benchmarky se projíždí na o dost nižší frekvenci, u 9900K se jedná o cca 6,8-7GHz (Cinebench R15), a to je pořád na hraně stability.

Der8auer a ostatní si tekutý dusík platí sami, když dělají OC u sebe doma. Tohle byla OC akce uspořádaná přímo Asusem - Asus poskytl desky, zdroje, CPU i dusík a hélium.
Peníze možná nějaké dostali, ale ne zas tak moc. Brzo se bude konat GOC (Galax Overclocking Carneval), to bude OC soutěž kde se teprve budou vyhrávat pěkné ceny :) Jen za každý pokořený světový rekord se bude dávat tuším 1000USD.

dom324

Level

15. 10. 2018 23:02

Komentáře tohoto uživatele máš zablokované.

Důvod není to, že by FMA4 bylo implementováno chybně, důvod je úplně jiný.
Mezi Intelem a AMD (a kdysi i VIA a jinými) se na poli instrukční sady x86 vede něco jako studená válka - společnosti nejsou ochotné spolupracovat ve vývoji instrukční sady. Jednoduchý příklad: Cyrix vyvinul vlastní instrukci pro šifrování a implementoval ji do svých CPU, o nějakou dobu později Intel představil úplně stejnou instrukci, jen s jinou opcode (něco jako jméno, díky kterému dekodér rozeznává co instrukce dělá). Problém je, že když někdo představí novou instrukci, nemůže ji jen tak přestat podporovat. V CPU se drží podpora i několik desítek let starých instrukcí, nelze z ničeho nic přestat podporovat instrukci kterou jsme minulý měsíc představili. CPU Cyrixu tedy musely najednou podporovat dvě šifrovací instrukce místo jedné, i když byly naprosto shodné. Byly tam i mnohem větší problémy, kdy se nejednalo jen o jednu instrukci, ale o celé instrukční rozšíření složené třeba z 50-100 instrukcí.
Tímhle způsobem výrobci přidávali tunu zbytečných instrukcí do x86, až jsme se dostali do dnešního stavu, kdy všechny x86 CPU trpí na to, že dekodér není schopný dostatečně rychle zjistit, co za instrukci z těch více než dvou tisíc má HW vlastně počítat.
Když se objevila potřeba vytvořit nové vektorové instrukce, AMD a Intel samozřejmě nespolupracovali. AMD představilo FMA3, pak si to rozmysleli a představili FMA4, pár měsíců později Intel představil AVX - AVX dělalo úplně to samé co FMA4/3, jen Intel zvolil výhodnější opcody (tj. AVX bylo o něco málo lepší). Později Intel upravil specifikaci tak, že AVX bude umět jen instrukce s 3 operandami (FMA3), ne se 4 (FMA4).

Na jakékoliv změny v HW bylo už pozdě, AMD tedy u Buldozeru muselo vydat CPU s FMA4 a nemohlo (nestíhalo) přejít na AVX, Intel na FMA4 ani nechtěl přejít a stejně by to taky nestihl implementovat.

U Ryzenů se původně počítalo s podporou obojího (FMA4 i 3), jenže pak si uvědomili, že tak by si sami vytvořili strašný problém - zatímco Intel si bude dělat vektorové jednotky pro 3 operandy, AMD by v budoucnu muselo zcela úplně zbytečně podporovat mrtvé vektorové instrukce se 4 operandami, které NIKDO nepoužívá. Kdyby Ryzeny (oficiálně) podporovaly FMA4, riskovali by, že někdo udělá na FMA4 pár programů, FMA4 dostane trochu popularity a ejhle - nemohli by FMA4 v budoucnu vyhodit ze Zenu 2 popřípadě Zenu 3, museli by je podporat už navždy (vektorové jednotky jsou už tak obrovské, muset zcela zbytečně podporovat 4 operandy by zabralo obrovské množství křemíku).

dom324

Level

9. 10. 2018 14:30

Komentáře tohoto uživatele máš zablokované.

@snajprik Myslím, že většina lidí co hodnotila kvalitu Vašeho příspěvku, bohužel nepoznala tu ironii :)

dom324

Level

5. 9. 2018 22:09

Komentáře tohoto uživatele máš zablokované.

Vůbec jsem nevěděl, že Infineon má tržby na úrovni nVidie. Ale na druhou stranu je to logické, mají sice mnohokrát nižší marži, ale těch čipů prodají třeba tisíc krát více. Navíc když mají dost prostředků na to, aby koupili celé IR, je jasné že jejich příjmy nebudou malé.

dom324

Level

23. 8. 2018 16:51

Komentáře tohoto uživatele máš zablokované.

@snajprik 100% výtěžnost není nikdy. Každý wafer obsahuje chyby.
Kolik čipů se vleze na wafer lze jednoduše zjistit http://caly-technologies.com/en/die-yield-calculator/ (popřípadě http://www.silicon-edge.co.uk/j/index.php/resources/die-per-wafer ale ten neumí spočítat chyby. Výsledky vycházejí trochu odlišně, protože jsou nastavené trochu jiné mezery mezi čipy pro řezání - 0.08mm/0.2mm)rozměry čipu jsou 31x25mm. Výsledek je 64 čipů.
Umí spočítat i výtěžnost, ale k tomu potřebuje "Defect Density" (počet chyb na milimetr čtvereční) a ten TSMC jen tak nezveřejní.

dom324

Level

23. 8. 2018 12:13

Komentáře tohoto uživatele máš zablokované.

@sroobik V nadpisu je jasně napsáno slovo "firmám". Vy a kdokoliv jiný si může porovnávat co chce, týká se to pouze firem které souhlasili s těmi podmínkami.

dom324

Level

22. 8. 2018 23:20

Komentáře tohoto uživatele máš zablokované.

@slondyn Jádro se sice jmenuje Zen 2, ale jinak to budou Ryzeny 3 generace. AMD z těch názvů udělalo pěkný guláš. Řekne se Zen 2, a nikdo neví jestli je myšleno jádro Zen 2 nebo 12nm verze Zen 1 (Zen+).

dom324

Level

21. 8. 2018 09:41

Komentáře tohoto uživatele máš zablokované.

@Cemada To porovnání bylo trochu zavádějící, ve skutečnosti by se ten rasterizovaný render ještě doplnil o post processing a další vychytávky - byla to vyloženě extrémní ukázka.
Blender momentálně přidává nový renderovací engine - Eevee, je založen na rasterizaci a zaměřen hlavně na animace. Cycles (současný ray tracingový engine) má beze sporu hezčí výsledky, ale potřebný čas není několikrát delší, ale několikdesítekkrát delší. https://www.youtube.com/watch?v=HntAab0Z7tg https://www.youtube.com/watch?v=hgS3BTkBct0 dá se najít spousta ukázek.
Eevee zatím není hotový, ale ty výsledky jsou hodně slušné.

dom324

Level

19. 7. 2018 21:37

Komentáře tohoto uživatele máš zablokované.

@docik Když se podíváte do starých roadmap od AMD, je tam pro segment serverů (a tedy i ThreadRipperů) jako nástupce čipu "Naples" (současné Epycy a ThreadRippery) naplánován čip "Starship" s architekturou Zen 2 který má mít 48 jader. To bych bral jako minimální počet jader kterého se dočkáme. Těch 64 dost možná příjde, ale třeba s nějakým odstupem.
*Jen mimochodem - teď budete dělat upgrade buď z 8 na 32 jader nebo z 16 na 64 vláken :) Ve svém příspěvku jste asi omylem buď z 1800X udělal 16-ti jádro nebo z 2990X udělal 32 vlákno :)

dom324

Level

12. 7. 2018 17:10

Komentáře tohoto uživatele máš zablokované.

@Blaazen Vzhledem k tomu, že na 99,999999% je druhý M.2 slot napojený přes PCIe 2.0 x4 tak dá 2GB/s, stejně jako všechny ostatní desky.

dom324

Level

10. 7. 2018 13:20

Komentáře tohoto uživatele máš zablokované.

Jsem jediný, komu nadpis připadá jako jasný clickbait?

Nadpis zní jako by nVidia vyvinula speciální HW jednotky pro simulaci vlasů. Ale článek je o tom, že nějaká univerzita, která není nijak spojena s nVidií, vyvinula AI pro vytvoření 3D modelů vlasů z 2D fotek. Proč je tedy v nadpisu nVidia, když článek se nVidie vůbec netýká? Článek je přece o tom, že UNIVERZITA (ne nVidia) vyvinula AI, slovo nVidia nemá v nadpisu co dělat.

Chápu, že články týkající se nových GPU od nVidie mají vysoké prokliky, ale snad je nemusíte strkat někam, kam vůbec nepatří.

dom324

Level

25. 6. 2018 20:01

Komentáře tohoto uživatele máš zablokované.

@Jan Vítek Já bych očekával 7nm GPU (z obou táborů) až ke konci roku 2018/začátku 2019. A to spíše v malém množství.
TSMC teprve začalo s komerční výrobou 7nm procesu. Výtěžnost bude nízká, vhodná možná tak pro mobily, ale ne pro GPU s plochou několik stovek mm² a potřebou vysokých frekvencí.

dom324

Level

7. 6. 2018 21:40

Komentáře tohoto uživatele máš zablokované.

@coremar Vega 20 není jenom dieshrink. Je tam použitý dvakrát širší paměťový řadič (4096 bitů vs 2048), přidaná podpora pro FP64 + další HW zaměřený na AI. Dost možná tam budou i další změny (pravděpodobně předělali ty technologie, které nezvládly u Vegy 10 aktivovat). Tudíž bych se na poměr stran určitě nespoléhal.
HBM2 může být od Samsungu nebo Hynixu, takže těžko říct, jestli jsou použity totožné čipy jako u 14nm Vegy.

dom324

Level

3. 6. 2018 11:10

Komentáře tohoto uživatele máš zablokované.

@snajprik Nejspíš by se dalo nastavit 800MHz CL2 (ale kdo ví jestli by to bylo stabilní) a výkon by určitě nebyl vyšší. Pro každou frekvenci lze spočítat teoretickou maximální propustnost při ideálních časováních - když vynásobíte frekvenci * 8 (počet bytů na kanál u DDR4) * počet kanálů dostanete teoretickou maximální propustnost pro danou frekvenci. 800 * 8 * 2 = 12,8GB/s, větší propustnost z 800MHz čipů při dual channelu nedostanete, nikdy.
Z vlastního testování vím, že s B-Die od Samsungu se dá bez problému při frekvenci 3200MHz (max teoretická propustnost 51,2GB/s) dostat se čtením na 50,5GB/s (primární časování 14-13-13-13), zápis a kopírování byly o něco nižší ale atakovaly 50GB/s. Tzn. RAM byla cca 4 krát rychlejší než by byla jakákoliv 800MHz RAM za ideálních podmínek.
Čím vyšší frekvence, tím těžší je přiblížit se k tomu teoretickému limitu. Ta RAM v článku bude mít nízkou propustnost protože všechny časování budou volné. Ale třeba s 4000MHz a vyladěnými časováními se lze dostat ještě poměrně blízko teoretickému limitu (64GB/s).

Časování se spolu se zvyšující frekvencí snižují (CL2 800MHz je stejné časování jako 1600MHz CL4 a 3200MHz CL8). Časování udává počet cyklů, zvýšení frekvence zkrátí cykly.

RAM v článku měla primární časování 21-31-31-58 (podle příspěvku na HWBotu, ale připadá mi to dost nízké, dost možná tam zadali špatné časování).

dom324

Level

3. 6. 2018 10:40

Komentáře tohoto uživatele máš zablokované.

To byl pokus o max frequency, ne o maximální propustnost - ta bude tragická.
U Intel IMC je nejvyšší propustnost okolo 4000MHz (většinou kousek nad), Ryzen první generace má swšeet spot na 3466MHz a druhá generace na 3600/3733MHz. S těmihle frekvencemi lze dosáhnout nejvyšší propustnosti.

dom324

Level

14. 5. 2018 19:13

Komentáře tohoto uživatele máš zablokované.

@LukyCZK Jak píše Komplikator, nVidia ten čip oseká tak, aby byl na úrovni běžné GTX 1060. Ale skoro určitě nepůjde do běžných karet, použitelných čipů (těch, které mají částečně vadný paměťový řadič nebo mají více vadných CUDA jader než dovoluje GTX 1070) bude málo a nVidia do GTX 1060 zrčitě nebude strkat čipy použitelné do GTX 1070 nebo dokonce do GTX 1080.

Komentáře

Uživatelský žebříček