Zpět na článek

Diskuze: Intel Larrabee: nová éra výpočetní techniky

Nejsi přihlášený(á)

Pro psaní a hodnocení komentářů se prosím přihlas ke svému účtu nebo si jej vytvoř.

pavel_p
pavel_p
Level Level
3. 9. 2008 20:24

Komentáře tohoto uživatele máš zablokované.

.... „general purpose“ procesor, to označuje univerzální výpočetní jednotku schopnou zpracovat libovolný x86 kód...

Toto by chtělo trochu upřesnit, z různých náznaků to vypadá na nějaké Pentium s 64bitovými instrukcemi, odlišnými SIMD instrukcemi (odlišnými od MMX, SSE) a z toho nelze moc tušit jak rychle na tom pojede jedna aplikace využívající jeden thread. Nové aplikace z toho těžit mohou (díky více threadům a novým SIMD instrukcím), ale pak padá výhoda kompatibility a SIMD instrukce žádný překladač C++ apod. nevygeneruje. Jestli programátoři napíší kód v nějaké knihovně co z nových vlastností těží nebo použijí nějaký céčku podobný jazyk pro shadery je celkem jedno.

... Situace se ale drasticky změní, když začneme poptávat zpracování vektorových operací (multi-threaded) a procesoru v patici základní desky necháme běžné operace.

Pak bych měl výhradu k tomu, že vektorové operace znamenají něco jako multithreading. Opakující se výpočty lze paralelizovat jednak více vlákny a jednak tím, že se použijí instrukce SIMD (sigle instruction, multiple data), které dokážou provádět v jedné instrukci třeba 4 násobení (jako SSE). V tabulce srovnávající C2D a larabee je to dobře.

K obrázku srovnávajícímu raytracing a rasterizaci - zrcadlo bylo už v Q3A, možná dříve. Podobného efektu se dá dosáhnout např. pomocí environment mappingu, viz. třeba http://developer.nvidia.com/object/cube_map_ogl_tutorial.html i když je použití omezené pro dynamické scény a vzájemné odlesky.

... tile-based renderingu. Pracuje se jen s daty, kterou jsou skutečně potřeba. Grafické čipy ATI nebo Nvidia pracují se všemi daty scény bez ohledu na to, jestli jsou nebo nejsou nakonec viditelné.

Co se týká transformací tak ano, rasterizace (obarvení, pokrytí texturami, vykreslení) neprobíhá, pokud je příslušný trojuhelník překrytý jiným nebo orientován směrem od pozorovatele.

Jinak díky za článek, sice obsahuje nepřesnosti, ale dozvěděl jsem se díky němu něco nového.

Petr Štefek
Petr Štefek
Level Level
4. 9. 2008 15:10

Komentáře tohoto uživatele máš zablokované.

@pavel_p Vidim, ze se v dane problematice opravdu orientujete. Dekuji za prinosne poznamky. jen v pripade toho raytracingu je jasne, ze ten jevetsi prinos jsou reflexe a refrakce, ktere se u klasicke rasterizace delaji jako simulace toho, co je pro RT prirozene. mam zato ze dokonaly svetelny model je vyhrou pro vetsi realitu v nastupujicich hrach. Enviroment mapping je proti tomu ponekud tezkopadnejsi.

rotik
rotik
Level Level
28. 8. 2008 13:22

Komentáře tohoto uživatele máš zablokované.

Díky za skutečně zajímavý článek, byť třeba odněkud převzatý. Opravdu mě čtení této problematiky chytlo.

satai
satai
Level Level
28. 8. 2008 10:11

Komentáře tohoto uživatele máš zablokované.

Larrabee a fuze je pravdepodobne neco dost jineho. Fuze od AMD ma byt spojenim klasickeho CPU a kalsickeho GPU do jednoho balicku (a snad i na jeden kus kremiku), Intelovsky +-ekvivalent jsou nektere varianty Nehalemu (Havendale). Je to reseni heterogeni. Co prinasi Intel je unifikovana masivne paralelni architektura s x86-64 instrukcni sadou. Zda se bude hodit na hry netusim (48xx i 2x0 jsou pekne rychle kusy kremiku), ale vsadim boty, ze po ni skoci spousta vyvojaru, vedcu a inzenyru, kterym jsou dnesni top procesory malo, GPU se jim programuji s obtizemi a maji dobre paralelizovatelne ulohy.

andrey
andrey
Level Level
28. 8. 2008 10:37

Komentáře tohoto uživatele máš zablokované.

@satai treba si polozit otazku, ci je pre GPU a GPGPU riesenie podstatne, ze vyuziva x86 architekturu. binarna kompatibilita tu nie je podstatna, ulohy vyuzivajuce masivny paralelizmus treba (pre)kompilovat tak ci tak.
intel to nerad pripusta, ale dnesne gfx cipy uz maju vlastnosti general purpose procesorov a su masivne paralelne.
co sa tyka presadenia GPGPU, podla ma rozhodne API a v druhom poradi vykon. a co som pocul od znamych z pocitacovej grafiky, CUDA vyzera dobre.
ak by nV vytvorila CUDA alianciu s AMD, mali by oproti intelu perspektivnu sancu presadit svoje riesenie.

satai
satai
Level Level
28. 8. 2008 10:43

Komentáře tohoto uživatele máš zablokované.

@andrey Jak rikam - naprosto netusim, jak to dopadne u GPU. x86 je tam vyhoda, ale mala.
Soucasne GPU jsou trochu programovatelne, ale ve srovnani s x86 (ARMem, Power architekturou, Sparcem...) je to zoufala nahrazka. CUDA nevypada nijak strasne, ale prijde mi to pro mnoho veci jako "malo spatne" reseni. Paralelni x86 by v mnoha pripadech byla pro programovani prijemnejsi, protoze by nenutila vyvojare tolik ohybat datove struktury.

JiVy
JiVy
Level Level
28. 8. 2008 10:53

Komentáře tohoto uživatele máš zablokované.

@andrey Nvidia to AMD nabízela, ale AMD asi zatím málo teče do bot aby to přijali.
Samozřejmě by tu byl problém s tím, že spoustu patentů dneska vlastní NVidia a AMD by se tak dostalo do závislého postavení.
IMHO je to hlavně v zájmu NVidie, protože bez spolupráce s ostatními své nové technologie neprosadí a přitom je z hlediska dlouhodobé perspektivy na tom z trojlístku Intel, AMD, NVidia nejhůře.

andrey
andrey
Level Level
28. 8. 2008 16:50

Komentáře tohoto uživatele máš zablokované.

@andrey co sa tyka datovych struktur, je to otazka jazyka (CUDA: C + extenzie) a kompilatoru. nikto netusi, ako sa bude programovat Larrabee, ale asi tiez C + ext.
vacsi zmysel by malo zrovnavat vypocty na GPGPU vs. SSE, Altivec a podobne rozsirenia, cize SIMT (single-instruction, multiple-thread: CUDA) vs. vektorovy SIMD.
samotne x86 jadra Larrabee kod zazracne nesparalelizuju.

satai
satai
Level Level
29. 8. 2008 10:14

Komentáře tohoto uživatele máš zablokované.

@andrey CUDA nepouziva primarne C++ ale C.

Pocitam, ze Intel vyda nejake predpripravene knihovny se zakladnimi rutinami ve stylu FFT. Jak bude vypadat SDK netusim, ale dovedu si predstavit moznost m.j. pouzit bezne paralelni konstrukty (thready pro vetsinu jazyku). A uvidime, co nato Erlang :-)

Ondra_1
Ondra_1
Level Level
27. 8. 2008 23:55

Komentáře tohoto uživatele máš zablokované.

clanek ruznym zpusobem porovnava cache larrabee a pentia, ale kupodivu nezminil pravy duvod cache a to jsou stale se rozevirajici nuzky mezi frekvenci procesoru a latenci hlavni pameti, to je ten duvod proc larrabee ma L2 na cipu a puvodni pentium ho nemelo, tedy s vyjimkou L2 na desce, protoze v te dobe jeste bylo mozno vyrobit SRAM s latenci, ktera byla schopna vykonu pomoci. V clanku jsem se o tom bohuzel nic nedocetl...

Petr Štefek
Petr Štefek
Level Level
28. 8. 2008 01:15

Komentáře tohoto uživatele máš zablokované.

@Ondra_1 Mate 100% pravdu...bohuzel neznam nebo neumim popsat to, na co narazite ve vasem prispevku. V clanku samotnem je tato problematika pouze natuknuta...

andrey
andrey
Level Level
28. 8. 2008 10:07

Komentáře tohoto uživatele máš zablokované.

@Ondra_1 "protoze v te dobe jeste bylo mozno vyrobit SRAM s latenci, ktera byla schopna vykonu pomoci" -- to nie je pravda. ako L1 cache sa uz dlho pouzivala SRAM na plnej vnutornej frekvencii procesoru. ze L2 nebola na cipe, bolo z technologickych dovodov (vyrobny proces) a s tym suvisiacej ekonomiky vyroby. a tiez to suvisi Amdahlovym zakonom, totiz, aj keby mala L2 4MB a bezala na plnej rychlosti, samotny vypocet by sa zrychlil povedzme len o 25% (a naklady povedzme 20x).
Pentium bol in-order dual-pipelined procesor, nepotreboval kvantum dat v cache.

Ondra_1
Ondra_1
Level Level
28. 8. 2008 14:07

Komentáře tohoto uživatele máš zablokované.

@andrey vsak jsem psal ze L2 byla na desce, bezela na frekvenci sbernice, protoze tehdy jeste nebyl takovy rozdil mezi frekvenci CPU a rychlosti sbernice. Dneska by se to proste nevyplatilo,ani cenou ani vykonecm, levnejsi je integrovat L2 na cip, kde pobezi na frekvenci CPU.

Zdeněk Michálek
Zdeněk Michálek
Level Level
27. 8. 2008 21:27

Komentáře tohoto uživatele máš zablokované.

díky, početl jsem si a těším se na další články. K (rozumnému) zaujetí - osobně ho mám rád, není nic horšího než přísně neutrální články. S článkem psaným se zaujetím se dá souhlasit, dá se s ním polemizovat nebo třeba autorovi vynadat ;-) , u přísně neutrálního lze tak akorát pokrčit rameny.

Petr Štefek
Petr Štefek
Level Level
28. 8. 2008 01:18

Komentáře tohoto uživatele máš zablokované.

@Zdeněk Michálek Přesně tak, přísně neutrální články jsou nudné a nevedou nikam...jakoby nebyly napsány a nikdy neexistovaly

Boguš
Boguš
Level Level
1. 9. 2008 13:54

Komentáře tohoto uživatele máš zablokované.

@Petr Štefek heh .... od vás to sedí ... :) :) :)

Petr Štefek
Petr Štefek
Level Level
27. 8. 2008 18:34

Komentáře tohoto uživatele máš zablokované.

Clanek na ehw myslim ma tak tretinovy rozsah takze tezko...ten clovicek vyse evidentne nema rad ani mou osobu ani shw, ale s tim mu holt nepomuzu.

bigless
bigless
Level Level
27. 8. 2008 17:50

Komentáře tohoto uživatele máš zablokované.

Článek je velmi kvalitně a rozsáhle pojat. Proti provedení, stylistice a obsau nic nemám. Jen jsem v průběhu čtení měl takový pocit, že je do textu vloženo trochu moc zaujetí na to, že tento produkt ještě nespatřil světlo světa mezi uživately a neukázal prakticky nic(mimo již zmíněného ray-tracingu, který byl nepochybně sw optimalizován samotným výrobcem). Připadá mi to s dovolením jako lehká propaganda, ale to může být samozřejmě dáno i samotným vztahem autora(nadšení) k dané technologii.. Přísliby jsou více než optimistické, budu zvědav jakou se nakonec ukáže praxe... Koneckonců, Physx byl živým důkazem. Pravda Intel je brand jiných rozměrů..záleží jak se k tomu postaví, jaká bude skutečná výpočetní síla, jaké bude vývojové prostředí a jak si s tím poradí samotní vývojáři.. Je to dost faktorů na tolik chvály v předvečer vypuštění dle mého.. :)

Petr Štefek
Petr Štefek
Level Level
27. 8. 2008 18:28

Komentáře tohoto uživatele máš zablokované.

@bigless Ano, neni to jen vas pocit. Jsem nadseny z podobnych technologii a prorokuji tomuto reseni uspech v budoucich letech. Stejne tak jsem zastancem ray-tracingu ... prestoze se nejedna o nejnovejsi technologii nebo ze je Nvidia proti:)

Miko
Miko
Level Level
27. 8. 2008 18:31

Komentáře tohoto uživatele máš zablokované.

@Petr Štefek dovoluji si reagovat "je to rebel!", že? Ale proč ne, třetí hráč na poli s jiným řešením... kdo ví, také jsem opatrně nadšený :)

JiVy
JiVy
Level Level
27. 8. 2008 18:54

Komentáře tohoto uživatele máš zablokované.

@Petr Štefek Měl jsem pocit, že nové NVidia karty raytracing zvládají poměrně dobře. Samozřejmě zatím nikdo nemá dostatečný výkon na plnou herní grafiku v reálném čase.

JiVy
JiVy
Level Level
27. 8. 2008 18:57

Komentáře tohoto uživatele máš zablokované.

@Petr Štefek Já jsem spíše zvědavý a čekám zemětřesení v oblasti GPU.
V klíčových technologiích, kam GPU nesporně patří, je na trhu dlouhodobě místo pouze pro dva hráče. Takže pokud Intel uspěje bude muset jeden z dvojice AMD/ATI z kola ven.

Boguš
Boguš
Level Level
1. 9. 2008 13:53

Komentáře tohoto uživatele máš zablokované.

@Petr Štefek AMD jej zvládá lépe .. viz porovnání tech. ray-trc dem

mr.qeg
mr.qeg
Level Level
27. 8. 2008 15:23

Komentáře tohoto uživatele máš zablokované.

Velmi dobrý článek pane Štefku a jen doufám,že zde bude více článků od vás,protože v poslední době SHW články o grafických kartách nějak "nevedl":D

Petr Štefek
Petr Štefek
Level Level
27. 8. 2008 15:48

Komentáře tohoto uživatele máš zablokované.

@mr.qeg Grafickych karet bude opet hodne. Prvni test bude opozdeny HD4870 X2 a po ni nasleduje ihned 4870 1GB. Ale protoze jsem nebyl prilis spokojen s vysledky recenzi na ceskych webech, tak ta moje bude zamerena, tak aby byl videt skutecny vykon techto reseni a ne tabulkove pocty.

crazyman
crazyman
Level Level
27. 8. 2008 13:49

Komentáře tohoto uživatele máš zablokované.

su tu infosky z anandtechu, nevidim na tom nic zle.. a autor to doplnil o svoje nazory, tak vocogou??

Petr Štefek
Petr Štefek
Level Level
27. 8. 2008 13:19

Komentáře tohoto uživatele máš zablokované.

A dejte zde prosím link ten web o kterém mluvíte. Děkuji

rebit03
rebit03
Level Level
27. 8. 2008 15:33

Komentáře tohoto uživatele máš zablokované.

@Petr Štefek Myslím, že řeč je o tomto článku:
http://www.anandtech.com/cpuchipsets/intel/showdoc.aspx?i=3367

Petr Štefek
Petr Štefek
Level Level
27. 8. 2008 15:46

Komentáře tohoto uživatele máš zablokované.

@rebit03 Vsude jsou zmineny zdroje u tabulek i dvakrat v textu. Anandtech je spicka, tak neni duvod jejich zdroju nevyuzit. Tento clanek ovsem neni sprosty opis...zde bych mel ukazat prstem na jine ceske weby, ktere maji doslova prelozeny pasaze, ale neudelam to, protoze tyhle zabomysi valky odmitam vest.

JiVy
JiVy
Level Level
27. 8. 2008 15:48

Komentáře tohoto uživatele máš zablokované.

@rebit03 Konkrétní zdroj není podstatný. Právě skončilo Intel Developers Forum a proto se takovéto články budou objevovat všude.
Primárním zdrojem informací jsou samozřejmě Intelovské prezentace, které bývají na těchto akcích opravdu vynikající, podrobné a ukazují zpravidla vývoj nejméně na rok dopředu.
Byl jsem na takovéto akci před dvěma roky v Praze a některé z prezentovaných technologií byly uvedeny až letos.

rebit03
rebit03
Level Level
27. 8. 2008 16:06

Komentáře tohoto uživatele máš zablokované.

@rebit03 Ano, samozřejmě. Jen jsem chtěl přidat ten zdrojový článek. Do konfliktu se nijak zapojovat nechci.:b

JiVy
JiVy
Level Level
27. 8. 2008 16:35

Komentáře tohoto uživatele máš zablokované.

@rebit03 Je samozřejmé, že pokud se jedná o technologie, které má zatím pouze Intel, tak se dá vycházet jenom z jejich informací. Za dva roky si tu jistě rádi přečteme recenzi a test, ale teď prostě nikdo nic jiného nemá.
Nikomu by neprospělo kdyby se psalo jenom o tom, co si redaktoři můžou sami osahat.

Petr Štefek
Petr Štefek
Level Level
27. 8. 2008 13:16

Komentáře tohoto uživatele máš zablokované.

Radku_cerny netuším o co vám jde, ale můžete jít číst jinde.

Mem_
Mem_
Level Level
27. 8. 2008 12:53

Komentáře tohoto uživatele máš zablokované.

Že váš to baví, to sebemrskačství Čechů je až dojemné... když už tady urážíte, měl byste odkaz na ten článek, ze kterého autor údajně opisoval, aby si lidé mohli udělat vlastní názor? Takovéhle výkřiky jsou jinak o ničem

Boguš
Boguš
Level Level
1. 9. 2008 13:48

Komentáře tohoto uživatele máš zablokované.

@Mem_ Hehe ... asi nevíte že tady odkazy na cizí weby nefungují ... což jen mluví ve prospěch vámi kritizovaného pána ..

Jinak ... SH jde s kvalitou dolů. Stal se z něj neohrabaný otesánek který jen velmi nepružně a docela nudně reguje na dění v takto dynamickém odvětví.

Něhledě na to že o larrabee jsem se dozvěděl z jiných zde nemožno jmenovatelných webů daleko dříve a kvalitněji. Nejde o množství slov v článku, ale o obsah. Ale taky o sekci novinek, kde mají téměř všechny den až dva zpoždění oproti konkurenci.

Navíc, docela překvapko že zde P. Štefek píše ... jeho arogantní výstupy na HWM jen dokazují kam SH kráčí. Jeho arogance se lehce projevuje i v článku ...

Kdysi tohle byl jeden z mých oblíbených serverů, ale postupem času a hlavně díky kostantění webu sem závítávám spíše se zvyku.

Je to takové stašně suché. Nikde žádna uvaha, zamyšlení, trochu spekulací, odbornosti bez keců. Vše je omezeno čistně na články o kusech hardware, nebo techologie a to navíc s notným zpožděním ...

Jinak Pavel Kováč odvádí dobrou práci ... ale jako celek ... už pro mne nemá takovou cenu ...

Jeden z důkazů upadku je i vložení zeleného proužku s oslavujícím textem přímo do hlavního loga ... ble

V postatě je mi to jedno ... jsou zde jiné a lepší alternativy .. jen ta nostalgie ...

SH se vydává cestou mas, proč ne ... ale bezemne ..

andrey
andrey
Level Level
27. 8. 2008 12:08

Komentáře tohoto uživatele máš zablokované.

"U jedno-vláknového (single-threaded) výpočtu srazíme Larrabee na kolena, jelikož dokáže zpracovat pouze dvě operace za takt a jediný procesor Core 2 Duo bude díky možnosti zpracovat až 8 operací (2x4 operace u dual-core) jednoznačně rychlejší."

u C2D single-thread kodu nebude IPC 8 (instructions per cycle), ale len 4. ziadny procesor, ktory je na trhu, nevie vykonavat 1 thread na dvoch jadrach tak, akoby sa jednalo o jedno dvakrat tak rychle jadro.
a nie, intel core multiplexing skutocne nie je reverzny hyperthreading.

xkunes
xkunes
Level Level
27. 8. 2008 10:41

Komentáře tohoto uživatele máš zablokované.

Hezký článek, jen malá korekce k větě: "aritmeticko-logickou vektorovou jednotku, která zvládne 16 operací za sekundu (16-wide ALU)" ... jestli budou počítá 16 operací za SEKUNDU, tak to toho moc nezvládnou :-) .. to bude zřejmě za takt :-)...

Petr Štefek
Petr Štefek
Level Level
27. 8. 2008 11:29

Komentáře tohoto uživatele máš zablokované.

@xkunes Ano je to tak, uz na upozornovali vyse. Obcas se stane haluz, v dalsich kapitolach je ok.

Petr Štefek
Petr Štefek
Level Level
27. 8. 2008 10:15

Komentáře tohoto uživatele máš zablokované.

Diky to je haluz v textu:)...opravime.

Petr Štefek
Petr Štefek
Level Level
27. 8. 2008 10:08

Komentáře tohoto uživatele máš zablokované.

Stydím se...vypnu si automatické opravy ve wordu, někdy to dělá psí kusy.

randomofamber
randomofamber
Level Level
27. 8. 2008 09:29

Komentáře tohoto uživatele máš zablokované.

dobrá práce

Petr Štefek
Petr Štefek
Level Level
27. 8. 2008 10:19

Komentáře tohoto uživatele máš zablokované.

@randomofamber Děkuji, budu se snažit psát více takových článků.

Mem_
Mem_
Level Level
27. 8. 2008 09:17

Komentáře tohoto uživatele máš zablokované.

No ten obrázek rasterizace je samozřejmě tendenční - i tady jsou a běžně se používají metody pro odlesky a stínování

Petr Štefek
Petr Štefek
Level Level
27. 8. 2008 10:19

Komentáře tohoto uživatele máš zablokované.

@Mem_ Je tendenční, to nepopírám ... ovšem nění raytracing není pouze simulace efektu reálného. Lepší srovnání v jediné scéně jsem bohužel nenašel.

Mem_
Mem_
Level Level
27. 8. 2008 07:48

Komentáře tohoto uživatele máš zablokované.

Výborný článek, srozumitelně podané informace, díky. K doplnění chybek od diskutujícího nahoře bych ještě upozornil na "potencionální"

Reklama
Reklama