Zpět na článek

Diskuze: GPU-Tech a využití GPU k výpočetním úkonům

Nejsi přihlášený(á)

Pro psaní a hodnocení komentářů se prosím přihlas ke svému účtu nebo si jej vytvoř.

Rychlé přihlášení přes:

Reklama

Federmann

Level

23. 6. 2007 20:35

Komentáře tohoto uživatele máš zablokované.

@PetFish Děkuji za odpověď, za překlep se samozřejmě omlouvám. Jen ve zkratce:
Hlavním tématem byl výpočet pomocí GPU a jeho výhody, mezi které nesporně patří velká paralelizace výpočtu, pokud vezmu vlákna tak každému jádru odpovídá jedno vlákno…
Počítání pomocí CPU je v některých případech značně pomalejší, navíc má mnohem méně jader a tím může zpracovávat méně vláken…
Pouze jsem poukázal na bod vzniku odlišnosti architektur, CPU a GPU, ale taky na okamžik vzniku odlišnosti architektur hlavních výrobců procesorů. Intel šel cestou vyšších frekvencí a AMD velkou paralelizací. Zde jsem neměl samozřejmě na mysli žádný konkrétní procesor, ale celou platformu a možnosti, které platforma vytváří. Grafické karty šly v paralelizaci výpočtu ještě dál, opět nemám na mysli žádnou konkrétní kartu, ale trend, který na poli grafických karet převládá.
Samotný článek není zaměřen na konkrétní procesor, ani na konkrétní grafickou kartu, ale ukazuje další možný směr vývoje či nárůstu výkonnosti PC pouhým softwarovým zásahem. Pokud dá někdo odborný dotaz, mám za to, že má jisté odborné znalosti. Pokud jeho znalosti přecením, pak mu budu vysvětlovat, to co dobře zná, pokud jeho znalosti nedocením, pak použiji některé výrazy či pojmy, kterým samozřejmě nerozumí. Jako další možnost nedorozumění je, že tazatel má na mysli konkrétní procesor a já možnosti, které skýtá. To je situace, která právě nastala.
Vy jste měl na mysli jedno vlákno a k němu jedno jádro a já více vláken a více jader, ale jak jsem k nim došel, jsem považoval za samozřejmost. Tím mohl vzniknout nesprávný dojem, že nerozlišuji druh vzniku více vláken. Ale já jsem neměl potřebu rozlišovat možnosti jak toho dosáhnout, proto jsem je ani neuváděl. Pro mne bylo spíše rozhodující, že Intel je omezen maximálním počtem, AMD je omezeno maximálním počtem a grafická karta je omezena maximálním počtem, tato počty se od sebe značně liší, dokonce v jednom řádu, je zcela jedno zda Intel složí Quad-Core, nebo dokonce dvě a ještě použije virtualizaci jader, kterou užíval dříve. Předpokládám, že při této úvaze nebude čtenář uvažovat cestou, že AMD použije jedno-jádrový procesor a tím je mnohonásobně vyšší paralelizace u Intelu. Vše se samozřejmě vztahuje k PC, jak jej známe. Extrémy spojování jako velké servery či superpočítače sem nepatří.
Postačí taková odpověď?

PetFish

Level

24. 6. 2007 13:08

Komentáře tohoto uživatele máš zablokované.

@PetFish Ano, takovato odpoved uz je jasna.
Nicmene pripada mi prilis zjednodusujici Vase uchopeni pojmu paraelizace a zpusob porovnanvani vykonu.
P4 slo na urovni jadra mimo jiné cestou zvysovani frekvence na frekvenci (souhlasim)
K8 slo na "paraelizaci", ale byla to paraelizace pod urovni vlakna (IPC) a rozdílná architektura umoznujici efektivněji multiprocesoring ... prave tam vidim nejvetsi problem z hlediska Vaseho uchopeni tematiky: paraelizace je siroky pojem a v ramci teto tematiky bych videl 3 druhy paraelizace:
- u CPU pod urovni vlakna (IPC)
- u CPU na urovni vlakna (vice threadu, vice jader, vice CPU)
- u GPU, ktere je architektonicky uplne odlisne od CPU
Vy tyto tri pojmy smichate do jednoho a reknete vetsi paraelizace = vetsi vykon ve FLOPs ... jenze to je pravda pouze pokud pojem paraelizace definuji odvozene od vykonu ve FLOPS (Vykon/pocet cyklu za jednotku casu), ale to je pak definice kruhem (pouze pouziti jinych slov na popis ciloveho stavy, kdy GPU je vykonejsi z hlediska operaci v plovouci desetinne carce nez CPU).
Jinak je dopad paraelizace na uroven vykonu platny pouze pri zmenach ceteris paribus. Mezi ruznymi architekturami jsou pak vztahy mezi vykonem a stupnem "paraelizace" ponekud slozitejsi a skutecny rozdil ve vykonu vyplyva z architektury, kdy GPU je v podstate specializovany matematicky procesor (vykony pro urcite druhy zpracovani dat), zatim co CPU tuto specializaci postrada. Rozdily mezi CPU pak vyplyvaji zejmana z poctu a vykonu FPU jednotek v ramci jadra (a pripadne z efektivity a rozsahu multiprocesoringu).
Nyní k faktickym chybam
- Za opravdu velkou chybu povazuji v clanku smichani pipeline a delky shaderoveho programu.
- Jak jiz vyse někdo poznamenal AMD mělo prvni 1ghz procesor
Další velmi sporne body:
- myslenku s 4kanalovym radicem u K8 jsem nepochopil
- srovnavani podobnosti a rozdilu architektur K7, K8, P3 a P4 (moc nesouhlasim s tim, která CPU vidite jako obdobna a která jako rozdílná)
- vykonostni prevaha K8 nad P4 mi ve FLOPS unika - pokud merim přes rating, jsou K8 a P4 priblizne stejne vykone, pouze pokud merim přes realnou frekvenci je K8 vykonejsi
- není vhodne srovnavat „vlakno“ stream procesoru GPU a vlakno bezici nad jednim jadrem CPU
- a dalsi, ale to by bylo na A4

Pokud to mam shrnout svůj nazor: clanek by mel asi skončit na urovni konstatovani, ze GPU je vykonejsi a nepokouset se analyzovat důvod vyssiho vykonu přes „paralelizaci zpracovani“, protože to by si vyzadalo rozebrat problematiku do obrovske sirky a hloubky (frekvence, datove sirky, latence, delky pipeline, architektura, …). Takto je clanek velmi kontroverzni a pro „laika“ v problematice spise matouci (a to se tyka i většiny vysvetlujicich prispevku v diskuzi pod clankem).

Reklama

Diskuze: GPU-Tech a využití GPU k výpočetním úkonům

Nejnovější komentáře

Nejčtenější obsah

Nejaktivnější čtenáři

Pokračujte ve čtení