Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

Nvidia Tesla K20 - součást nejvýkonnějšího superpočítače

27.11.2012, Petr Štefek, technologie
Nvidia Tesla K20 - součást nejvýkonnějšího superpočítače
V dnešním článku si představíme hardware, který se stal stěžejním základem pro nejvýkonnější superpočítač Titan. Základem akcelerátorů Tesla K20 je jádro GK110, které drží primát čipu s největším množstvím tranzistorů.
Nvidia Tesla K10 má jednu zásadní vlastnost, a to, že se jedná o dual GPU kartu, která je velmi podobná high-endovému hernímu modelu GeForce GTX 690. V minulosti byla Tesla typická tím, že disponovala pouze jediným high-endových jádrem (Fermi GF100/110) a kromě dalších menších úprav disponovala hlavně podstatně větší kapacitou paměti, která je v případě profi aplikací rozhodně potřeba. Jádro GK104 nepředstavuje top produkt Nvidie, kterým je dneska zbrusu nový počin GK110. Ten ale v běžných grafických kartách nenalezneme.





Nvidia potřebovala velký surový výkon proti konkurenčnímu čipu Tahiti (Radeon HD 7970), a tak stvořila relativně jednoduché GPU s velkým počtem stream procesorů a zřekla se odděleného taktu pro shaderovou část čipu, čímž uspořila také nezanedbatelnou porci nutných tranzistorů. Výkonnost GK104 v GPGPU není nijak oslňující, na čemž má zásluhu jednak chybějící zmiňovaný hardwarový scheduling ale také velmi slabý výkon FP64 (1/24). Svým výkonem se tak zařadí docela hluboko pod GF110 a její výkon je spíše podoben mainstreamovému jádru GF114, které známe z GeForce GTX 560. Dalšími faktory, které GK104 předurčovaly spíše pro zábavu, byl nižší počet registrů na jeden stream procesor (CUDA Core) nebo úplná absence ECC. Error Code Correction napravuje alespoň částečně Tesla K10 na úrovni pamětí (podobně jako v případě operační paměti serveru s vyhrazeným opravným bitem).

Uvedení profi řady Tesla právě s jádrem GK104 bylo velkým překvapením. Nvidia ale ve své produktové mapě uvažuje nad Tesla K10 jako nad akcelerátorem pro specifické účely, kde její handicap v FP64 nebo podpora úplného ECC nebude na škodu věci. Vzniká nám tedy jakýsi „low-cost“ produkt Tesla. Poprvé tak Nvidia tak nabízí levnější (K10) a dražší (K20) variantu, které má výrazně větší předpoklady pro HPC a specifického úlohy jako je molekulární dynamika nebo biochemie.




Podle Nvidie je Tesla K10 vhodným akcelerátorem pro pomoc při projektech jako je hledání zásob plynu a ropy (seismická data jsou využívána pro výpočty za pomocí Kirhoffových integrálů, vlnové rovnice atd.) nebo zpracování signálu a obrazu. Můžeme uvažovat například těžařské společnosti, bezpečnostní agentury nebo veřejný sektor. V těchto specifických nasazeních je potřeba pouze velký surový výkon a solidní paměťová propustnost. Výsledky nejsou dramaticky ovlivněny absencí ECC nebo double precision výpočtů, jako je tomu u čistě vědeckých aplikací. Nvidia tak zřejmě chce cenově i funkčně oba produkty odlišit, aby si vzájemně nekonkurovaly.

Prozatím můžeme o reálném výkonu Tesla K10 pouze spekulovat, ale vsadím se, že ve specifickým aplikacích smysl mít bude. Aby nedošlo k mýlce tak GeForce GTX 690 disponuje také dvěma jádry Gk104, ale na rozdíl od „profi“ verze postrádá například ECC na úrovni paměti a také má poloviční kapacitu paměti. Nvidia si segmenty, pro které využívá své GPU, rozčlenila do tří skupin. Tou první jsou profesionální grafické karty Quadro, které se odlišují především ovladači a BIOSem karet. Druhou skupinou jsou herní akcelerátory pro PC a notebooky. Jako poslední v řadě, ale rozhodně s velkým potenciálem, jsou akcelerátory Tesla.





Teoretický výkon 4.58 TFlops (FP32) je u Tesla K10 podpořen relativně vysokou propustností pamětí GDDR5 na taktu 5 GHz s „papírovou“ hodnotou na úrovni 320 GB/s. Je zde ovšem nutné počítat s tím, že tato propustnost je součtem pro obě GPU, kde každé z nich má svůj paměťový řadič a 16 paměťových čipů GDDR5 o kapacitě 2 GB. Jejich celkový počet 32 dává dohromady 8 GB paměti. Takt jádra je v případě Tesla K10 stanoven na 745 MHz, což v kombinaci s relativně nízkou spotřebou GK104 na 28nm procesů dává TDP na úrovni 225 W. To odpovídá jednojádrovým kartám minulé generace, jako je GeForce GTX 580 nebo její souputník z profesionálního světa pod označením Tesla M2090. Na trhu je Tesla K10 dostupná od července tohoto roku. Nvidia si cení Tesla K10 na v přepočtu něco okolo 50 tisíc korun, takže je to výrazně méně než v případě K20, ale také tuto kartu můžete využít v pracovních stanicích a není určena primárně pouze pro HPC.
Doporučujeme náš velký přehled desktopových grafických čipů.