Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

Intel Larrabee: nová éra výpočetní techniky

27.8.2008, Petr Štefek, článek
Intel Larrabee: nová éra výpočetní techniky
Exotické pojmenování Larrabee coby nové technologie Intelu je možná revolucí v oblasti akcelerování grafiky ve hrách a jistě je políčkem do tváře sebevědomé Nvidie s platformou CUDA. Příští rok nás může čekat jedna z nejzajímavějších epoch akcelerace grafiky.
V minulé kapitolce bylo zmíněno, že základ Larrabee budou tvořit jádra, která jsou derivátem původního Pentia. Na tom se nic nemění, ale aby toho nebylo dost, Intel vylepšil tato jádra o podporu 64-bitových operací, upgrade x86 instrukčního setu, vetší on-die cache, 4-way SMT (simultánní zpracování více-vláknových operací) a 16-wide vektorovou ALU (Arithmetic Logic Unit). Nyní jsme již od původního Pentia podstatně vzdáleni, nemyslíte?


Struktura jediného jádra Larrabee (obsahuje jak vektorovou tak skalární jednotku)

Zahraniční servery často zmiňují podobnost mezi architekturou jádra Larrabee a současné nejnovější mobilní platformy Intel Atom. Faktem zůstává, že vývojový tým, který stál za zrodem Larrabee, stál také u vývoje Atomu. Obě platformy jsou ale natolik odlišné a zaměřené na jiný segment, že se jedná v některých ohledech pouze o jisté funkční podobnosti. Atom je určen pro mobilní segment a low-cost systémy, takže je vybaven specificky pro zpracovávání jedno-vláknových aplikací, čemuž napovídá přítomnost instrukční sady SSE, větší L2 cache nebo delší pipeline.

Velkou podobnost mezi originálním Pentiem a jádrem Larrabee tvoří právě krátká 5-stages pipeline (Atom má 16-stages pipeline). Jádro Larrabee má k dispozici 32kB L1 cache (32kB I/32kB D), což je rozdíl oproti původnímu Pentiu, které disponovalo 8kB L1 cache (8kB I/8kB D). Atom má naproti tomu k dispozici poněkud zvlaštně 32kB I-cache a 24kB D-cache, která je zmenšena z důvodu nutnosti úspory energie. Podle expertů na procesorové architektury má menší L1 cache zásadní vliv na spotřebu čipu.


Zdroj: Anandtech - Intel's Larrabee Architecture Disclosure: A Calculated First Move

Larrabee disponuje na rozdíl od Pentia také integrovanou L2 cache, která má velikost 256 kB a podle Intelu je tato velikost ideální pro tento typ procesoru zpracovávajícího převážně vektorové výpočty (dále v článku si povíme proč). Architektura Atom disponuje dvojnásobnou L2 cache převážně kvůli nasazení v desktopových aplikacích, kde přijde pomalejší a větší cache L2 vhod. Stará Pentia měla naproti tomu L2 cache integrovanou na základní desce, protože to bylo, pokud se týká návrhu čipu a nákladů, daleko efektivnější. Velká L2 cache okolo 1 MB by dobách 800nm procesu znamenala obrovitý procesor, který by bylo velmi těžké vyrobit, uchladit a zaplatit.

256kB L2 cache bude podle Intelu tou pravou velikostí pro Larrabee, které bude primárně nasazeno pro grafiku a využívat bude známé „tile-based“ metody, kde pro zpracování grafiky pod DirectX nebo OpenGL rozděluje scénu do polí o velikosti 64x64 bodů nebo 128x128 bodů a spolu s informací o barvě a hodnotě Z (32-bit RGB/32-bit Z). Jednoduchým výpočtem zjistíme, že 128x128x8 = 128kB + informace o hloubce a barvě dává dohromady rovných 256kB. Tile-based rendering známe například z dnes už prastarých grafických akcelerátorů Kyro, které se bohužel neprosadily v konkurenci tehdejších produktů Nvidia, 3dfx nebo ATI (více později).

Z předchozích odstavců můžeme usuzovat, že jádro Larrabee není příliš odlišné od běžně používaných jader pro procesory Intel. Jeden ze zásadních rozdílů je ovšem přítomnost speciální aritmeticko logické jednotky pro vektorové výpočty (16-wide ALU), která je specifická pro jádra Larrabee. Původní Pentium žádnou podobnou SIMD jednotkou nedisponovalo a u architektury Atom supluje tuto jednotku SSE (Streaming SIMD Extension), což ovšem není nic proti samostatné ALU Larrabee. Označení 16-wide ALU si získala tato jednotka schopností pracovat s až 16 32-bitovými operacemi v oblasti čísel s plovoucí desetinnou čárkou. Bez této jednotky by Larrabee nemohlo dosáhnout ani zdaleka k laťce požadovaného výkonu.

Posledním podstatným upgrade je podpora 64-bitových x86 operací a úprava hardwarových jednotek „prefetch“ pro předpovídání požadovaných operací, které budou pravděpodobně na rozdíl od Atomu optimalizovány pro využití při zpracovávání paralelních datových výpočtů. Jak je tedy snad vidět po přečtení této kapitoly, Larrabee má do původního Pentia hodně daleko a jedná se spíše o jakýsi hybrid mezi ním a novým Atomem.