Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

Shanghai vs. Nehalem aneb co chystá AMD a Intel?

6.6.2008, Lukáš Petříček, článek
Shanghai vs. Nehalem aneb co chystá AMD a Intel?
V dnešním článku se blíže podíváme na to, co pro nás chystají věční rivalové na poli procesorového průmyslu AMD a Intel. AMD má již brzy přinést inovovanou architekturu "K10.5" s jádrem Shanghai, zatímco Intel připravuje novou architekturu Nehalem.



V další části článku se podíváme na plány Intelu pro následující 2 generace procesorů a výrobních technologií. Následovník Core architektury, dlouho očekávaný Nehalem, má přijít již koncem roku. Funkční čipy jsou ale již dávno na světě a Intel je hrdě předvádí i na Computexu, který aktuálně probíhá v Taipei...


Co připravuje Intel


Uvádění nových procesorů na trh je obvykle postupný proces, nicméně nejpodstatnější novinkou na straně Intelu bude letos uvedení architektury nové generace přezdívané Nehalem. Intel se prozatím stále drží "Tic-Toc" strategie, která již byla několikrát prezentována na IDF. Změna architektury a výrobní technologie každé dva roky - stávající výrobní technologie, je použita pro novou architekturu, kterou později vystřídá její vylepšená verze založená na další generaci výrobní technologie. Při uvedení nové výrobní technologie, a s tím obvykle i nového jádra, se zde obvykle nejedná o čistý "die-shrink", tedy pouhé zmenšení jádra, ale architektura je samozřemě patřičně dopilována. Opraveny jsou některé chybky, přidána cache a podobně. Analogicky opět následuje další architektura založená na stejné generaci výrobní technologii a tak dále.


Intel "Tic-Toc" a strategie změny architektury a výrobního procesu každé dva roky - po uvedení Core architektury v roce 2006 došlo vloni k uvedení 45 nm výrobní technologie s jádrem Penryn - krok, který, Intel nazývá "Tick" a letos nás čeká takzvaný "Tock", kdy dojde opět k uvedení mikroarchitektury s označením Nehalem, zdroj: Intel

Současná architektura Core na trhu s procesory Intel jednoznačně převažuje, ačkoliv v řadě sestav můžeme stále ještě narazit na procesory s architekturou Netburst. Core architektura s příchodem Nehalemu samozřejmě nekončí. Jak pro desktopový, tak proserverový trh se chystá řada novinek, ačkoliv spíše bude docházet k uvádění dalších procesorů pro vyplnění mezer na trhu (včetně 45nm variant střední a nižší třídy), žádné zásadnější změny nás v desktopech již nečekají. Protože Nehalem doplní serverový segment pro 2socketový trh a oblast high-endu, Core architektura ani v serverovém trhu neřekla své poslední slovo. Kromě Itanií Intel chystá s Core architekturou ještě rozšířené jádro Dunnington, postavené na jádrech Penryn. Ačkoliv se v případě Dunningtonu jedná čistě o řešení pro serverový trh (a později jej vytlačí řešení na bázi architektury Nehalem), nemohu jej nezmínit, a to z několika důvodů.



Dunnington bude poslední update Core architektury a první nativní 6jádrový procesor. Čip budou tvořit tři dvoujádra Penryn na jediném kusu křemíku (následovník Tigertonu pro MP, pro 4 a 8socketové stroje). Jádro bude obrovské, poměrně jednoduchým výpočtem se přibližně dostáváme někde k hranici okolo 420 mm2, nicméně vzhledem k zaměření tohoto CPU jeho nepochybně vysoká cena nebude až takový problém. Architektura bude téměř shodná s jádrem Penryn. Zmenšena bude pouze L2 cache na 3 MB (sdílená vždy mezi dvě jádra) a přibude masivní L3 cache s velikostí až 16 MB (sdílená mezi všech 6 jader). Takto velká cache má samozřejmě svůj důvod - z L3 těží zejména databázové aplikace, navíc má Dunnington pouze 1066MHz FSB, takže zde každý MB cache přijde vhod.

Plánované TDP Dunnigntonu je 130 W a aktuální informace hovoří zatím o variantách až 2,66 GHz s 16 MB L3 cache. Nižší varianty budou obsahovat také 12 a 8 MB, případně deaktivovaná některá jádra. Kvůli výtěžnosti a možným chybám na takové ploše, a zejména v L3 cache, je uvedení takových modelů logický krok - případnou deaktivací části cache se stále jedná o pořádně velký funkční kus "křemíku". Dunnington s 1,9 miliardami tranzistorů a kompatibilní se současnou platformou Canneland (a čipset Clarksboro) bude poslední předzvěstí příchodu architektury Nehalem.



Mimochodem, v počtu tranzistorů nezůstává pozadu ani nejnovější Intel Itanium a jádro Tukwilla, které již obsahuje na 2 miliardy tranzistorů. Postavené navíc na 65 nm a s "obří" 30 MB cache se plocha vyšplhala na neuvěřitelných 699 mm2 (jedná se o nativní čtyřjádrový procesor s podporou SMT, QPI a TDP až 170 wattů). To se ale již dostáváme do oblasti zcela mimo osobní počítače.


Next Generation Microarchitecture - Intel Nehalem


Intel Nehalem má přijít již koncem tohoto roku a přinést lehkou revoluci pro Intel procesory a ačkoliv má kořeny v Core architektuře, přináší řadu podstatných vylepšení. Zřejmě nejzásadnější změnou bude přidání integrovaného řadiče paměti (IMC, Integrated Memory Controller) stejně jako tomu je u architektury AMD K8, ale dle slov Intelu IMC nebude nezbytně součástí všech procesorů (není žádným tajemstvím, že Intel by se samozřejmě připravil o část zisku z prodeje čipsetů a o variabilitu snadné evoluce řadiče paměti a platforem). Nehalem každopádně zůstane zpočátku doménou nejvýkonnějšího high-endu a serverového segmentu CPU.



Kromě integrovaného řadiče pamětí bude další výraznou změnou QuickPath Interconnect (dříve známý jako CSI, Common System Interconnect), kde Intel konečně nahradí FSB (Front Side Bus) sběrnici. FSB byla samozřejmě postupně zrychlována, případně některé serverové platformy umožnují použítí několika nezávislých FSB, ale takové řešení není příliš elegantní a stále nedosahuje možností a škálovatelnosti HyperTransportu nebo nově QPI u Intelu. V každém případě, změn je podstatně více a veškeré úpravy a vylepšení stávající architektury Core jsou logickým krokem k dalšímu navyšování výkonu CPU.

Počet jader u Nehalemu bude mezi dvěma až osmi podle nasazení procesoru - modulární bloky mohou být přídány/ubrány podle segmentu trhu. Nehalem je první architektura, která je plně škálovatelná jak s ohledem na počet jader nebo QPI, tak s ohledem na spotřebu a co nejvyšší efektivitu CPU. Narozdíl od současných řešení MCM (Multi Chip Module, několik čipů na jedné destičce) tak Intel nabídne s architekturou Nehalem varianty přesně podle segmentu trhu a navíc s podporou SMT (Simultaneous Multi-Threading). SMT je obdoba HyperThreadingu, kde každé jádro umí zpracovávat až 2 vlákna - čtyřjádrový Nehalem se tak pro operační systém bude tvářit jako procesor osmijádrový. SMT je velice efektivní cesta jak zýšit výkon v multithreaded prostředí, pro které je Nehalem primárně určený, a to s poměrně malou investicí do "křemíku" a dalšího výrazného zvětšování jádra. Ačkoliv architektura Nehalem počítá až s variantou, kde bude procesor ukrývat 8 jader (a díky SMT tak bude umět zpracovat až 16 vláken současně), masové nasazení těchto procesorů bude díky velikosti podmíněno 32 nm výrobní technologií. Pojďme se podívat na Nehalem podrobněji v číslech.


Intel Nehalem - plocha čipu má velikost přibližně 246 mm2 při 45nm výrobní technologii a obsahuje 731 milionů tranzistorů - každé jádro má 32 kB instrukční a 32 kB datové L1 a 256 kB L2 cache, 8 MB L3 cache je sdílená mezi všechna jádra, čip dále obsahuje 2x QPI a tříkanálový řadič DDR3 paměti, zdroj: Intel

Jak již padlo v úvodu, největší změnou bude integrovaný trojkanálový řadič paměti pro paměti typu DDR3. Podporovány zatím budou standardy DDR3-800, DDR3-1066 a DDR3-1333 (s takty 800, 1066 a 1333 MHz) a podporou až 3 DIMM modulů na kanál. S integrovaným řadičem paměti samozřejmě výrazně stoupne efektivita komunikace s pamětí a klesnou latence pro přístup do paměti - v případě použití 1333MHz pamětí se maximální přenosová rychlost pohybuje až okolo 32 GB/s. Tříkanálový řadič paměti bude nicméně pouze doménou high-endu a dostupné budou i varianty s dvoukanálovým řadičem paměti (stejně jako v případě integrovaného GPU bude možné postavit řešení "na míru").

Zmiňovaný "QuickPath" interconnect přinese vyšší výkon a zejména serverový trh pocítí tuto změnu nejvíce. U vícesocketových systémů platformy s FSB postrádají onu potřebnou škálovatelnost. Nová sběrnice zde odstraní úzké hrdlo a QPI "QuickPath" Interface zde bude doslova spásou. Na 45 nm přináší 6,4 GT/s s celkovou propustností až 25,6 GB/s a komunikace mezi sockety nebo čipsetem tak bude mnohem efektivnější. Novinky architektury Nehalem nespočívají pouze v IMC a QPI, ale oproti Core architektuře doznalo změn i samotné jádro. Rozšířena byla paralelizace a počet micro-ops byl zvýšen na 128 (jádro Penryn má 96, Yonah 64) a dále se zvýšila efektivita práce s cache. Odhady růstu výkonu jsou oproti Yorkfieldu v jednovláknových aplikacích o 10 až 20 procent, ale v multithreaded aplikacích s vysokou závislostí na paměťové propustnosti (díky SMT a integrovanému řadiči paměti) může vzrůst výkon až na dvojnásobek. Dostupné výsledky SPECint_rate2006, SPECfp_rate2006 (kde se AMD dařilo i s K8 a K10 přinesla jen další zlepšení) jsou doslova "brutální". Naopak v řadě singlethreaded aplikací bude nárůst výkonu v řádu jednotek procent, ale již Penryn má myslím v tomto směru špičkový výkon, takže se nejedná o žádný problém.



Základem architektury Nehalem je dále 32 kB instukční a 32 kB datové L1 a 256 KB L2 cache s velice nízkou latencí. Novinkou je 2-level TLB (Translation Lookaside Buffer). Oproti jádru Penryn dále přibude inkluzivní L3 cache sdílená mezi všechna jádra. Pro čtyřjádrový Nehalem na 45 nm má L3 cache velikost 8 MB, ale na trhu bude více variant, jak s menší L3 cache, tak s menším počtem jader.



Nehalem dále přinese 7 nových instrukcí, označených jako SSE4.2 (jak ukazují výsledky s podporou SSE4 například v Penrynu, v případě optimalizace software umí SSE s výkonem pěkně zahýbat). Všechna zmíněná vylepšení na straně Nehalem architektury tak přinesou růst IPC za současného snížení spotřeby. Na nízké spotřebě se jistě podepíše i odladěná 45nm výrobní technologie, která bude stejně jako jádro Penryn používat technologie HKMG (kombinace technologií použití High-k dielektrika a technologie kovových hradel).

Ačkoliv Nehalem bude v maximální konfiguraci podporovat až 8 jader (s SMT až 16 threadů), ani 4jádrová varianta není s 45nm výrobní technologií žádný drobeček. Na ploše cca 246 mm2 bude obsahovat na 731 miliónů tranzistorů. Pro srovnání, dvoujádro Penryn na 45nm výrobní technologii má plochu 107 mm2 (a starší Conroe s 65 nm přibližně 143 mm2), což nám v případě MCM "čtyřjádra" dává 214, respektive 286 mm2.

Penryn přinesl příjemnou úsporu a čtyřjádrové procesory se tak dostávají na úroveň 214 mm2, nicméně Nehalem bude ještě o kus větší a navíc se jedná o poznání komplexnější čip. Nejdříve plánovaný Bloomfield zůstane tedy spíše luxusním řešením a mainstream platformy se dočkáme až se socketem LGA1160, který přijde v první polovině příštího roku. Podle dostupných informací se Nehalem pro LGA1366 nestane mainstreamem alespoň do konce příštího roku a platformy v každém případě zůstanou více diverzifikované - možnosti každé platformy zde (díky integrovanému řadiči paměti, QPI nebo PCI-E linkám a GPU) určuje z největší části již samotný procesor. Na řadu přijde také několik nových socketů.


Přehled procesorů s architekturou Nehalem


Jako další architektura, se zaměřením prakticky do všech segmentů (kromě ultramobilních platforem, kam je směřovaný procesor Atom) bude mít Nehalem řadu variant pro několik socketů. Jsou to LGA1160 a LGA1366 - LGA1366 pro Nehalem-ES má přijít již během posledního kvartálu 2008 a v první čtvrtině příštího roku se dočkáme LGA1160. Ve čtvrtém kvartálu 2009 přijde také serverová platforma se socketem LGA1567. Připravované procesory shrnuje následují tabulka:

Přehled připravovaných procesorů Nehalem
Jádro
Segment
Počet jader
L3 Cache
DDR3 / počet kanálů
QPI
IGPU
TDP
Socket
Dostupnost
Beckton
MP servery
8
24 MB
4 (FB-DIMM)
4x
ne
90/105/130 W
LGA1567
Q4 2009
Gainestown
DP servery
4
8 MB
3
2x
ne
60/80/130 W
LGA1366
Q4 2008
Bloomfield
High-end
desktop
4
8 MB
3/2
1x
ne
130 W
LGA1366
Q4 2008
Lynnfield
Mainstream desktop
4
8 MB
2
-
ne
95 W
LGA1160
Q1 2009
Havendale
Mainstream desktop
2
4 MB
2
-
ano
75 W
LGA1160
Q2 2009
Clarksfield
Mainstream mobile
4
8 MB
2
-
ano
45/55 W
mPGA989
Q2 2009
Auburndale
Mainstream mobile
2
4 MB
2
-
ano
35/45 W
mPGA989
Q2 2009

Rozdíly v rodině procesorů Nehalem tak můžeme kromě taktu očekávat podle nasazení procesorů (zejména počtem kanálů řadiče paměti, QPI a dalšími "vychytávkami", včetně například MCM a GPU). Díky návrhu této nové architektury bude také možné procesor snadno modifikovat a během roku 2009 přijde i varianta s integrovaným grafickým jádrem (jedná se o obdobné řešení, jako má přinést další generace AMD procesorů a AMD Fusion) nebo varianty s přímou podporou PCI-E linek a DMI, jak pro notebooky, tak pro běžné počítače.

Rozdíly budou také v připojení čipové sady přes QPI nebo v přímé podpoře PCI-E a DMI linek. V případě Bloomfieldu tak bude například přes QPI připojen čipset X58 (ICH10 IO hub, konfigurace pro grafiky budou dva PCI-E 2.0 16x sloty), v případě nižších variant Nehalem jádra zde bude přímo dostupné PCI-E linky.

Evolucí procesorů založených na Nehalemu bude později Westmere, vyrobený již pomocí 32nm výrobní technologie. Westmere již bude obsahovat 6 jader (s SMT bude tento procesor schopen zvládat až 12 threadů) a dojde také k navýšení L3 cache, a to na 12 MB. Následovníkem a novou architekturou na 32 nm bude následně Sandy Bridge (dříve pojmenovaný Gesher).



Další z produktů je připravovaný "Larrabee", který má zasáhnout zejména do trhu HPC a nejvýkonnějších GPU s nasazením 16 až 24 jednodušších x86 "in-order" jader (a údajně s redukovanou instrukční sadou x86 s řadou vylepšení) takže bude umožnovat více flexibilnější nasazení než GPU (a současná řešení od AMD nebo nVidie). Mimochodem, zde jsou již použity plody výzkumu architektury dříve přezdívané Gesher a projektu Tera-scale, o kterém jsem psal již koncem předminulého roku. Ale to už se opět dostáváme mimo oblast "klasických" procesorů a do roku 2010...



Zde si ještě dovolím jednu poznámku k 45nm CPU a Nehalemu. I přes navyšování produkce CPU vyrobených na 45 nm až ve třetím kvartálu tohoto roku dojde k převážení 45nm produkce nad 65nm (koncem roku bude stále 40% na 65 nm). Pokud vynecháme levnějších procesory, jako jsou dvoujádrová Pentia nebo Celerony, vzhledem ke škále nabídky to není problém, ale Nehalem bude tak či tak v posledním čtvrtletí zastoupen zřejmě do jednoho procenta. Penryn nás tedy neopustí a Nehalem bude zatím čistě doménou high-endu.

Pojďme si informace o nových procesorech krátce shrnout a podívat se na srovnání připravovaných procesorů u AMD a Intelu, které nás v nejbližší době čekají.