Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

AMD Opteron - osmá generace procesorů

5.5.2003, Zdeněk Kabát, článek
AMD Opteron - osmá generace procesorů
Dne 22. dubna byl oficiálně představen první procesor osmé generace od AMD, serverový Opteron. Nová generace přináší mnoho architektonických změn a mezi ty nejdůležitější patří technologie AMD64 pro podporu 64- i 32-bitových aplikací a integrovaný paměťový řadič, zvyšující rychlost komunikace s pamětí.

Architektura Opteronu



Opteron se jako první procesor osmé generace výrazně odlišuje od dřívějších modelů společnosti AMD. Změny byly provedeny nejen v mikroarchitektuře, ale i ve vnějším vzhledu procesoru. Nejdříve se tedy podíváme na fyzické rozdíly. Jak vidíte z obrázku níže, změny jsou patrné na první pohled. Zaprvé AMD poprvé sáhlo k použití IHS, tedy kovovému povrchu, který slouží k rozložení uvolněného tepla na větší plochu a usnadňuje tak chlazení čipu.

Opteron je vybaven také novou verzí tepelné ochrany. Kromě standardní tepelné diody, kterou mají všechny novější procesory AMD, obsahuje také tzv. Thermtrip, což je obvod zajišťující včasnou prevenci přehřátí jádra. Bohužel není o tomto systému známo více informací. Procesor je stále keramický, ale díky IHS již nebude hrozit tolik obávané ulomení růžku procesoru.


Obr. 5 - Opteron seshora a zespodu
převzato z Tom's Hardware

Dále je vidět, že celá spodní strana je zaplněna piny, kterých byste s trochou trpělivosti napočítali rovných 940. Tomu odpovídá i nový typ patice nazývaný oficiálně "AMD Socket 940". Končí tedy éra jedné z nejdéle přežívajících patic mezi procesory, Socketu A (nebo-li Socket 462), který používala celá škála řešení od AMD. V desktopové verzi ho pak nahradí Socket 754 pro Athlon 64. Uchycení chladiče zůstává stejné, v případě Athlonu 64 ovšem bude existovat podobný systém jako u Pentia 4.


Obr. 6 - Nová patice Socket 940
převzato z Tom's Hardware

Opteron je první procesor AMD, který je vyráběn 0,13mikronovým procesem s technologií SOI (Silicon On Insulator). Stejně jako všechny moderní procesory této společnosti ho produkuje drážďanská Fab 30, stále ovšem na 200mm křemíkových plátech (Intel využívá 300mm). Velikost čipu procesoru Opteron je 193 mm2, z čehož přes 50% zabírá L2 cache. Teoreticky lze z každého plátu získat 148 čipů, při 60% výtěžnosti (která je navíc velmi nadsazená) je to kolem 89 čipů. Pro porovnání - z jednoho plátu získá AMD 153 Bartonů nebo 186 T-Bredů. Není divu, že Opterony jsou relativně drahé.


Interní mikroarchitektura



AMD Opteron je postaven na jádře SledgeHammer, které je velmi podobné některým Athlonům XP/MP, v několika faktorech se ovšem liší. Nejdříve se podívejme na samotné rozložení tranzistorů v jádře:


Obr. 7 - Detail jádra Opteronu

Celkově obsahuje procesor 105,9 milionu tranzistorů a co rozhodně na první pohled upoutá je obrovská cache. Ještě jsme se o ní nezmiňovali, ale vězte, že její velikost je 1MB. Druhou změnou je relativně rozsáhlý integrovaný paměťový řadič, který se nachází vedle samotné funkční jednotky. Ta se ovšem příliš neodlišuje od procesorů AMD K7, protože na první pohled se zdá rozložení částí totožné. Vidíte, že vynecháme-li L1 a L2 cache, paměťový řadič a rozhraní DDR sběrnice a HyperTransportu, tak samotné funkční jádro zaujímá velmi malou část čipu.




Obr. 8, 9 - Blokové diagramy Opteronu
klikněte pro zvětšení

Zde jsou bloková schémata procesoru Opteron, která byla průběžně zveřejňována na různých akcích. První slide de facto odpovídá detailu jádra, který je o pár řádků výše - velká L2 cache, instrukční a datová cache o velikosti 64kB přistupující k jádru a kontrolery pro duální paměť DDR a sběrnici HyperTransport. Více o těchto součástech níže.

Na obrázku je také zmiňována L2 cache o velikosti "až 1MB". Nakonec to dopadlo tak, že pro všechny série Opteronů bude cache sjednocená o velikosti 1MB. Tato vyrovnávací paměť je 16-way asociativní a její zpoždění je 8 cyklů. Další schéma již odhaluje procesorovou pipeline podrobněji, komentáře k ní naleznete v následujícím rozboru.


Integrovaný paměťový řadič



Opteron tedy ve svém jádře obsahuje integrovaný paměťový řadič. Co to znamená? Většina současných procesorů přistupuje k hlavní paměti přes NorthBridge, což je jedna součást čipové sady umístěná na základní desce. Spojení mezi procesorem a NorthBridge musí být realizováno pomocí sběrnic, které zpomalují tok dat a zvyšují zpoždění (latenci). Protože má ale Opteron řadič pamětí přímo v jádře, snižuje se tak latence a přístup je výrazně rychlejší, údajně až o 20%.

Pro přístup do paměti má Opteron k dispozici dva 72-bitové kanály s podporou pamětí DDR SDRAM na frekvenci 200MHz, 266MHz a 333MHz. Znamená to, že nejvyšší propustnost je 5,4GB/s, což je sice méně než u desktopových čipsetů nForce2 či Canterwood, ale propustnost roste s počtem procesorů. Každý procesor dokáže adresovat až 8GB paměti.

Menší nevýhodou tohoto systému je zafixovaná podpora určitého typu pamětí. V serverové oblasti sice není situace tak žhavá, ale přesto je omezení na DDR333 nevýhodné. Další generace Opteronů by již mohla přijít i s podporou DDR-II, ale těžko říci, jak se tyto paměti prosadí a zda-li se dostanou také do serverů.


Pipeline podrobněji



Na počátku rozboru procesorové pipeline Opteronu se nejdříve podíváme na její schéma, tentokrát trochu odlišné od předchozího:


Obr. 10 - Schéma procesorové pipeline Opteronu
klikněte pro zvětšení

Instrukční i datová cache procesoru jsou shodné velikosti 64K, jsou 2-way asociativní a velikost řádku je 64 bytů. Jejich zpoždění je stejně jako u Athlonu 2 cykly, ale kromě toho se od generace K7 odlišuje v dalších parametrech (nepočítáme-li větší cache, HyperTransport a integrovaný řadič pamětí). Je to například rozsáhlejší TLB (Translation Look-Aside Buffer) pro L2 cache, který zvládá 512 vstupů a také o něco zvětšený TLB pro L1 cache, jenž nyní činí 40 vstupů. Vyrovnávací paměť první i druhé úrovně samozřejmě podporuje ECC.

Opteron má také oproti Athlonu delší pipeline, která čítá 12 celočíselných a 17 floating-point stupňů. Prodloužení bylo nutné z důvodu použití sběrnice HyperTransport a v budoucnu dovolí lepší škálovatelnost. SledgeHammer také zvládá rychleji násobení celých čísel a provádění SSE instrukcí. Mimo to byla vylepšena i předpověď větvení kódu (Branch Prediction). Podle AMD je sice nutné prodloužit kód asi o 10%, ale počet statických instrukcí klesl o 10% a počet dynamických asi o 5%. Efektivita 64-bitového kódu také omezuje počet load/store instrukcí až o 20%.

Opteron nepodporuje simultánní multithreading (SMT), ale pouze chip-level multithreading (CMT) podporující dvouprocesorovou architekturu. Schéma funkce je vidět na následujícím obrázku:


Obr. 11 - Schéma podporované CMP architektury
klikněte pro zvětšení

Celkové uvolňované teplo Opteronu je cca 89W a potřebné napájení se pohybuje kolem 1,55V. To by bylo k pipeline Opteronu přibližně vše a na další straně se můžete podívat podrobněji na popis sběrnice HyperTransport a také způsoby zapojení Opteronu do systému.