Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

Technologie: Athlon 64 - 64bitů pro masy

23.9.2003, Eagle , článek
Technologie: Athlon 64 - 64bitů pro masy
Už je tady! Athlony 64 dorazily a vzaly si s sebou i velké bratříčky Athlony 64 FX. My se dnes podíváme, co jsou tyto nové procesory zač a zaměříme se především na to, co nového pozitivního (a případně i negativního) mohou nabídnout. Novinek není málo.
Změny v přístupu k datům - integrovaný řadič pamětí

Velké změny zaznamenala v Opteronu a Athlonu 64 filosofie přístupu k datům. Současné procesory pracují s paměťovým řadičem umístěným v čipové sadě na základní desce. Mezi čipovou sadou a procesorem je sběrnice FSB (Front-Side Bus), přes kterou musí všechna data určená pro procesor proudit. Ta se v minulosti ukázala jako značné omezení - její změna vyžaduje komplexní změny v procesoru a ty se provádějí jednou za cca. čtyři až pět let, při vývoji nové architektury. Původní Athlon začínal na frekvenci FSB 100 MHz s dvojnásobným datovým a adresovým přenosem. Kdysi úchvatná rychlost 1.6 GB/s dnes již nikoho moc nenadchne. Postupné zvýšení frekvence až na 200 MHz a nárůst rychlosti na 3.2 GB/s sice přineslo značné navýšení výkonu, nemohlo se ale rovnat architektuře Pentia 4.

Zásadní rozdíl mezi těmito procesory je v tom, že Athlon vycházel ze situace bez hardwarového data prefetch, rozhodující byly latence (jak rychle lze získat jedno konkrétní číslo, nikoliv obrovské množství dat), čistá přenosová rychlost byla proto vedlejší. Tehdy používané paměti SDRAM byly příliš pomalé než aby bylo možné z nich tahat obrovské bloky dat. Pentium 4 naproti tomu vsadilo na cache a hardwarový data prefetch. Filosofií procesoru bylo získávat jedno konkrétní číslo v drtivé většině případů přímo z cache, nikoliv z hlavní paměti. Proto je při jakémkoliv požadavku dat z paměti načteno nejen jedno číslo, ale hned 128 bytů okolo. Tento postup nevyžaduje ani tak nízké latence jako spíše obrovský datový tok. Latence vyrovná paměť cache v procesoru, jejíž velikost je proto jedním z klíčových faktorů architektury Pentia 4 (proto je Celeron tak pomalý). Vyšší frekvence FSB v tomto případě spíše snižují poměrně vysoké latence této komplikované sběrnice než aby byly přímým faktorem pro dosažení teoretického maximálního datového toku 6.4 GB/s.

Protože ale ani jedno z těchto řešení není právě optimální, zaměřili se v AMD při vývoji Hammeru na to, jak vyvinout procesor optimalizovaný na hardwarový data prefetch a zároveň zachovat nízké latence z Athlonu. Jinými slovy jak získat obrovskou datovou propustnost a ještě k tomu rychle.



Výsledkem bylo integrování paměťového řadiče přímo do procesoru. Toto má hned několik výhod:

1. Řadič přímo v procesoru je od výpočetní části vzdálen v řádu milimetrů, nikoliv centimetrů, jak je tomu u běžných systémů. Menší vzdálenost znamená menší latence, možné vyšší rychlosti a větší spolehlivost.

2. Řadič pracuje na mnohem vyšší frekvenci a využívá nejmodernější výrobní technologie. Je vyráběn stejnou technologií jako procesor. S rychlostí procesoru roste i rychlost řadiče.

3. Rapidně se zlepšuje kompatibilita s pamětí a tím i spolehlivost, protože nezávisle na použité čipové sadě na základní desce zůstává řadič pamětí stejný pro všechny systémy. Výrobci pamětí tak mají mnohem jednodušší práci - stačí otestovat kompatibilitu s procesorem a mohou prohlásit, že jejich paměť bude fungovat na všech systémech s tímto procesorem, bez ohledu na použitý čipset. Mohou to dokonce prohlásit i o budoucích verzích čipsetů.

4. Často poměrně energeticky náročný řadič je chlazen společně s procesorem, čipset základní desky pak může být chlazen pasivně.

5. Ve víceprocesorových systémech s přibývajícími procesory roste maximální množství použitelné paměti a především celková propustnost. Dva procesory Opteron jsou schopny adresovat každý 8 GB paměti a každý má propustnost 5.3 GB/s, dohromady tedy 16 GByte a přes 10 GB/s. Čtyři procesory jsou pak schopny adresovat 32 GB s celkovou propustností přes 21 GB/s. To umožňuje excelentní nárůsty výkonu v porovnání s konkurenčními procesory (včetně např. Itania 2).

Hlavním pozitivem je tedy mnohem vyšší rychlost - jednak řadiče samotného a jednak spoje mezi řadičem a výpočetní částí. Ze stejných pamětí je tak možné vytěžit i o desítky procent vyššího výkonu - latence se drasticky snižují a efektivní paměťová propustnost se vlivem rychlého zpracování požadavků zvyšuje. Přitom kompatibilita s (nově navrhnutými) paměťmi je lepší než kdy předtím.

Integrování řadiče má pochopitelně i jisté nevýhody:

1. Procesor je vázán na jeden typ pamětí o předem dané datové šířce. Různé paměti vyžadují různá napětí a různý počet elektrických spojů s řadičem, technologie řadiče je proto přímo závislá na technologii pamětí a nelze jej upgradovat. V případě změny typu pamětí je nutné vyměnit nejen procesor, ale i základní desku, protože jiný počet spojů si vyžádá jiný socket procesoru a jiné elektrické specifikace - napětí, odpory, sloty atd. (což zařizuje deska).

2. Paměť je spojená s řadičem přes piny procesoru, nikoliv přes pevně vázané dráhy. Je možné očekávat o něco horší elektrické vlastnosti, a tedy trochu nižší spolehlivost tohoto spoje. Nemělo by se ale jednat o nic závažného.

3. Prodlužuje se doba přenosu dat mezi grafickou kartou (ať už integrovanou nebo ne) a pamětí. Dřívější přímé napojení na řadič teď vyžaduje přenos dat po sběrnici HyperTransport. Stejný problém nastává u pevných disků, USB a jiných zařízeních v south bridge čipové sady.

Nyní malá tabulka vystihující dopady na výkon:



Nevýhoda o něco pomalejšího přístupu k AGP a south bridge je ve srovnání s výhodou velmi rychlého přístupu k procesoru prakticky zanedbatelná - zatímco procesor tahá gigabyty dat, přenosy na south bridge jsou maximálně v řádu stovek MB a AGP karty se dnes spoléhají především na vlastní paměť než na tu systémovou, protože i to nejrychlejší rozhraní AGP je dnes více než 10x pomalejší než nejrychlejší paměti grafických karet. Jediný problém tak může nastat u integrovaných grafických karet, které se spoléhají výhradně na propustnost systémové paměti. Někteří výrobci proto začali uvažovat, že na základní desce bude pro integrovanou grafickou kartu připravená vlastní paměť - to by značně zvýšilo cenu, ale také výkon.



Integrací paměťového řadiče se FSB fakticky zrušuje - této sběrnice již není třeba. Z fotky desky Tyan je patrná změna - paměť je u procesoru, nikoliv u čipsetu.

Řadič pamětí procesorů Athlon 64 a Athlon 64 FX je schopen práce s pamětí DDR400, i když tato ještě nebyla v registrované verzi schválena konsorciem JEDEC. To je důvod, proč Opteron byl zatím omezen pouze na DDR333.