Test procesorů: Sandy Bridge přichází
17.1.2011, Jan Vítek, srovnávací test
Úvod letošního roku zaznamenal příchod nových procesorů Intel Sandy Bridge, které znamenají již druhou generaci procesorů s architekturou Core. My si je v tomto testu srovnáme se staršími modely procesorů Intel i novými AMD z konce minulého roku.
Kapitoly článku:
Vypuštění nových procesorů Core i3/i5/i7 řady 2000 se stalo velkou událostí začátku tohoto roku, ovšem co konkrétního nám tyto nové modely přináší? Není to nic opravdu očividného, jako např. zvýšení počtu jader, výroba pokročilejším procesem, či výrazně vyšší frekvence, ale změny přesto jsou markantní. Dnešní procesory a jejich výkon nezávisí pouze na frekvenci a počtu jader, ale také na pokročilých architekturách, technologiích a k nim se přidávají i integrovaná grafická jádra a další části. Však samotné AMD má už dlouhou dobu pod logem psáno, že budoucnost leží ve fúzi.
Intel a AMD mají dnes tedy daleko více možností pro vzájemné odlišení svých procesorů vzhledem k výkonu a technologiím, čehož patřičně využívají. A především Intel toto dovedl až do stavu, kdy neznalý uživatel nemá šanci dle pouhého označení procesoru poznat, co si vlastně kupuje, což se s příchodem procesorů Sandy Bridge ještě více zamotalo. My se to nyní pokusíme rozmotat, aby bylo jasné, co nám procesory Sandy Bridge přinesou nového i jak a podle čeho se dělí.
Procesory Sandy Bridge doznaly oproti první generaci Core výrazných změn, díky nimž sice (alespoň prozatím) nezaútočí na pozici šestijádrových procesorů Gulftown, ale namísto toho se pokusí usurpovat mainstreamový trh.
Napomoci jim má k tomu třeba nová paměť micro-op cache, která přímo ukládá všechny dekódované instrukce. Pokud nějaká pak již je v paměti uložena, pak micro-op cache se postará o obsluhu pipeline namísto front-end, který se pro ušetření energie vypne. Cache zde dokáže uložit asi 1500 instrukcí micro-op (po zaplnění se vyřazují podle pravidla nejdéle nepoužité), což odpovídá asi 6 kB instrukční cache. Samotná paměť je přitom součástí instrukční L1 cache, které je stále stejně jako datové 32 kB.
Dále nám Intel naservíroval kompletně předělanou BPU (Branch Prediction Unit), tedy jednotku snažící se předpovědět, kam se bude program ubírat pomocí větvení, což má platit přibližně pro 80 procent všech aplikací. V případě úspěchu pak dokáže tato jednotka navýšit výkon zpracování instrukcí v pipeline. Standardně pracuje tak, že využívá 2bitový 'bimodální prediktor' označující jednotlivé větve jako prošlé či neprošlé a přiřazuje jim silnou či slabou jistotu, že budou znovu danou operaci opakovat, takže dohromady mohou nastat 4 stavy. Dle zkušeností mají ale větve v téměř každém případě silnou jistotu, takže procesory Sandy Bridge šetří bity pro označování každé větve, což může přispět k přesnějšímu předpovídání.
Sandy Bridge také dostanou novou instrukční sadu AVX spojenou s Register File, která každé instrukci dokáže přiřadit až 256 bitů operandů (čili vstupních hodnot operace) s ní spojených, což je oproti SSE se 128 bity značné rozšíření.
Vzhledem k implementaci jádra GPU schopného zpracovávat video, které má dovoleno využívat sdílenou L3 cache procesoru, byla pro přístup do této paměti zvolena sběrnice Ring Bus, kterou již úspěšně používají serverové CPU Nehalem EX a Westmere EX. Šířka pásma je u Sandy Bridge stejná, tedy 96 GB/s na jádro. Ovšem latence byla snížena z 36 cyklů (Westmere) na 26 až 31 cyklů a také běží na stejné frekvenci jako jádro. A pak můžeme zmínit také příslib celkového snížení latencí pamětí vlivem přepracování paměťového řadiče pro DDR3.
Minulé integrované grafické řešení Intel GMA HD nám nepřineslo zrovna výtečný výkon, ale na přehrávání filmů a Aero stačilo. Nová jádra ale slibují i více než dvojnásobný grafický výkon oproti GMA HD a jsou již vyráběna stejně jako procesor 32nm technologií, neboť jsou již jeho nedílnou součástí a ne pouze jako další čip na procesorové destičce. Mají pak vlastní napájení i měnitelnou pracovní frekvenci v různých rozsazích, což je další faktor, jímž se mohou jednotlivé modely procesorů lišit.
GPU má u Sandy Bridge tedy přístup do paměti L3 cache, kterou si může částečně alokovat pro sebe a může ji využít jako vysokorychlostní úložiště dat, pro něž by jinak muselo využít pomalejší operační paměť. Na druhou stranu není oproti očekáváním plně programovatelné a namísto toho má programovatelné pouze své části - shadery, pro které Intel vymyslel označení Execution Unit (EU). Co se týče podpory her, pak DirectX 10 zde bohatě stačí.
Procesory se také svým grafickým výkonem rozdělí nejen podle frekvence čipů, ale také podle toho, zda ponesou 6 EU, nebo 12 EU. Dle očekávání budou mít slabší GPU mobilní čipy a nižší řady desktopových procesorů.
Media Engine patří do grafické části, neboť má na starosti dekódování i enkódování videa. Při přehrávání videa mají pomoci práce EU, od čehož si Intel slibuje poloviční spotřebu. Druhá funkce je pak u Sandy Bridge naprostou novinkou, která má napomoci k rychlejšímu převodu videa do jiných formátů, což Intel již před časem demonstroval převodem cca tříminutového videa v 1080p (bitrate 30 Mbps) do rozlišení 640 x 360 pro iPhone, což mu trvalo 14 sekund odpovídajících asi 400 FPS.
Celková architektura Sandy Bridge byla již popsána v našem dřívějším článku, kde se můžete dozvědět více.
Již dříve představená technologie Turbo Boost byla u nových procesorů vylepšena. Pro neznalé se jedná o zvyšování a snižování frekvence jader v závislosti na zátěži. U nových procesorů to platí i pro grafické jádro, neboť to je již součástí procesoru. V případě starších procesorů Core se udávala konfigurace Turba pomocí číslic, u dvoujádrových Core i5 například 2/4. To znamená, že při zatížení jednoho jádra se základní frekvence procesoru navýší o 4x 133 MHz a při zatížení obou je to pouze o 2x 133 MHz, kde oněch 133 MHz je základní frekvence, která společně s multiplikátorem udává frekvenci procesoru.
Turbo tak funguje stejně jako Intel EIST pro šetření energií díky změnám násobiče, ale všímá si především jednotlivých jader. Tato funkce je omezena především hodnotou TDP, tedy maximální spotřebou procesoru, která se při zvýšené frekvenci snadno dosáhne, což kontroluje jednotka PCU (Power Control Unit).
PCU u Sandy Bridge však umožní procesoru až na 25 sekund překročení hodnoty TDP a dosažení vyšší frekvence, než by jinak bylo možné. Nesmí se ale přitom ohrozit stabilita celého systému, což je opět práce jednotky PCU a jejích výpočtů. Je také jasné, že při dlouhodobém vytížení bude přínos malý, ale pro krátkodobou potřebu výkonu to bude mít jistě přínos. Nápomocné bude i grafické jádro, jehož spotřeba se počítá do celkové spotřeby procesoru a jeho podtaktováním se mohou uvolnit prostředky pro navýšení frekvence procesorových jader a naopak.
Dále se nedočkáme ničeho převratného, ale stojí za to si upřesnit, jaké technologie a pod jakými zkratkami nové Sandy Bridge podporují. Především to je již zmíněná sada instrukcí AVX, které doplňují SSE, chybět nemůže EIST pro snížení spotřeby a pak všechny mají také virtualizační technologii VT-x. Pokročilejší VT-d mají pouze Core i5-2000 a Core i7-2000, což platí i pro Turbo Boost, TXT a AES-NI pro akceleraci šifrování pomocí AES klíče.
HyperThreading se Intel rozhodl uplatnit pouze u Core i7 a zatím v jednom modelu Core i5-2390T. Ten však nemá oproti ostatním novým Core i5 výkonnostní převahu, protože HyperThreading pouze doplňuje jeho dvě fyzická procesorová jádra, zatímco ostatní Core i5 mají čtyři, což je rozhodně lepší než 2 + HT. Na druhou stranu je zmíněný procesor velmi zajímavý v tom, že jeho TDP je při frekvenci 2,7 - 3,5 GHz pouze 35 W.
Můžeme se tedy těšit na opravdu širokou nabídku čtyřjádrových procesorů střední třídy, které naváží na staré 45nm Lynnfield.
Již jsme nakousli téma označení nových procesorů Sandy Bridge a nyní si ho ucelíme. Základní označení procesorů zůstalo stejné, takže se dočkáme modelů Core i3, Core i5 a Core i7 zasahujících do nízké, střední a vyšší třídy. Za pomlčkou bývalo tříčíselné označení konkrétního modelu, před nějž se nyní přidala číslice 2 označující druhou generaci.
A nakonec jsou tu přípony K, T a S. Přípona K je pro nás velmi zajímavá díky tomu, že takové procesory přicházejí s odemčeným násobičem, což umožní daleko snadnější přetaktování v porovnání s úpravou základní frekvence. Za takovou možnost si ale připlatíme, konkrétně u modelu Core i5-2500K celkem 11 dolary navrch (cena platí pro procesory prodávané v 1000kusových sériích).
- úvodní ceny desktopových Sandy Bridge -
Stejný procesor pak může mít také označení S (performance optimized lifestyle) a T (power optimized lifestyle), kde S je níže taktovaný model s nižším TDP, což model T ještě umocňuje.
Intel a AMD mají dnes tedy daleko více možností pro vzájemné odlišení svých procesorů vzhledem k výkonu a technologiím, čehož patřičně využívají. A především Intel toto dovedl až do stavu, kdy neznalý uživatel nemá šanci dle pouhého označení procesoru poznat, co si vlastně kupuje, což se s příchodem procesorů Sandy Bridge ještě více zamotalo. My se to nyní pokusíme rozmotat, aby bylo jasné, co nám procesory Sandy Bridge přinesou nového i jak a podle čeho se dělí.
Architektura
Procesory Sandy Bridge doznaly oproti první generaci Core výrazných změn, díky nimž sice (alespoň prozatím) nezaútočí na pozici šestijádrových procesorů Gulftown, ale namísto toho se pokusí usurpovat mainstreamový trh.
Napomoci jim má k tomu třeba nová paměť micro-op cache, která přímo ukládá všechny dekódované instrukce. Pokud nějaká pak již je v paměti uložena, pak micro-op cache se postará o obsluhu pipeline namísto front-end, který se pro ušetření energie vypne. Cache zde dokáže uložit asi 1500 instrukcí micro-op (po zaplnění se vyřazují podle pravidla nejdéle nepoužité), což odpovídá asi 6 kB instrukční cache. Samotná paměť je přitom součástí instrukční L1 cache, které je stále stejně jako datové 32 kB.
Dále nám Intel naservíroval kompletně předělanou BPU (Branch Prediction Unit), tedy jednotku snažící se předpovědět, kam se bude program ubírat pomocí větvení, což má platit přibližně pro 80 procent všech aplikací. V případě úspěchu pak dokáže tato jednotka navýšit výkon zpracování instrukcí v pipeline. Standardně pracuje tak, že využívá 2bitový 'bimodální prediktor' označující jednotlivé větve jako prošlé či neprošlé a přiřazuje jim silnou či slabou jistotu, že budou znovu danou operaci opakovat, takže dohromady mohou nastat 4 stavy. Dle zkušeností mají ale větve v téměř každém případě silnou jistotu, takže procesory Sandy Bridge šetří bity pro označování každé větve, což může přispět k přesnějšímu předpovídání.
Sandy Bridge také dostanou novou instrukční sadu AVX spojenou s Register File, která každé instrukci dokáže přiřadit až 256 bitů operandů (čili vstupních hodnot operace) s ní spojených, což je oproti SSE se 128 bity značné rozšíření.
Vzhledem k implementaci jádra GPU schopného zpracovávat video, které má dovoleno využívat sdílenou L3 cache procesoru, byla pro přístup do této paměti zvolena sběrnice Ring Bus, kterou již úspěšně používají serverové CPU Nehalem EX a Westmere EX. Šířka pásma je u Sandy Bridge stejná, tedy 96 GB/s na jádro. Ovšem latence byla snížena z 36 cyklů (Westmere) na 26 až 31 cyklů a také běží na stejné frekvenci jako jádro. A pak můžeme zmínit také příslib celkového snížení latencí pamětí vlivem přepracování paměťového řadiče pro DDR3.
Grafické jádro
Minulé integrované grafické řešení Intel GMA HD nám nepřineslo zrovna výtečný výkon, ale na přehrávání filmů a Aero stačilo. Nová jádra ale slibují i více než dvojnásobný grafický výkon oproti GMA HD a jsou již vyráběna stejně jako procesor 32nm technologií, neboť jsou již jeho nedílnou součástí a ne pouze jako další čip na procesorové destičce. Mají pak vlastní napájení i měnitelnou pracovní frekvenci v různých rozsazích, což je další faktor, jímž se mohou jednotlivé modely procesorů lišit.
GPU má u Sandy Bridge tedy přístup do paměti L3 cache, kterou si může částečně alokovat pro sebe a může ji využít jako vysokorychlostní úložiště dat, pro něž by jinak muselo využít pomalejší operační paměť. Na druhou stranu není oproti očekáváním plně programovatelné a namísto toho má programovatelné pouze své části - shadery, pro které Intel vymyslel označení Execution Unit (EU). Co se týče podpory her, pak DirectX 10 zde bohatě stačí.
Procesory se také svým grafickým výkonem rozdělí nejen podle frekvence čipů, ale také podle toho, zda ponesou 6 EU, nebo 12 EU. Dle očekávání budou mít slabší GPU mobilní čipy a nižší řady desktopových procesorů.
Media Engine patří do grafické části, neboť má na starosti dekódování i enkódování videa. Při přehrávání videa mají pomoci práce EU, od čehož si Intel slibuje poloviční spotřebu. Druhá funkce je pak u Sandy Bridge naprostou novinkou, která má napomoci k rychlejšímu převodu videa do jiných formátů, což Intel již před časem demonstroval převodem cca tříminutového videa v 1080p (bitrate 30 Mbps) do rozlišení 640 x 360 pro iPhone, což mu trvalo 14 sekund odpovídajících asi 400 FPS.
Celková architektura Sandy Bridge byla již popsána v našem dřívějším článku, kde se můžete dozvědět více.
Technologie
Již dříve představená technologie Turbo Boost byla u nových procesorů vylepšena. Pro neznalé se jedná o zvyšování a snižování frekvence jader v závislosti na zátěži. U nových procesorů to platí i pro grafické jádro, neboť to je již součástí procesoru. V případě starších procesorů Core se udávala konfigurace Turba pomocí číslic, u dvoujádrových Core i5 například 2/4. To znamená, že při zatížení jednoho jádra se základní frekvence procesoru navýší o 4x 133 MHz a při zatížení obou je to pouze o 2x 133 MHz, kde oněch 133 MHz je základní frekvence, která společně s multiplikátorem udává frekvenci procesoru.
Turbo tak funguje stejně jako Intel EIST pro šetření energií díky změnám násobiče, ale všímá si především jednotlivých jader. Tato funkce je omezena především hodnotou TDP, tedy maximální spotřebou procesoru, která se při zvýšené frekvenci snadno dosáhne, což kontroluje jednotka PCU (Power Control Unit).
PCU u Sandy Bridge však umožní procesoru až na 25 sekund překročení hodnoty TDP a dosažení vyšší frekvence, než by jinak bylo možné. Nesmí se ale přitom ohrozit stabilita celého systému, což je opět práce jednotky PCU a jejích výpočtů. Je také jasné, že při dlouhodobém vytížení bude přínos malý, ale pro krátkodobou potřebu výkonu to bude mít jistě přínos. Nápomocné bude i grafické jádro, jehož spotřeba se počítá do celkové spotřeby procesoru a jeho podtaktováním se mohou uvolnit prostředky pro navýšení frekvence procesorových jader a naopak.
Dále se nedočkáme ničeho převratného, ale stojí za to si upřesnit, jaké technologie a pod jakými zkratkami nové Sandy Bridge podporují. Především to je již zmíněná sada instrukcí AVX, které doplňují SSE, chybět nemůže EIST pro snížení spotřeby a pak všechny mají také virtualizační technologii VT-x. Pokročilejší VT-d mají pouze Core i5-2000 a Core i7-2000, což platí i pro Turbo Boost, TXT a AES-NI pro akceleraci šifrování pomocí AES klíče.
HyperThreading se Intel rozhodl uplatnit pouze u Core i7 a zatím v jednom modelu Core i5-2390T. Ten však nemá oproti ostatním novým Core i5 výkonnostní převahu, protože HyperThreading pouze doplňuje jeho dvě fyzická procesorová jádra, zatímco ostatní Core i5 mají čtyři, což je rozhodně lepší než 2 + HT. Na druhou stranu je zmíněný procesor velmi zajímavý v tom, že jeho TDP je při frekvenci 2,7 - 3,5 GHz pouze 35 W.
Můžeme se tedy těšit na opravdu širokou nabídku čtyřjádrových procesorů střední třídy, které naváží na staré 45nm Lynnfield.
Označení
Již jsme nakousli téma označení nových procesorů Sandy Bridge a nyní si ho ucelíme. Základní označení procesorů zůstalo stejné, takže se dočkáme modelů Core i3, Core i5 a Core i7 zasahujících do nízké, střední a vyšší třídy. Za pomlčkou bývalo tříčíselné označení konkrétního modelu, před nějž se nyní přidala číslice 2 označující druhou generaci.
A nakonec jsou tu přípony K, T a S. Přípona K je pro nás velmi zajímavá díky tomu, že takové procesory přicházejí s odemčeným násobičem, což umožní daleko snadnější přetaktování v porovnání s úpravou základní frekvence. Za takovou možnost si ale připlatíme, konkrétně u modelu Core i5-2500K celkem 11 dolary navrch (cena platí pro procesory prodávané v 1000kusových sériích).
- úvodní ceny desktopových Sandy Bridge -
Stejný procesor pak může mít také označení S (performance optimized lifestyle) a T (power optimized lifestyle), kde S je níže taktovaný model s nižším TDP, což model T ještě umocňuje.