Intel Sandy Bridge: sametová evoluce
29.9.2010, Petr Štefek, technologie
Sandy Bridge je zbrusu nová architektura Intelu, která nahradí postupně celou produktovou řadu procesorů založenou na jádrech Nehalem a Westmere. Nová architektura není pouze nudným evolučním krokem, ale o tom více už v samotném článku.
Kapitoly článku:
System Agent
Intel zavedl poměrně zajímavý název pro zbývající funkčnost, kterou jsme byli zvyklí očekávat od Noth Bridge. Ten se nyní nazývá System Agent a je to v zásadě starý dobrý North Bridge, který má na starosti PCIe linky, paměťový řadič a podobně. Velmi dobrá zpráva je, že díky redesignu paměťového řadiče DDR3 došlo k podstatnému snížení latencí pamětí, které trápily Nehalem i Westmere a nikdy nedosáhly na metu nastavenou jádrem Lynnfield. Důvod byl zřejmý, a to přemístění řadiče z jádra pryč.
Systém Agent rovněž přichází s DMI rozhraním, display engine a jednotkou řízení spotřeby PCU. Systém Agent pracuje na frekvenci nižší než zbytek jader a také disponuje nezávislým napájením.
Sandy Bridge Graphics
Grafická část Sandy Bridge je asi nejpodstatnější, když mluvíme o nárůstu výkonu, neboť jeho výkon je dvojnásobný oproti řešení, které přinesla jádra Clarkdale a Arrandale na začátku tohoto roku. Samozřejmě, asi těžko můžeme doufat, že se tak stane Sandy Bridge snem každého hráče, ale již můžeme mluvit o dostatečném výkonu k provozování Windows 7 a Aera nebo starých her.
Důležitou vlastností nového integrovaného GPU je fakt, že je vyráběno 32nm procesem a disponuje svým vlastním napájením a pracovní frekvencí. To značí, že GPU může být vypnuto a uspořena tak energie nebo docíleno lepšího přetaktování samotných jader, kde aktivace GPU může mít na tento fakt vliv. Funkce Turbo zůstala zachována stejně jako tomu v případě Arrandale procesorů.
Zajímavostí architektury Sandy Bridge je fakt, že GPU má plný přístup do L3 cache a skrze své ovladače může řídit, co se do cache dostane a kolik jí GPU alokuje. Ukládání dat je pro GPU a jeho výkon při výpočtech důležitý, neboť si tak ušetří mnohonásobně pomalejší cestu do operační paměti, která vše výrazně zpomalí. Celkový evoluční krok s GPU u Sandy Bridge a jeho zakomponování do celého procesoru včetně spolupráce s L3 cache vyžadovalo v Intelu spoustu práce, ale zdá se, že se nakonec vyplatí.
Dalším poněkud zajímavým krokem Intelu je, že udělal GPU v Sandy Bridge jako „fixed fiction hardware“, což znamená jediné, není plně programovatelné a ten, kdo doufal v zúročení zkušeností s projektem Larrabee, bude asi zklamán. Nutno ovšem říci, že podobný krok Intel učinil, aby ušetřil velikost čipu. GPU zde má doprovodný charakter a asi nikdo si nedělá ambice, že by nahradilo samostatnou grafickou kartu kromě kancelářských operací. Každopádně to je ve světě, kde je plná programovatelnost „in“, zajímavá zpráva.
Programovatelné části GPU jsou složeny ze shaderů nebo jader, které Intel nazývá EU (Execution Units), kde každá EU může vykonávat dvě instrukce z rozdílných vláken. Co vás může zajímat dále, je fakt, že celé GPU je kompatibilní s rozhraním DirectX 10, což pro integrované řešení je více než dostatečná technologická výbava. DirectX 11 nemá smysl ani u méně výkonných samostatných karet, natož u integrovaného řešení. Intel je, pokud se tyká výkonů nového GPU, optimistický a tvrdí, že ve specifických případech má novinka několikanásobně vyšší výkon než současná řada Intel HD.
V předchozím integrovaném GPU byl registrový soubor (pole procesorových registrů v CPU) přerozdělován za běhu, takže pokud vlákno potřebovalo méně registrů, zbytek nezahálel, ale byl přiřazený jinému vláknu. To se ukázalo být skvělé, pokud jste potřebovali uspořit místo v návrhu integrovaného „on die“ GPU, ale rozhodně to bylo limitujícím faktorem pro samotný výkon. Bohužel docházelo často k tomu, že samotné vlákno nemohlo být občas zpracováno, neboť jednoduše registry „došly“ a nebylo s čím pracovat, tak se čekalo na uvolnění. V případě Arrandale došlo k navýšení počtu registrů na jedno vlákno na 80 a v případě zbrusu nové architektury Sandy Bridge jsme došli ke 120 registrům na vlákno. Momentů, kdy tento počet registrů na vlákno nebude stačit, je značně omezený.
Zdroj: Anandtech - výkon integrované grafiky Sandy Bridge (úplně nahoře:))
Sandy Bridge bude nabízet dvě úrovně grafiky, kdy jedna bude disponovat 6 EU (Execution Units – obdoba shader core nebo SM) a druhá rovnou 12 EU. Ještě není zcela jasné, které modely budou disponovat jakým typem a zda bude menší počet EU vyhrazen pro mobilní řešení nebo menší Core i3 pro LGA 1155. Desktopové čipy, které spatří světlo světa počátkem příštího roku, budou mít bez rozdílu 12 EU. Očekávaný výkon této grafické karty je někde na úrovni dvoj až trojnásobku současné řady Intel HD graphics.
Media Engine
Media Engine je vedle grafického jádra další součástí architektury Sandy Bridge a skládá se ze dvou hlavních částí. První část se stará o dekódování videa a druhá část má na starosti enkódování videa, čili jeho převod do jiných formátů. V případě dekódovací části došlo od poslední generace ke znatelnému vylepšení, neboť celá video pipeline je nyní v rukou speciálních FFU (Fixed Function Unit). V současných řešeních dekódování probíhá skrze integrované EU (Execution Unit). Intel tak nyní předpokládá, že díky tomu dosáhne poloviční spotřeby při přehrávání videa.
Intel se nezmiňuje nijak výrazně o funkčnosti druhé sekce, která má na starosti enkódování, které je naprostou novinkou v Sandy Bridge. Neověřené zdroje tvrdí, že procesor bude schopen převádět video z HD formátů například na iPhone v délce minut pro celý film.
Intel velmi pravděpodobně bude spolupracovat i s několika hlavními vývojáři software, aby zajistil Media Enginu při uvedení alespoň základní podporu. Ono bude stačit, pokud se bude jednat o Apple a další společnosti se už nabalí. Pokud vezmeme v úvahu předpokládaný výkon transkódování někde okolo 400 snímků za sekundu, pak se dostáváme skoro k výkonů, které sportují klasická samostatná GPU, ale vše zabalené do 3 mm2 z jádra Sandy Bridge.