Intel Silvermont: ofenzíva do světa tabletů a mobilů
27.6.2013, Petr Štefek, recenze
Intel tento měsíc uvedl zbrusu novou architekturu Silvermont, která bude pro společnost vstupenkou do elitního klubu výrobců špičkových platforem pro tablety a smartphony. Silvermont nebude žádné ořezávátko a třást se před ním může AMD Jaguar i ARM Cortex A15.
Kapitoly článku:
Nyní se musíme se podívat na architektury od Intelu a AMD a především si říci, v čem se liší od konkurenčních architektur ARM, na kterých staví Apple nebo Qualcomm. ARM Cortex A8 byl ještě striktně in-order architektura, zato novější ARM Cortex A9 se již dá považovat za ou-of-order, což platí i pro významně vylepšený ARM Cortex A15. Poslední jmenovaná architektura je ovšem krom out-of-order také three-issue, což je mezi mobilními čipy vítaná změna. Například AMD s Jaguarem je dual-issue architektura a pro Silvermont platí totéž, co pro AMD.
Intel stejně jako AMD věří, že receptem na špičkový výkon je stále dual-issue architektura ve spojení s out-of-order funkcionalitou tak, aby velikost a provozní vlastnosti čipu byly na akceptovatelné úrovni. Není vůbec potřeba v případě těchto x86 architektur tlačit výrazně na pilu, pokud se týká samotného výkonu, protože v tomto ohledu ARM pouze dohání. Tam, kde je naopak třeba zapracovat, jsou provozní vlastni SoC a především s tím spojená spotřeba, která byla u minulé generace Atomu vyšší než v případě řešení na architekturách ARM. To je také jeden z důvodů proč se ARM v mobilním světě natolik prosadil.
Předešlá verze Atomu podporovala Hyper Threading pro lepší využití, které měl Saltwell k dispozici. Samozřejmě také Hyper Threading představoval jisté zvýšení spotřeby, ale na druhou stranu přinášel výkon, který toto zvýšení lehce ospravedlnil. V případě 22nm se ale situace změnila, protože Intel měl dostatek prostoru, respektive plochy jádra, aby se místo Hyper Threadingu mohl spolehnout přímo na fyzická výpočetní jádra pro vícevláknové aplikace. Tam, kde Intel ušetřil na odebrání podpory Hyper Threadingu, přidal na out-of-order architekturu, která se na spotřebě bude také podílet významným dílem. Plocha jádra by v případě využití 22nm výrobního procesu byla podobná jak v případě zvolení implementace Hyper Threadingu, tak v případě zvolení vyššího počtu fyzických jader a out-of-order logiky.
Samozřejmě tady máme ještě dual-issue architekturu, která je na první pohled poněkud nevýhodná, ale pokud vezmeme v úvahu, že Silvermont se vyvaroval využití load-op-store a load-op-execute instrukcí jako jediných instrukcí pro dekódování, tak vše dostane trošku jiný nádech. Instrukce tak už nejsou rozdělovány do několika mikrooperací a poté samostatně zpracovány, ale jsou považovány za jedinou instrukci, která prochází výpočetní pipeline. Silvermont proto dokáže konkurovat v oblasti IPC i three-issue architektuře ARM Cortex A15.
Silvermont bude mít stále pouze dva x86 dekodéry ve front-endu pipeline, ale zato toho dokáží mnohem více než v minulé generaci Atomu. Některé x86 instrukce jsou dekódovány do jediné micro-op a některé komplexnější instrukce vyžadují zapojení podporu (microcode assist) a nemohou projít skrze běžné dekódovací cesty v pipeline. Silvermont posílil tyto dekodéry, takže jsou schopny zpracovat více micro-ops (opět ne všechny).
Exekuční jádro vypadá podobně jako v případě prvního Atomu (Bonnell), ale oproti němu podporuje nejen out-of-order, ale exekuční jednotky mají také výrazně nižší latenci, což znamená, že některé operace s plovoucí desetinnou čárkou nebo celočíselné operace mohou být zpracovány výrazně rychleji. Jako třešnička na dortu je tu fakt, že Silvermont může zpracovat paralelně jednu load a jednu store operaci.
Intel stejně jako AMD věří, že receptem na špičkový výkon je stále dual-issue architektura ve spojení s out-of-order funkcionalitou tak, aby velikost a provozní vlastnosti čipu byly na akceptovatelné úrovni. Není vůbec potřeba v případě těchto x86 architektur tlačit výrazně na pilu, pokud se týká samotného výkonu, protože v tomto ohledu ARM pouze dohání. Tam, kde je naopak třeba zapracovat, jsou provozní vlastni SoC a především s tím spojená spotřeba, která byla u minulé generace Atomu vyšší než v případě řešení na architekturách ARM. To je také jeden z důvodů proč se ARM v mobilním světě natolik prosadil.
Předešlá verze Atomu podporovala Hyper Threading pro lepší využití, které měl Saltwell k dispozici. Samozřejmě také Hyper Threading představoval jisté zvýšení spotřeby, ale na druhou stranu přinášel výkon, který toto zvýšení lehce ospravedlnil. V případě 22nm se ale situace změnila, protože Intel měl dostatek prostoru, respektive plochy jádra, aby se místo Hyper Threadingu mohl spolehnout přímo na fyzická výpočetní jádra pro vícevláknové aplikace. Tam, kde Intel ušetřil na odebrání podpory Hyper Threadingu, přidal na out-of-order architekturu, která se na spotřebě bude také podílet významným dílem. Plocha jádra by v případě využití 22nm výrobního procesu byla podobná jak v případě zvolení implementace Hyper Threadingu, tak v případě zvolení vyššího počtu fyzických jader a out-of-order logiky.
Samozřejmě tady máme ještě dual-issue architekturu, která je na první pohled poněkud nevýhodná, ale pokud vezmeme v úvahu, že Silvermont se vyvaroval využití load-op-store a load-op-execute instrukcí jako jediných instrukcí pro dekódování, tak vše dostane trošku jiný nádech. Instrukce tak už nejsou rozdělovány do několika mikrooperací a poté samostatně zpracovány, ale jsou považovány za jedinou instrukci, která prochází výpočetní pipeline. Silvermont proto dokáže konkurovat v oblasti IPC i three-issue architektuře ARM Cortex A15.
Silvermont bude mít stále pouze dva x86 dekodéry ve front-endu pipeline, ale zato toho dokáží mnohem více než v minulé generaci Atomu. Některé x86 instrukce jsou dekódovány do jediné micro-op a některé komplexnější instrukce vyžadují zapojení podporu (microcode assist) a nemohou projít skrze běžné dekódovací cesty v pipeline. Silvermont posílil tyto dekodéry, takže jsou schopny zpracovat více micro-ops (opět ne všechny).
Exekuční jádro vypadá podobně jako v případě prvního Atomu (Bonnell), ale oproti němu podporuje nejen out-of-order, ale exekuční jednotky mají také výrazně nižší latenci, což znamená, že některé operace s plovoucí desetinnou čárkou nebo celočíselné operace mohou být zpracovány výrazně rychleji. Jako třešnička na dortu je tu fakt, že Silvermont může zpracovat paralelně jednu load a jednu store operaci.