Pohled na technologii Z-RAM
22.5.2007, Lukáš Petříček, článek
Kapacita vyrovnávací paměti je dnes výrazně omezena a to zejména velikostí čipu a s tím související cenou. Velikost vyrovnávací paměti postupně roste, ale stále jsou tu limity vzhledem k použité výrobní technologii a ploše čipu. Jedna z technologií, která může kapacitu vyrovnávací paměti výrazně zvýšit, je technologie Z-RAM. A právě na ni se v tomto článku podíváme.
Vývoj osobních počítačů zapříčinil, že procesory i operační paměť jdou svou vlastní cestou. V případě procesorů byl požadavek směřován zejména k vyššímu výkonu, a s pokrokem ve výrobních technologiích i za pomocí zmiňované vyrovnávací paměti, která má zakrýt výkonnostní nedostatky DRAM paměti - zde byl hlavní požadavek směřován k rychlému navyšování kapacity.
Od dob prvních procesorů s vyrovnávací pamětí cache již uplynulo hodně vody. Cache nalézala stále větší uplatnění a vystřídala v osobních počítačích několik pozic - od umístění na základní desce, na destičce společně s procesorem, až po integraci do samotného jádra procesoru. Podmínkou byl pokrok ve výrobních technologiích a miniaturizace výrobního procesu, kde na vyrovnávací paměť (zejména druhé úrovně, která má větší kapacitu a zabírá tak podstatně větší plochu) zbývá víc a víc místa. Trend je zřejmý - větší integrace a posun směrem k jádru procesoru. To přináší vyšší výkon, snažší implementaci a ve finále také nižší cenu. Jednodušší je výroba jak procesoru, tak základní desky. Časy cache mimo jádro, až na pár vyjímek, jsou nenávratně pryč.
S každou další generací procesorů si také můžeme všimnout rostoucí velikosti vyrovnávací paměti. Nasazení a kapacita se samozřejmě výrazně liší podle architektury a nasazení procesoru. S rostoucí frekvencí procesorů, růstem IPC a počtem jader se stále více rozevírají nůžky mezi rychlostí operační paměti, výkonem procesoru a tím také požadavky na přísun dat. Nejvýznamnější bude v dnešní době zejména růst počtu jader a také co nejefektivnější sdílení dat a prostředků - zde má velikost cache a možnost efektivního sdílení dat mezi jádry zcela zásadní vliv na výkon a možnou škálovatelnost vícejádrových procesorů. S rostoucím počtem jader se samozřejmě bude nutně navyšovat i kapacita cache, protože efektivní rychlost a propustnost operační paměti roste mnohem pomaleji.
Nejčastěji je v procesorech použita vyrovnávací paměť typu SRAM (Static RAM), obvykle dvou úrovní L1 a L2, která je hned po registrech dalším "dílkem" v moderních procesorech a architekturách, a zaručuje "hladký běh" systému a aplikačního software. Co se cache týče, jednou z vyjímek u architektury x86 bylo například jádro Gallatin nebo procesory Itanium od Intelu, případně budoucí generace procesorů AMD z rodiny K10 (která bude mít také integrovanou L3 cache). Příkladem doslova "obří" cache budiž, někdy opěvované a někdy zatracované, procesory Itanium. Poslední Itanium II s jádrem Montecito má až 24 MB L3 cache.
Intel Itanium II, jádro Montecito - až 24 MB L3 cache, 1.72 miliardy tranzistorů, 596 mm^2 při 90 nm výrobní technologii (většinu jádra tvoří cache několika úrovní)
Faktická závislost na cache je dnes jasně zřetelná, nehledě na architekturu. Co ovšem lze také pozorovat, je snaha navrhovat procesory pro cache s takovou velikostí, která bude v době vydání vzhledem k ploše čipu dostupná - a mít velikost cache "pod kontrolou". Opět se samozřejmě najdou vyjímky, kde se dodatečné na "náklady" na velkou cache příliš nehledí, jako v případě výše zmíněných serverových procesorů nebo procesorů pro speciální nasazení. Vyšší cena zde není přílišnou překážkou.
Předpokládaný vývoj velikosti jádra procesorů , SoC a paměti na čipu vzhledem k jeho velikosti, zdroj: ITRS
Z výhod Z-RAM samozřejmě nemusí těžit pouze "běžné" procesory, ale také SOC (System On Chip) a FPGA (Field-Programmable Gate Array), kde se SOI také uplatňuje. Po Z-RAM tak mohou sáhout všichni výrobci, kteří se spolehnou na SOI technologii. Jednou z firem možná bude i AMD, případně Freescale (kde již byla dávno dokončena validace SOI procesu a technolgoie Z-RAM pro 90 nm výrobní technologii a stejně jako v případě Intelu, AMD a dalších, míří k 45 nm), případně řada dalších výrobců. Jak dále zvyšovat výkon procesorů je nasnadě. Kromě úprav jádra samotného je tu také řada další technik, kromě prostého zvětšení plochy cache, se zvětšující se integrací...
Z-RAM samozřejmě není jedinou technologií, která se snaží zvyšovat výkon a kapacitu vyrovnávací paměti. Mezi další, a dnes již poměrně rozšířené technologie, můžeme zařadit například zmiňovanou EDRAM (Embedded DRAM). V případě EDRAM se již jedná o osvědčenou technologii, která ale přináší i několik "potíží". Pro implementaci do jádra jsou třeba úpravy při vývoji a výrobě jádra (další kroky při vrstvení a vzniku jádra) a je samozřejmě také třeba dalších litografických masek, o čtyři a více. Je zde totiž nutné do samotné struktury čipu dostat nějakým způsobem kondenzátory. Pro větší integraci, protože kondenzátory zaberou dost místa, přišli na řadu „Trench“ kondenzátory. Ty již na čipu nezaberou takovou plochu, ale přináší problémy s výrobou a vytvořením kondezátorů správně zakomponovaných do tranzistorové struktury (a stále platí, že na každou paměťovou buňku je třeba samostatný kondenzátor).
EDRAM a stinná strana "síly" , porovnání tranzistoru a tranzistoru s "Trench" kondenzártorem, zdroj: IS Inc
EDRAM je již využívána například v čipu ATI Xenos (u herní konzole Xbox 360) a dovoluje tak nasadit například antialiasing pro scénu bez zásadnějšího vlivu na výkon (zde je integrována na destičce, mimo jádro). S technologií EDRAM v dalších generací procesorů počítá také například firma IBM. Zde se zřejmě dočkáme masivní vyrovnávací paměti v řádu až desítek megabajtů. Novou a nadějnou technologií pro další desetiletí, která umožní ještě větší kapacitu vzhledem k ploše čipu, je právě technologie Z-RAM.
Z-RAM, jinak také (Zero capacitor RAM, „bezkondenzátorová“ paměť), poskytuje oproti standardní SRAM (Static RAM) několik výhod. Asi nejzásadnější z nich je možná kapacita paměti na mm^2 plochy čipu. Již letmé srovnání "náročnosti" na bit kapacity ukazuje jasné výhody technologie Z-RAM. Při srovnání je na každý bit cache v případě SRAM třeba běžně 4 nebo 6 tranzistorů (jsou ale dostupné varianty i s jiným počtem tranzistorů). V případě použití Z-RAM je třeba pouze jediný tranzistor.
SOI tranzistor a jeho funkce - jediný tranzistor postačí k vytvoření paměťové buňky o velikosti 1 bit
Funkce Z-RAM je založena na efektu "floating-body" v tranzistoru, kde je jev postavený na SOI (Silicon On Insulator) technologii bez dalších dodatečných nákladů dostatečný k uchování bitu paměti. Jedná se prakticky o chytré využití jinak parazitního jevu. Vzhledem k použití SOI technologie oproti standardnímu výrobnímu procesu je zde tedy nevýhoda mírně vyšší ceny, která plyne z větší nákladnosti SOI waferů, ale vzhledem k stále rozšířenějšímu použití této technologie to již přestává být překážkou. Nástup SOI technologie, která se začíná čím dál více uplatňovat na trhu polovodičů a procesorů samozřejmě postupně klesá cena a SOI wafery jsou dostupnější. Hlavním dodavatelem SOI technologie a waferů je firma Soitec. Průměrný meziroční růst se SOI wafery mezi roky 2002 a 2008 se odhaduje okolo 42% a na tato technologie poslouží ještě řadu generací výrobních procesů.
Vše má však své "pro" i "proti" a ne jinak je tomu u technologie Z-RAM, při použití jako vyrovnávací paměti procesorů. Nevýhodou je mírně nižší rychlost oproti tradiční SRAM cache. Ani samotná IS Inc netvrdí, že dojde k vytlačení standardní SRAM cache, nicméně efektivní rychlostí Z-RAM může dobře zapadnout mezi SRAM a DRAM paměť.
Z-RAM od Innovative Silicon - tranzistor a měděné mezispoje, zdroj: IS Inc
Pro cache vyšších úrovní je asi vhodným kandidátem, zejména vzhledem k možné kapacitě - použítí na vyrovnávací paměť druhé, respektive třetí úrovně, kde již převažuje vliv kapacity cache, je na snadě. Optimalizace jádra směřuje také tímto směrem - k nižší spotřebě, rostoucí kapacitě cache a také k mírnému růstu jejich latencí.
Porovnání možností škálování "cache" a její kapacita vzhledem k výrobní technologii, zdroj: IS Inc, ITRS
Z-RAM, v současnosti již druhé generace, přináší tedy zejména výhodu vyšší kapacity - v případě 65 nm výrobního procesu pod 5 Mbit/mm2 a okolo 9 Mbit/mm2 v případě 45 nm výrobního procesu. Hustota je tedy 1.4x až 2x vyšší než v případe EDRAM a až 5x ve srovnání se standardní SRAM vyrovnávací pamětí. Přesná data nejsou k dispozici, ale již byla prezentována Z-RAM cache s přístupovou dobou pod 2.5 ns v případě 2. gernerace Z-RAM, vyrobené pomocí 90 nm výrobní technologie. Spotřeba má být minimálně o 30% nižší než u EDRAM pamětí.
Výhodou jsou také možnosti škálování této technologie vzhledem k výrobnímu procesu. Podle všeho nebude problém Z-RAM v případě SOI použít i s 22 nm výrobní technologií, kde díky potřebě jediného tranzistoru škáluje lineárně s výrobní technologií. Testovací vzorky jsou již k dispozici i na bázi vícehradlých tranzistorů FinFET, které se mají dostat na trh až po roce 2012.
Výrobní možnosti Z-RAM a její škálování vzhledem k výrobní technologii ukazuje následující roadmapa od Innovatives Silicon Inc
Z-RAM tedy těží kromě kapacity také z kompatibility se standardní SOI výrobní technologií, založené na SOI waferech. Nejsou třeba žádné nadstandardní kroky a procesy pro vytvoření kondenzátorů v struktuře čipu, žádné další litografické masky a výroba je tedy snažší než například v případě konkurenční technologie EDRAM.
Jak již zřejmě vyplynulo z vývoje a kapacity cache v procesorovém průmyslu, vliv a velikost vyrovnávacích pamětí nadále poroste. Jak u osobních počítačů, tak u procesorů a řešení pro specifické nasazení. EDRAM je již také poměrně využívána, zejména jako on-die cache a je velice pravděpodobné, že i její podíl na trhu s procesory nadále poroste.
Jak dalece se prakticky prosadí Z-RAM jako cache v x86 procesorech zatím není jisté. Potenciál na to jistě má, ale nasazení v procesorovém průmyslu u neosvědčené technologie je vždy rizikem, ačkoliv tato technologie přináší i nesporné výhody. Je možné, že jedno z možných budoucích nasazení Z-RAM přijde právě v podání AMD. Technologii Z-RAM byla AMD již licencována. Kdy se však dočkáme skutečného nasazení v AMD procesorech, pokud vůbec, je zatím asi předčasné tvrdit.
Co říci úplně na závěr? Je zřejmé, že pokud se začne technologie Z-RAM prosazovat jako vyrovnávací paměť, bude to zejména díky kapacitě a snadné výrobě. SRAM jako takovou jistě nenahradí, ale v řadě segmentů přináší alternativu, kterou lze zacílit jak na výkon nebo spotřebu. Kompatibilita se standardními výrobními procesy SOI je jistě také obrovským plusem, a také jedním z důvodů, proč je tato technologie tak lákavou...
Zdroje: innovativesilicon.com, ieee.org, itrs.net, intel.com, amd.com
Od dob prvních procesorů s vyrovnávací pamětí cache již uplynulo hodně vody. Cache nalézala stále větší uplatnění a vystřídala v osobních počítačích několik pozic - od umístění na základní desce, na destičce společně s procesorem, až po integraci do samotného jádra procesoru. Podmínkou byl pokrok ve výrobních technologiích a miniaturizace výrobního procesu, kde na vyrovnávací paměť (zejména druhé úrovně, která má větší kapacitu a zabírá tak podstatně větší plochu) zbývá víc a víc místa. Trend je zřejmý - větší integrace a posun směrem k jádru procesoru. To přináší vyšší výkon, snažší implementaci a ve finále také nižší cenu. Jednodušší je výroba jak procesoru, tak základní desky. Časy cache mimo jádro, až na pár vyjímek, jsou nenávratně pryč.
S každou další generací procesorů si také můžeme všimnout rostoucí velikosti vyrovnávací paměti. Nasazení a kapacita se samozřejmě výrazně liší podle architektury a nasazení procesoru. S rostoucí frekvencí procesorů, růstem IPC a počtem jader se stále více rozevírají nůžky mezi rychlostí operační paměti, výkonem procesoru a tím také požadavky na přísun dat. Nejvýznamnější bude v dnešní době zejména růst počtu jader a také co nejefektivnější sdílení dat a prostředků - zde má velikost cache a možnost efektivního sdílení dat mezi jádry zcela zásadní vliv na výkon a možnou škálovatelnost vícejádrových procesorů. S rostoucím počtem jader se samozřejmě bude nutně navyšovat i kapacita cache, protože efektivní rychlost a propustnost operační paměti roste mnohem pomaleji.
Vyrovnávací paměť jak ji známe
Nejčastěji je v procesorech použita vyrovnávací paměť typu SRAM (Static RAM), obvykle dvou úrovní L1 a L2, která je hned po registrech dalším "dílkem" v moderních procesorech a architekturách, a zaručuje "hladký běh" systému a aplikačního software. Co se cache týče, jednou z vyjímek u architektury x86 bylo například jádro Gallatin nebo procesory Itanium od Intelu, případně budoucí generace procesorů AMD z rodiny K10 (která bude mít také integrovanou L3 cache). Příkladem doslova "obří" cache budiž, někdy opěvované a někdy zatracované, procesory Itanium. Poslední Itanium II s jádrem Montecito má až 24 MB L3 cache.
Intel Itanium II, jádro Montecito - až 24 MB L3 cache, 1.72 miliardy tranzistorů, 596 mm^2 při 90 nm výrobní technologii (většinu jádra tvoří cache několika úrovní)
Faktická závislost na cache je dnes jasně zřetelná, nehledě na architekturu. Co ovšem lze také pozorovat, je snaha navrhovat procesory pro cache s takovou velikostí, která bude v době vydání vzhledem k ploše čipu dostupná - a mít velikost cache "pod kontrolou". Opět se samozřejmě najdou vyjímky, kde se dodatečné na "náklady" na velkou cache příliš nehledí, jako v případě výše zmíněných serverových procesorů nebo procesorů pro speciální nasazení. Vyšší cena zde není přílišnou překážkou.
Předpokládaný vývoj velikosti jádra procesorů , SoC a paměti na čipu vzhledem k jeho velikosti, zdroj: ITRS
Z výhod Z-RAM samozřejmě nemusí těžit pouze "běžné" procesory, ale také SOC (System On Chip) a FPGA (Field-Programmable Gate Array), kde se SOI také uplatňuje. Po Z-RAM tak mohou sáhout všichni výrobci, kteří se spolehnou na SOI technologii. Jednou z firem možná bude i AMD, případně Freescale (kde již byla dávno dokončena validace SOI procesu a technolgoie Z-RAM pro 90 nm výrobní technologii a stejně jako v případě Intelu, AMD a dalších, míří k 45 nm), případně řada dalších výrobců. Jak dále zvyšovat výkon procesorů je nasnadě. Kromě úprav jádra samotného je tu také řada další technik, kromě prostého zvětšení plochy cache, se zvětšující se integrací...
Technologie a současné alternativy pro vyrovnávací paměť
Z-RAM samozřejmě není jedinou technologií, která se snaží zvyšovat výkon a kapacitu vyrovnávací paměti. Mezi další, a dnes již poměrně rozšířené technologie, můžeme zařadit například zmiňovanou EDRAM (Embedded DRAM). V případě EDRAM se již jedná o osvědčenou technologii, která ale přináší i několik "potíží". Pro implementaci do jádra jsou třeba úpravy při vývoji a výrobě jádra (další kroky při vrstvení a vzniku jádra) a je samozřejmě také třeba dalších litografických masek, o čtyři a více. Je zde totiž nutné do samotné struktury čipu dostat nějakým způsobem kondenzátory. Pro větší integraci, protože kondenzátory zaberou dost místa, přišli na řadu „Trench“ kondenzátory. Ty již na čipu nezaberou takovou plochu, ale přináší problémy s výrobou a vytvořením kondezátorů správně zakomponovaných do tranzistorové struktury (a stále platí, že na každou paměťovou buňku je třeba samostatný kondenzátor).
EDRAM a stinná strana "síly" , porovnání tranzistoru a tranzistoru s "Trench" kondenzártorem, zdroj: IS Inc
EDRAM je již využívána například v čipu ATI Xenos (u herní konzole Xbox 360) a dovoluje tak nasadit například antialiasing pro scénu bez zásadnějšího vlivu na výkon (zde je integrována na destičce, mimo jádro). S technologií EDRAM v dalších generací procesorů počítá také například firma IBM. Zde se zřejmě dočkáme masivní vyrovnávací paměti v řádu až desítek megabajtů. Novou a nadějnou technologií pro další desetiletí, která umožní ještě větší kapacitu vzhledem k ploše čipu, je právě technologie Z-RAM.
Pohled na technologii Z-RAM
Z-RAM, jinak také (Zero capacitor RAM, „bezkondenzátorová“ paměť), poskytuje oproti standardní SRAM (Static RAM) několik výhod. Asi nejzásadnější z nich je možná kapacita paměti na mm^2 plochy čipu. Již letmé srovnání "náročnosti" na bit kapacity ukazuje jasné výhody technologie Z-RAM. Při srovnání je na každý bit cache v případě SRAM třeba běžně 4 nebo 6 tranzistorů (jsou ale dostupné varianty i s jiným počtem tranzistorů). V případě použití Z-RAM je třeba pouze jediný tranzistor.
SOI tranzistor a jeho funkce - jediný tranzistor postačí k vytvoření paměťové buňky o velikosti 1 bit
Funkce Z-RAM je založena na efektu "floating-body" v tranzistoru, kde je jev postavený na SOI (Silicon On Insulator) technologii bez dalších dodatečných nákladů dostatečný k uchování bitu paměti. Jedná se prakticky o chytré využití jinak parazitního jevu. Vzhledem k použití SOI technologie oproti standardnímu výrobnímu procesu je zde tedy nevýhoda mírně vyšší ceny, která plyne z větší nákladnosti SOI waferů, ale vzhledem k stále rozšířenějšímu použití této technologie to již přestává být překážkou. Nástup SOI technologie, která se začíná čím dál více uplatňovat na trhu polovodičů a procesorů samozřejmě postupně klesá cena a SOI wafery jsou dostupnější. Hlavním dodavatelem SOI technologie a waferů je firma Soitec. Průměrný meziroční růst se SOI wafery mezi roky 2002 a 2008 se odhaduje okolo 42% a na tato technologie poslouží ještě řadu generací výrobních procesů.
Vše má však své "pro" i "proti" a ne jinak je tomu u technologie Z-RAM, při použití jako vyrovnávací paměti procesorů. Nevýhodou je mírně nižší rychlost oproti tradiční SRAM cache. Ani samotná IS Inc netvrdí, že dojde k vytlačení standardní SRAM cache, nicméně efektivní rychlostí Z-RAM může dobře zapadnout mezi SRAM a DRAM paměť.
Z-RAM od Innovative Silicon - tranzistor a měděné mezispoje, zdroj: IS Inc
Pro cache vyšších úrovní je asi vhodným kandidátem, zejména vzhledem k možné kapacitě - použítí na vyrovnávací paměť druhé, respektive třetí úrovně, kde již převažuje vliv kapacity cache, je na snadě. Optimalizace jádra směřuje také tímto směrem - k nižší spotřebě, rostoucí kapacitě cache a také k mírnému růstu jejich latencí.
Porovnání možností škálování "cache" a její kapacita vzhledem k výrobní technologii, zdroj: IS Inc, ITRS
Z-RAM, v současnosti již druhé generace, přináší tedy zejména výhodu vyšší kapacity - v případě 65 nm výrobního procesu pod 5 Mbit/mm2 a okolo 9 Mbit/mm2 v případě 45 nm výrobního procesu. Hustota je tedy 1.4x až 2x vyšší než v případe EDRAM a až 5x ve srovnání se standardní SRAM vyrovnávací pamětí. Přesná data nejsou k dispozici, ale již byla prezentována Z-RAM cache s přístupovou dobou pod 2.5 ns v případě 2. gernerace Z-RAM, vyrobené pomocí 90 nm výrobní technologie. Spotřeba má být minimálně o 30% nižší než u EDRAM pamětí.
Výhodou jsou také možnosti škálování této technologie vzhledem k výrobnímu procesu. Podle všeho nebude problém Z-RAM v případě SOI použít i s 22 nm výrobní technologií, kde díky potřebě jediného tranzistoru škáluje lineárně s výrobní technologií. Testovací vzorky jsou již k dispozici i na bázi vícehradlých tranzistorů FinFET, které se mají dostat na trh až po roce 2012.
Výrobní možnosti Z-RAM a její škálování vzhledem k výrobní technologii ukazuje následující roadmapa od Innovatives Silicon Inc
Z-RAM tedy těží kromě kapacity také z kompatibility se standardní SOI výrobní technologií, založené na SOI waferech. Nejsou třeba žádné nadstandardní kroky a procesy pro vytvoření kondenzátorů v struktuře čipu, žádné další litografické masky a výroba je tedy snažší než například v případě konkurenční technologie EDRAM.
Pohled na vývoj v oblasti a závěr
Jak již zřejmě vyplynulo z vývoje a kapacity cache v procesorovém průmyslu, vliv a velikost vyrovnávacích pamětí nadále poroste. Jak u osobních počítačů, tak u procesorů a řešení pro specifické nasazení. EDRAM je již také poměrně využívána, zejména jako on-die cache a je velice pravděpodobné, že i její podíl na trhu s procesory nadále poroste.
Jak dalece se prakticky prosadí Z-RAM jako cache v x86 procesorech zatím není jisté. Potenciál na to jistě má, ale nasazení v procesorovém průmyslu u neosvědčené technologie je vždy rizikem, ačkoliv tato technologie přináší i nesporné výhody. Je možné, že jedno z možných budoucích nasazení Z-RAM přijde právě v podání AMD. Technologii Z-RAM byla AMD již licencována. Kdy se však dočkáme skutečného nasazení v AMD procesorech, pokud vůbec, je zatím asi předčasné tvrdit.
Co říci úplně na závěr? Je zřejmé, že pokud se začne technologie Z-RAM prosazovat jako vyrovnávací paměť, bude to zejména díky kapacitě a snadné výrobě. SRAM jako takovou jistě nenahradí, ale v řadě segmentů přináší alternativu, kterou lze zacílit jak na výkon nebo spotřebu. Kompatibilita se standardními výrobními procesy SOI je jistě také obrovským plusem, a také jedním z důvodů, proč je tato technologie tak lákavou...
Zdroje: innovativesilicon.com, ieee.org, itrs.net, intel.com, amd.com