Tegra 3 alias KAL-EL: Superman mezi SoC?
1.3.2011, Petr Štefek, technologie
Nvidia dělá velký rozruch se svou připravovanou platformou KAL-EL alias Tegra 3, která se honosí 4 jádry a výkonem násobně vyšším než současná Tegra 2, která se na trhu stačila jen zabydlet a už se mluví o jejím nástupci.
Kapitoly článku:
- Tegra 3 alias KAL-EL: Superman mezi SoC?
- Tegra 2 - rekapitulace
- Roadmap Nvidie
- Architektura Supermana
- Závěr
Když bychom se na architekturu SoC KAL-EL podívali trochu blíže, můžeme na první pohled říci, že se jedná o dvojitou porci Tegry 2 bez dalších majoritních změn v designu. První, co zaregistrujeme, je přítomnost procesorů ARM Cortex A9, které známe ze současné platformy Tegra 2. Samotný čtyřjádrový procesor bude podle Nvidie vyráběný 40nm procesem a v současnosti není známa ani přibližná frekvence těchto jader. Osobně si troufnu tvrdit, že by mohlo jít o frekvenci okolo 1.2-1.5 GHz, aby dokázala společnost dostát svým výrokům o výkonu.
Samozřejmě, společnost očekává, že KAL-EL se v prvních měsících dostane pouze do telefonů z high-end segmentu, takže půjde o nejvyšší modely Samsungu, HTC či LG. Samsung přijal Tegru pozoruhodně ochotně na to, že vlastní svůj operační systém Bada a navíc je schopen vyrobit si své ARM procesory sám. Protože Samsung už nějakou tu dobu pozorujeme a víme, že ambice této společnosti jsou vysoké také v oblasti mobilních telefonů, tak se jistě dočkáme i nějakého toho překvapení.
KAL-EL bude mít k dispozici vyšší počet jader, ale např. sdílená L2 cache zůstane na úrovni 1 MB, což se dalo očekávat. Vyšší cache by nepřinesla natolik vyšší výkon, aby ospravedlnila podstatné zvětšení čipu. Jednu novinku zde ale přeci máme a jde o Media Processing Engine (MPE), který Nvidia implementovala do každého jádra, což je podstatný skok kupředu. Tegra 2 prvotně měla MPE mít, ale Nvidia nakonec od implementace ustoupila. Konkurenční Texas Instruments se svým SoC OMAP 4 MPE má, takže v následující generaci to již pro Tegru bylo téměř povinné.
ARM Cortex A9 dává možnost zvolit si, zda integrujete SIMD v podobě ARM Media Processing Engine aka NEON (pouze přejmenované SIMD) nebo FP jednotky (nevektorovou VFPv3-D13). Nvidia v současné SoC Tegra 2 zvolila možnost druhou, což je integrace FPU. Proč k tomuto kroku přistoupila? Na rozdíl od předchozí FPU v předchozí generaci ARM Cortex A8 je v té současné FPU plně zařazeno do pipeline. To znamená především podstatně vyšší výkon ve všech operacích. Media Processing Engine je v matematických operacích je sice podstatně vyšší, než FPU jednotky, ale Nvidia tvrdí, že zvolením FPU jednotky ušetřila minimálně 30 % z plochy.
Media Processing Engine by byl podle Nvidie výhodou jen v omezeném množství aplikací. Integrování SIMD má jistě své nesporné výhody, ale Nvidia si stojí za tím, že tato metoda byla pro SoC Tegra správnou volbou. Prozatímní zjištění jí tak nějak dávají zapravdu. Na trhu jsou ale i SoC s integrovanými ARM Cortex A9 a zároveň s využitím Media Processing Engine, kde jako první můžeme jmenovat SoC z dílen Texas Instruments.
Zajímavostí je integrace stejného paměťového řadiče jako v předešlé generaci, což znamená jediný 32bitový LPDDR2, ale Nvidia věří, že podobně dimenzovaný řadič stačí i pro podstatně výkonnější čtyřjádrové SoC. Na druhou stranu společnost tvrdí, že efektivní paměťová propustnost respektive její využití bude u KAL-Elu dvojnásobné. To může mít na svědomí také využití podstatně rychlejších DDR2 čipů, ale zde se nic dalšího nedozvíme. Velmi pravděpodobně to bude kombinace nejakým minoritních změn v paměťovém řadiči a rychlejších pamětí.
Mezi klíčové vlastnosti nové platformy KAL-EL bude patřit samozřejmě také spotřeba, kde by podle Nvidie mělo vše zůstat na úrovni současné Tegry 2. Samozřejmě zde bude muset být aplikován zajímavý power management, protože se mi nezdá proveditelné, aby při plném zatížení 4 jader měl KAL-EL stejný odběr jako starší Tegra 2. Když se vrátíme trochu zpět a připomene si, že KAL-EL bude mít pravděpodobně stejný power management jako Tegra 2, tedy možnost regulace frekvence jader a nikoli jejich napětí, pak se zdá, že toto prohlášení budeme raději brát s rezervou. KAL-EL je přeci jen SoC na 40nm procesu, což není žádný zázrak. Nvidia je neoblomná a tvrdí, že tento vývoj je spojený se zkušenostmi získanými při návrhu Tegry 2.
Jako poslední a nikoli nejméně důležitou součást musíme zmínit integrované ULP GPU GeForce, které je zde přítomno stejně jako v případě Tegry 2. Nepočítejme zde ovšem s nějakou unifikovanou architekturou, kterou známe již nějaký ten pátek z desktopových a notebookových grafických karet. Nvidia v případe KAL-ELu přistoupila k pouhému zvýšení počtu jader, takže v budoucí generaci jich najdeme 12. To je přesně o 50 % více než u Tegry 2. V současnosti není jasné, jestli zůstane zachován poměr vertex a pixel shaderů (50:50), nebo se vše vychýlí směrem ve prospěch pixel shaderů.
Kombinací vyššího počtu jader CPU spolu s výkonnější grafikou zde máme pořádného cvalíka mezi SoC (samozřejmě nemůžeme ještě odhadovat, jak na tom bude konkurence). Prozatímní čísla hovoří jasně. Celý čip včetně heatspreaderu má nějakých 196 mm2 a když vezmeme čistě velikost die, tak zde máme 80 mm2. Pokud vezmeme v úvahu, že Tegra 2 má die o velikosti 49 mm2, pak je nový KAL-EL skutečně cvalík.
Dekódování videa a zvlášť toho Full HD bude pro nové generace SoC klíčová, protože asi každý z nás by se rád díval na svém zbrusu novém tabletu s perfektním displejem o vysokém rozlišení na super kvalitní video. Tegra 2 podporuje formát H.264 do bitrate 20 Mbit/s, což může stačit, ale pro Full HD (1080p) potřebujete mnohem více. Typický Full HD záznam potřebuje podstatně více výkonu, vždyť testovací tituly dosahují až 40 Mbps. Pro současnou generaci Tegra je možné toto video transkódovat (převést) do formátu a bitrate, který je schopna přehrát. To ale není to pravé ořechové, co hledáme.
KAL-EL bude v tomto ohledu podstatně dále, protože dokáže přehrávat záznamy při využití H.264 o bitrate až 40 Mbit/s (ve špičkách až 60 Mbit/s) v rozlišení 2560x1440. To mimo jiné znamená, že tato specifikace je plně srovnatelná s přehráváním disků Blu-ray, které samozřejmě do KAL-Elu nedostanete. Budeme ovšem moci bez obav takovýto tablet nebo telefon připojit k monitoru s rozlišením až 2560x1440.
LG Optimus Pad s podporou streamovaného videa
Aby toho nebylo málo, KAL-EL bude mít podporu pro stereoskopické 3D přehrávání, což může posunout využitelnost do zcela jiných výšin, ač sám nejsem vůbec zastáncem pseudo 3D zobrazování na současných komerčních displejích. Asi už začínám stárnout, ale dobře prokreslený stabilní obraz na „obyčejné“ Full HD plazmě je pro mě daleko příjemnější záležitostí (beze strachu o to, zda se u mě projeví skrytá epilepsie nebo si budu ještě více ničit své oči).
Poslední záležitostí, kterou je třeba zmínit, je kvalita zachytávání videa, kde je potřeba zmínit skutečně nízkou kvalitu pořízeného videa nebo fotografií. Nvidia slíbila, že na tomto faktu zapracuje, protože se jedná o poměrně klíčovou vlastnost mobilních zařízení. Každý z nás by jednou rád měl v kapse možnosti alespoň průměrného digitálního kompaktu v ceně okolo 3 000 až 4 000 Kč.
Samozřejmě, společnost očekává, že KAL-EL se v prvních měsících dostane pouze do telefonů z high-end segmentu, takže půjde o nejvyšší modely Samsungu, HTC či LG. Samsung přijal Tegru pozoruhodně ochotně na to, že vlastní svůj operační systém Bada a navíc je schopen vyrobit si své ARM procesory sám. Protože Samsung už nějakou tu dobu pozorujeme a víme, že ambice této společnosti jsou vysoké také v oblasti mobilních telefonů, tak se jistě dočkáme i nějakého toho překvapení.
KAL-EL bude mít k dispozici vyšší počet jader, ale např. sdílená L2 cache zůstane na úrovni 1 MB, což se dalo očekávat. Vyšší cache by nepřinesla natolik vyšší výkon, aby ospravedlnila podstatné zvětšení čipu. Jednu novinku zde ale přeci máme a jde o Media Processing Engine (MPE), který Nvidia implementovala do každého jádra, což je podstatný skok kupředu. Tegra 2 prvotně měla MPE mít, ale Nvidia nakonec od implementace ustoupila. Konkurenční Texas Instruments se svým SoC OMAP 4 MPE má, takže v následující generaci to již pro Tegru bylo téměř povinné.
ARM Cortex A9 dává možnost zvolit si, zda integrujete SIMD v podobě ARM Media Processing Engine aka NEON (pouze přejmenované SIMD) nebo FP jednotky (nevektorovou VFPv3-D13). Nvidia v současné SoC Tegra 2 zvolila možnost druhou, což je integrace FPU. Proč k tomuto kroku přistoupila? Na rozdíl od předchozí FPU v předchozí generaci ARM Cortex A8 je v té současné FPU plně zařazeno do pipeline. To znamená především podstatně vyšší výkon ve všech operacích. Media Processing Engine je v matematických operacích je sice podstatně vyšší, než FPU jednotky, ale Nvidia tvrdí, že zvolením FPU jednotky ušetřila minimálně 30 % z plochy.
Media Processing Engine by byl podle Nvidie výhodou jen v omezeném množství aplikací. Integrování SIMD má jistě své nesporné výhody, ale Nvidia si stojí za tím, že tato metoda byla pro SoC Tegra správnou volbou. Prozatímní zjištění jí tak nějak dávají zapravdu. Na trhu jsou ale i SoC s integrovanými ARM Cortex A9 a zároveň s využitím Media Processing Engine, kde jako první můžeme jmenovat SoC z dílen Texas Instruments.
Zajímavostí je integrace stejného paměťového řadiče jako v předešlé generaci, což znamená jediný 32bitový LPDDR2, ale Nvidia věří, že podobně dimenzovaný řadič stačí i pro podstatně výkonnější čtyřjádrové SoC. Na druhou stranu společnost tvrdí, že efektivní paměťová propustnost respektive její využití bude u KAL-Elu dvojnásobné. To může mít na svědomí také využití podstatně rychlejších DDR2 čipů, ale zde se nic dalšího nedozvíme. Velmi pravděpodobně to bude kombinace nejakým minoritních změn v paměťovém řadiči a rychlejších pamětí.
Mezi klíčové vlastnosti nové platformy KAL-EL bude patřit samozřejmě také spotřeba, kde by podle Nvidie mělo vše zůstat na úrovni současné Tegry 2. Samozřejmě zde bude muset být aplikován zajímavý power management, protože se mi nezdá proveditelné, aby při plném zatížení 4 jader měl KAL-EL stejný odběr jako starší Tegra 2. Když se vrátíme trochu zpět a připomene si, že KAL-EL bude mít pravděpodobně stejný power management jako Tegra 2, tedy možnost regulace frekvence jader a nikoli jejich napětí, pak se zdá, že toto prohlášení budeme raději brát s rezervou. KAL-EL je přeci jen SoC na 40nm procesu, což není žádný zázrak. Nvidia je neoblomná a tvrdí, že tento vývoj je spojený se zkušenostmi získanými při návrhu Tegry 2.
Jako poslední a nikoli nejméně důležitou součást musíme zmínit integrované ULP GPU GeForce, které je zde přítomno stejně jako v případě Tegry 2. Nepočítejme zde ovšem s nějakou unifikovanou architekturou, kterou známe již nějaký ten pátek z desktopových a notebookových grafických karet. Nvidia v případe KAL-ELu přistoupila k pouhému zvýšení počtu jader, takže v budoucí generaci jich najdeme 12. To je přesně o 50 % více než u Tegry 2. V současnosti není jasné, jestli zůstane zachován poměr vertex a pixel shaderů (50:50), nebo se vše vychýlí směrem ve prospěch pixel shaderů.
Kombinací vyššího počtu jader CPU spolu s výkonnější grafikou zde máme pořádného cvalíka mezi SoC (samozřejmě nemůžeme ještě odhadovat, jak na tom bude konkurence). Prozatímní čísla hovoří jasně. Celý čip včetně heatspreaderu má nějakých 196 mm2 a když vezmeme čistě velikost die, tak zde máme 80 mm2. Pokud vezmeme v úvahu, že Tegra 2 má die o velikosti 49 mm2, pak je nový KAL-EL skutečně cvalík.
Dekódování videa
Dekódování videa a zvlášť toho Full HD bude pro nové generace SoC klíčová, protože asi každý z nás by se rád díval na svém zbrusu novém tabletu s perfektním displejem o vysokém rozlišení na super kvalitní video. Tegra 2 podporuje formát H.264 do bitrate 20 Mbit/s, což může stačit, ale pro Full HD (1080p) potřebujete mnohem více. Typický Full HD záznam potřebuje podstatně více výkonu, vždyť testovací tituly dosahují až 40 Mbps. Pro současnou generaci Tegra je možné toto video transkódovat (převést) do formátu a bitrate, který je schopna přehrát. To ale není to pravé ořechové, co hledáme.
KAL-EL bude v tomto ohledu podstatně dále, protože dokáže přehrávat záznamy při využití H.264 o bitrate až 40 Mbit/s (ve špičkách až 60 Mbit/s) v rozlišení 2560x1440. To mimo jiné znamená, že tato specifikace je plně srovnatelná s přehráváním disků Blu-ray, které samozřejmě do KAL-Elu nedostanete. Budeme ovšem moci bez obav takovýto tablet nebo telefon připojit k monitoru s rozlišením až 2560x1440.
LG Optimus Pad s podporou streamovaného videa
Aby toho nebylo málo, KAL-EL bude mít podporu pro stereoskopické 3D přehrávání, což může posunout využitelnost do zcela jiných výšin, ač sám nejsem vůbec zastáncem pseudo 3D zobrazování na současných komerčních displejích. Asi už začínám stárnout, ale dobře prokreslený stabilní obraz na „obyčejné“ Full HD plazmě je pro mě daleko příjemnější záležitostí (beze strachu o to, zda se u mě projeví skrytá epilepsie nebo si budu ještě více ničit své oči).
Poslední záležitostí, kterou je třeba zmínit, je kvalita zachytávání videa, kde je potřeba zmínit skutečně nízkou kvalitu pořízeného videa nebo fotografií. Nvidia slíbila, že na tomto faktu zapracuje, protože se jedná o poměrně klíčovou vlastnost mobilních zařízení. Každý z nás by jednou rád měl v kapse možnosti alespoň průměrného digitálního kompaktu v ceně okolo 3 000 až 4 000 Kč.