Nvidia Tegra 2: budoucnost smartphonů a tabletů
12.1.2011, Petr Štefek, technologie
Nvidia Tegra 2 je novinkou pro zbrusu nové smartphony a tablety, kde má ambice přinést dosud nevídaný výkon. Můžeme se těšit dual-core telefony nebo tablety umožňující přehrávání full HD videa nebo hraní her.
Kapitoly článku:
- Nvidia Tegra 2: budoucnost smartphonů a tabletů
- ARM Cortex A9 - nová architektura
- GeForce ULV, Video a akcelerace Flash
- Tegra Zone - optimalizované aplikace komerčně
- Závěr
Nvidia na své platformě Tegra 2 využívá ARM procesorů, ale jak jsme si již řekli dříve, tento typ ARM architektury není tak úplně produktem Nvidie. Na svědomí ho má britská společnost ARM Limited a její výrobky respektive architektury jsme mohli vídávat pod označením Advanced RISC Machine. Nvidia si licenci pro výrobu svých vlastních procesorových jader s ARM architekturou samozřejmě licencovala. Musíme ale mít na paměti, že Tegra 2 není pouze ARM procesor, ale SoC, tedy jinak (a česky) řečeno systém na čipu.
Tegra 2 SoC disponuje párem procesorů ARM Cortex A9 na frekvenci 1 GHz. Zajímavostí je, že v případě obou jader je možné dynamicky řídit jejich frekvenci v závislosti na potřebě výkonu, ale již nikoli jejich napájení. To je pro obě jádra stejné. Tento luxus máme třeba u nejnovější architektury Intel SandyBridge, kde lze řídit frekvenci i napájení u každého jádra zvlášť. Tento fakt ale není žádnou podstatnou nevýhodou.
Pokud se podíváme na blokové schéma procesoru ARM Cortex A9, neliší se nijak zásadně od předešlého modelu Cortex A8. Zcela zásadní věcí je ovšem změna typu architektury z „in-order“ na „out-of-order“. To přinese výrazné zvýšení výkonu v určitém typu aplikací. Tento trend můžeme vidět i u klasických desktopových a notebookových procesorů nových generací.
ARM Cortex A9 může byt nasazen až v počtu 4 jader se sdílenou L2 cache, jejíž maximální velikost je 1 MB. Současná Tegra 2 má sice k dispozici „pouze“ dvě jádra ARM Cortex A9, ale k dispozici má rovněž plnou velikost L2 cache. Dále vidíme na blokovém schématu ARM procesoru také L1 cache o kapacitě 64kB, která je rozdělena klasicky do 32kB instrukční cache a 32kB datové cache. Vše je podřízeno aplikacím, které se příliš neliší od klasických desktopových, takže lze očekávat postupné sbližování architektur.
Pipeline procesoru ARM Cortex A9 prošla poměrně zásadní změnou a je výrazně kratší, než v případě modelu ARM Cortex A8, což má výrazný vliv na spotřebu. Obecně znamená dlouhá pipeline vyšší spotřebu. Příkladem za všechny může být v procesor Intel Pentium 4, který dlouhou pipeline chtěl dosáhnout vysokých frekvencí, ale docílil spíše vysoké spotřeby. Cortex A9 pracuje na frekvenci 1 GHz a je vyráběn 40nm technologií u TSMC.
Další detaily pro tento nový procesor nejsou známy, ale Nvidia tvrdí, že mezigeneračně došlo k nárůstu výkonu na stejné frekvenci o 20 %. To se nezdá jako mnoho, ale musíme si uvědomit, že původní Cortex A8 je pouze jednojádrový a běžel na nižší frekvenci. Nárůst tak může být v reálu také díky „out-of-order“ architektuře i dvojnásobný oproti předchozí generaci. Jak si povede nová Tegra 2 v benchmarcích, můžeme vidět už v některých recenzích, ale rozhodovat budou reálné aplikace stejně jako desktopu.
Konkurence např. u Qualcommu také nespí a dočkáme se dvoujádrového Scorpionu na frekvenci až 1.5 GHz, který bude velmi pravděpodobně vycházet právě z architektury Cortex A8 a tedy nebude „out-of-order“. Srovnání výkonů obou platforem se již brzdy jistě dočkáme na některém z renomovaných světových serverů zabývajících se mobilními zařízeními.
Ve srovnání s konkurencí to vypadá dle materiálů Nvidie (které je třeba brát s rezervou) tak, že konkurenční platformy jsou v některých ohledech podstatně pomalejší. Asi největší konkurenční hrozbou je dvoujádrový Snapdragon od Qualcommu, který je kódově označen Scorpio a dokáže v pozdějších revizích pracovat až na hranicích 1.5 GHz.
Předchozí SoC založené na architektuře ARM Cortex A8 obsahovaly SIMD jednotky nazvané na NEON. Nyní u generace Cortex A9 máte možnost si zvolit, zda integrujete SIMD v podobě ARM Media Processing Engine alias NEON (pouze přejmenované SIMD) nebo FP jednotky (nevektorovou VFPv3-D13). Nvidia ve svém SoC Tegra 2 zvolila možnost číslo dvě, což je integrace FPU. Na rozdíl od předchozí FPU v ARM Cortex A8 je nyní FPU plně zařazena do pipeline ARM Cortex A9. To znamená především podstatně vyšší výkon. Výkon ARM Media Processing Engine je v matematické operaci ovšem podstatně vyšší, než u vybrané FPU jednotky.
Nvidia tvrdí, že zvolení FPU jednotky bylo logické, protože to ušetřilo minimálně 30 % z plochy jádra a navíc, že zvolení Media Processing Engine by bylo výhodou jen v omezeném množství aplikací. Integrování SIMD má jistě své nesporné výhody, ale Nvidia tvrdí, že tato doba ještě nenastala. Budeme ji tedy v tomto ohledu muset věřit. Na trhu se ale jistě objeví také SoC s integrovanými ARM Cortex A9 a zároveň s využitím Media Processing Engine. Podobný model připravuje např. známá firma Texas Instruments, takže budeme mít možnost srovnat obě možnosti v reálu i z výkonnostního hlediska.
Tegra 2 SoC disponuje párem procesorů ARM Cortex A9 na frekvenci 1 GHz. Zajímavostí je, že v případě obou jader je možné dynamicky řídit jejich frekvenci v závislosti na potřebě výkonu, ale již nikoli jejich napájení. To je pro obě jádra stejné. Tento luxus máme třeba u nejnovější architektury Intel SandyBridge, kde lze řídit frekvenci i napájení u každého jádra zvlášť. Tento fakt ale není žádnou podstatnou nevýhodou.
Pokud se podíváme na blokové schéma procesoru ARM Cortex A9, neliší se nijak zásadně od předešlého modelu Cortex A8. Zcela zásadní věcí je ovšem změna typu architektury z „in-order“ na „out-of-order“. To přinese výrazné zvýšení výkonu v určitém typu aplikací. Tento trend můžeme vidět i u klasických desktopových a notebookových procesorů nových generací.
ARM Cortex A9 může byt nasazen až v počtu 4 jader se sdílenou L2 cache, jejíž maximální velikost je 1 MB. Současná Tegra 2 má sice k dispozici „pouze“ dvě jádra ARM Cortex A9, ale k dispozici má rovněž plnou velikost L2 cache. Dále vidíme na blokovém schématu ARM procesoru také L1 cache o kapacitě 64kB, která je rozdělena klasicky do 32kB instrukční cache a 32kB datové cache. Vše je podřízeno aplikacím, které se příliš neliší od klasických desktopových, takže lze očekávat postupné sbližování architektur.
Pipeline procesoru ARM Cortex A9 prošla poměrně zásadní změnou a je výrazně kratší, než v případě modelu ARM Cortex A8, což má výrazný vliv na spotřebu. Obecně znamená dlouhá pipeline vyšší spotřebu. Příkladem za všechny může být v procesor Intel Pentium 4, který dlouhou pipeline chtěl dosáhnout vysokých frekvencí, ale docílil spíše vysoké spotřeby. Cortex A9 pracuje na frekvenci 1 GHz a je vyráběn 40nm technologií u TSMC.
Další detaily pro tento nový procesor nejsou známy, ale Nvidia tvrdí, že mezigeneračně došlo k nárůstu výkonu na stejné frekvenci o 20 %. To se nezdá jako mnoho, ale musíme si uvědomit, že původní Cortex A8 je pouze jednojádrový a běžel na nižší frekvenci. Nárůst tak může být v reálu také díky „out-of-order“ architektuře i dvojnásobný oproti předchozí generaci. Jak si povede nová Tegra 2 v benchmarcích, můžeme vidět už v některých recenzích, ale rozhodovat budou reálné aplikace stejně jako desktopu.
Konkurence např. u Qualcommu také nespí a dočkáme se dvoujádrového Scorpionu na frekvenci až 1.5 GHz, který bude velmi pravděpodobně vycházet právě z architektury Cortex A8 a tedy nebude „out-of-order“. Srovnání výkonů obou platforem se již brzdy jistě dočkáme na některém z renomovaných světových serverů zabývajících se mobilními zařízeními.
Ve srovnání s konkurencí to vypadá dle materiálů Nvidie (které je třeba brát s rezervou) tak, že konkurenční platformy jsou v některých ohledech podstatně pomalejší. Asi největší konkurenční hrozbou je dvoujádrový Snapdragon od Qualcommu, který je kódově označen Scorpio a dokáže v pozdějších revizích pracovat až na hranicích 1.5 GHz.
Předchozí SoC založené na architektuře ARM Cortex A8 obsahovaly SIMD jednotky nazvané na NEON. Nyní u generace Cortex A9 máte možnost si zvolit, zda integrujete SIMD v podobě ARM Media Processing Engine alias NEON (pouze přejmenované SIMD) nebo FP jednotky (nevektorovou VFPv3-D13). Nvidia ve svém SoC Tegra 2 zvolila možnost číslo dvě, což je integrace FPU. Na rozdíl od předchozí FPU v ARM Cortex A8 je nyní FPU plně zařazena do pipeline ARM Cortex A9. To znamená především podstatně vyšší výkon. Výkon ARM Media Processing Engine je v matematické operaci ovšem podstatně vyšší, než u vybrané FPU jednotky.
Nvidia tvrdí, že zvolení FPU jednotky bylo logické, protože to ušetřilo minimálně 30 % z plochy jádra a navíc, že zvolení Media Processing Engine by bylo výhodou jen v omezeném množství aplikací. Integrování SIMD má jistě své nesporné výhody, ale Nvidia tvrdí, že tato doba ještě nenastala. Budeme ji tedy v tomto ohledu muset věřit. Na trhu se ale jistě objeví také SoC s integrovanými ARM Cortex A9 a zároveň s využitím Media Processing Engine. Podobný model připravuje např. známá firma Texas Instruments, takže budeme mít možnost srovnat obě možnosti v reálu i z výkonnostního hlediska.