Fermi (GF100): pohled na architekturu čipu
31.3.2010, Petr Štefek, technologie
V dnešním článku, který je předvojem praktických testů, se podíváme na architekturu netrpělivě očekávaného čipu Fermi (GF100). Tento čip je s přehledem tím největším, co kdy bylo v segmentu grafických jader vyrobeno a integruje i největší množství procesorů.
Kapitoly článku:
- Fermi (GF100): pohled na architekturu čipu
- Specifikace GeForce GTX 480 a GeForce GTX 470
- Pohled na architekturu čipu
- Polymorph Engine a Raster Engine
- Vstříc lépe vyhlazeným hranám
- Nvidia Surround, 3D Vision a ECC
- Závěr
Nvidia oficiálně uvedla dva modely založené na architektuře GF100. První kouskem je high-endová GeForce GTX 480. První začnu špatnou zprávou, protože nová high-endová grafika nevyužívá plně grafického jádra GF100. Aktivních je pouze 480 z 512 CUDA Cores (stream procesory), což potvrzuje domněnky a zprávy, že TSMC má opravdu s výtěžností tak velkého čipu problémy.
GF100 je totiž s přehledem ten nejkomplexnější čip s největším počtem tranzistorů, jaký kdy byl vyroben. Jeho 3 mld. tranzistorů překonávají konkurenční RV 870 o plných 850 mil. tranzistorů. Potenciál jádra tedy není využit naplno a navíc se nepodařilo, aby tento bumbrlíček pracoval na alespoň 800 MHz. Základní frekvencí se stalo 700 MHz a takt shaderů byl nastaven na 1401 MHz.
Společnost využila kombinace 384-bitové sběrnice s 1.5 GB paměti GDDR5, což by mělo zajistit dostatek paměti i při využití nejvyšších rozlišení v kombinaci s vysokým levelem vyhlazování hran. Základ tedy nápadně připomíná starší generaci GeForce 8800 (G80), která také vsadila na poměrně nestandardní šířku sběrnice. Na rozdíl od straších modelů zde máme vhodně vybrány rychlé GDDR5 čipy pracující s přibližně dvojnásobnou efektivní frekvencí než GDDR3. Komplexnost karty při využití 512-bitové sběrnice by byla neúnosná a navíc by bylo možné využívat pravděpodobně jen kombinace s jedním nebo dvěma gigabyty paměti. 384-bitová sběrnice ve spolupráci s paměťovým řadičem a využitými čipy o kapacitě 1 Gbit tedy rozumně nastavuje limit na 1536 MB a neprodražuje zbytečně kartu jako takovou.
Grafické jádro samozřejmě plně podporuje DirectX 11 a také v minulé kapitole zmiňované technologie CUDA a PhysX (případně DirectCompute 5.0). Silnější model byl oceněn na 500 USD, což po přepočtu se současnými maržemi obchodů u nás dělá 12 až 13 tisíc korun za GeForce GTX 480. To je opravdu hodně, ale nechme se překvapit, zda tuto vskutku brutální cenovku vyváží adekvátním výkonem. Další šokující zprávou je udávané TDP GeForce GTX 480, které činí rovných 250 W, což také dává tušit, že karta jako taková bude krom enormní spotřeby energie také velmi hřát.
Slabší model GeForce GTX 470 bude pro většinu našinců zajímavějším modelem, protože přináší stejné jádro a podporu DirectX 11, to vše ovšem za podstatně nižší cenu, která byla stanovena na 350 USD a u nás by se karta měla prodávat za cenu okolo 9 tisíc korun s daní. Ovšem pozor, toto je cenová hladina Radeonu HD 5870, který není žádným ořezávátkem. Levnější model GeForce ale není nijak speciálně ořezaný a dočkáme se zde plných 448 CUDA cores alias stream procesorů.
Narozdíl od silnějšího modelu zde již samozřejmě najdeme úbytky na straně aktivních texturovacích jednotek nebo renderovacích jednotek. Pro nás je ovšem důležitý fakt, že i slabší Fermi má dostatečnou paměťovou propustnost díky 320-bitové paměťové sběrnici a přítomnosti GDDR5 (1286 MB). Vše je samozřejmě podstatně níže taktováno. Když se podíváte do tabulky výže, tak si velmi snadno lehkým spočítáním uděláte obrázek, že GeForce GTX 470 je papírově na 80% výkonu silnějšího a dražšího bratra. Také příkon karty dělá v zátěži 215 W, což je opět asi 86% TDP GeForce GTX 480.
Za snížení TDP může především nižší frekvence jádra, které tiká v tomto případě na 607 MHz a shadery na 1215 MHz. Kapacita paměti je tvořena v tomto případě 10 čipy o kapacitě 128 MB a pracujících na taktu 3348 MHz (efektivně), což při možnostech současných paměťovým čipů není mnoho, ale aspoň to dává nějakou naději pro přetaktování u slabšího modelu.
GF100 je totiž s přehledem ten nejkomplexnější čip s největším počtem tranzistorů, jaký kdy byl vyroben. Jeho 3 mld. tranzistorů překonávají konkurenční RV 870 o plných 850 mil. tranzistorů. Potenciál jádra tedy není využit naplno a navíc se nepodařilo, aby tento bumbrlíček pracoval na alespoň 800 MHz. Základní frekvencí se stalo 700 MHz a takt shaderů byl nastaven na 1401 MHz.
Grafická karta | GeForce GTX 480 | GeForce GTX 470 | GeForce GTX 285 |
GPU | GF100 | GF100 | GT200 |
Počet tranzistorů | 3 mld. | 3 mld. | 1.4 mld. |
Výrobní technologie | 40 nm | 40 nm | 55 nm |
Frekvence jádra | 700 MHz | 607 MHz | 648 MHz |
Frekvence shaderů | 1401 MHz | 1215 MHz | 1476 MHz |
Počet shaderů | 480 (1D) | 448 (1D) | 240 (1D) |
Pixel fillrate | 33 600 Mpix/s | 24 280 Mpix/s | 20 736 Mpix/s |
Texel fillrate | 42 000 Mtex/s | 33 992 Mtex/s | 51 840 Mtex/s |
Počet RBE | 48 | 40 | 32 |
Počet TMU | 60 | 56 | 80 |
Velikost paměti | 1536 MB GDDR5 | 1280 MB GDDR5 | až 2048 MB GDDR3 |
Frekvence paměti | 3 696 MHz | 3348 MHz | 2 484 MHz |
Šířka sběrnice | 384-bit | 320-bit | 512-bit |
Propustnost sběrnice | 177 400 MB/s | 133 900 MB/s | 158 970 MB/s |
Verze DirectX | DirectX 11 | DirectX 11 | DirectX 10 |
Společnost využila kombinace 384-bitové sběrnice s 1.5 GB paměti GDDR5, což by mělo zajistit dostatek paměti i při využití nejvyšších rozlišení v kombinaci s vysokým levelem vyhlazování hran. Základ tedy nápadně připomíná starší generaci GeForce 8800 (G80), která také vsadila na poměrně nestandardní šířku sběrnice. Na rozdíl od straších modelů zde máme vhodně vybrány rychlé GDDR5 čipy pracující s přibližně dvojnásobnou efektivní frekvencí než GDDR3. Komplexnost karty při využití 512-bitové sběrnice by byla neúnosná a navíc by bylo možné využívat pravděpodobně jen kombinace s jedním nebo dvěma gigabyty paměti. 384-bitová sběrnice ve spolupráci s paměťovým řadičem a využitými čipy o kapacitě 1 Gbit tedy rozumně nastavuje limit na 1536 MB a neprodražuje zbytečně kartu jako takovou.
Grafické jádro samozřejmě plně podporuje DirectX 11 a také v minulé kapitole zmiňované technologie CUDA a PhysX (případně DirectCompute 5.0). Silnější model byl oceněn na 500 USD, což po přepočtu se současnými maržemi obchodů u nás dělá 12 až 13 tisíc korun za GeForce GTX 480. To je opravdu hodně, ale nechme se překvapit, zda tuto vskutku brutální cenovku vyváží adekvátním výkonem. Další šokující zprávou je udávané TDP GeForce GTX 480, které činí rovných 250 W, což také dává tušit, že karta jako taková bude krom enormní spotřeby energie také velmi hřát.
Slabší model GeForce GTX 470 bude pro většinu našinců zajímavějším modelem, protože přináší stejné jádro a podporu DirectX 11, to vše ovšem za podstatně nižší cenu, která byla stanovena na 350 USD a u nás by se karta měla prodávat za cenu okolo 9 tisíc korun s daní. Ovšem pozor, toto je cenová hladina Radeonu HD 5870, který není žádným ořezávátkem. Levnější model GeForce ale není nijak speciálně ořezaný a dočkáme se zde plných 448 CUDA cores alias stream procesorů.
Narozdíl od silnějšího modelu zde již samozřejmě najdeme úbytky na straně aktivních texturovacích jednotek nebo renderovacích jednotek. Pro nás je ovšem důležitý fakt, že i slabší Fermi má dostatečnou paměťovou propustnost díky 320-bitové paměťové sběrnici a přítomnosti GDDR5 (1286 MB). Vše je samozřejmě podstatně níže taktováno. Když se podíváte do tabulky výže, tak si velmi snadno lehkým spočítáním uděláte obrázek, že GeForce GTX 470 je papírově na 80% výkonu silnějšího a dražšího bratra. Také příkon karty dělá v zátěži 215 W, což je opět asi 86% TDP GeForce GTX 480.
Za snížení TDP může především nižší frekvence jádra, které tiká v tomto případě na 607 MHz a shadery na 1215 MHz. Kapacita paměti je tvořena v tomto případě 10 čipy o kapacitě 128 MB a pracujících na taktu 3348 MHz (efektivně), což při možnostech současných paměťovým čipů není mnoho, ale aspoň to dává nějakou naději pro přetaktování u slabšího modelu.