První výsledky NV40 a další info o R420
23.3.2004, Martin Štěpánek, článek
Sice do 13.dubna, kdy má být NV40 oficiálně představena, stále ještě pár dnů chybí, nicméně na internetu se již objevují první obrázky a výsledky této nové zbraně od firmy nVidia. Ta má za úkol rázně zakročit proti vzpírající se ATi s jejím R420.
Všichni jsme byli velmi zklamaní, že nedošlo k oficiálnímu uvedení grafických čipů NV40 a R420 na německém CeBITu, ale stane se tak až v průběhu několika týdnů. V případě nVidie je již datum známé, jedná se o 13. dubna (místo konání je San Francisco) a následně 14. dubna, kdy má být oficiální uvedení pro starý kontinent.
Ale nyní zpět k NV40. Včera se na internetu objevilo mnoho nových a velmi zajímavých zpráv. Ty se týkají nejen čipu samotného, ale také výkonu. Ještě bych rád upozornil, že se jedná o nepodložené informace!! Začněme ale pěkně popořádku. Jak se postupně ukazuje, současná NV40 není to co měla původně být. Ve skutečnosti se jedná o NV45, která měla spatřit světlo světa mnohem později. Důvody si asi každý domyslí sám (samozřejmě, je to ATi).
16x1, 8x2 či 8x1 pipelines, toť otázka
Není to tak dávno, co jsme vás informovali, že nová NV40 má mít 16 pipelines. Ovšem jak to tak vypadá, není to celá pravda. Podle deníku Inquirer je NV40 schopna pracovávat jak v režimu 8x1, ale zároveň také v některých případech 16x1. To je dáno schopností nových Vertex Shaderů 3.0 tvářit se jako 8 virtuálních pipelines. Bohužel nevýhodou je, že Vertex Shadery mohou zpracovávat textury pouze bez filtrovacích informací. To je v dnešní době, kdy se běžně používá bilineární, trilineární či anisotropické fitlrování poměrně velkou daní za výkon. Díky tomu je velmi pravděpodobné, že v nových hrách bude použita klasická formace 8 pipelines, které budou schopny zpracovat 8 textur pomocí single texturingu.
Takže pokud je tato informace pravdivá, bude zpracováno 8 textur normálně a 8 textur pomocí VS 3.0. Při použití této konfigurace, bude každá lichá textura zpracována normálně pomocí pixel pipelines a každá sudá textura pomocí VS 3.0. To ale znamená, že bude jasně patrný rozdíl v kvalitě obrazu u sudých a lichých textůr.
Při podrobnější pohledu na celý problém zjistíme, že VS 3.0 jsou schopny zpracovat textury pouze bez geometrie, to znamená čistě pixely. Výsledkem tedy je, že kvůli zpracovávání čistě point sample textur nelze toto schéma použít u moderních her. Toto je také důvod, proč je NV40 schopna dosahovat takových výsledků v 3D Marku 2001SE (ten používá pouze point sample filtering).
Předběžný výkon
V jednom internetovém fóru se objevily předběžné informace o výkonu od člověka "velmi blízkého nVidii". Jednalo se o revizi A2, tedy ne finální, která běžela na 475MHz a paměti o velikosti 256MB byly taktované na 1,2GHz (GDDR3). Bohužel nebyla specifikována sestava na které tento drobeček běžel, ale lze očekávat jen to nej. Byly použity ovladače ve verzi 56.55. které podporovaly pouze 4x AntiAliasing (pomocí RGMSAA), maximální úroveň Aisotropického Filteringu byla 8x. Ale to se má ještě vše změnit s novou verzí ovladačů.
A nyní již slibované výsledky:
Fillrate v 3D Marku 2001SE byl až neuvěřitelných 7010 Mtexelů za sekundu, ale o celém problému jsem se již zmiňoval výše. Při multitexturingu je dosaženo 7234 Mtexelů za sekundu. Jen pro porovnání, NV38 je schopna zpracovat okolo 3800 Mtexelů za sekundu.
Vzhled
Fotky jsou z japonské stránky, kde se také po překladu v Babelfish píše, že se jedná o čistě referenční design.
Obr. 01 - Přední strana referenční karty s NV40
Při pohledu na kartu mě ani tak nezaujala dvojice DVI konektorů, se kterou se můžeme setkat již dnes u grafických karet Asus, ale především dvojíice Molex konektorů pro dodatečné napájení. Je vidět, že 210 milionů transistorů, které mají být použity v jádru, je nutné dostatečně živit. Na desce je 256MB GDDR3 pamětí v konfiguraci 8x32MB od firmy Samsung (ne Micron jak se původně plánovalo a jak je plánováno u ATi).
Obr. 02 - Jádro NV40
ATi R420
Podle dostupných informací bude nová generace grafických čipů od ATI představena v San Jose při příležitosti Game Developers Conference, která se má konat 22-26.března. Ale ať už se tak stane či nikoliv, dostalo se k nám pár dalších informací.
R420 bude dostupná v několika verzích, jednak Pro s taktem 500MHz a paměťmi na reálném taktu 475MHz a druhá bude Nitro s taktem 600MHz a reálnou frekvencí pamětí 550MHz. Druhá informace se týká R423, který by měl mít plný počet 16 skutečných! pipelines, zatím co R420 jich bude mít "jen" 12. Zatím to tedy vypadá, že se bude jednat o dva stejné čipy, jen bude záležet na kvalitě 4 pipelines, které budou v případě potřeby deaktivovány (QuadBlock).
Bohužel, o výkonu zatím není známo nic bližšího.
Co dodat závěrem, snad jen že se již velmi těším na první skutečné porovnání těchto dvou velkých rivalů.
Dodatek - Point Sample Filtering
Podrobnější informace lze nalézt na stránkách německého serveru www.3dcenter.de, z jehož stránek jsem také částečně čerpal.
Jen poměrně zjednodušeně: každý texel musí mít barvu, která je určena pomocí souřadnic. Na příklad v našem případě se jedná o vektor (2,7 11.1). A právě zde přichází point sampling, který zaokrouhlí onen vektor na celá čísla a výsledkem tak bude (3 11).
Obr. 03 - Schéma funkce point samplingu
Pro svoji jednoduchost a nenáročnost byl tento způsob filtrování používán u softwarového režimu u her jako Doom nebo Unreal. A pokud chcete srovnání s Bilineárním filtrováním, asi nejlépe poslouží následující obrázek:
Obr. 04 - Srovnání kvality obarazu PS a BI
Toto je pouze dodatek, který popisuje jak pracuje point sampling. Rozhodně nechci, do momentu než otestuji novou NV40, tvrdit, že kvalita obrazu bude špatná. Ono také hodně záleží na ovladačích.
Zdroj: Elitebastards, Beyond 3D, 3D center, Inquirer.
Ale nyní zpět k NV40. Včera se na internetu objevilo mnoho nových a velmi zajímavých zpráv. Ty se týkají nejen čipu samotného, ale také výkonu. Ještě bych rád upozornil, že se jedná o nepodložené informace!! Začněme ale pěkně popořádku. Jak se postupně ukazuje, současná NV40 není to co měla původně být. Ve skutečnosti se jedná o NV45, která měla spatřit světlo světa mnohem později. Důvody si asi každý domyslí sám (samozřejmě, je to ATi).
16x1, 8x2 či 8x1 pipelines, toť otázka
Není to tak dávno, co jsme vás informovali, že nová NV40 má mít 16 pipelines. Ovšem jak to tak vypadá, není to celá pravda. Podle deníku Inquirer je NV40 schopna pracovávat jak v režimu 8x1, ale zároveň také v některých případech 16x1. To je dáno schopností nových Vertex Shaderů 3.0 tvářit se jako 8 virtuálních pipelines. Bohužel nevýhodou je, že Vertex Shadery mohou zpracovávat textury pouze bez filtrovacích informací. To je v dnešní době, kdy se běžně používá bilineární, trilineární či anisotropické fitlrování poměrně velkou daní za výkon. Díky tomu je velmi pravděpodobné, že v nových hrách bude použita klasická formace 8 pipelines, které budou schopny zpracovat 8 textur pomocí single texturingu.
Takže pokud je tato informace pravdivá, bude zpracováno 8 textur normálně a 8 textur pomocí VS 3.0. Při použití této konfigurace, bude každá lichá textura zpracována normálně pomocí pixel pipelines a každá sudá textura pomocí VS 3.0. To ale znamená, že bude jasně patrný rozdíl v kvalitě obrazu u sudých a lichých textůr.
Při podrobnější pohledu na celý problém zjistíme, že VS 3.0 jsou schopny zpracovat textury pouze bez geometrie, to znamená čistě pixely. Výsledkem tedy je, že kvůli zpracovávání čistě point sample textur nelze toto schéma použít u moderních her. Toto je také důvod, proč je NV40 schopna dosahovat takových výsledků v 3D Marku 2001SE (ten používá pouze point sample filtering).
Předběžný výkon
V jednom internetovém fóru se objevily předběžné informace o výkonu od člověka "velmi blízkého nVidii". Jednalo se o revizi A2, tedy ne finální, která běžela na 475MHz a paměti o velikosti 256MB byly taktované na 1,2GHz (GDDR3). Bohužel nebyla specifikována sestava na které tento drobeček běžel, ale lze očekávat jen to nej. Byly použity ovladače ve verzi 56.55. které podporovaly pouze 4x AntiAliasing (pomocí RGMSAA), maximální úroveň Aisotropického Filteringu byla 8x. Ale to se má ještě vše změnit s novou verzí ovladačů.
A nyní již slibované výsledky:
- Halo ( no AA, 8x AF ) 1600x1200 51.1fps
- Far Cry ( no AA, no AF ) 1600x1200 53.4fps
- UT2004 ( 4xAA, 4xAF ) 1280x960 82.9fps - botmatch
- UT2004 ( 4xAA, 4xAF ) 1600x1200 71.9fps - botmatch
- Star Wars Kotor ( 4xAA, 8xAF ) 1600x1200 49.3fps
Fillrate v 3D Marku 2001SE byl až neuvěřitelných 7010 Mtexelů za sekundu, ale o celém problému jsem se již zmiňoval výše. Při multitexturingu je dosaženo 7234 Mtexelů za sekundu. Jen pro porovnání, NV38 je schopna zpracovat okolo 3800 Mtexelů za sekundu.
Vzhled
Fotky jsou z japonské stránky, kde se také po překladu v Babelfish píše, že se jedná o čistě referenční design.
Obr. 01 - Přední strana referenční karty s NV40
Při pohledu na kartu mě ani tak nezaujala dvojice DVI konektorů, se kterou se můžeme setkat již dnes u grafických karet Asus, ale především dvojíice Molex konektorů pro dodatečné napájení. Je vidět, že 210 milionů transistorů, které mají být použity v jádru, je nutné dostatečně živit. Na desce je 256MB GDDR3 pamětí v konfiguraci 8x32MB od firmy Samsung (ne Micron jak se původně plánovalo a jak je plánováno u ATi).
Obr. 02 - Jádro NV40
ATi R420
Podle dostupných informací bude nová generace grafických čipů od ATI představena v San Jose při příležitosti Game Developers Conference, která se má konat 22-26.března. Ale ať už se tak stane či nikoliv, dostalo se k nám pár dalších informací.
R420 bude dostupná v několika verzích, jednak Pro s taktem 500MHz a paměťmi na reálném taktu 475MHz a druhá bude Nitro s taktem 600MHz a reálnou frekvencí pamětí 550MHz. Druhá informace se týká R423, který by měl mít plný počet 16 skutečných! pipelines, zatím co R420 jich bude mít "jen" 12. Zatím to tedy vypadá, že se bude jednat o dva stejné čipy, jen bude záležet na kvalitě 4 pipelines, které budou v případě potřeby deaktivovány (QuadBlock).
Bohužel, o výkonu zatím není známo nic bližšího.
Co dodat závěrem, snad jen že se již velmi těším na první skutečné porovnání těchto dvou velkých rivalů.
Dodatek - Point Sample Filtering
Podrobnější informace lze nalézt na stránkách německého serveru www.3dcenter.de, z jehož stránek jsem také částečně čerpal.
Jen poměrně zjednodušeně: každý texel musí mít barvu, která je určena pomocí souřadnic. Na příklad v našem případě se jedná o vektor (2,7 11.1). A právě zde přichází point sampling, který zaokrouhlí onen vektor na celá čísla a výsledkem tak bude (3 11).
Obr. 03 - Schéma funkce point samplingu
Pro svoji jednoduchost a nenáročnost byl tento způsob filtrování používán u softwarového režimu u her jako Doom nebo Unreal. A pokud chcete srovnání s Bilineárním filtrováním, asi nejlépe poslouží následující obrázek:
Obr. 04 - Srovnání kvality obarazu PS a BI
Toto je pouze dodatek, který popisuje jak pracuje point sampling. Rozhodně nechci, do momentu než otestuji novou NV40, tvrdit, že kvalita obrazu bude špatná. Ono také hodně záleží na ovladačích.
Zdroj: Elitebastards, Beyond 3D, 3D center, Inquirer.