Seznam kapitol
Nová grafická karta založená na grafickém čipu Fiji se jistě v krátké době stane novou vlajkovou lodí grafických karet od společnosti AMD. Chcete už dnes vědět, jakou asi bude mít Fiji architekturu a výkon? Můžete tedy spekulovat s námi.
Všichni už asi víte, že novou vlajkovou lodí grafických karet společnosti AMD se měl stát
Radeon R9 390X
s kódovým označením
Fiji
, který by mohl být v tomto měsíci představen veřejnosti a spatřit tak světlo světa. Dnes ale není úplně jisté, jestli tato grafická karta opravdu ponese označení Radeon R9 390X, jak se doposud tradovalo, nebo nějaké jiné, jako třeba Radeon
Fury
. My v tomto článku budeme tedy raději, jak grafický čip, tak i grafickou kartu založenou na tomto čipu, nazývat prostě a jednoduše Fiji.
Na internetu se objevila a stále objevuje spousta „zaručených“ spekulací o výkonu Fiji a také o tom, jaká bude jeho architektura. Aby ani čtenáři Světa hardware nebyli nijak ochuzeni o nějaké ty "zaručené" informace, my si dnes trochu zaspekulujeme také.
Architektura GCN v kostce
Abychom mohli správně odhalit architekturu grafického čipu Fiji, musíme být alespoň zběžně obeznámeni s architekturou grafických čipů AMD, tedy s architekturou
GCN
(
G
raphics
C
ore
N
ext). Ne, opravdu se nemusíte bát, že půjdeme do nějaké hloubky, nám bude tentokrát stačit prachobyčejná kalkulačka a trocha zdravého rozumu.
Základním stavebním prvkem architektury GCN je výpočetní jednotka z názvem
Compute Unit
(CU) a jak už název napovídá, za pomoci této jednotky se provádějí veškeré výpočty.
	Každý takový CU obsahuje
64Stream procesorů
(organizovaných ve 4 blocích po 16 SP) plus jeden skalární a
4Texture Mapping Units
(TMU). Pro nás je v tuto chvíli důležité to, že CU se od počátku GCN nijak zásadně nezměnil a dá se velmi úspěšně spekulovat o tom, že ani u Fiji tomu nebude jinak.
Každý CU u Fiji bude obsahovat 64 SP a 4 TMU
. Compute Units jsou dále organizovány v blocích po čtyřech a tato čtveřice CU pak sdílí jednu L1 Cache (L1$). To pro nás už tak důležité není a navíc, není to až takovým pravidlem, někdy musí L1$ sdílet méně CU (třeba jako u grafického čipu Hawaii).
Půjdeme-li o úroveň výše, pak vyšší stavební jednotkou architektury GCN je
Shader Engine
(SE)
	
Shader Engine
pak v různém počtu obsahuje právě výše uvedené
CU
, dále
Geometry Processor
,
Rasterizér
a různý počet (maximálně však 4)
Render Back Ends
(
RB
E). Shader Engine vlastně provádí kompletní rasterizaci, která byla popsána v našem
. Těm zvídavějším z vás jistě neuniklo, že tu přeci jen něco schází. Kde jsou
ROP
(Render Outpu Unit nebo lépe
R
aster
O
perations
P
ipeline) jednotky? ROP jednotky jsou součástí RBE a každá taková jednotka obsahuje celkem čtyři ROP.
Shader Engine ale nyní opustíme a podíváme se na GCN ještě o další úroveň výše. Nebojte, k SE se dnes ještě vrátíme a podíváme se na něj podrobněji.
	- pro zvětšení klikněte na obrázek -
Nyní jsme již na nejvyšší úrovni grafického čipu. Toto je blokové schéma grafického čipu Hawaii (R9 290X) a vidíte, že čip se může skládat z několika (v případě Hawaii čtyř) Shader Enginů. Grafický čip pak obsahuje ještě další jednotky jako je
Graphics Command Processor
(GPC),
Asynchronous Compute Engine
(ACE),
L2 Cache
(L2$) atd. Tyto jednotky, snad kromě L2$, nejsou ale pro nás dnes nijak důležité. Stačí si pouze zapamatovat, že grafická karta obsahuje vlastně dva druhy enginů. Jeden standardní grafický, který představuje klasickou grafickou pipeline a je obsluhován právě GPC, další enginy jsou pak výpočetní a jejich práce je organizována za pomoci ACE. Dnešní moderní hry totiž nemusí být vždy a za všech okolností renderovány pouze přes klasickou pipeline grafické karty, tedy geometry shader, rasterizér, pixel shader a ROPs, ale naprogramované compute shadery mohou zapisovat přímo do frame bufferu také a vytvářet tak na výsledném snímku rozličné efekty.
Pro prvotní seznámení s architekturou GCN by to myslím mohlo stačit, takže se pojďme podívat na nějaké ty souvztažnosti a výpočty. Pokud bychom chtěli např. popsat grafický čip Hawaii (Radeon R9 290X), nebo raději matematicky vyjádřit jeho parametry, udělali bychom to následovně.
Počet Stream Procesorů
= počet Shader Enginů x počet Compute Unitů x 64 (počet SP v CU) = 4 x 11 x 64 =
2816 SP
Počet TMU
= počet Shader Enginů x počet Compute Unitů * 4 (počet TMU v CU) = 4 x 11 x 4 =
176 TMU
Počet ROP
= počet Shader Enginů x počet RBE x 4 (počet ROP v RBE) = 4 x 4 x 4 =
64 ROP
Vidíte, že na tom není nic těžkého a obyčejná kalkulačka je dostatečným nástrojem pro takovéto výpočty.
Hrubou orientaci v architektuře GCN tedy máme za sebou a můžeme se nyní konečně pustit do našich spekulací kolem Fiji.