Pentium 4 potřetí - 90nm Prescott
1.2.2004, Eagle , článek
Dnes je uveden první procesor vyráběný 90nm technologií. Kódové označení následníka současného Pentia 4 zní Prescott a do vínku si přinesl vyšší frekvence, větší cache a různé úpravy v pipeline. Jde o největší úpravu architektury NetBurst od jejího uvedení.
Kapitoly článku:
- Pentium 4 potřetí - 90nm Prescott
- Prescott - třetí jádro pro Pentium 4
- Prescott - změny v architektuře
- Spotřeba elektrické energie
- Kompatibilita, shrnutí
Prescott
Prescott je již třetí generací jádra architektury NetBurst použité v Pentiích 4. Nahrazuje současné jádro Northwood, které je na trhu již více než dva roky. Během letošního roku bude tento nový čip tvořit polovinu dodávek Intelu v oblasti desktopů. Dnes startuje jen jako Pentium 4, ale již během několika příštích měsíců budou uvedeny i procesory Celeron a Xeon založené na tomto jádru.
Prescott je také prvním čipem masově vyráběným 90nm výrobní technologií. To by však samo o sobě nebylo až tak převratné. Neméně důležité je, co Intel přichystal za změny "inside".
Na ploše 112 mm2 se rozprostírá jádro s celkem 125 miliony transistorů. Toto jádro je dnes uváděno na frekvencích 2.8 GHz (s 533 MHz FSB a bez HyperThreading - pouze ne-BOX verze), 2.8, 3.0, 3.2 a 3.4 GHz (s 800 MHz FSB a s HyperThreading). Čip je plně kompatibilní se stávajícími čipsety i875 a i865.
Yamhill - je tu mezi námi !
Nové jádro přináší řadu změn v architektuře oproti svým předchůdcům Willamette a Northwood. Než se jim budu věnovat změnám, které uživatel pocítí, rád bych rozebral změny z trochu jiného soudku - fyzické v čipu.
Dvě dvojice ALU jednotek - budoucí Yamhill ?
Pamatujete ještě na Yamhill, 64bit rozšíření Intelu jako konkurence proti instrukční sadě AMD64? Již přes rok se spekuluje, zda Prescott bude tím procesorem, který bude Yamhill integrovat. Bez překvapení - ano, je to tu. Prescott integruje zdvojené aritmeticko-logické jednotky (ALU), což mu umožní pracovat nativně s 64bit čísly.
Co je zvláštní, Prescott hlásí prostřednictvím CPUID instrukce číslo 8000_0008h, že podporuje 40 bitové fyzické adresování. Jednak je na tom zvláštní, že je to přesně stejně jako u Athlonu 64 a za druhé Prescott podle dokumentace tuto instrukci podporovat nemá! Maximum má být 8000_0006h. Starší Pentia 4 samozřejmě tuto instrukci nepodporují. Že by nám v Intelu něco tajili?
A co je ještě zajímavé, v nové sadě Feature Flags z registru ECX je bit 2, u něhož Prescott hlásí podporu, nicméně tento bit není v dokumentaci popsán! Feature Flags slouží k detekci vlastností procesoru, zde se programy dozví, že procesor podporuje / nepodporuje x87, SSE2, MSR registry, různé jiné vlastnosti atd.. Ono je dost dobře možné, že již Prescott má Yamhill integrován a má ho zapnutý, jen zatím programátoři neví, že tomu tak je, neznají binární kódy instrukcí, proto tuto technologii zatím nemohou využít. Pokud se přítomnost 64bit instrukcí potvrdí, můžeme jen doufat, že budou kompatibilní s instrukcemi od AMD.
Čtvrtina jádra je cache
Ke každé dvojici ALU jednotek nyní patří 16 kByte datové cache první úrovně. To je dvojnásobek oproti procesorům Willamette a Northwood. Větší, velmi rychlá L1 cache umožní v řadě aplikací dosahovat vyššího výkonu - právě maličká datová cache byla předchozím generacím nejvíce vytýkána. Aby toho však nebylo málo, Prescott má zvětšenou i cache druhé úrovně - na 1 MByte (na fotce jádra velké bloky dole). Tyto cache jsou i nadále spojeny přes velmi rychlou 256 bitovou sběrnici. Pokud jde o L1 instrukční cache (neboli Trace cache), ta uchovává, stejně jako u Willamette a Northwood, 12 tisíc mikro-instrukcí dekódovaných z podporovaných instrukčních sad. Existuje však podezření, že tato Trace cache byla urychlena tak, aby zásobovala výpočetní jednotky větším počtem instrukcí za hodinový cyklus - konkrétně namísto třemi mikroinstrukcemi čtyřmi. Trace cache je do L2 cache spojena sběrnicí o šířce 64 bitů.
Cache nyní zabírá více než čtvrtinu plochy jádra.
Další zlepšení
Kompletně přepracována byla jednotka pro operace s desetinnými čísly a SIMD instrukcemi - FPU jednotka. Její vývoj probíhal s pomocí automatizovaného počítačového návrhu.
Další výhodou Prescottu je lepší distribuce hodinového signálu z generátorů frekvence po celém čipu:
Na obrázku výše je zpoždění některých částí jádra v pikosekundách proti ideálnímu stavu. Zatímco u Northwoodu bylo nejhorší zpoždění 22ps, v Prescottu je to nejhůře 7ps. To má umožnit lepší stabilitu při vysokých frekvencích.
Prescott je již třetí generací jádra architektury NetBurst použité v Pentiích 4. Nahrazuje současné jádro Northwood, které je na trhu již více než dva roky. Během letošního roku bude tento nový čip tvořit polovinu dodávek Intelu v oblasti desktopů. Dnes startuje jen jako Pentium 4, ale již během několika příštích měsíců budou uvedeny i procesory Celeron a Xeon založené na tomto jádru.
Prescott je také prvním čipem masově vyráběným 90nm výrobní technologií. To by však samo o sobě nebylo až tak převratné. Neméně důležité je, co Intel přichystal za změny "inside".
Na ploše 112 mm2 se rozprostírá jádro s celkem 125 miliony transistorů. Toto jádro je dnes uváděno na frekvencích 2.8 GHz (s 533 MHz FSB a bez HyperThreading - pouze ne-BOX verze), 2.8, 3.0, 3.2 a 3.4 GHz (s 800 MHz FSB a s HyperThreading). Čip je plně kompatibilní se stávajícími čipsety i875 a i865.
Yamhill - je tu mezi námi !
Nové jádro přináší řadu změn v architektuře oproti svým předchůdcům Willamette a Northwood. Než se jim budu věnovat změnám, které uživatel pocítí, rád bych rozebral změny z trochu jiného soudku - fyzické v čipu.
Dvě dvojice ALU jednotek - budoucí Yamhill ?
Pamatujete ještě na Yamhill, 64bit rozšíření Intelu jako konkurence proti instrukční sadě AMD64? Již přes rok se spekuluje, zda Prescott bude tím procesorem, který bude Yamhill integrovat. Bez překvapení - ano, je to tu. Prescott integruje zdvojené aritmeticko-logické jednotky (ALU), což mu umožní pracovat nativně s 64bit čísly.
Co je zvláštní, Prescott hlásí prostřednictvím CPUID instrukce číslo 8000_0008h, že podporuje 40 bitové fyzické adresování. Jednak je na tom zvláštní, že je to přesně stejně jako u Athlonu 64 a za druhé Prescott podle dokumentace tuto instrukci podporovat nemá! Maximum má být 8000_0006h. Starší Pentia 4 samozřejmě tuto instrukci nepodporují. Že by nám v Intelu něco tajili?
A co je ještě zajímavé, v nové sadě Feature Flags z registru ECX je bit 2, u něhož Prescott hlásí podporu, nicméně tento bit není v dokumentaci popsán! Feature Flags slouží k detekci vlastností procesoru, zde se programy dozví, že procesor podporuje / nepodporuje x87, SSE2, MSR registry, různé jiné vlastnosti atd.. Ono je dost dobře možné, že již Prescott má Yamhill integrován a má ho zapnutý, jen zatím programátoři neví, že tomu tak je, neznají binární kódy instrukcí, proto tuto technologii zatím nemohou využít. Pokud se přítomnost 64bit instrukcí potvrdí, můžeme jen doufat, že budou kompatibilní s instrukcemi od AMD.
Čtvrtina jádra je cache
Ke každé dvojici ALU jednotek nyní patří 16 kByte datové cache první úrovně. To je dvojnásobek oproti procesorům Willamette a Northwood. Větší, velmi rychlá L1 cache umožní v řadě aplikací dosahovat vyššího výkonu - právě maličká datová cache byla předchozím generacím nejvíce vytýkána. Aby toho však nebylo málo, Prescott má zvětšenou i cache druhé úrovně - na 1 MByte (na fotce jádra velké bloky dole). Tyto cache jsou i nadále spojeny přes velmi rychlou 256 bitovou sběrnici. Pokud jde o L1 instrukční cache (neboli Trace cache), ta uchovává, stejně jako u Willamette a Northwood, 12 tisíc mikro-instrukcí dekódovaných z podporovaných instrukčních sad. Existuje však podezření, že tato Trace cache byla urychlena tak, aby zásobovala výpočetní jednotky větším počtem instrukcí za hodinový cyklus - konkrétně namísto třemi mikroinstrukcemi čtyřmi. Trace cache je do L2 cache spojena sběrnicí o šířce 64 bitů.
Cache nyní zabírá více než čtvrtinu plochy jádra.
Další zlepšení
Kompletně přepracována byla jednotka pro operace s desetinnými čísly a SIMD instrukcemi - FPU jednotka. Její vývoj probíhal s pomocí automatizovaného počítačového návrhu.
Další výhodou Prescottu je lepší distribuce hodinového signálu z generátorů frekvence po celém čipu:
Na obrázku výše je zpoždění některých částí jádra v pikosekundách proti ideálnímu stavu. Zatímco u Northwoodu bylo nejhorší zpoždění 22ps, v Prescottu je to nejhůře 7ps. To má umožnit lepší stabilitu při vysokých frekvencích.