Autor: Michal Poho°elsk²
Uve°ejn∞no: CHIP 09/99, str. 54-55
Tvrd² ·tok na Pentium III


Dlouhodob² ·sp∞ch fenomenßlnφho procesoru Digital Alpha zaΦal celkem nenßpadn∞ v roce 1990. V roce 1992 firma Digital Equipment Corporation (DEC) oficißln∞ ohlßsila nov² typ RISC procesoru, kter² prezentovala jako prvnφho zßstupce pln∞ 64bitov²ch procesor∙ architektury Alpha. Ve stejnΘm roce byl takΘ p°edstaven prvnφ poΦφtaΦ s procesorem Alpha 21064, kter² se pon∞kud zßhadn∞ naz²val Jensen.
Ze znaΦnΘ pozornosti odbornΘho tisku a ve°ejnosti zaΦala architektura Alpha v²razn∞ profitovat v roce 1994, proto₧e firma DEC uvedla na trh stolnφ poΦφtaΦ DECpc AXP 150. Tento poΦφtaΦ pou₧φval procesor Alpha 21064 AA (8+8 KB internφ cache) s frekvencφ 150 MHz. MenÜφ slabinou poΦφtaΦe byla pou₧itß sb∞rnice typu EISA, kterß nabφzela propustnost 33 MB/s. Velmi rychle se vÜak objevily dva mφrn∞ odliÜnΘ procesory: Alpha 21066 a Alpha 21068 s integrovanou sb∞rnicφ PCI. SouΦasn∞ DEC ohlßsil novou generaci procesor∙ - Φip Alpha 21164. èpiΦkov²m reprezentantem novΘho Φipu se stala pracovnφ stanice Alphastation 500/500, kterß byla na trh uvedena v zß°φ 1996. Srdcem stanice byl Φty°cestn² procesor Alpha 21164 (8 KB instrukΦnφ a 8 KB datovΘ internφ cache) s frekvencφ 500 MHz spolu s 8 MB cache L2 pam∞ti. VÜechny komponenty stanice vydatn∞ podporovala 64bitovß PCI sb∞rnice s propustnostφ 267 MB/s.
V souΦasnΘ dob∞ se vÜak na trhu ji₧ prodßvajφ AlphaServery s v²razn∞ v²konn∞jÜφmi procesory novΘ generace - Alpha 21264. Aktußlnφ ÜpiΦkov² procesor s nov² jmΘnem EV6 se vÜak od p°edchozφ generace v²razn∞ odliÜuje. Proto podrobn∞jÜφ seznßmenφ s jeho schopnostmi bude urΦit∞ velmi zajφmavΘ.

Zßkladnφ prvky architektury

Procesor Alpha EV6 (21264) je vyroben na matrici Üestivrstvou CMOS technologiφ 0.35 mikronu. V roce 2000 by m∞ly novΘ procesory postupn∞ dosp∞t k technologii 0.25 a 0.18 mikronu, co₧ umo₧nφ v²razn∞ zv²Üit v²kon a snφ₧it v²robnφ nßklady. Procesor obsahuje celkem 15.9 mili≤nu tranzistor∙ (Alpha 21164 m∞la 9.3 mili≤nu tranzistor∙). Jeho superskalßrnφ jßdro dokß₧e zpracovßvat a₧ Üest instrukcφ b∞hem jedinΘho taktu (Φty°i instrukce jsou naΦteny do Φty° jednotek pro v²poΦet v pevnΘ Φßrce a dalÜφ dv∞ instrukce jsou provßd∞ny dv∞mi jednotkami pro v²poΦet v plovoucφ desetinnΘ Φßrce).
V²vojov² t²m DEC kompletn∞ zm∞nil hierarchii vyrovnßvacφch cache pam∞tφ. Nov² Φip mß na prvnφ ·rovni (L1) 64 KB instrukΦnφ a 64 KB datovΘ cache pam∞tφ. Cache druhΘ ·rovn∞ (L2) o velikosti 1 a₧ 16 MB nenφ sice p°φmo na Φipu, ale je s nφm propojena p°es extrΘmn∞ rychlou 128bitovou sb∞rnici. Velkß internφ cache nynφ v²razn∞ zvyÜuje procento ·sp∞Ün∞ zpracovan²ch dat s minimßlnφ re₧iφ. DalÜφ data p°itom u₧ Φekajφ v obrovskΘ sekundßrnφ cache pam∞ti, aby mohla b²t okam₧it∞ p°esunuta do procesoru. Cache t°etφ ·rovn∞ (L3), kterou pou₧φvß znßm² procesor AMD K6-III, nenφ zatφm nutnß. V prvnφ verzi Alphy EV6 je L2 cache tvo°ena 200 MHz SRAM (Static RAM) Φipy, jen₧ dosahujφ propustnosti a₧ 3.2 GB/s. V dalÜφch verzφch procesoru vÜak najde z°ejm∞ vyu₧itφ ÜpiΦkovß technologie Dual Data Rate SRAM. NovΘ DDR-SRAM Φipy s velmi vysokou frekvencφ nabφdnou procesoru impozantnφ propustnost 8 GB/s. Dnes se nejΦast∞ji prodßvajφ procesory s frekvencφ 500, 525 a 575 MHz. B∞hem krßtkΘ doby vÜak budou k dispozici v²konn∞jÜφ Φipy s frekvencemi 666 MHz a 775 MHz. P°itom v roce 1998 u₧ DEC s tφmto procesorem experimentßln∞ dosßhl magickΘ frekvence 1 GHz (1000 MHz) ! Enormnφ nßr∙st v²poΦetnφho v²konu na magickΘ frekvenci vÜak bude siln∞ ovlivn∞n prßv∞ pou₧itφm DDR-SRAM Φip∙, kterΘ nebudou brzdit procesorovΘ jßdro.
Jednou z nejzajφmav∞jÜφch vlastnostφ novΘ Alphy je dynamickΘ vykonßvßnφ instrukcφ mimo po°adφ (out of order), kterΘ je pro celou architekturu Alpha ·plnou novinkou. Procesor vykonßvajφcφ instrukce mimo po°adφ p°eskupuje dynamicky instrukce programu tak, aby co nejlΘpe vyu₧il vlastnφ zdroje. Celß operace se p°itom sklßdß ze t°φ navzßjem propojen²ch fßzφ - p°edpov∞d skok∙, anal²za toku dat a spekulativnφ provßd∞nφ. Tato hardwarovΘ technologie byla obvykle souΦßstφ mΘn∞ v²konn²ch CISC procesor∙ (nap°. Intel Pentium Pro), proto₧e jejich architektura byla vφce orientovßna na sofistikovanΘ odevzdßvßnφ instrukcφ. Komplexnφ logika pot°ebnß pro takovΘ °φzenφ procesoru je toti₧ v rozporu s po₧adavkem na velmi vysokou frekvenci. A₧ do nßstupu Pentia II / AMD K6 platilo, ₧e vysokß taktovacφ frekvence nepat°φ mezi absolutnφ priority CISC procesor∙. Dnes ovÜem panuje jinß situace. P°itom Alpha 21264 m∞nφ pravidla - pracuje s nezvyklou inteligencφ (v∙Φi p°edchozφ generaci) a z∙stßvß pekeln∞ rychlß.
Kritick²m m∞°φtkem ·sp∞Ünosti p°i zpracovßnφ instrukcφ mimo po°adφ je poΦet instrukcφ, kterΘ procesor m∙₧e p°φmo pou₧φvat. D∙vodem je fakt, ₧e poΦet naΦten²ch instrukcφ (Üφ°ka zßb∞ru) p°φmo ovliv≥uje efektivitu rozhodovßnφ, pon∞vad₧ CPU vidφ najednou v∞tÜφ Φßst b∞₧φcφho programu. To ovÜem vy₧aduje mnoho hardwarov²ch zdroj∙ (logiku pro zm∞nu instrukΦnφho po°adφ, pomocnΘ registry pro uchovßnφ hodnot zastaven²ch instrukcφ apod.). Zatφmco aktußlnφ procesory firmy Intel (Pentium II, Pentium II Xeon) mohou manipulovat se 40 instrukcemi najednou, Alpha EV6 mß p°ed celou konkurencφ drtiv² nßskok - dokß₧e v jednom okam₧iku zpracovßvat a₧ 80 instrukcφ. Za tφmto nßskokem stojφ v pozadφ sofistikovanΘ schΘma procesorov²ch registr∙. Alpha obsahuje, stejn∞ jako °ada jin²ch RISC Φip∙, soubor 32 celoΦφseln²ch (integer) a 32 plovoucφch (floating-point) registr∙, kterΘ jsou 64bitovΘ. Kv∙li zv²Üenφ kapacity na manipulovßnφ s instrukcemi mß procesor navφc 48 celoΦφseln²ch a 40 plovoucφch pomocn²ch registr∙, kterΘ slou₧φ k ·schov∞ hodnot vÜech Φekajφcφch instrukcφ. Po kompletnφm zpracovßnφ jednΘ instrukce se vybran² pomocn² registr stane doΦasn∞ souΦßstφ sady (32 celoΦφseln²ch + 32 plovoucφch) regulΘrnφch registr∙. V tomto okam₧iku se hodnota registru stßvß oficißln∞ platnou souΦßstφ stavu a je viditelnß pro aktußln∞ provßd∞n² program.

Rychlost sv∞tla

P°i projektovßnφ procesoru Alpha EV6 musel v²vojov² t²m vy°eÜit pozoruhodn² problΘm. Ukßzalo se toti₧, ₧e vesmφrnß rychlost sv∞tla zaΦφnß z°eteln∞ omezovat rychlost procesoru Alpha ! SouΦasnΘ procesory s relativn∞ b∞₧nou frekvencφ 500 MHz provedou jeden taktovacφ cyklus za dv∞ nanosekundy. B∞hem tohoto extrΘmn∞ krßtkΘho okam₧iku sv∞teln² paprsek uletφ vzdßlenost 60 cm. P°i taktovacφ frekvenci 1000 MHz, kterß se brzy stane pro Alphu realitou, trvß cyklus procesoru pouze jednu nanosekundu, co₧ nestaΦφ ani foton∙m - uletφ jen kritick²ch 30 cm. Proto mß Alpha 21264 duplicitnφ soubor 80 celoΦφseln²ch registr∙ (32 normßlnφch + 48 pomocn²ch), co₧ p°edstavuje celkem 160 celoΦφseln²ch registr∙ ! P°itom jsou Φty°i celoΦφselnΘ jednotky logicky rozd∞leny do dvou skupin (po dvou jednotkßch). Ka₧dß skupina mß vlastnφ soubor 80 celoΦφseln²ch registr∙ a p°i zm∞n∞ hodnoty n∞kterΘho registru je tato zm∞na okam₧it∞ nakopφrovßna do druhΘho souboru registr∙. Uvedenß operace sice vy₧aduje jeden takt procesoru, ale zpracovßnφ instrukcφ mimo po°adφ dokß₧e toto zdr₧enφ kompenzovat.

Inteligentnφ v∞tvenφ

P°i nßvrhu procesoru ovÜem bylo nutnΘ pamatovat na vÜechny potencionßln∞ slabß mφsta p°i zpracovßvßnφ dat. Proto mß Alpha 21264 takΘ t°i odhadovacφ mechanizmy v∞tvenφ. Prvnφ se naz²vß lokßlnφ predikßtor a zam∞°uje se hlavn∞ na lokßlnφ v∞tvenφ. Druh² se naz²vß globßlnφ predikßtor a jeho ·kolem je udr₧ovat celkov² p°ehled o naposledy pou₧it²ch v∞tvenφch. T°etφ rozhodovacφ predikßtor urΦuje, kter² odhad ze dvou p°edchozφch predikßtor∙ se nakonec pou₧ije. Tato trojice predikßtor∙ si spoleΦn∞ udr₧uje historii v∞tvenφ ve Φty°ech tabulkßch, kterΘ na Φipu zabφrajφ asi 3,6 KB pam∞ti. DalÜφch 6 KB pam∞ti na Φipu spot°ebuje mal² archiv odhad∙ predikce z instrukΦnφ cache pam∞ti. Dφky tomu se celkovß ·sp∞Ünost odhad∙ pohybuje kolem 95 procent.

Podpora multimΘdiφ

V roce 1997 byl uveden na trh velmi zajφmav² procesor Alpha 21164 PC. Jeho nominßlnφ v²kon (a₧ 2133 MIPS a 1066 MFLOPS) na ÜpiΦkov²ch frekvencφch 400 a 533 MHz sice nestaΦil na b∞₧nΘ Φleny rodiny Alpha 21164, ale jeho hlavnφ zbranφ byla cena. Cφlem v²vojovΘho t²mu, v jeho p°φpad∞, bylo vytvo°it nov² ÜpiΦkov² procesor pro stolnφ PC poΦφtaΦe se systΘmem Windows NT, kter² by zßrove≥ dokßzal konkurovat technologii MMX firmy Intel. Integrßlnφ souΦßstφ novΘho procesoru, kter² byl Üiroce podporovßn Φipovou sadou Alpha 21174, se stala multimedißlnφ technologie MVI (Motion Video Instruction). Dφky tΘto technologii, kterou reprezentuje 5 nov²ch instrukcφ (PEER, MAX, MIN, PACK a UNPACK) pro celoΦφselnΘ operace, doÜlo k dramatickΘmu nßr∙stu v²konu v celΘ multimedißlnφ oblasti.
VylepÜenß verze technologie MVI se nßsledn∞ stala velmi d∙le₧it²m rysem procesoru Alpha EV6. Aktußlnφ Alpha dokß₧e softwarov∞ sama (bez hardwarov²ch dopl≥k∙) v reßlnΘm Φase dek≤dovat DVD video s pou₧φtφm preciznφch standard∙ Dolby AC-3 (audio) a MPEG-2 (video). 21264 sice nedokß₧e zpracovßvat MMX instrukce, ale mß dv∞ jednotky pro v²poΦet v plovoucφ desetinnΘ Φßrce pou₧φvajφcφ proudovΘ zpracovßnφ (pipeline) a zajiÜ¥ujφcφ propustnost minimßln∞ 1,2 GigaFLOPS. V p°φpad∞ pot°eby navφc mohou a₧ Φty°i celoΦφselnΘ jednotky pomßhat p°i v²poΦtech v plovoucφ desetinnΘ Φßrce tak, ₧e zpracovßvajφ a₧ dv∞ LOAD / STORE operace b∞hem jedinΘho taktu jßdra.

Procesor AMD-K7 vstupuje na scΘnu

Velmi zajφmavou skuteΦnostφ je fakt, ₧e I/O sb∞rnice procesoru 21264 je dokonce rychlejÜφ ne₧ sb∞rnice cache pam∞ti L2. V souΦasnΘ dob∞ tato sb∞rnice, kterß °φzena Φipovou sadou Tsunami, pracuje s frekvencφ 200 MHz. PoΦφtß se vÜak s tφm, ₧e v budoucnosti dosßhne sb∞rnice frekvence vφce ne₧ 400 MHz !
Pro b∞₧nΘho u₧ivatele PC je vÜak velmi d∙le₧itΘ, ₧e na stejnou sb∞rnici mß licenci takΘ firma AMD, kterß ho pou₧ila u prßv∞ dokonΦenΘho procesoru AMD K7. Procesor AMD K7, kter² je dostupn² ve verzφch s frekvencφ 500, 550 a 600 MHz, je tedy urΦen pro zcela novΘ zßkladnφ desky s architekturou Alpha EV6. Procesor se instaluje do slotu, kter² pouze fyzicky podobn² Slotu 1 (procesory Pentium II a III), tak₧e zßm∞na procesor∙ mo₧nß nenφ. Zßkladnφ desky pro AMD K7 (Alphu EV6) budou z°ejm∞ vyrßb∞t firmy AsusTech, Biostar, FIC, Gigabyte a Microstar.
Po upgradu BIOSu na t∞chto zßkladnφch deskßch bude mo₧nΘ si vybrat mezi procesorem AMD K7 a Alpha EV6. Pro AMD to znamenß, ₧e u₧ mß k dispozici rychlejÜφ sb∞rnici ne₧ Pentium III. Pro Compaq (vlastnφka spoleΦnosti DEC) to znamenß, ₧e procesory Alpha EV6 (21264) u₧ mohou tvrd∞ za·toΦit na Pentium III. P°itom Alpha EV6 dokß₧e sv²m v²konem ve Windows NT hladce deklasovat i Pentium III Xeon. Navφc firma Intel musφ p°φÜtφ rok Φelit novΘ generaci procesor∙ - Alpha 21364. V²konnostnφ souboj vÜech procesor∙ na trhu se tedy dnes dostßvß do nov²ch obrßtek a p°φÜtφ rok bude nepochybn∞ velmi zajφmav².




Skok na dalÜφ strßnku Skok na hlavnφ menu Skok na dalÜφ strßnku


Copyright (c) 1993-2000 Michal Poho°elsk²