Autor: Michal Pohorelsky
Uverejneno: CHIP 09/99, str. 54-55
Tvrdy utok na Pentium III


Dlouhodoby uspech fenomenalniho procesoru Digital Alpha zacal celkem nenapadne v roce 1990. V roce 1992 firma Digital Equipment Corporation (DEC) oficialne ohlasila novy typ RISC procesoru, ktery prezentovala jako prvniho zastupce plne 64bitovych procesoru architektury Alpha. Ve stejnem roce byl take predstaven prvni pocitac s procesorem Alpha 21064, ktery se ponekud zahadne nazyval Jensen.
Ze znacne pozornosti odborneho tisku a verejnosti zacala architektura Alpha vyrazne profitovat v roce 1994, protoze firma DEC uvedla na trh stolni pocitac DECpc AXP 150. Tento pocitac pouzival procesor Alpha 21064 AA (8+8 KB interni cache) s frekvenci 150 MHz. Mensi slabinou pocitace byla pouzita sbernice typu EISA, ktera nabizela propustnost 33 MB/s. Velmi rychle se vsak objevily dva mirne odlisne procesory: Alpha 21066 a Alpha 21068 s integrovanou sbernici PCI. Soucasne DEC ohlasil novou generaci procesoru - cip Alpha 21164. Spickovym reprezentantem noveho cipu se stala pracovni stanice Alphastation 500/500, ktera byla na trh uvedena v zari 1996. Srdcem stanice byl ctyrcestny procesor Alpha 21164 (8 KB instrukcni a 8 KB datove interni cache) s frekvenci 500 MHz spolu s 8 MB cache L2 pameti. Vsechny komponenty stanice vydatne podporovala 64bitova PCI sbernice s propustnosti 267 MB/s.
V soucasne dobe se vsak na trhu jiz prodavaji AlphaServery s vyrazne vykonnejsimi procesory nove generace - Alpha 21264. Aktualni spickovy procesor s novy jmenem EV6 se vsak od predchozi generace vyrazne odlisuje. Proto podrobnejsi seznameni s jeho schopnostmi bude urcite velmi zajimave.

Zakladni prvky architektury

Procesor Alpha EV6 (21264) je vyroben na matrici sestivrstvou CMOS technologii 0.35 mikronu. V roce 2000 by mely nove procesory postupne dospet k technologii 0.25 a 0.18 mikronu, coz umozni vyrazne zvysit vykon a snizit vyrobni naklady. Procesor obsahuje celkem 15.9 milionu tranzistoru (Alpha 21164 mela 9.3 milionu tranzistoru). Jeho superskalarni jadro dokaze zpracovavat az sest instrukci behem jedineho taktu (ctyri instrukce jsou nacteny do ctyr jednotek pro vypocet v pevne carce a dalsi dve instrukce jsou provadeny dvemi jednotkami pro vypocet v plovouci desetinne carce).
Vyvojovy tym DEC kompletne zmenil hierarchii vyrovnavacich cache pameti. Novy cip ma na prvni urovni (L1) 64 KB instrukcni a 64 KB datove cache pameti. Cache druhe urovne (L2) o velikosti 1 az 16 MB neni sice primo na cipu, ale je s nim propojena pres extremne rychlou 128bitovou sbernici. Velka interni cache nyni vyrazne zvysuje procento uspesne zpracovanych dat s minimalni rezii. Dalsi data pritom uz cekaji v obrovske sekundarni cache pameti, aby mohla byt okamzite presunuta do procesoru. Cache treti urovne (L3), kterou pouziva znamy procesor AMD K6-III, neni zatim nutna. V prvni verzi Alphy EV6 je L2 cache tvorena 200 MHz SRAM (Static RAM) cipy, jenz dosahuji propustnosti az 3.2 GB/s. V dalsich verzich procesoru vsak najde zrejme vyuziti spickova technologie Dual Data Rate SRAM. Nove DDR-SRAM cipy s velmi vysokou frekvenci nabidnou procesoru impozantni propustnost 8 GB/s. Dnes se nejcasteji prodavaji procesory s frekvenci 500, 525 a 575 MHz. Behem kratke doby vsak budou k dispozici vykonnejsi cipy s frekvencemi 666 MHz a 775 MHz. Pritom v roce 1998 uz DEC s timto procesorem experimentalne dosahl magicke frekvence 1 GHz (1000 MHz) ! Enormni narust vypocetniho vykonu na magicke frekvenci vsak bude silne ovlivnen prave pouzitim DDR-SRAM cipu, ktere nebudou brzdit procesorove jadro.
Jednou z nejzajimavejsich vlastnosti nove Alphy je dynamicke vykonavani instrukci mimo poradi (out of order), ktere je pro celou architekturu Alpha uplnou novinkou. Procesor vykonavajici instrukce mimo poradi preskupuje dynamicky instrukce programu tak, aby co nejlepe vyuzil vlastni zdroje. Cela operace se pritom sklada ze tri navzajem propojenych fazi - predpoved skoku, analyza toku dat a spekulativni provadeni. Tato hardwarove technologie byla obvykle soucasti mene vykonnych CISC procesoru (napr. Intel Pentium Pro), protoze jejich architektura byla vice orientovana na sofistikovane odevzdavani instrukci. Komplexni logika potrebna pro takove rizeni procesoru je totiz v rozporu s pozadavkem na velmi vysokou frekvenci. Az do nastupu Pentia II / AMD K6 platilo, ze vysoka taktovaci frekvence nepatri mezi absolutni priority CISC procesoru. Dnes ovsem panuje jina situace. Pritom Alpha 21264 meni pravidla - pracuje s nezvyklou inteligenci (vuci predchozi generaci) a zustava pekelne rychla.
Kritickym meritkem uspesnosti pri zpracovani instrukci mimo poradi je pocet instrukci, ktere procesor muze primo pouzivat. Duvodem je fakt, ze pocet nactenych instrukci (sirka zaberu) primo ovlivnuje efektivitu rozhodovani, ponevadz CPU vidi najednou vetsi cast beziciho programu. To ovsem vyzaduje mnoho hardwarovych zdroju (logiku pro zmenu instrukcniho poradi, pomocne registry pro uchovani hodnot zastavenych instrukci apod.). Zatimco aktualni procesory firmy Intel (Pentium II, Pentium II Xeon) mohou manipulovat se 40 instrukcemi najednou, Alpha EV6 ma pred celou konkurenci drtivy naskok - dokaze v jednom okamziku zpracovavat az 80 instrukci. Za timto naskokem stoji v pozadi sofistikovane schema procesorovych registru. Alpha obsahuje, stejne jako rada jinych RISC cipu, soubor 32 celociselnych (integer) a 32 plovoucich (floating-point) registru, ktere jsou 64bitove. Kvuli zvyseni kapacity na manipulovani s instrukcemi ma procesor navic 48 celociselnych a 40 plovoucich pomocnych registru, ktere slouzi k uschove hodnot vsech cekajicich instrukci. Po kompletnim zpracovani jedne instrukce se vybrany pomocny registr stane docasne soucasti sady (32 celociselnych + 32 plovoucich) regulernich registru. V tomto okamziku se hodnota registru stava oficialne platnou soucasti stavu a je viditelna pro aktualne provadeny program.

Rychlost svetla

Pri projektovani procesoru Alpha EV6 musel vyvojovy tym vyresit pozoruhodny problem. Ukazalo se totiz, ze vesmirna rychlost svetla zacina zretelne omezovat rychlost procesoru Alpha ! Soucasne procesory s relativne beznou frekvenci 500 MHz provedou jeden taktovaci cyklus za dve nanosekundy. Behem tohoto extremne kratkeho okamziku svetelny paprsek uleti vzdalenost 60 cm. Pri taktovaci frekvenci 1000 MHz, ktera se brzy stane pro Alphu realitou, trva cyklus procesoru pouze jednu nanosekundu, coz nestaci ani fotonum - uleti jen kritickych 30 cm. Proto ma Alpha 21264 duplicitni soubor 80 celociselnych registru (32 normalnich + 48 pomocnych), coz predstavuje celkem 160 celociselnych registru ! Pritom jsou ctyri celociselne jednotky logicky rozdeleny do dvou skupin (po dvou jednotkach). Kazda skupina ma vlastni soubor 80 celociselnych registru a pri zmene hodnoty nektereho registru je tato zmena okamzite nakopirovana do druheho souboru registru. Uvedena operace sice vyzaduje jeden takt procesoru, ale zpracovani instrukci mimo poradi dokaze toto zdrzeni kompenzovat.

Inteligentni vetveni

Pri navrhu procesoru ovsem bylo nutne pamatovat na vsechny potencionalne slaba mista pri zpracovavani dat. Proto ma Alpha 21264 take tri odhadovaci mechanizmy vetveni. Prvni se nazyva lokalni predikator a zameruje se hlavne na lokalni vetveni. Druhy se nazyva globalni predikator a jeho ukolem je udrzovat celkovy prehled o naposledy pouzitych vetvenich. Treti rozhodovaci predikator urcuje, ktery odhad ze dvou predchozich predikatoru se nakonec pouzije. Tato trojice predikatoru si spolecne udrzuje historii vetveni ve ctyrech tabulkach, ktere na cipu zabiraji asi 3,6 KB pameti. Dalsich 6 KB pameti na cipu spotrebuje maly archiv odhadu predikce z instrukcni cache pameti. Diky tomu se celkova uspesnost odhadu pohybuje kolem 95 procent.

Podpora multimedii

V roce 1997 byl uveden na trh velmi zajimavy procesor Alpha 21164 PC. Jeho nominalni vykon (az 2133 MIPS a 1066 MFLOPS) na spickovych frekvencich 400 a 533 MHz sice nestacil na bezne cleny rodiny Alpha 21164, ale jeho hlavni zbrani byla cena. Cilem vyvojoveho tymu, v jeho pripade, bylo vytvorit novy spickovy procesor pro stolni PC pocitace se systemem Windows NT, ktery by zaroven dokazal konkurovat technologii MMX firmy Intel. Integralni soucasti noveho procesoru, ktery byl siroce podporovan cipovou sadou Alpha 21174, se stala multimedialni technologie MVI (Motion Video Instruction). Diky teto technologii, kterou reprezentuje 5 novych instrukci (PEER, MAX, MIN, PACK a UNPACK) pro celociselne operace, doslo k dramatickemu narustu vykonu v cele multimedialni oblasti.
Vylepsena verze technologie MVI se nasledne stala velmi dulezitym rysem procesoru Alpha EV6. Aktualni Alpha dokaze softwarove sama (bez hardwarovych doplnku) v realnem case dekodovat DVD video s pouzitim preciznich standardu Dolby AC-3 (audio) a MPEG-2 (video). 21264 sice nedokaze zpracovavat MMX instrukce, ale ma dve jednotky pro vypocet v plovouci desetinne carce pouzivajici proudove zpracovani (pipeline) a zajistujici propustnost minimalne 1,2 GigaFLOPS. V pripade potreby navic mohou az ctyri celociselne jednotky pomahat pri vypoctech v plovouci desetinne carce tak, ze zpracovavaji az dve LOAD / STORE operace behem jedineho taktu jadra.

Procesor AMD-K7 vstupuje na scenu

Velmi zajimavou skutecnosti je fakt, ze I/O sbernice procesoru 21264 je dokonce rychlejsi nez sbernice cache pameti L2. V soucasne dobe tato sbernice, ktera rizena cipovou sadou Tsunami, pracuje s frekvenci 200 MHz. Pocita se vsak s tim, ze v budoucnosti dosahne sbernice frekvence vice nez 400 MHz !
Pro bezneho uzivatele PC je vsak velmi dulezite, ze na stejnou sbernici ma licenci take firma AMD, ktera ho pouzila u prave dokonceneho procesoru AMD K7. Procesor AMD K7, ktery je dostupny ve verzich s frekvenci 500, 550 a 600 MHz, je tedy urcen pro zcela nove zakladni desky s architekturou Alpha EV6. Procesor se instaluje do slotu, ktery pouze fyzicky podobny Slotu 1 (procesory Pentium II a III), takze zamena procesoru mozna neni. Zakladni desky pro AMD K7 (Alphu EV6) budou zrejme vyrabet firmy AsusTech, Biostar, FIC, Gigabyte a Microstar.
Po upgradu BIOSu na techto zakladnich deskach bude mozne si vybrat mezi procesorem AMD K7 a Alpha EV6. Pro AMD to znamena, ze uz ma k dispozici rychlejsi sbernici nez Pentium III. Pro Compaq (vlastnika spolecnosti DEC) to znamena, ze procesory Alpha EV6 (21264) uz mohou tvrde zautocit na Pentium III. Pritom Alpha EV6 dokaze svym vykonem ve Windows NT hladce deklasovat i Pentium III Xeon. Navic firma Intel musi pristi rok celit nove generaci procesoru - Alpha 21364. Vykonnostni souboj vsech procesoru na trhu se tedy dnes dostava do novych obratek a pristi rok bude nepochybne velmi zajimavy.




Skok na dalsi stranku Skok na hlavni menu Skok na dalsi stranku


Copyright (c) 1993-2000 Michal Pohorelsky