home *** CD-ROM | disk | FTP | other *** search
- Daten zwischen den L1-Daten-Caches der zwei
- --- RECORDSEPARATOR ---
- Kerne direkt austauschen. Detaillierte Informa-
- --- RECORDSEPARATOR ---
- tionen zu dieser Technik stehen vom Hersteller
- --- RECORDSEPARATOR ---
- allerdings noch aus.
- --- RECORDSEPARATOR ---
- Neben den zwei Daten- und einem Befehls-
- --- RECORDSEPARATOR ---
- Prefetcher pro Prozessorkern besitzt die Core-
- --- RECORDSEPARATOR ---
- Architektur zwei Prefetcher im L2-Cache. Diese
- --- RECORDSEPARATOR ---
- suchen beispielsweise nach mehrfach vorhan-
- --- RECORDSEPARATOR ---
- denen Datenmustern pro Core. Außerdem gibt
- --- RECORDSEPARATOR ---
- der Smart Cache so genannte Œmismatched
- --- RECORDSEPARATOR ---
- loads - vorab mit falschen Daten geladene Ca-
- --- RECORDSEPARATOR ---
- che-Lines - automatische wieder frei. Damit
- --- RECORDSEPARATOR ---
- steht beiden Kernen immer m├╢glichst viel Spei-
- --- RECORDSEPARATOR ---
- cherplatz im L2-Cache zur Verf├╝gung.
- --- RECORDSEPARATOR ---
-
- --- RECORDSEPARATOR ---
- Smart Memory Access
- --- RECORDSEPARATOR ---
-
- --- RECORDSEPARATOR ---
- Mit Smart Memory Access f├╝hrt Intel einen Ad-
- --- RECORDSEPARATOR ---
- vanced-Prefetch-Mechanismus f├╝r den Spei-
- --- RECORDSEPARATOR ---
- cherzugriff ein. Die Core-Mikroarchitektur ver-
- --- RECORDSEPARATOR ---
- bessert damit das Load-/Store-Handling beim
- --- RECORDSEPARATOR ---
- Zugriff auf den Arbeitsspeicher. Intel will damit
- --- RECORDSEPARATOR ---
- Latenzzeiten Œverstecken, indem die CPU Da-
- --- RECORDSEPARATOR ---
- ten bereits spekulativ im Cache hält. Damit soll
- --- RECORDSEPARATOR ---
- der Nachteil des externen Speicher-Controllers
- --- RECORDSEPARATOR ---
- zumindest teilweise ├╝berwunden werden.
- --- RECORDSEPARATOR ---
- Der Smart Memory Access setzt sich dabei aus
- --- RECORDSEPARATOR ---
- den Improved Prefetchers sowie der Memory
- --- RECORDSEPARATOR ---
- Disambiguation zusammen. Bei einer Out-of-
- --- RECORDSEPARATOR ---
- Order-Architektur f├╝hrt der Prozessor die In-
- --- RECORDSEPARATOR ---
- struktionen in einer optimierten, und nicht in
- --- RECORDSEPARATOR ---
- der eingehenden Reihenfolge durch. Beim
- --- RECORDSEPARATOR ---
- Speicherzugriff kann dies aber zu Problemen
- --- RECORDSEPARATOR ---
- f├╝hren. Beispielsweise speichert ein Store1-
- --- RECORDSEPARATOR ---
- Befehl Daten bei der Speicheradresse F000h.
- --- RECORDSEPARATOR ---
- Fünf Befehle später liest die CPU einen Load5-
- --- RECORDSEPARATOR ---
- Befehl f├╝r diese Adresse ein.
- --- RECORDSEPARATOR ---
- Dazwischen gibt es aber einen zweiten
- --- RECORDSEPARATOR ---
- Speicherbefehle Store2 mit noch unbekannter
- --- RECORDSEPARATOR ---
- und erst zur Laufzeit generierter Speicher-
- --- RECORDSEPARATOR ---
- adresse. W├╝rde jetzt durch das Out-of-Order-
- --- RECORDSEPARATOR ---
- Verfahren der Load5-Befehl durch die Optimie-
- --- RECORDSEPARATOR ---
- rung vor dem Store2 ausgef├╝hrt werden, so
- --- RECORDSEPARATOR ---
- liest der Prozessor eventuell die falschen Daten
- --- RECORDSEPARATOR ---
- ein. Demnach darf ein Load-Befehl nicht vor
- --- RECORDSEPARATOR ---
- dem Store erfolgen, wenn die Adresse des
- --- RECORDSEPARATOR ---
- Load-Befehls noch nicht bekannt ist. Ein Ver-
- --- RECORDSEPARATOR ---
- schieben von Load5 vor Store1 ist sowieso
- --- RECORDSEPARATOR ---
- nicht erlaubt, weil diese direkt zusammen hän-
- --- RECORDSEPARATOR ---
- gen.
- --- RECORDSEPARATOR ---
- Mit der Memory-Disambiguation-Technologie
- --- RECORDSEPARATOR ---
- analysiert die CPU anhand spezieller Algorith-
- --- RECORDSEPARATOR ---
- men, ob Loads von vorhergehenden Stores
- --- RECORDSEPARATOR ---
- unabhängig sind. Der Smart Memory Access
- --- RECORDSEPARATOR ---
- der Core-Architektur entkoppelt damit Load-
- --- RECORDSEPARATOR ---
- von Store-Vorgängen. Bei typischem x86-Code
- --- RECORDSEPARATOR ---
- hängen dicht aufeinander folgende Store- und
- --- RECORDSEPARATOR ---
- Load-Vorgänge überwiegend nicht zusammen.
- --- RECORDSEPARATOR ---
- Die Memory Disambiguation sollte bei der Out-
- --- RECORDSEPARATOR ---
- of-Order-Architektur der Core-Prozessoren
- --- RECORDSEPARATOR ---
- somit eine deutlich gesteigerte Effizienz er-
- --- RECORDSEPARATOR ---
- m├╢glichen.
- --- RECORDSEPARATOR ---
- Ausgeführte ŒDisambiguated Loads überprüft
- --- RECORDSEPARATOR ---
- die Core-Architektur nach deren Ausf├╝hrung
- --- RECORDSEPARATOR ---
- auf die Datenkohärenz. War die Vorhersage
- --- RECORDSEPARATOR ---
- falsch und ein Store-/Load-Vorgang hing von-
- --- RECORDSEPARATOR ---
- einander ab, so wird die Pipeline Œgeflutet
- --- RECORDSEPARATOR ---
- und der komplette Vorgang wiederholt.
- --- RECORDSEPARATOR ---
- Das Verfahren der Memory Disambiguation
- --- RECORDSEPARATOR ---
- verwendet Intel bereits bei der IA64-Architek-
- --- RECORDSEPARATOR ---
- tur der Itanium-2-Prozessoren. Allerdings wird
- --- RECORDSEPARATOR ---
- das Verfahren hier mit Unterst├╝tzung des Com-
- --- RECORDSEPARATOR ---
- pilers erledigt, während die Core-Architektur
- --- RECORDSEPARATOR ---
- die Memory Disambiguation im Silizium durch-
- --- RECORDSEPARATOR ---
- f├╝hrt.
- --- RECORDSEPARATOR ---
-
- --- RECORDSEPARATOR ---
- Intelligent Power Capability
- --- RECORDSEPARATOR ---
-
- --- RECORDSEPARATOR ---
- Unter der Bezeichnung ŒIntelligent Power Ca-
- --- RECORDSEPARATOR ---
- pability fasst Intel die Powermanagement-
- --- RECORDSEPARATOR ---
- Features der Core-Mikroarchitektur zusam-
- --- RECORDSEPARATOR ---
- men. Einige Energiesparfunktionen verwendet
- --- RECORDSEPARATOR ---
- Intel bereits beim Centrino-Prozessor Core
- --- RECORDSEPARATOR ---
- Duo.
- --- RECORDSEPARATOR ---
- So schaltet die Core-Architektur wie der Core
- --- RECORDSEPARATOR ---
- Duo inaktive Logik-Subsysteme komplett ab,
- --- RECORDSEPARATOR ---
- wenn diese zur Befehlsabarbeitung kurzfristig
- --- RECORDSEPARATOR ---
- nicht benötigt werden. Damit lässt sich Strom
- --- RECORDSEPARATOR ---
- sparen. Das Ein- und Ausschalten der einzel-
- --- RECORDSEPARATOR ---
- nen Bl├╢cke erledigt der Prozessor innerhalb
- --- RECORDSEPARATOR ---
- eines Taktzyklus.
- --- RECORDSEPARATOR ---
- Um nicht zu ├╝berhitzen, integriert Intel bei den
- --- RECORDSEPARATOR ---
- Core-Prozessoren mehrere digitale Tempera-
- --- RECORDSEPARATOR ---
- tursensoren (DTS) an den Hotspots. Eine dedi-
- --- RECORDSEPARATOR ---
- zierte Logik scannt die Sensoren und misst die
- --- RECORDSEPARATOR ---
- maximale Temperatur auf dem Siliziumplätt-
- --- RECORDSEPARATOR ---
- chen. Bei zu hoher Temperatur beginnt die
- --- RECORDSEPARATOR ---
- CPU automatisch zu Œthrotteln und reduziert
- --- RECORDSEPARATOR ---
- die Taktfrequenz. Ist der Prozessor thermisch
- --- RECORDSEPARATOR ---
- im grünen Bereich und nur mäßig ausgelastet,
- --- RECORDSEPARATOR ---
- senkt die bekannte SpeedStep-Technologie bei
- --- RECORDSEPARATOR ---
- den Core-Modellen die Taktfrequenz und Span-
- --- RECORDSEPARATOR ---
- nung dynamisch.
- --- RECORDSEPARATOR ---
- Bei der Core-Architektur lässt Intel auch die
- --- RECORDSEPARATOR ---
- internen Datenbusse nicht außen vor und opti-
- --- RECORDSEPARATOR ---
- miert sie auf niedrigen Stromverbrauch. Des-
- --- RECORDSEPARATOR ---
- halb werden nur die Stellen des Busses mit
- --- RECORDSEPARATOR ---
- Strom versorgt, die diesen auch aktuell ben├╢ti-
- --- RECORDSEPARATOR ---
- gen. Die volle Datenbreite der Datenbusse wird
- --- RECORDSEPARATOR ---
- nicht bei allen Transaktionen ausgenutzt. Mit
- --- RECORDSEPARATOR ---
- den ŒSplit Busses teilt sie Intel für den Trans-
- --- RECORDSEPARATOR ---
- fer von verschiedenen Datenbreiten auf. Bei-
- --- RECORDSEPARATOR ---
- spielsweise werden bei 64-Bit-Daten die Lei-
- --- RECORDSEPARATOR ---
- tungen der h├╢herwertigen 64 Bit nicht ben├╢ti-
- --- RECORDSEPARATOR ---
- gt.
- --- RECORDSEPARATOR ---
- Auch die Buffer-Schaltungen des FSB besitzen
- --- RECORDSEPARATOR ---
- eine hohe Leistungsaufnahme. Diese Schalt-
- --- RECORDSEPARATOR ---
- kreise konvertieren die Busspannungen in die
- --- RECORDSEPARATOR ---
- vom Chip ben├╢tigten Spannungswerte. Die
- --- RECORDSEPARATOR ---
- Core-Architektur versorgt wie bereits der Pen-
- --- RECORDSEPARATOR ---
- tium M die Buffer dynamisch nur bei Bedarf
- --- RECORDSEPARATOR ---
- und nicht ständig.
- --- RECORDSEPARATOR ---
-
- --- RECORDSEPARATOR ---
- Conroe-Benchmarks
- --- RECORDSEPARATOR ---
-
- --- RECORDSEPARATOR ---
- Bereits im März 2006 konnte tecCHANNEL auf
- --- RECORDSEPARATOR ---
- dem Intel Developer Forum den Desktop-Core-
- --- RECORDSEPARATOR ---
- Prozessor ŒConroe testen. Das Sample arbei-
- --- RECORDSEPARATOR ---
- tet mit 2,67 GHz Taktfrequenz und nimmt in
- --- RECORDSEPARATOR ---
- einem Intel-Mainboard mit 975X-Express-
- --- RECORDSEPARATOR ---
- Chipsatz Platz. Der Prozessorbus ist mit 1066
- --- RECORDSEPARATOR ---
- MHz getaktet. Als Speicher steht dem Conroe
- --- RECORDSEPARATOR ---
- 1 GByte DDR2-667-SDRAM in einer Dual-
- --- RECORDSEPARATOR ---
- Channel-Konfiguration mit einem 5-5-5-Timing
- --- RECORDSEPARATOR ---
- zur Verf├╝gung.
- --- RECORDSEPARATOR ---
- Als Vergleich f├╝r den Conroe 2,67 GHz dient
- --- RECORDSEPARATOR ---
- AMDs Dual-Core-CPU Athlon 64 FX-60. Statt
- --- RECORDSEPARATOR ---
- mit den serienmäßigen 2,6 GHz arbeitet der
- --- RECORDSEPARATOR ---
- Socket-939-Prozessors mit ├╝bertakteten 2,8