home *** CD-ROM | disk | FTP | other *** search
/ PC Welt 2006 October (DVD) / PCWELT_10_2006.ISO / fscommand / papers / 182.swf / texts / 333.txt < prev    next >
Encoding:
Text File  |  2006-08-11  |  8.7 KB  |  273 lines

  1. Micro-Ops in den Ausf├╝hrungseinheiten be- 
  2. --- RECORDSEPARATOR ---
  3. rechnen. Bei der Core-Architektur erweitert 
  4. --- RECORDSEPARATOR ---
  5. Intel zudem die Anzahl von fusionierbaren 
  6. --- RECORDSEPARATOR ---
  7. Micro-Ops. 
  8. --- RECORDSEPARATOR ---
  9. Um die Zahl der MicroOps weiter zu verrin- 
  10. --- RECORDSEPARATOR ---
  11. gern, gibt es seit der Pentium-M-Architektur 
  12. --- RECORDSEPARATOR ---
  13. ┬îBanias┬ì einen dedizierten Ablaufmanager. 
  14. --- RECORDSEPARATOR ---
  15. Programm-Overhead wie die Stack-Befehle 
  16. --- RECORDSEPARATOR ---
  17. push, pop, call und ret f├╝hrt der Prozessor in 
  18. --- RECORDSEPARATOR ---
  19. einer dedizierten Hardware durch. Die CPU 
  20. --- RECORDSEPARATOR ---
  21. kann das eigentliche Programm in den Ausf├╝h- 
  22. --- RECORDSEPARATOR ---
  23. rungseinheiten damit ohne Unterbrechung 
  24. --- RECORDSEPARATOR ---
  25. abarbeiten. Die Zahl der Micro-Ops verringert 
  26. --- RECORDSEPARATOR ---
  27. sich durch den Stack Manager laut Intel um 
  28. --- RECORDSEPARATOR ---
  29. f├╝nf Prozent.
  30. --- RECORDSEPARATOR ---
  31.  
  32. --- RECORDSEPARATOR ---
  33. Macro-Fusion
  34. --- RECORDSEPARATOR ---
  35.  
  36. --- RECORDSEPARATOR ---
  37. Neben der vom Pentium M bekannten Micro- 
  38. --- RECORDSEPARATOR ---
  39. Ops-Fusion f├╝hrt Intel bei der Core-Architektur 
  40. --- RECORDSEPARATOR ---
  41. die neue Macro-Fusion ein. Bei der Macro-Fusi- 
  42. --- RECORDSEPARATOR ---
  43. on geht Intel im Vergleich zur Micro-Ops-Fusion 
  44. --- RECORDSEPARATOR ---
  45. einen anderen Weg. In der Pre-Dekodierphase 
  46. --- RECORDSEPARATOR ---
  47. analysiert das Frontend der Core-Architektur, 
  48. --- RECORDSEPARATOR ---
  49. ob sich zwei in der Regel aufeinander folgende 
  50. --- RECORDSEPARATOR ---
  51. Macro-Ops zusammenfassen lassen. So folgt 
  52. --- RECORDSEPARATOR ---
  53. auf den Assembler-Befehl ┬îcmp┬ì (Compare) 
  54. --- RECORDSEPARATOR ---
  55. oder ┬îtest┬ì typischerweise ein Sprungbefehl 
  56. --- RECORDSEPARATOR ---
  57. ┬îjcc┬ì, wie Intel angibt. 
  58. --- RECORDSEPARATOR ---
  59. Die komplexe Dekodiereinheit der vier Deko- 
  60. --- RECORDSEPARATOR ---
  61. der f├╝gt diese beiden Macro-Ops zu einer ein- 
  62. --- RECORDSEPARATOR ---
  63. zigen Micro-Op zusammen. Diese Micro-Op 
  64. --- RECORDSEPARATOR ---
  65. f├╝hren die Execution-Units der Core-Architek- 
  66. --- RECORDSEPARATOR ---
  67. tur dann in einem Taktzyklus durch. 
  68. --- RECORDSEPARATOR ---
  69. Durch die Macro-Fusion kann das Frontend 
  70. --- RECORDSEPARATOR ---
  71. der Core-Architektur aus dem Befehlspuffer 
  72. --- RECORDSEPARATOR ---
  73. (L1-Befehls-Cache) bis zu f├╝nf Instruktionen 
  74. --- RECORDSEPARATOR ---
  75. pro Taktzyklus holen. Drei Macro-Ops dekodie- 
  76. --- RECORDSEPARATOR ---
  77. ren die drei einfachen Dekoder-Units. Sind von 
  78. --- RECORDSEPARATOR ---
  79. den f├╝nf Macro-Ops zwei fusionierbar, werden 
  80. --- RECORDSEPARATOR ---
  81. sie ├╝ber die komplexe Dekodiereinheit per Ma- 
  82. --- RECORDSEPARATOR ---
  83. cro-Fusion in eine Micro-Op umgewandelt. 
  84. --- RECORDSEPARATOR ---
  85. Ohne Macro-Fusion w├ñren f├╝r das Dekodieren 
  86. --- RECORDSEPARATOR ---
  87. von f├╝nf Assembler-Befehlen zwei Taktzyklen 
  88. --- RECORDSEPARATOR ---
  89. notwendig. Pro Taktzyklus ist bei der Core-Ar- 
  90. --- RECORDSEPARATOR ---
  91. chitektur allerdings nur eine Macro-Fusion 
  92. --- RECORDSEPARATOR ---
  93. m├╢glich. F├╝r das Ausf├╝hren der aus Macro-Fu- 
  94. --- RECORDSEPARATOR ---
  95. sion entstandenen neuen Micro-Ops verf├╝gt 
  96. --- RECORDSEPARATOR ---
  97. die Core-Architektur ├╝ber eine speziell ange- 
  98. --- RECORDSEPARATOR ---
  99. passte ALU. 
  100. --- RECORDSEPARATOR ---
  101. Durch die Macro-Fusion reduziert sich wie 
  102. --- RECORDSEPARATOR ---
  103. schon bei der Micro-Ops-Fusion die Zahl der 
  104. --- RECORDSEPARATOR ---
  105. auszuf├╝hrenden Micro-Ops. Dadurch wird zum 
  106. --- RECORDSEPARATOR ---
  107. einem die Performance weiter gesteigert. Au- 
  108. --- RECORDSEPARATOR ---
  109. ├ƒerdem erh├╢ht sich die Effizient des Out-of-Or- 
  110. --- RECORDSEPARATOR ---
  111. der-Schedulers, weil durch die reduzierte 
  112. --- RECORDSEPARATOR ---
  113. Micro-Ops-Anzahl mehr Programm-Code auf 
  114. --- RECORDSEPARATOR ---
  115. einmal analysiert und parallelisiert werden 
  116. --- RECORDSEPARATOR ---
  117. kann.
  118. --- RECORDSEPARATOR ---
  119.  
  120. --- RECORDSEPARATOR ---
  121. Advanced Digital Media Boost
  122. --- RECORDSEPARATOR ---
  123.  
  124. --- RECORDSEPARATOR ---
  125. Mit ┬îAdvanced Digital Media Boost┬ì will Intel 
  126. --- RECORDSEPARATOR ---
  127. bei der Core-Architektur f├╝r eine signifikante 
  128. --- RECORDSEPARATOR ---
  129. Beschleunigung von SSE-Instruktionen sorgen. 
  130. --- RECORDSEPARATOR ---
  131. Bei NetBurst und dem Core-Duo-Design wird 
  132. --- RECORDSEPARATOR ---
  133. eine 128 Bit breite SSE-Instruktion beim Deko- 
  134. --- RECORDSEPARATOR ---
  135. dieren in zwei 64-Bit-Micro-Ops aufgeteilt. Der 
  136. --- RECORDSEPARATOR ---
  137. Datenpfad in die SSE-Execution-Unit besitzt 
  138. --- RECORDSEPARATOR ---
  139. ebenfalls eine Datenbreite von nur 64 Bit. So- 
  140. --- RECORDSEPARATOR ---
  141. mit werden f├╝r die Ausf├╝hrung eines 128-Bit- 
  142. --- RECORDSEPARATOR ---
  143. SSE-Befehls zwei Taktzyklen ben├╢tigt: Zuerst 
  144. --- RECORDSEPARATOR ---
  145. findet die Berechnung der minderwertigen 64 
  146. --- RECORDSEPARATOR ---
  147. Bit statt, es folgen im zweiten Taktzyklus die 
  148. --- RECORDSEPARATOR ---
  149. h├╢herwertigen 64 Bit. 
  150. --- RECORDSEPARATOR ---
  151. Die Core-Architektur besitzt dagegen einen 
  152. --- RECORDSEPARATOR ---
  153. durchgehenden 128-Bit-Ausf├╝hrungspfad. In- 
  154. --- RECORDSEPARATOR ---
  155. tel legt die internen Datenbusse hierf├╝r 128 Bit 
  156. --- RECORDSEPARATOR ---
  157. breit aus. Damit muss nur ein einziger Micro- 
  158. --- RECORDSEPARATOR ---
  159. Op erzeugt, geordnet und ausgef├╝hrt werden. 
  160. --- RECORDSEPARATOR ---
  161. Die Berechnung eines SSE-Befehls in der ent- 
  162. --- RECORDSEPARATOR ---
  163. sprechenden Ausf├╝hrungseinheit erfolgt in 
  164. --- RECORDSEPARATOR ---
  165. einem Taktzyklus. Damit verdoppelt sich die 
  166. --- RECORDSEPARATOR ---
  167. SSE-Performance. Beispielsweise kann Core 
  168. --- RECORDSEPARATOR ---
  169. auch einen 128-Bit Packet Multiply, 128-Bit 
  170. --- RECORDSEPARATOR ---
  171. Packed Add, 128-Bit Packet Load, 128-Bit Pa- 
  172. --- RECORDSEPARATOR ---
  173. cked Store und einen Macro-Fusion-Befehl 
  174. --- RECORDSEPARATOR ---
  175. ┬îcmp & jcc┬ì zusammen in einem Taktzyklus 
  176. --- RECORDSEPARATOR ---
  177. berechnen. 
  178. --- RECORDSEPARATOR ---
  179. Durch die SSE-Ausf├╝hrung in einem Taktzyklus 
  180. --- RECORDSEPARATOR ---
  181. entlastet die Core-Architektur zudem die Load- 
  182. --- RECORDSEPARATOR ---
  183. Pipeline. Bei Mikroarchitekturen, wo der inter- 
  184. --- RECORDSEPARATOR ---
  185. ne 128-Bit-Pfad bei den SSE-Ausf├╝hrungsein- 
  186. --- RECORDSEPARATOR ---
  187. heiten nur noch 64 Bit breit ist, kann es hier zu 
  188. --- RECORDSEPARATOR ---
  189. Engp├ñssen kommen. 
  190. --- RECORDSEPARATOR ---
  191. Die Core-Architektur beherrscht neben MMX, 
  192. --- RECORDSEPARATOR ---
  193. SSE, SSE2 und SSE3 zus├ñtzlich 16 neue Multi- 
  194. --- RECORDSEPARATOR ---
  195. media-Befehle. Die mancherorts als SSE4 be- 
  196. --- RECORDSEPARATOR ---
  197. zeichneten Instruktionen sind vor allem f├╝r 
  198. --- RECORDSEPARATOR ---
  199. Berechnungen mit doppelter Genauigkeit hilf- 
  200. --- RECORDSEPARATOR ---
  201. reich. Ob die Zusatzbefehle einen neuen Na- 
  202. --- RECORDSEPARATOR ---
  203. men erhalten, oder sie in der Bezeichnung 
  204. --- RECORDSEPARATOR ---
  205. ┬îAdvanced Digital Media Boost┬ì eingehen, 
  206. --- RECORDSEPARATOR ---
  207. l├ñsst Intel noch offen. Urspr├╝nglich waren die 
  208. --- RECORDSEPARATOR ---
  209. neuen Multimedia-Befehle f├╝r den eingestell- 
  210. --- RECORDSEPARATOR ---
  211. ten NetBurst-Nachfolger mit Code-Namen Te- 
  212. --- RECORDSEPARATOR ---
  213. jas vorgesehen.
  214. --- RECORDSEPARATOR ---
  215.  
  216. --- RECORDSEPARATOR ---
  217. Advanced Smart Cache
  218. --- RECORDSEPARATOR ---
  219.  
  220. --- RECORDSEPARATOR ---
  221. Der ┬îSmart Cache┬ì ist bereits aus dem Core 
  222. --- RECORDSEPARATOR ---
  223. Duo bekannt. Beide Prozessorkerne teilen sich 
  224. --- RECORDSEPARATOR ---
  225. dynamisch einen gemeinsamen L2-Cache. Bei 
  226. --- RECORDSEPARATOR ---
  227. der Core-Architektur verdoppelte Intel aller- 
  228. --- RECORDSEPARATOR ---
  229. dings die Bandbreite zum L1-Cache. 
  230. --- RECORDSEPARATOR ---
  231. Dieser ┬îAdvanced Smart Cache┬ì des Core be- 
  232. --- RECORDSEPARATOR ---
  233. steht aus einer 2 oder 4 MByte gro├ƒen zweiten 
  234. --- RECORDSEPARATOR ---
  235. Pufferstufe - je nach Prozessortyp. Der Vorteil 
  236. --- RECORDSEPARATOR ---
  237. von einem Shared Cache ist unter anderem ei- 
  238. --- RECORDSEPARATOR ---
  239. ne bessere Auslastung. Arbeitet beispielsweise 
  240. --- RECORDSEPARATOR ---
  241. nur ein Prozessorkern, so steht diesem der ge- 
  242. --- RECORDSEPARATOR ---
  243. samte Cache zur Verf├╝gung. Bei der Dual-Core- 
  244. --- RECORDSEPARATOR ---
  245. Technologie des Pentium D und des Xeons 
  246. --- RECORDSEPARATOR ---
  247. besitzt jeder Kern seinen eigenen L2-Cache. 
  248. --- RECORDSEPARATOR ---
  249. Die Cache-Auslastung ist bei diesen CPU inef- 
  250. --- RECORDSEPARATOR ---
  251. fektiver, wenn nicht beide Cores unter Last 
  252. --- RECORDSEPARATOR ---
  253. sind. 
  254. --- RECORDSEPARATOR ---
  255. Ein weiterer Vorteil des Advanced Smart Cache 
  256. --- RECORDSEPARATOR ---
  257. ist das Data-Sharing zwischen den CPU-Ker- 
  258. --- RECORDSEPARATOR ---
  259. nen. Ben├╢tigt der zweite Kern die Daten, die 
  260. --- RECORDSEPARATOR ---
  261. der erste schon aus dem Speicher geholt hat, 
  262. --- RECORDSEPARATOR ---
  263. so findet er diese bereits im L2-Cache vor. Da- 
  264. --- RECORDSEPARATOR ---
  265. durch wird die Prozessorbus-Auslastung mini- 
  266. --- RECORDSEPARATOR ---
  267. miert. Auch die zu bewerkstelligende Cache- 
  268. --- RECORDSEPARATOR ---
  269. Koh├ñrenz bei eigenen L2-Caches pro Prozes- 
  270. --- RECORDSEPARATOR ---
  271. sorkern ist mit dem Smart Cache obsolet. 
  272. --- RECORDSEPARATOR ---
  273. Weiterhin kann Intel bei der Core-Architektur