home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #30 / NN_1992_30.iso / spool / comp / arch / 11706 < prev    next >
Encoding:
Internet Message Format  |  1992-12-16  |  3.6 KB

  1. Xref: sparky comp.arch:11706 comp.sys.intel:2735
  2. Path: sparky!uunet!mcsun!uknet!gdt!aber!aberfa!pcg
  3. From: pcg@aber.ac.uk (Piercarlo Grandi)
  4. Newsgroups: comp.arch,comp.sys.intel
  5. Subject: Re: Superscalar vs. multiple CPUs ?
  6. Message-ID: <PCG.92Dec11162630@aberdb.aber.ac.uk>
  7. Date: 11 Dec 92 16:26:30 GMT
  8. References: <1992Dec7.012026.11482@athena.mit.edu>
  9.     <1992Dec8.000357.26577@newsroom.utas.edu.au>
  10.     <PCG.92Dec9154602@aberdb.aber.ac.uk>
  11.     <1992Dec9.211737.23911@walter.cray.com>
  12. Sender: news@aber.ac.uk (USENET news service)
  13. Reply-To: pcg@aber.ac.uk (Piercarlo Grandi)
  14. Organization: Prifysgol Cymru, Aberystwyth
  15. Lines: 57
  16. In-Reply-To: bradc@ferris.cray.com's message of 10 Dec 92 03: 17:36 GMT
  17. Nntp-Posting-Host: aberdb
  18.  
  19. On 10 Dec 92 03:17:36 GMT, bradc@ferris.cray.com (Bradley R. Carlile) said:
  20.  
  21. pcg> as far as I can see, 6 instruction issue per cycle is virtually
  22. pcg> pointless. The *limit* of superscalarity present in general purpose
  23.                              ^^^^^^^^^^^^^^^
  24.  
  25. Note the "general purpose"; if the codes exhibit high regularity in data
  26. access patterns then they are no longer "general purpose" codes, at
  27. least in my understanding of that term, which encompasses things like
  28. editors, databases, compilers, word processors, spreadsheets, ...
  29.  
  30. pcg> codes is 4, and actually we are hard pressed to find many codes
  31. pcg> with superscalarity higher than 2.
  32.  
  33. bradc> The limit of 4 or 6 may be the limit programming a superscalar
  34. bradc> chip like by simply letting the the chip group instructions
  35. bradc> together.  *However* if one uses the technique of software
  36. bradc> pipelining like we used to use on the VLIW machines of yesteryear
  37. bradc> FPS-120B (before 1976), FPS-164, and the FPS-264 (1985?).
  38.  
  39. Ah yes, well known, for codes well suited to SIMD style computing. But
  40. frankly the jury is still out on software pipelining even in that case.
  41. It covers, like LIW/VLIW, a gray area between [super]scalar and vector,
  42. one maybe suited to short vector lengths.
  43.  
  44. bradc> These machines could issue up to 10 instruction every cycle {I
  45. bradc> wrote software for 7 years that used these instructions}.
  46.  
  47. But I still think that a proper vector processor is overall, except for
  48. particular cases, a better bet, especially because memory queues fit in
  49. more easily with a vector architecture than with everything else, and
  50. SIMD-style codes are great bandwidth eaters. And one can design vector
  51. architectures that do perform well even for the short vector length for
  52. which a LIW/VLIW seems designed.
  53.  
  54. Also, If you can put to good use software pipelining, and issue 10
  55. instructions per cycle, this means you have the same order of magnitude
  56. memory transactions, and you need the same order of magnitude register
  57. file depths, and so on. This looks like calling for vector instructions,
  58. vector registers, vector memory access.
  59.  
  60. bradc> In addition, compilers can automatically perform software
  61. bradc> pipelining. At FPS we had several.  A "modern" example of a
  62. bradc> compiler includes Portland Group Inc.'s i860 compiler.
  63.  
  64. Fascinating compilers, but the i860 story (which is often considered a
  65. sort of LIW architecture) seems to support my impressions: it would have
  66. been easier, even for the limited degree of parallelism available in the
  67. i860, to have proper vector style instructions; the ones that do exploit
  68. the multiple functional units of the i860 really amount to such, only
  69. with loads of complications and hazards, and difficulties with keeping
  70. the pipes fed. Now the i860 is a particularly awkward quasi-LIW design,
  71. and it should not be taken as a straw man, but still...
  72. --
  73. Piercarlo Grandi                   | JNET: pcg@uk.ac.aber
  74. Dept of CS, University of Wales    | UUCP: ...!aber-cs!pcg
  75. Penglais, Aberystwyth SY23 3BZ, UK | INET: pcg@aber.ac.uk
  76.