home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #30 / NN_1992_30.iso / spool / comp / sys / intel / 2664 < prev    next >
Encoding:
Internet Message Format  |  1992-12-12  |  5.3 KB

  1. Xref: sparky comp.sys.intel:2664 comp.arch:11587
  2. Path: sparky!uunet!olivea!charnel!rat!zeus!
  3. From: mneideng@thidwick.acs.calpoly.edu (Mark Neidengard)
  4. Newsgroups: comp.sys.intel,comp.arch
  5. Subject: Re: Superscalar vs. multiple CPUs ?
  6. Message-ID: <1992Dec12.152224.168173@zeus.calpoly.edu>
  7. Date: 12 Dec 92 15:22:24 GMT
  8. References: <1992Dec7.012026.11482@athena.mit.edu> <1992Dec8.000357.26577@newsroom.utas.edu.au> <PCG.92Dec9154602@aberdb.aber.ac.uk>
  9. Sender: news@zeus.calpoly.edu
  10. Organization: Academic Computing Services, Cal Poly San Luis Obispo
  11. Lines: 97
  12.  
  13. In article <PCG.92Dec9154602@aberdb.aber.ac.uk> pcg@aber.ac.uk (Piercarlo Grandi) writes:
  14. >On 8 Dec 92 00:03:57 GMT, gunther@bronte.cs.utas.edu.au (Bernard Gunther) said:
  15. >
  16. >gunther> (Jason W Solinsky) writes:
  17. >
  18. >gunther> So, are we going to see (for example) four CPUs stuffed in each
  19. >gunther> corner of a big die?
  20. >
  21. >Well, Intel have sort of _promised_/_planned_ such a thing for the late
  22. >90s. When you have several dozen million transistors on a chip, you can
  23. >start treating it like a micro-PCB -- even Intel processors can only get
  24. >so much complex.
  25. >
  26. >gunther> That implies some unreasonable design choices: *four* I-caches,
  27. >gunther> *four* D-caches, four sets on FPUs, four sets of ALUs, etc...
  28. >
  29. >Unreasonable? And what you are going to use all those transistors for?
  30. >Time ago the PC-on-a-chip seemed unreasonable too maybe, but we now have
  31. >ti, and palmtop PCs have appeared. Eventually we'll have the palmtop
  32. >touchstone delta :-).
  33. >
  34. >gunther> No, I guess looking at it like that, the idea of laying four
  35. >gunther> megacells down on the chip and having them communicate via
  36. >gunther> test-and-set semaphores from their individual caches seems
  37. >gunther> slightly crazy.  It's not that there isn't enough transistors
  38. >gunther> to do it some day, but rather that those transistors aren't
  39. >gunther> being used very efficiently.
  40. >
  41. >Uhm?
  42. >
  43. >gunther> That's fine if chips cost zero and going off-chip extracts no
  44. >gunther> penalty and you don't mind competing CPUs running twice times
  45. >gunther> as fast with the same hardware budget.  :-)
  46. >
  47. >gunther> By sharing many functional units in a multithreaded CPU, it's
  48. >gunther> possible to achieve over 6 instruction issues per cycle with
  49. >gunther> 99% memory utilization (no D-cache!) and 97% FPU utilization -
  50. >gunther> all from a *single* I-cache and multiple instruction
  51. >gunther> sequencers.
  52. >
  53. >Well, certain tricks can also be used with multiple CPUs on the same
  54. >die. And these have an important advantage: as far as I can see, 6
  55. >instruction issue per cycle is virtually pointless. The *limit* of
  56. >superscalarity present in general purpose codes is 4, and actually we
  57. >are hard pressed to find many codes with superscalarity higher than 2.
  58. >
  59. >Naturally if one looks at very regular algorithms one can issue many,
  60. >many instructions, *in sequence*, usually. But at that point one is
  61. >really better off with a proper vector processor; emulating a vector
  62. >processor with a superscalar one is not efficient.
  63. >
  64. >On the other hand there are plenty of non vector problems for which a
  65. >coarser grain of parallelism (say 1-10 CPUs) is provenly effective.
  66. >Also, considering that future applications (a multimedia movie, where
  67. >you have to run in parallel sound and image expansion, and track net
  68. >comms and the like) will be probably quite multitasking, multiple CPUs
  69. >looks like being a better idea than:
  70. >
  71. >gunther> At the ISA level, however, the machine might well appear to be
  72. >gunther> just a collection of separate CPUs.
  73. >
  74. >Hardly -- there is some problem with multiple contexts and MMUs.
  75. >
  76. >gunther> For the cost of two CPUs it's possible to obtain the
  77. >gunther> performance of four.  Obviously this approach has its limits,
  78. >gunther> and it's then when it pays to integrate multiple CPUs.
  79. >gunther> I've drawn this line at the point where a single I-cache and a
  80. >gunther> single D-cache no longer suffice.
  81. >
  82. >I'd rather say the divide is between general purpose scalar/superscalar
  83. >and vector...
  84. >
  85. >--
  86. >Piercarlo Grandi                   | JNET: pcg@uk.ac.aber
  87. >Dept of CS, University of Wales    | UUCP: ...!aber-cs!pcg
  88. >Penglais, Aberystwyth SY23 3BZ, UK | INET: pcg@aber.ac.uk
  89.  
  90. I see nothing wrong with many instruction units on one chip; all you have to
  91. do is either A) use them like a sort of on-chip diastolic pipeline, or B)
  92. have the system process scheduler schedule different processes to use
  93. different units.  I could easily envision a chip with three FP adders and
  94. three FP multipliers (maybe not with today's fabrication, but in another
  95. year or so...)  What you would have to do is increase the sophistication of
  96. the chip's internal pipeline controller and do a LOT of instruction
  97. predecoding.  However, if you took a six-unit chip up to 200 MHz, you'd have
  98. a single-chip supercomputer; if the i860 was the "supercomputer on a chip",
  99. such a high-superscalability chip would be a "parallel-supercomputer on a
  100. chip."  I could see using 1.2 gigaflops on a singe workstation...=)
  101.  
  102. Mark Neidengard                                Author of UUSHRED, avail. on
  103.                                                wuarchive.wustl.edu in /pub
  104. mneideng@cosmos.acs.calpoly.edu
  105. "I remember green suits on a black mayor
  106.  I remember nine-millimeter child slayers
  107.  I remember all the times that you called me an animal
  108.  But now I'm walkin' as a Cannibal-"
  109.        Brother J of the X-Clan
  110.