home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #16 / NN_1992_16.iso / spool / comp / arch / 8192 < prev    next >
Encoding:
Text File  |  1992-07-22  |  2.3 KB  |  55 lines

  1. Newsgroups: comp.arch
  2. Path: sparky!uunet!metaflow!rschnapp
  3. From: rschnapp@metaflow.com (Russ Schnapp)
  4. Subject: Re: SuperSPARC doesn't need superscalar compiler?!
  5. Message-ID: <BrstrI.GJ7@metaflow.com>
  6. Sender: usenet@metaflow.com
  7. Nntp-Posting-Host: habu
  8. Organization: Metaflow Technologies Inc.
  9. References: <9207201142.AA04083@x1sun6.ccl.itri.org.tw> <MOSS.92Jul21091941@ibis.cs.umass.edu>
  10. Date: Wed, 22 Jul 1992 16:28:30 GMT
  11. Lines: 42
  12.  
  13. In article <MOSS.92Jul21091941@ibis.cs.umass.edu>, moss@cs.umass.edu (Eliot Moss) writes:
  14. |> >>>>> On 21 Jul 92 01:42:07 GMT, lycmit@X1SUN6.CCL.ITRI.ORG.TW (Yin-Chih Lin)
  15. |> >>>>> said:
  16. |> 
  17. |> Yin-Chih> ... one of the Sun Micro employees had adverted that the SuperSPARC
  18. |> Yin-Chih> (superscalar SPARC which can issue 3 intructions at max performance)
  19. |> Yin-Chih> does not require the superscalar compiler to obtain the best CPU
  20. |> Yin-Chih> performance.
  21. |> 
  22.  
  23. |> Of course, you are right that in general a good schedule for a non-superscalar
  24. |> may not be the best schedule for a superscalar that does not have enough
  25. |> resources available on each cycle. For example, a non-superscalar might be
  26. |> able to issue one register to register multiply every cycle, given one fully
  27. |> pipelined multiplier. A superscalar that issues N instructions per cycle would
  28. |> need N fully pipeined units to guarantee not to stall, but most code probbaly
  29. |> does not need N fully pipelined multipliers.
  30. |> 
  31.  
  32. ...and there are other reasons why issue might stall on a superscalar
  33. machine.  Even if there were, for instance, three multipliers, a conventional
  34. superscalar machine could not issue the following sequence in a single frame:
  35.  
  36.     smul %g1,%g2,%g3
  37.     smul %g3,%g4,%g3
  38.     smul %g3,6,%g1
  39.  
  40. (i.e., calculating %g1 * %g2 * %g4 * 6).  There are a couple of kinds of
  41. data hazards here.  While this is a very contrived example, it points out
  42. one of the additional intricacies of generating code for conventional 
  43. superscalar processors.  
  44.  
  45. There are, of course, solutions to superscalar design that allow
  46. unrecompiled code to execute at a very substantial performance
  47. improvement...
  48.  
  49. ---
  50.  
  51. ...Russ Schnapp
  52.                         Email: uunet!metaflow!rschnapp or rschnapp@metaflow.com
  53. Metaflow Technologies   Voice: 619/452-6608x230;  FAX: 619/452-0401
  54. La Jolla, California    Unless otw specified, I`m speaking only for myself!
  55.