home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #26 / NN_1992_26.iso / spool / comp / arch / 10663 < prev    next >
Encoding:
Internet Message Format  |  1992-11-13  |  3.8 KB

  1. Xref: sparky comp.arch:10663 comp.benchmarks:1672
  2. Newsgroups: comp.arch,comp.benchmarks
  3. Path: sparky!uunet!ukma!darwin.sura.net!news.udel.edu!perelandra.cms.udel.edu!mccalpin
  4. From: mccalpin@perelandra.cms.udel.edu (John D. McCalpin)
  5. Subject: Re: DEC ALPHA Performance Claims
  6. Message-ID: <BxM8xv.EFI@news.udel.edu>
  7. Summary: Micro have a long way to go yet....
  8. Keywords: memory bandwidth, vectorized codes
  9. Sender: usenet@news.udel.edu
  10. Nntp-Posting-Host: perelandra.cms.udel.edu
  11. Organization: College of Marine Studies, U. Del.
  12. References: <1992Nov12.091854.22914@walter.cray.com>
  13. Date: Thu, 12 Nov 1992 18:34:42 GMT
  14. Lines: 71
  15.  
  16. In article <1992Nov12.091854.22914@walter.cray.com> cmg@magnet.cray.com writes:
  17. >
  18. >We must be careful when comparing new architectures with old
  19. >architectures because of the effect of software.  [...]
  20. >        [....]
  21. >The improvement of microprocessor speed of the past decade has been
  22. >tremendous.  How much of this improvement is attributable to software?
  23.  
  24. Without bothering to hunt down the numbers, it is clear that for the
  25. LINPACK 100x100 and 1000x1000 benchmarks, the effect of software
  26. improvements has been tremendous.   Because of this, I no longer
  27. consider any of the LINPACK numbers to be useful for characterizing
  28. system performance (except for dense linear algebra).
  29.  
  30. The two cases have been improved by different sets of software
  31. enhancements: 
  32.  
  33. (1) In the 100x100 case, inlining has been the real key, though there
  34. is still some room for improvement in the compile-time evaluation of
  35. the excessive logical predicates in the BLAS routines.  On the hardware
  36. side, larger caches have helped quite a bit.
  37.  
  38. (2) In the 1000x1000, the improvement has been mostly due to the
  39. industry's increasing knowledge about block-mode algorithms, although
  40. the use of pipelined FPU's has been crucial for these algorithmic
  41. improvements to be effective.
  42.  
  43.  
  44. Just as in the case of the SPEC89 Matrix300 benchmark (which was made
  45. useless by the combination of these two sets of optimizations), this
  46. set of enhancements has made the LINPACK test cases rather poor
  47. predictors of scientific workload performance.  For most large-scale
  48. scientific applications, the real bottleneck continues to be
  49. sustainable memory bandwidth --- often requiring non-unit or irregular
  50. strides.
  51.  
  52. The combination of unbalanced architectures (fast and/or pipelined
  53. FPU's combined with slow memory systems) with an algorithm that
  54. benefits far more than most from blocking results in systems that
  55. cannot deliver what these LINPACK numbers appear to promise.
  56.  
  57. ----------------------------------------------------------------------
  58.  
  59. It is interesting to note that the top-of-the-line DEC Alpha system
  60. appears to be about even with the Cray C90 on $/MFLOP for the LINPACK
  61. 1000x1000 case.   Since this is a best case for the Alpha, one must
  62. conclude that the C90 is more cost-effective for more memory-intensive
  63. vectorized algorithms (i.e. most all of them).
  64.  
  65.     Alpha AXP 10000 : $ 300k/111 MFLOPS = 2.7 k$/MFLOPS
  66.     Cray C90 - 1 cpu: $2500k/871 MFLOPS = 2.9 k$/MFLOPS
  67.  
  68. The Cray price is a guestimate.  It is probably not too far off
  69. for a uniprocessor system.  Multiprocessor systems are likely
  70. noticeably cheaper per cpu.
  71. ----------------------------------------------------------------------
  72.  
  73. It is also interesting to note that the DEC AXP 3000/500 at 150 MHz
  74. has almost identical LINPACK 100x100 and LINPACK 1000x1000 numbers
  75. with the IBM RS/6000-970 at 50 MHz.   Prices are similar, with DEC
  76. appearing to have a slight edge: $39k vs ~$55k.
  77.  
  78. ----------------------------------------------------------------------
  79.  
  80. All in all, a disappointing set of announcements from the point of view
  81. of this number-cruncher....
  82. -- 
  83. --
  84. John D. McCalpin                        mccalpin@perelandra.cms.udel.edu
  85. Assistant Professor                     mccalpin@brahms.udel.edu
  86. College of Marine Studies, U. Del.      John.McCalpin@mvs.udel.edu
  87.