home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #3 / NN_1993_3.iso / spool / comp / sys / super / 1213 < prev    next >
Encoding:
Internet Message Format  |  1993-01-28  |  2.2 KB

  1. Path: sparky!uunet!UB.com!pacbell.com!sgiblab!munnari.oz.au!manuel.anu.edu.au!nimbus!tridge
  2. From: tridge@nimbus.anu.edu.au (Andrew Tridgell)
  3. Newsgroups: comp.sys.super
  4. Subject: Re: LIST OF SITES - NEW RATINGS
  5. Date: 27 Jan 1993 09:56:26 GMT
  6. Organization: Australian National University, Canberra
  7. Lines: 35
  8. Distribution: inet
  9. Message-ID: <1k5m8bINNs2@manuel.anu.edu.au>
  10. References: <1jnktgINNn60@uniwa.uwa.edu.au> <1993Jan22.153944.5686@chpc.utexas.edu>
  11. NNTP-Posting-Host: 150.203.15.21
  12.  
  13. >Since many of those sites included [not very interesting] peak MFLOPS
  14. >ratings for Intel Paragon and TMC CM-5 machines, but Dongarra's latest
  15. >[January 13, 1993] Linpack report STILL has no Linpack numbers for the
  16. >Paragons and CM-5s (even in Table 3, where one can make the matrices
  17. >as large as they wish!), would some owner of these machines please
  18. >give us the Linpack results for those two systems?
  19.  
  20. I haven't tried linpack itself but I have coded some vector and matrix
  21. routines. On a CM-5 with vector units I have achieved 75MFlops per node
  22. for vector*matrix, matrix*vector and matrix*matrix routines. I have
  23. achieved 45MFlops for an outer product of two vectors. These are all for
  24. double precision numbers. I believe the quoted peak performance is
  25. 128MFlops per node. I am not a experienced CM5 programmer (these were my
  26. first vector unit routines) and expect that much better results could be
  27. obtained by someone with more experience. In particular I suspect that
  28. the pipelining of instructions could give me a big improvement.
  29.  
  30. I coded these routines in CDPEAC and tested with vector lengths of
  31. around 100 and matrices of approx 100*100. 
  32.  
  33. On a related issue - has anyone got any code to copy data from scalar
  34. memory to the DP stack or heap on the CM5 at better than 16Mb per
  35. second? I really need to copy data much faster than that.  This is
  36. really only an issue if you are programming using the CMMD message
  37. passing library. 
  38.  
  39.  
  40. Andrew
  41.  
  42.  
  43. -- 
  44. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-
  45. Andrew Tridgell                 CSLab, Research School of Physical Sciences
  46. Andrew.Tridgell@anu.edu.au      Australian National University (x3064)
  47. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-
  48.