home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #1 / NN_1993_1.iso / spool / comp / sys / sgi / 18590 < prev    next >
Encoding:
Internet Message Format  |  1993-01-08  |  2.5 KB

  1. Path: sparky!uunet!wupost!sdd.hp.com!spool.mu.edu!olivea!sgigate!odin!twilight!zuni!anchor!olson
  2. From: olson@anchor.esd.sgi.com (Dave Olson)
  3. Newsgroups: comp.sys.sgi
  4. Subject: Re: Indigo R4000 vs. R3000 4D/35
  5. Message-ID: <uk0r1d4@zuni.esd.sgi.com>
  6. Date: 8 Jan 93 08:50:10 GMT
  7. References: <1993Jan7.142834.7127@jarvis.csri.toronto.edu> <1993Jan7.213506.6454@Princeton.EDU>
  8. Sender: news@zuni.esd.sgi.com (Net News)
  9. Organization: Silicon Graphics, Inc.  Mountain View, CA
  10. Lines: 52
  11.  
  12. In <1993Jan7.213506.6454@Princeton.EDU> awolfe@moo.Princeton.EDU (Andrew Wolfe) writes:
  13. | In article <1993Jan7.142834.7127@jarvis.csri.toronto.edu>, corkum@csri.toronto.edu (Brent Thomas Corkum) writes:
  14. | |> We just installed a R4000 upgrade in an Indigo and after running an in house application
  15. | |> that is completely cpu bound I found that it was only 1.8 times faster on the Indigo
  16. | |> than on a R3000 4D/35. Now, both have the same amount of memory and the application
  17. | |> doesn't use that much. Is this right? Do I need to recompile on the R4000 with some
  18. | |> magic compiler option (the code is in kr C)? I'm using the:
  19. | |> 
  20. | |> -cckr -float -O2
  21. | |> 
  22. | |> command line options.
  23. | |> 
  24. | |> Brent
  25. | Sounds about right to me...
  26.  
  27. This I more or less agree with.
  28.  
  29. | Remember - even though the CPU is about 3-4 times faster, other factors come
  30. | into play.
  31. | Examples:
  32. |     Main memory is approximately the same speed
  33.  
  34. Nope, the R4K memory system is much faster, and 64 bits wide vs 32
  35. (datapath to memory).
  36.  
  37. |     Primary caches are smaller
  38.  
  39. True, and this can offset some of the other gains.
  40.  
  41. | This means that loads/stores may not speed up if you have little locality.
  42.  
  43. They should, particularly stores, because the cache is so much larger,
  44. and writeback vs writethrough.  Of course, a *lot* depends on the
  45. data access patterns.
  46.  
  47. | Also - you imply that you have a lot of floating-point.
  48. |     Note that the latency of an FP add only changes from  ~55ns to 40ns.
  49. |                        double prec. FP mult     changes from ~140ns to 80ns.
  50.  
  51. And it is this that indicates there is a good chance of -mips2 really
  52. helping (as others indicated), since it does 64 bit loads and stores
  53. of double precisions flots, rather than a pair of 32 bit loads/stores.
  54.  
  55. Note that you need the 3.10 compilers (4.1 IDO) to use -mips2.
  56. --
  57. Let no one tell me that silence gives consent,  |   Dave Olson
  58. because whoever is silent dissents.             |   Silicon Graphics, Inc.
  59.     Maria Isabel Barreno                        |   olson@sgi.com
  60.