home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #30 / NN_1992_30.iso / spool / comp / sys / super / 1124 < prev    next >
Encoding:
Internet Message Format  |  1992-12-13  |  4.2 KB

  1. Path: sparky!uunet!usc!sdd.hp.com!ux1.cso.uiuc.edu!roundup.crhc.uiuc.edu!roundup.crhc.uiuc.edu!anik
  2. From: anik@crhc.uiuc.edu (Sadun Anik)
  3. Newsgroups: comp.sys.super
  4. Subject: Re: Precision requirements
  5. Date: 13 Dec 92 02:06:43
  6. Organization: Center for Reliable and High-Performance Computing
  7. Lines: 60
  8. Distribution: inet
  9. Message-ID: <ANIK.92Dec13020643@polaris.crhc.uiuc.edu>
  10. References: <1992Dec10.073526.4969@nas.nasa.gov> <1992Dec10.141843.2836@cis.uab.edu>
  11.     <1992Dec10.164402.17832@news.eng.convex.com>
  12.     <1992Dec10.225326.18139@nas.nasa.gov>
  13.     <1992Dec11.015624.15139@news.arc.nasa.gov>
  14. NNTP-Posting-Host: polaris.crhc.uiuc.edu
  15. In-reply-to: lamaster@pioneer.arc.nasa.gov's message of Fri, 11 Dec 1992 01:56:24 GMT
  16.  
  17. In article <1992Dec11.015624.15139@news.arc.nasa.gov> lamaster@pioneer.arc.nasa.gov (Hugh LaMaster) writes:
  18. >In article <1992Dec10.225326.18139@nas.nasa.gov>, eugene@wilbur.nas.nasa.gov (Eugene N. Miya) writes:
  19. >|> In article <1992Dec10.164402.17832@news.eng.convex.com>
  20. >|> dodson@convex.COM (Dave Dodson) writes:
  21. >|> >The oil industry consumes lots of supercomputer cycles doing seismic
  22. >|> >analysis, and 32 bits is more than enough precision for that.  After
  23. >|> >all, the seismic data has only 2 or 3 significant digits.  Using more
  24. >|> >than 32 bits doesn't improve their ability to find oil.
  25. >|> People think that if you double precision, all computations (adds, multiplies)
  26. >|> double in time. They forget their long hand multiplications.  That's
  27. >|> real estate.  Just another storage vs. time tradeoff.  Remember that you
  28. >|> can gain insight by asking a person how many bits "single-precision" is.
  29. >
  30. >I don't know if this was discussed at SC '92, but at SC '91, several 
  31. >presentations mentioned that (please read carefully) 64 bits will not
  32. >be enough for some (significant) algorithms when the problem *sizes* are 
  33. >scaled up to *TeraFLOPS* computing.  Therefore (please read carefully)
  34. >microprocessor designs should now include some minimal support for
  35. >128 bit FP so that the speed penalty is not enormous (full speed NOT
  36. >required; 4:1 might be OK, 100:1 probably not).  
  37. >
  38. >Why should today's MFLOPS-speed uP's worry about TeraFLOPS problems?  
  39. >Some of these micros are going to be used in MPP's.   This does not mean 
  40. >that we can expect (many) people to use (or need) 128 bit FP in 
  41. >their workstation-based computations.  But, generic uP's are becoming key 
  42. >components in some MPPs, and, as uP's approach GFLOPS speeds, people will
  43. >have to worry about this.  [And, for the same reason, micros need 64 bit
  44. >addressing, even though most workstations are not going to exceed a 1 GByte
  45. >of physical memory for a few years.]
  46.  
  47. I don't follow the logic here. Since when MPP usage has been an
  48. important factor in uP design? I wouldn't hold my breath to see 128
  49. bit FP in a uP. It may happen in the future, but only when desktop
  50. machine users require  it. As far as uP's are concerned x86
  51. style FP operations should satisfy almost everybody. Ofcourse current
  52. implemetation is microcoded but I expect to see a hardwired
  53. add/multiply unit soon. x86 provides 80 bit "extended precision"
  54. registers to handle 64 bit IEEE standard operations. Register to
  55. register operations are 80 bits and some C compilers support this
  56. precision. I don't think 80 bit operations are IEEE. 
  57.  
  58. I don't think there is a good precision vs speed type tradeoff in a
  59. pipelined FPU. If the hardware handles X bits per cycle, doing 2X
  60. precision with pipelining would be pain. Think of all the flags and
  61. exception detection for concurrently executing instructions. Designing
  62. hardware to do this correctly can be harder than implementing 2X
  63. precision for a scalar processor. When a 2X precision instruction is
  64. provided in assembly language, you will end up executing it pretty
  65. much on its own, with not much of pipelining. The bottom line is when
  66. you have a pipeline unit you can either do 2X precision in about the
  67. same time as X precision or much  slower. Ofcourse if you can get a
  68. single cycle X precision FPU, then doubling your precision won't cost
  69. too much (1:4 maybe). But still there is no "twice the precision half
  70. the performance" type tradeoff for a generic uP. 
  71.  
  72.  
  73. --
  74. Sadun Anik, U of Illinois at Urbana-Champaign
  75. Center for Reliable and High-performance Computing
  76. e-mail: anik@crhc.uiuc.edu
  77.