home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #1 / NN_1993_1.iso / spool / comp / sys / dec / 6719 < prev    next >
Encoding:
Internet Message Format  |  1993-01-07  |  2.6 KB

  1. Xref: sparky comp.sys.dec:6719 comp.dsp:2935
  2. Path: sparky!uunet!spool.mu.edu!uwm.edu!rutgers!sgigate!odin!pipo.paris.sgi.com!jpp
  3. From: jpp@pipo.paris.sgi.com (Jean-Pierre Panziera - SGI PARIS)
  4. Newsgroups: comp.sys.dec,comp.dsp
  5. Subject: Re: Alpha fft performance
  6. Message-ID: <1993Jan7.121038.4845@odin.corp.sgi.com>
  7. Date: 7 Jan 93 12:10:38 GMT
  8. References: <1992Dec31.164221.27734@aplcen.apl.jhu.edu> <1993Jan4.154245.13258@crl.dec.com>
  9. Sender: news@odin.corp.sgi.com (Net News)
  10. Reply-To: jpp@sgi.com
  11. Organization: Silicon Graphics, Parallel Team
  12. Lines: 56
  13. Nntp-Posting-Host: pipo.paris.sgi.com
  14.  
  15. In article <1993Jan4.154245.13258@crl.dec.com>, payne@crl.dec.com
  16. (Andrew Payne) writes:
  17. ......
  18. |> 
  19. |> For a 1024 point, complex, single precision FFT (i.e. just fits in
  20. the on-chip
  21. |> 8K D cache), we have a measured time of 96,000 cycles.  For the
  22. various Alpha
  23. |> systems, this translates to:
  24. |> 
  25. |>     133 MHz clock        722 microseconds
  26. |>     150 Mhz            640 microseconds
  27. |>     200 MHz            480 microseconds
  28. |> 
  29. |> The algorithm is a radix-4 algorithm, and is basically just a C translation
  30. |> of the FORTRAN code in "DFT/FFT and Convolution Algorithms" by Burrus and 
  31. |> Parks (with a few tweaks, of course).  It was compiled with GCC 2.3 and
  32. |> the execution time was measured with the Alpha's process cycle counter.
  33. |> 
  34. ......
  35. |> -- 
  36. |> Andrew C. Payne
  37. |> DEC Cambridge Research Lab
  38.  
  39. I'd like to ask a few questions:
  40.  
  41. |> For a 1024 point, complex, single precision FFT (i.e. just fits in
  42. the on-chip
  43. |> 8K D cache),
  44.  
  45.   An array of 1024 complex numbers indeed uses 8 Kbytes. However to compute an 
  46.   FFT you need an extra array of Sines and Cosines of same size (8 kBytes).
  47.   The total space required for this FFT is then at least 8+8 = 16 kBytes.
  48.   So the assumption "just fits in the on-chip 8K D cache" seems abusive. ???
  49.  
  50.  
  51. |> the execution time was measured with the Alpha's process cycle counter.
  52.  
  53.   I am not familiar with "Alpha's process cycle counter". Is this a simulator ?
  54.   Does this tool take in account eventual cache misses ?
  55.   How do real benchmark compare with your simulation ?
  56.  
  57. |> The algorithm is a radix-4 algorithm, and is basically just a C translation
  58. |> of the FORTRAN code in "DFT/FFT and Convolution Algorithms" by Burrus and 
  59. |> Parks (with a few tweaks, of course).
  60.  
  61.   Are the results of your transform ordered, or are they "bit reversed" ?
  62.  
  63. Thanks you in advance.
  64.  
  65. ---
  66.     ___   ___/       ___   /       ___   /    Jean-Pierre Panziera
  67.          /          /     /       /     /    jpp@paris.sgi.com
  68.         /          ______/       ______/    
  69.        /          /             /        
  70.  _____/       ___/          ___/        
  71.