home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #19 / NN_1992_19.iso / spool / comp / sys / amiga / audio / 3221 < prev    next >
Encoding:
Internet Message Format  |  1992-08-29  |  3.3 KB

  1. Path: sparky!uunet!zephyr.ens.tek.com!uw-beaver!ubc-cs!destroyer!gumby!yale!yale.edu!qt.cs.utexas.edu!cs.utexas.edu!sun-barr!ames!elroy.jpl.nasa.gov!swrinde!swrinde.nde.swri.edu!kent
  2. From: kent@swrinde.nde.swri.edu (Kent D. Polk)
  3. Newsgroups: comp.sys.amiga.audio
  4. Subject: Re: Halving sample speed while keeping pitch
  5. Message-ID: <13327@swrinde.nde.swri.edu>
  6. Date: 28 Aug 92 17:40:25 GMT
  7. References: <9208241809.AA00474@.nairobi.inel.gov.inel.gov.> <ERICJ.92Aug24131911@lagos.cfsat.Honeywell.COM> <1992Aug25.155155.20785@kong.gsfc.nasa.gov>
  8. Sender: news@swrinde.nde.swri.edu
  9. Organization: Southwest Research Institute, San Antonio, Texas
  10. Lines: 50
  11.  
  12. In article <1992Aug25.155155.20785@kong.gsfc.nasa.gov> arensb@kong.gsfc.nasa.gov (Andrew Arensburger - RMS) writes:
  13. >ericj@hwcae.Honeywell.COM (Eric Jacobsen) writes:
  14. >
  15. >    I did this thing once, by chopping the original signal into 50-
  16. >sample segments. The segment size should be longer than the wavelength
  17. >of the signal, but short enough to be almost unnoticeable. Then just play
  18. >each segment twice, so that
  19. >        "hello world"
  20. >becomes
  21. >        "hheelllloo  wwoorrlldd"
  22. >
  23. >I didn't conduct an extensive study of appropriate segment lengths or
  24. >sampling rates, but it seemed to me that slowing down human speech in this
  25. >way worked fairly well (sounded like someone speaking verrrry slowwwly,
  26. >albeit a bit choppy), but made musical instruments sound like hell.
  27.  
  28. You have hit on some very intriguing aspects of how the aural system handles
  29. events. If someone is interested in pursuing this type of solution to the
  30. problem, I have some references that might be of use. I have been studying
  31. the problems associated with auralization of waveform data (obtaining
  32. information from waveforms aurally) for several years now. I won't go into
  33. detail here, but I use high-speed repetition of small signal segments to
  34. enhance comprehension as well as to place signal information in a certain
  35. 'context', and it works very well under the correct circumstances. Sample
  36. rates and segment lengths are critical aspects which can completely alter the
  37. perceived information.
  38.  
  39. I would say that the key issues here are to get a handle on how auditory
  40. streaming works and then understand what categories your sounds fit into so
  41. you can set the correct sample lengths for the desired effects.
  42. Unfortunately, I haven't worked much with speech, but from I have read and
  43. seen, speech would be handled the easiest with this method. Certainly the
  44. method described for speeding up speech is a 'picket fence' phenomenon where
  45. contextual information is heavily relied on by the aural system to fill in
  46. the missing signal elements. Have played a bit with music containing singing
  47. though. Very interesting results.
  48.  
  49. I think you would find that a little masking would help improve the
  50. comprehension for both speech and music, though I expect that the music
  51. segment lengths would have to be a little different for each contributing
  52. sound source.  (Not very easy :^). 
  53.  
  54. Oh yes. I use "The Web Data Acq. and Signal Processing Suite" for this
  55. research. If you have tried out the demo and wondered what all those strange
  56. options in the 'Play' filter were for... (Gotta put a plug in for Pete and
  57. Dave :^)
  58.  
  59. Kent Polk: Southwest Research Institute
  60. Internet : kent@swrinde.nde.swri.edu
  61. UUCP     : $ {cs.utexas.edu, gatech!petro, sun!texsun}!swrinde!kent
  62.