home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #26 / NN_1992_26.iso / spool / comp / speech / 251 < prev    next >
Encoding:
Text File  |  1992-11-12  |  1.1 KB  |  28 lines

  1. Newsgroups: comp.speech
  2. Path: sparky!uunet!convex!darwin.sura.net!sgiblab!swrinde!elroy.jpl.nasa.gov!ames!riacs!danforth
  3. From: danforth@riacs.edu (Douglas G. Danforth)
  4. Subject: Re: Very simple speech recognition Alg. wanted.
  5. Message-ID: <1992Nov12.232526.17013@riacs.edu>
  6. Sender: news@riacs.edu
  7. Organization: RIACS, NASA Ames Research Center
  8. References: <MHALL.92Nov9152432@occs.cs.oberlin.edu> <1992Nov12.180625.13886@riacs.edu>
  9. Distribution: comp.speech
  10. Date: Thu, 12 Nov 92 23:25:26 GMT
  11. Lines: 15
  12.  
  13.  
  14. Addendum to QUICKY:
  15.  
  16. Amplitude normalization: 
  17.   Forgot to mention that the amplitude in each segment should be normalized
  18. otherwise loud sounds will look different from  soft sounds even though
  19. the same word is spoken.  The Interstate Algorithm actually just
  20. uses the amplitude difference (1 bit) from one lowpass filter to the
  21. next higher frequency within a segment.  For 16 filters there are
  22. 15 differences.  An increase gets a 1 bit.  No change or decrease gets
  23. a 0 bit.  The result is a 256 bit (pad low frequency with zeros) pattern.
  24. You can try other schemes as well.
  25.  
  26. Doug Danforth
  27.  
  28.