home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #1 / NN_1993_1.iso / spool / comp / speech / 418 < prev    next >
Encoding:
Internet Message Format  |  1993-01-07  |  3.9 KB

  1. Xref: sparky comp.speech:418 comp.sys.apple2:26535
  2. Path: sparky!uunet!cs.utexas.edu!zaphod.mps.ohio-state.edu!darwin.sura.net!spool.mu.edu!olivea!hal.com!hal!brennan
  3. From: brennan@hal.com (Dave Brennan)
  4. Newsgroups: comp.speech,comp.sys.apple2
  5. Subject: Speech synthesis and voice recognition on the Apple 2
  6. Message-ID: <BRENNAN.93Jan7112149@hysteria.hal.com>
  7. Date: 7 Jan 93 17:21:49 GMT
  8. Organization: HaL Computer Systems, Austin, TX
  9. Lines: 61
  10. NNTP-Posting-Host: hysteria.hal.com
  11.  
  12. My Apple //e has been idle for some time, but I've been considering brining
  13. it out of retirement to play around with some speech synthesis and voice
  14. recognition and possibly connect it to my Unix machine with a serial line
  15. and use it as a dedicated speech I/O machine.
  16.  
  17. I've got an Echo II speech synthesizer and Lis'ner 1000 speech recognition
  18. board (from MicroMint).  Both are about 6 year old technology, but may be
  19. good enough to get the job done.  I'm wondering if anyone has any experience
  20. programming either of these beasties?  Both come with user-level programs
  21. and some machine language drivers for Basic, which isn't going to be
  22. sufficient for what I want to do.  I also know that both don't seem to work
  23. at the same time, but I don't remember why.  (They probably load their
  24. drivers in the same location, or try to use the same page 0 addresses.)
  25.  
  26. Ideally I'd like to be able to hack together a program (in assembler) that
  27. could drive these two boards and communicate over the serial port to another
  28. computer.  I was hoping that since they are both old enough now it might
  29. even be possible to get my hands on some of the original source code for the
  30. drivers for the boards, but I haven't tried to contact the manufactures (are
  31. either of them still around).  I know that the Lis'ner 1000 design appeared
  32. in Steve Ciarcia "Circuit Cellar" column in Byte, November 1984.  He decided
  33. to build and sell them as well (I bought my board from him directly).  I
  34. could always disassemble the drivers for both and figure out what's going
  35. on, but this is a last resort.
  36.  
  37. The Lis'ner 1000 could be a lot of fun to hack around with.  The board uses
  38. a General Instrument SP1000 voice-recognition chip to do liner predictive
  39. coding (LPC).  Is LPC still a valid technology for speech recognition?  One
  40. of the big "selling points" for the Lis'ner was that the board did the LPC
  41. half of the recognition and the software did the job of deciding what word
  42. was spoken.  The idea was that as speech recognition technology improved,
  43. one could simply replace the software and get better recognition
  44. capabilities.  I still have the original software, and have no idea if there
  45. were ever any improvements.  Does anyone have some good references on
  46. recognition algorithms which are based on LPC encoding of speech?
  47.  
  48. The SP1000 could also do "reverse LPC," that is, given the LPC coefficients,
  49. it would generate speech.  The Byte article said:
  50.  
  51.   Typically, these coefficients are computer on a minicomputer and
  52.   stored as files to be loaded into the microprocessor's memory.  
  53.   Eventually, General Instrument intends to supply an allophone set
  54.   that will let the user synthesize any word using a text-to-speech
  55.   algorithm or a dictionary table.
  56.  
  57. In fact, the board came with a demo program that generated human sounding
  58. speech from sample coefficient data from General Instrument.  I don't
  59. know if they ever got around to creating that allophone set.  It also seems
  60. like if the input for recognition is the LPC coefficients, it should be
  61. possible to save them, then feed them back to the chip again to reproduce
  62. what was captured, but this isn't mentioned in the article anywhere.  The
  63. idea is pretty obvious, but I'm no expert, and there must be some reason
  64. that it isn't mentioned.
  65.  
  66. I guess that's enough for now.  
  67. Let me know if you have any comments, help, pointers, etc.  I can post
  68. more information if anyone is interested.
  69.  
  70. --
  71. Dave Brennan                                      HaL Computer Systems
  72. brennan@hal.com                                         (512) 794-2855
  73.