home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #30 / NN_1992_30.iso / spool / comp / speech / 358 < prev    next >
Encoding:
Internet Message Format  |  1992-12-13  |  1.5 KB

  1. Path: sparky!uunet!mcsun!uknet!bcc.ac.uk!link-1.ts.bcc.ac.uk!ubacr45
  2. From: ubacr45@ucl.ac.uk (Mr G Toal)
  3. Newsgroups: comp.speech
  4. Subject: Re: better phoneme directory for scat on SPARC
  5. Keywords: scat phoneme speech
  6. Message-ID: <1992Dec13.044503.26573@bas-a.bcc.ac.uk>
  7. Date: 13 Dec 92 04:45:03 GMT
  8. References: <7619@stan.xx.swin.oz.au>
  9. Sender: news@ucl.ac.uk (Usenet News System)
  10. Organization: Bloomsbury Computing Consortium, London
  11. Lines: 20
  12.  
  13. In article <7619@stan.xx.swin.oz.au> quentin@swin.oz.au writes:
  14. >I am running scat on my SUN SPARC. Scat will speak stdin for you.
  15. >It uses a directory of phonemes, which are short (.1 to .3 s) .au files.
  16. >The trouble is that the speech sounds garbled. I believe that the problem
  17. >lies in the recording of the .au files for each phoneme. I tried to record
  18. >my own with some success but I was wondering if anyone has a directory
  19. >of phonemes for scat which makes the speech understandable.
  20.  
  21. I don't think you'll ever get anything very impressive: it's a general
  22. limitation of the simple sampled-phoneme algorithm: phonemes simply
  23. don't join up.  A marginally cleverer idea is to sample pairs of
  24. phonemes, and provide samples that run from the middle of one
  25. segment to the middle of the next.  This means of course that you
  26. need N^2 samples instead of N (slightly less if you skip ones that
  27. don't happen in your language)  This gives better speech because
  28. most of the rising or lowering inflexions are at the start and end
  29. of phonemes, and the middles are relatively stable and can be abutted
  30. with less noticable discontinuity.
  31.  
  32. G
  33.