home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #19 / NN_1992_19.iso / spool / comp / text / tex / 10658 < prev    next >
Encoding:
Internet Message Format  |  1992-08-29  |  1.1 KB

  1. Path: sparky!uunet!snorkelwacker.mit.edu!ai-lab!news.ai!ilh
  2. From: ilh@lcs.mit.edu (Lee Hetherington)
  3. Newsgroups: comp.text.tex
  4. Subject: Re: IBM Pennant Systems survey
  5. Message-ID: <ILH.92Aug28162140@winnie-the-pooh.lcs.mit.edu>
  6. Date: 28 Aug 92 20:21:40 GMT
  7. References: <199208281156.AA08401@claude.cs.umb.edu>
  8.     <l9sn7jINNnrm@utkcs2.cs.utk.edu>
  9. Sender: news@ai.mit.edu
  10. Reply-To: ilh@lcs.mit.edu
  11. Organization: MIT/LCS Spoken Language Systems
  12. Lines: 15
  13. In-reply-to: eijkhout@cupid.cs.utk.edu's message of 28 Aug 92 17:05:55 GMT
  14.  
  15. I'd guess that they're going to use the documents to build statistical
  16. language models, probably for speech recognition purposes.  I know
  17. that they've collected literally millions of words of internal memos
  18. and email for just that purpose.  Basically, they estimate the
  19. probability of a word given the surrounding context and need millions
  20. of words to get reliable estimates for still longer strings of words.
  21.  
  22. Why they don't tell you, I don't know.  This is just my educated
  23. guess.  I have nothing to do with IBM.
  24.  
  25.  
  26. --
  27.  
  28.                                 Lee Hetherington
  29.                                 ilh@lcs.mit.edu
  30.