home *** CD-ROM | disk | FTP | other *** search
/ ftp.pasteur.org/FAQ/ / ftp-pasteur-org-FAQ.zip / FAQ / comp-speech-faq / part1 next >
Internet Message Format  |  1998-07-13  |  132KB

  1. Path: senator-bedfellow.mit.edu!faqserv
  2. From: andrew.hunt@east.sun.com (Andrew Hunt)
  3. Newsgroups: comp.speech,comp.answers,news.answers
  4. Subject: comp.speech Frequently Asked Questions - part 1/3
  5. Supersedes: <comp-speech-faq/part1_897652698@rtfm.mit.edu>
  6. Followup-To: comp.speech
  7. Date: 12 Jul 1998 12:00:13 GMT
  8. Organization: Speech Applications Group, Sun Microsystems Laboratories
  9. Lines: 3292
  10. Approved: news-answers-request@MIT.Edu
  11. Expires: 14 Sep 1998 12:00:04 GMT
  12. Message-ID: <comp-speech-faq/part1_900244804@rtfm.mit.edu>
  13. Reply-To: andrew.hunt@east.sun.com (Andrew Hunt)
  14. NNTP-Posting-Host: penguin-lust.mit.edu
  15. Summary: Information on Speech Technology
  16. X-Last-Updated: 1998/07/08
  17. Originator: faqserv@penguin-lust.MIT.EDU
  18. Xref: senator-bedfellow.mit.edu comp.speech:18455 comp.answers:32121 news.answers:134642
  19.  
  20. Archive-name: comp-speech-faq/part1
  21. Last-modified: 1998/07/06
  22. URL: http://www.speech.su.oz.au/comp.speech/
  23.  
  24.                    COMP.SPEECH FAQ POSTING - PART 1/3
  25.  
  26.  
  27. [Note: this document has been automatically extracted from a WWW site:
  28.         http://www.speech.su.oz.au/comp.speech/
  29. This may introduce some formatting errors.]
  30.  
  31.  
  32.                     Comp.Speech Frequently Asked Questions
  33.  
  34.    The Frequently Asked Questions (FAQ) is a regular posting to
  35.    comp.speech which attempts to answer some of the regular questions in
  36.    the comp.speech newsgroup. It covers speech synthesis, speech
  37.    recognition, speech coding and a range of related material. It
  38.    contains lists of speech technology software and hardware, including
  39.    commerical products, public domain and freeware software, plus it
  40.    contains over 500 links to speech technology sites and software.
  41.  
  42.    The FAQ is not meant to discuss any topic exhaustively. It will
  43.    hopefully provide readers with pointers on where to find useful
  44.    information, especially material available on the Internet.
  45.  
  46.    If you have not already read the Usenet introductory material posted
  47.    to news.announce.newusers, please do. For help with FTP (file transfer
  48.    protocol) look for a regular posting of anonymous FTP FAQ in
  49.    comp.misc, comp.archives.admin or news.answers.
  50.  
  51.    This FAQ is posted every 4 weeks to comp.speech, comp.answers and
  52.    news.answers.
  53.  
  54.    It is also available on the World Wide Web:
  55.  
  56.      * Australia: http://www.speech.su.oz.au/comp.speech/
  57.      * Britain: http://svr-www.eng.cam.ac.uk/comp.speech/
  58.      * Japan: http://www.itl.atr.co.jp/comp.speech/
  59.      * USA: http://www.speech.cs.cmu.edu/comp.speech/
  60.  
  61.    Or by anonymous ftp from the comp.speech archive site:
  62.  
  63.      * ftp://svr-ftp.eng.cam.ac.uk/pub/comp.speech/FAQ-complete
  64.  
  65.    Or from the news.answers ftp site (and its mirrors):
  66.  
  67.      * ftp://rtfm.mit.edu/pub/usenet/comp.speech/*
  68.  
  69.    Or by sending email to mail-server@rtfm.mit.edu with the following
  70.    line in the body of the message:
  71.  
  72.      * send usenet/news.answers/comp-speech-faq/*
  73.  
  74.    If you only have email access to the internet, then I suggest you
  75.    obtain the Internet-by-email guide. Send email to
  76.    mail-server@rtfm.mit.edu with the following line in the body of the
  77.    message:
  78.  
  79.      * send usenet/news.answers/internet-services/access-via-email
  80.  
  81.                                    Admin
  82.  
  83.    Minor changes each month. Thanks to all the companies and individuals
  84.    who send in information.
  85.  
  86.                               Acknowledgements
  87.  
  88.    Hundreds of people and companies have made contributions to the
  89.    comp.speech FAQ over the last few years - too many to name
  90.    individually. Special thanks go to Tony Robinson and Kevin Lenzo who
  91.    have provided a wide range of information and assistance. Tony
  92.    Robinson also maintains the comp.speech ftp site which is an excellent
  93.    resource for all people working with speech technology. I am grateful
  94.    to the people at Sydney University, Cambridge University, ATR ITL and
  95.    CMU for supporting the FAQ on their WWW sites.
  96.  
  97.                                  Disclaimer
  98.  
  99.    The comp.speech FAQ and WWW pages are provided as is without any
  100.    express or implied warranties. While every effort has been taken to
  101.    ensure the accuracy of the information presented here, the author
  102.    assumes no responsibility for errors or omissions, or for damages
  103.    resulting from the use of the information contained herein.
  104.    The comp.speech FAQ and WWW pages should not be construed as
  105.    representing the views or products of my employer, Sun Microsystems,
  106.    Inc.
  107.  
  108.                          Copyright and Reproduction
  109.  
  110.    Copyright (c) 1994-6 by Andrew Hunt, all rights reserved.
  111.    The comp.speech FAQ posting may not be distributed for financial gain.
  112.  
  113.    The comp.speech FAQ posting may not be included in any collections or
  114.    compilations without express permission from the author.
  115.    The comp.speech FAQ posting may be posted to any USENET newsgroup,
  116.    on-line service, or BBS as long as it is posted in its entirety with
  117.    this copyright statement, and that a current version is always
  118.    maintained.
  119.    [Note: hyperlinks to the comp.speech WWW pages are encouraged.]
  120.  
  121. Maintainer
  122.  
  123.    The FAQ posting and the Comp.Speech WWW Site are maintained on a
  124.    volunteer basis by
  125.  
  126.     Andrew Hunt
  127.     Speech Applications Group, Sun Microsystems Laboratories
  128.     Two Elizabeth Drive, Chelmsford, MA, 01824-4195, USA
  129.     Ph: (508) 442 2681 Fax: (508) 250 5067
  130.     andrew.hunt@east.sun.com
  131.  
  132.  
  133. ___________________________________________________________________________
  134.  
  135.                               comp.speech FAQ
  136.  
  137.                              Table of Contents
  138.  
  139.   + SpeechLinks: Speech Technology Hyperlinks Pages
  140.  
  141.           * SpeechLinks: 500+ Speech Technology Links 
  142.           * SpeechLinks: General Speech Technology Links 
  143.           * SpeechLinks: Signal Processing for Speech 
  144.           * SpeechLinks: Speech Coding 
  145.           * SpeechLinks: Speech Synthesis 
  146.           * SpeechLinks: Speech Recognition 
  147.  
  148.   + List Of Software/Hardware
  149.  
  150.   + Update Times 
  151.  
  152.   + Availability
  153.  
  154.   + Odds 'n Ends
  155.  
  156.   + FAQ Section 1: General Information on Speech Technology
  157.  
  158.           * SpeechLinks: General
  159.           * Q1.1: What is comp.speech?
  160.           * Q1.2: comp.speech ftp site
  161.           * Q1.3: Common abbreviations and jargon
  162.           * Q1.4: Related newsgroups and mailing lists
  163.           * Q1.5: Associations, publications and conferences
  164.           * Q1.6: Handicap Aids
  165.           * Q1.7: Speech Databases
  166.           * Q1.8: Speech File Formats and Conversion
  167.           * Q1.9: Speech Laboratory Environments and Audio Editors
  168.           * Q1.10: Speech Research Sites
  169.           * Q1.11: Miscellaneous Software and Resources
  170.  
  171.   + FAQ Section 2: Signal Processing
  172.  
  173.           * SpeechLinks: Signal Processing for Speech
  174.           * Q2.1: What sampling do I need for speech?
  175.           * Q2.2: Finding the pitch of a speech signal
  176.           * Q2.3: How do I find the start and end points of a speech
  177.           signal?
  178.           * Q2.4: Where can I find FFT software?
  179.           * Q2.5: Signal processing in speech technology
  180.           * Q2.6: Speech sampling and signal processing hardware
  181.           * Q2.7: How do I convert to/from mu-law format?
  182.           * Q2.8: Signal Processing Software
  183.  
  184.   + FAQ Section 3: Speech Coding and Compression
  185.  
  186.           * SpeechLinks: Speech Coding
  187.           * Q3.1: Speech compression techniques
  188.           * Q3.2: Information on speech coding and compression
  189.           * Q3.3: Speech Compression / Coding Software
  190.  
  191.   + FAQ Section 4: Natural Language Processing
  192.  
  193.           * Q4.1: NLP References and Books
  194.           * Q4.2: NLP Software
  195.  
  196.   + FAQ Section 5: Speech Synthesis
  197.  
  198.           * SpeechLinks: Speech Synthesis
  199.           * Q5.1: What is speech synthesis?
  200.           * Q5.2: How can speech synthesis be performed?
  201.           * Q5.3: References/Books on Synthesis
  202.           * Q5.4: Speech Synthesis on the WWW
  203.           * Q5.5: Speech Synthesis Software/Hardware
  204.  
  205.   + FAQ Section 6: Speech Recognition
  206.  
  207.           * SpeechLinks: Speech Recognition
  208.           * Q6.1: What is speech recognition?
  209.           * Q6.2: How is speech recognition performed?
  210.           * Q6.3: How can I build a simple speech recogniser?
  211.           * Q6.4: References & books on speech recognition
  212.           * Q6.5: Speech Recognition Hardware/Software
  213.           * Q6.6: Speaker Recognition (Verification and Identification)
  214.           * Q6.7: Integrated Speech Products
  215.  
  216.  
  217. ___________________________________________________________________________
  218.  
  219.                    List of Software/Hardware/Information
  220.  
  221.    The comp.speech FAQ provides information on a range of software,
  222.    hardware and resources.
  223.  
  224. Q1.6: Handicap Aids
  225.  
  226.           * Man-Machine Interfacing
  227.           * SpeechViewer II
  228.  
  229. Q1.7: Speech Data
  230.  
  231.           * Bavarian Archive for Speech Signals
  232.           * BUPT Spoken Digit Database (Chinese)
  233.           * Center for Spoken Language Understanding (CSLU)
  234.           * Examples of IPA Symbols
  235.           * Linguistic Data Consortium (LDC)
  236.           * NOISEX
  237.           * Oxford Acoustic Phonetic Database
  238.           * Phonemic Samples
  239.           * RELATOR project
  240.           * ShATR
  241.           * University of Victoria Phonetic Database
  242.  
  243. Q1.9: Speech Processing Environments
  244.  
  245.           * CSRE: Computerized Speech Research Environment
  246.           * DADiSP from DSP Development Corporation
  247.           * Entropic Signal Processing System (ESPS) and Waves
  248.           * GoldWave
  249.           * Kay Elemetrics Computer Speech Lab
  250.           * Khoros
  251.           * Matlab plus Signal Processing Toolbox
  252.           * MacSpeech Lab II
  253.           * N!Power
  254.           * OGI Speech Tools
  255.           * Ptolemy
  256.           * Quadravox Speech Processing Products - Qbox
  257.           * Speech Filing System (SFS)
  258.           * Signalyze 3.0 from InfoSignal
  259.           * SoundScope
  260.  
  261. Q1.11: Miscelaneous Software and Resources
  262.  
  263.   Speech Application Interfaces
  264.  
  265.           * ASAPI: Advanced Speech API (AT&T)
  266.           * SAPI: Microsoft Windows Speech API
  267.           * SRAPI: Speech Recognition API
  268.           * TAPI: Microsoft Windows Telephony API
  269.  
  270.   Network "Phone" Software
  271.  
  272.           * CUSeeMe
  273.           * CyberPhone
  274.           * DigiPhone
  275.           * InterFACE from Hijinx
  276.           * FAQ: How can I use the Internet as a telephone?
  277.           * Nautilus: Secure Computer Telephony
  278.           * NEVOT (1.4v) from AT&T BL
  279.           * PGPfone
  280.           * Speak Freely
  281.           * Internet Phone from VocalTec
  282.           * WebPhone
  283.           * WebTalk
  284.  
  285.   Audio Processing Software
  286.  
  287.           * AF version AF3R1
  288.           * Voice E-Mail from Bonzi Software
  289.           * MicNotePad Recording Software for Macs
  290.           * MixViews
  291.           * Network Audio System Release 1.1
  292.           * NIST Software - SPHERE and SCORE
  293.           * Sound Processing Kit
  294.           * TCPplay
  295.  
  296.   Human Audio Perception
  297.  
  298.           * Auditory Modeller 1
  299.           * Auditory Modeller 2
  300.           * Auditory Toolbox for Matlab
  301.           * Human Audio Perception Document
  302.  
  303.   Dictionaries and other Lexical Tools
  304.  
  305.           * BEEP dictionary
  306.           * CMU dictionary
  307.           * CUVOLAD dictionary (Oxford Dictionary)
  308.           * Comprehensive Word List
  309.           * EAT: Edinburgh Associative Thesaurus
  310.           * Homophone List
  311.           * Moby Lexical Resources
  312.           * MRC Psycholinguistic Database
  313.           * WordNet
  314.           * Dictionaries on the WWW
  315.  
  316.   Phonetic Fonts and Phonetic Samples
  317.  
  318.           * International Phonetic Alphabet
  319.           * WWW: Phonetic Fonts and Examples Online
  320.           * Summer Institute of Linguistics IPA Fonts
  321.           * Phonetic Fonts for TeX and LaTeX
  322.           * Yamada Language Center
  323.  
  324.   Very Miscellaneous Software
  325.  
  326.           * The vOICe
  327.           * The Learning Company's Language Training
  328.           * Wildfire - an Electronic Assistant
  329.  
  330. Q2.6: Audio Hardware
  331.  
  332.           * Macintosh Audio Hardware
  333.           * PC Audio Hardware
  334.           * Unix Audio Hardware
  335.  
  336. Q2.8: Signal Processing Software
  337.  
  338.           * SigLib from Numerix Ltd.
  339.  
  340. Q3.3: Compression Software and Hardware
  341.  
  342.           * 32 kbps ADPCM
  343.           * Castleton Network Systems - G.729 Voice Coder
  344.           * CELP 3.2a & LPC-10
  345.           * 8 Kbit/s CELP on the TMS320C5x family of DSP chips
  346.           * CyberVoice
  347.           * Rockwell's DigiTalk
  348.           * File format conversion
  349.           * G.711/721/723 Compression
  350.           * G.728 LD-CELP vocoder
  351.           * G.728 Compression
  352.           * GSM 06.10 Compression
  353.           * Lernout & Hauspie Speech Coding (5 products)
  354.           * Lernout & Hauspie Speech Coding SDK
  355.           * MPEG Audio
  356.           * shorten - a lossless compressor for speech signals
  357.           * Sipro Lab Telecom Inc. Coding
  358.           * Sonarc: Digital Audio Compression
  359.           * StarAudio Compressor/Player
  360.           * TrueSpeech from DSP Group
  361.           * U.S.F.S. 1016 CELP vocoder for DSP56001
  362.           * ToolVox from Voxware
  363.  
  364. Q4.2: Natural Language Processing
  365.  
  366.      * Natural Language Software Registry (NLSR) - NLP Tools
  367.      * Part of Speech Tagger
  368.  
  369. Q5.5: Speech Synthesis
  370.  
  371.    _Apple Macintosh_
  372.           * BeSTspeech from Berkeley Speech Technologies, Inc., (BST) 
  373.           * Infovox Product Range 
  374.           * Macintosh Speech Output Applications 
  375.           * Macintosh Speech Synthesis Manager 
  376.           * MacYack Pro 
  377.           * MBROLA: Free Speech Synthesis Project 
  378.           * ProVoice Developer's Speech Toolkit from First Byte 
  379.           * SENSYN speech synthesizer 
  380.           * Sound Bytes DeveloperUs Kit 
  381.           * Macintosh Speech Synthesis Manager 
  382.  
  383.    _Windows (including 95, NT, 3.1)_
  384.           * AcuVoice 
  385.           * AT&T Watson Speech Synthesis 
  386.           * BeSTspeech from Berkeley Speech Technologies, Inc., (BST) 
  387.           * Creative TextAssist and TextAssist API 
  388.           * DECtalk: Text-to-Speech from Digital 
  389.           * ETI-Eloquence 
  390.           * HADIFIX 
  391.           * Infovox Product Range 
  392.           * IPOX: All Prosodic Speech Synthesis Architecture 
  393.           * Lernout and Hauspie Text-To-Speech Windows SDK 
  394.           * Listen2 Text Reader 
  395.           * MBROLA: Free Speech Synthesis Project 
  396.           * Monologue for Windows from First Byte 
  397.           * PAM - A Text-To-Speech Application 
  398.           * ProVerbe Speech Engine from ELAN Informatique 
  399.           * ProVoice Developer's Speech Toolkit from First Byte 
  400.           * SENSYN speech synthesizer 
  401.           * Sound Bytes DeveloperUs Kit 
  402.           * Tinytalk 
  403.           * TruVoice from Centigram 
  404.           * WinSpeech 
  405.           * ZMD Speech Synthesis 
  406.  
  407.    _DOS_
  408.           * CSRE: Computerized Speech Research Environment 
  409.           * Infovox Product Range 
  410.           * MBROLA: Free Speech Synthesis Project 
  411.           * ProVoice Developer's Speech Toolkit from First Byte 
  412.           * SENSYN speech synthesizer 
  413.           * spchsyn.exe 
  414.           * Tinytalk 
  415.           * ZMD Speech Synthesis 
  416.  
  417.    _OS/2_
  418.           * ProVerbe Speech Engine from ELAN Informatique 
  419.           * ProVoice Developer's Speech Toolkit from First Byte 
  420.           * Sound Bytes DeveloperUs Kit 
  421.  
  422.    _Unix_
  423.           * AcuVoice 
  424.           * AsTeR 
  425.           * BeSTspeech from Berkeley Speech Technologies, Inc., (BST) 
  426.           * DECtalk: Text-to-Speech from Digital 
  427.           * ETI-Eloquence 
  428.           * Emacspeak - A Speech Output Subsystem For Emacs 
  429.           * Festival Speech Synthesis System 
  430.           * JSRU 
  431.           * Klatt-style synthesiser 
  432.           * KPE80 - A Klatt Synthesiser and Parameter Editor 
  433.           * "learph": Trainable text-to-phoneme software by Antonio Lucca
  434.  
  435.           * Lucent Technologies Bell Labs Text-to-Speech system 
  436.           * MBROLA: Free Speech Synthesis Project 
  437.           * Orator from Bellcore 
  438.           * ProVerbe Speech Engine from ELAN Informatique 
  439.           * rsynth 
  440.           * SENSYN speech synthesizer 
  441.           * SGI Developers Toolbox Synthesiser 
  442.           * Speak 
  443.           * TrueTalk 
  444.           * TruVoice from Centigram 
  445.  
  446.    _Integrated Circuits and Dedicated Hardware_
  447.           * Eurovocs 
  448.           * Infovox Product Range 
  449.           * ProVerbe Speech Engine from ELAN Informatique 
  450.           * RC Systems V8600/V8601 Text to Speech synthesizers 
  451.  
  452.    _Other Platforms_
  453.           * BeSTspeech from Berkeley Speech Technologies, Inc., (BST) 
  454.           * TheBigMouth (NeXT) 
  455.           * MBROLA: Free Speech Synthesis Project 
  456.           * Narrator Translator Library (Amiga) 
  457.           * Narrator (Amiga) 
  458.           * TextToSpeech Kit (NeXT) 
  459.           * Orator from Bellcore 
  460.           * SENSYN speech synthesizer 
  461.           * WreadFiles: File reader for Commodore Amiga 
  462.  
  463.    _Unknown_
  464.           * Lernout and Hauspie Text-To-Speech (3 products) 
  465.           * SIMTEL 
  466.           * Text to Phoneme Program 1 
  467.           * Text to phoneme program 2 
  468.           * Text to phoneme program 3 
  469.  
  470. Q6.5: Speech Recognition
  471.  
  472.    _Apple Macintosh_
  473.           * Digital Dreams Speech Recognition Plug-Ins 
  474.           * Dragon Dictation Products 
  475.           * Macintosh Speech Recognition Manager 
  476.           * PowerSecretary 
  477.  
  478.    _Windows (including 95, NT, 3.1)_
  479.           * AT&T Watson Speech Recognition 
  480.           * Cambridge Voice for Windows 
  481.           * CustomVoice and CustomTelephone: A&G Graphics Interface Inc. 
  482.           * DragonDictate for Windows 
  483.           * Dragon Dictation Products 
  484.           * Dragon Developer Tools 
  485.           * Ficomp Interpreter 6000 
  486.           * IBM VoiceType Dictation and Control 
  487.           * IN CUBE 
  488.           * Kurzweil Speech Recognition (2 products) 
  489.           * Lernout & Hauspie ASR SDK 
  490.           * Listen for Windows 2.0 from Verbex Voice Systems 
  491.           * Microsoft Speech Recognition 
  492.           * NCC Dictate 
  493.           * Phonetic Engine 500 (PE500) from Speech Systems, Inc. 
  494.           * Philips Speech Recognition (2 products) 
  495.           * ProNotes Voice Tools 
  496.           * PureSpeech 
  497.           * smARTspeak from Advanced Recognition Technologies, Inc. 
  498.           * Visual Voice from Stylus Innovation 
  499.           * VoiceAssist for Windows from Creative Labs, Inc. 
  500.           * VoiceServer for Windows 
  501.           * Whisper 
  502.           * WildCard Speech Products 
  503.  
  504.    _DOS_
  505.           * DATAVOX - French 
  506.           * Dragon Developer Tools 
  507.           * Ficomp Interpreter 6000 
  508.           * Jialong He's Speech Recognition Research Tool 
  509.           * smARTspeak from Advanced Recognition Technologies, Inc. 
  510.           * Votan VPC2100 Voice Card and VSP 1010 Speech Processor 
  511.  
  512.    _OS/2_
  513.           * IBM VoiceType Dictation and Control 
  514.  
  515.    _Unix_
  516.           * AbbotDemo 
  517.           * BBN Hark Telephony Recognizer 
  518.           * EARS: Single Word Recognition Package 
  519.           * Ficomp Interpreter 6000 
  520.           * Hidden Markov Model Toolkit (HTK) from Entropic 
  521.           * IN CUBE 
  522.           * Jialong He's Speech Recognition Research Tool 
  523.           * Lotec Speech Recognition Package 
  524.           * Myers' Hidden Markov Model software 
  525.           * NICO Artificial Neural Network Toolkit 
  526.           * Nuance Speech Recognition System 
  527.           * PureSpeech 
  528.           * recnet 
  529.  
  530.    _Integrated Circuits and Dedicated Hardware_
  531.           * HM2007 - Speech Recognition Chip 
  532.           * OKI VRP6679 - Speech Recognition Chip 
  533.           * Sensory Inc. Integrated Circuits 
  534.           * Speech Commander - Verbex Voice Systems 
  535.           * Voice Control Systems Recognition 
  536.           * VCS 2030 & 2060 Voice Dialer 
  537.  
  538.    _Other Platforms_
  539.           * Simon Says (NeXT) 
  540.           * Voice Command Line Interface (Amiga) 
  541.           * Visus SpeechKit 
  542.  
  543.    _Unknown_
  544.           * Berkeley Restaurant Project (BeRP) 
  545.           * Lernout & Hauspie ASR (3 products) 
  546.           * Voice-Trek 2.0 
  547.           * Voicetek Corp. 
  548.           * Voice Processing Corporation Speech Recognition Product Line 
  549.  
  550. Q6.6: Speaker Verification and Identification
  551.  
  552.           * ImagineNation: Voice Activated UnLock Technology 
  553.           * Jialong He's Speaker Recognition (Identification) Tool
  554.           * Keyware Biometric Security Products
  555.           * SpeakerKey Voice Verifier from ITT
  556.           * SpeakEZ Voice Print Speaker Verification
  557.           * Voice Control Systems: Speaker Verification Technology
  558.  
  559. Q6.7: Integrated Speech Products
  560.  
  561.           * SpeechWorksfrom Applied Language Technologies, Inc.
  562.           * Nortel Speech Technology Products
  563.  
  564.  
  565. ___________________________________________________________________________
  566.  
  567.                          General Speech Technology
  568.  
  569.                          comp.speech FAQ Section 1
  570.  
  571.           * SpeechLinks: General
  572.           * Q1.1: What is comp.speech?
  573.           * Q1.2: comp.speech ftp site
  574.           * Q1.3: Common abbreviations and jargon
  575.           * Q1.4: Related newsgroups and mailing lists
  576.           * Q1.5: Associations, publications and conferences
  577.           * Q1.6: Handicap Aids
  578.           * Q1.7: Speech Databases
  579.           * Q1.8: Speech File Formats and Conversion
  580.           * Q1.9: Speech Laboratory Environments and Audio Editors
  581.           * Q1.10: Speech Research Sites
  582.           * Q1.11: Miscellaneous Software and Resources
  583.  
  584.  
  585.  
  586.                           Q1.1: What is comp.speech?
  587.  
  588.    Comp.speech is an unmoderated newsgroup for discussion of speech
  589.    technology and speech science. It covers a wide range of issues from
  590.    the application of speech technology, to research, to products and
  591.    lots more. By its nature, speech technology is an inter-disciplinary
  592.    field and the newsgroup reflects this. However, computer application
  593.    is the basic theme of the group.
  594.  
  595.    Note: If you don't know what a newsgroup is, then talk to your local
  596.    system administration about how to get access. A useful newsgroups for
  597.    beginners is news.announce.newusers. You might also find the following
  598.    documents useful.
  599.  
  600.           ftp://rtfm.mit.edu/pub/usenet/news.announce.newusers/What_is_Us
  601.           enet?
  602.  
  603.           ftp://rtfm.mit.edu/pub/usenet/news.announce.newusers/Answers_to
  604.           _Frequently_Asked_Questions_about_Usenet
  605.  
  606.           ftp://rtfm.mit.edu/pub/usenet/news.announce.newusers/Rules_for_
  607.           posting_to_Usenet
  608.  
  609.           ftp://rtfm.mit.edu/pub/usenet/news.announce.newusers/FAQs_about
  610.           _FAQs
  611.  
  612.    The following is a list of some of the topics covered by comp.speech.
  613.  
  614.      * Speech Recognition - discussion of methodologies, training,
  615.        techniques, results and applications. This should cover the
  616.        application of techniques including HMMs, neural-nets and so on to
  617.        the field.
  618.      * Speech Synthesis - discussion concerning theoretical and practical
  619.        issues associated with the design of speech synthesis systems.
  620.      * Speech Coding and Compression - both research and application
  621.        matters.
  622.      * Phonetic/Linguistic Issues - coverage of linguistic and phonetic
  623.        issues which are relevant to speech technology applications. Could
  624.        cover parsing, natural language processing, phonology and prosodic
  625.        work.
  626.      * Speech System Design - issues relating to the application of
  627.        speech technology to real-world problems. Includes the design of
  628.        user interfaces, the building of real-time systems and so on.
  629.      * Other matters - relevant conferences, jobs, books, software,
  630.        hardware, and products.
  631.  
  632.  
  633. ___________________________________________________________________________
  634.  
  635.                        Q1.2: comp.speech ftp site
  636.  
  637.    Tony Robinson maintains the comp.speech ftp site. The ftp site is a
  638.    comprehensive repository of software and information related to speech
  639.    technology. The site is
  640.  
  641.      * ftp://svr-ftp.eng.cam.ac.uk/pub/comp.speech/
  642.  
  643.   Comp.speech Archives
  644.  
  645.    The comp.speech ftp site provides full archives of the comp.speech
  646.    newsgroup dating back to the creation of the group in 1991. The
  647.    postings are stored in the order in which they arrive. Batches of 1000
  648.    articles are grouped into gzip'ed tar file. Matching files listing the
  649.    subjects are also provided.
  650.  
  651.      * ftp://svr-ftp.eng.cam.ac.uk/pub/comp.speech/archive/
  652.  
  653.   Software and Other Resources
  654.  
  655.    The comp.speech ftp site includes a wide range of useful software and
  656.    resources. Tony has arranged it into a series of sub-directories:
  657.  
  658.    /analysis : Speech analysis software
  659.           FFT code, a pitch tracker, RASTA code, and IEEE DSP code.
  660.  
  661.    /auditory : Auditory model software
  662.           AIM, Auditory Toolbox and Lutear.
  663.  
  664.    /coding : Speech coding software
  665.           ADPCM, CELP 3.2a, G711, G721, G723, GSM, LDCELP, LPC10,
  666.           Shorten.
  667.  
  668.    /data : Repository for (small) speech-related databases
  669.           BEEP, CMUDict, Homophone list, hVd database, Peterson Barney
  670.           database
  671.  
  672.    /dictionaries : Phonetic dictionaries
  673.           BEEP, CMUDict, CUVOALD, Homophone list, MRC database
  674.  
  675.    /info : Key postings to comp.speech archives by subject
  676.           Lots of interesting info!
  677.  
  678.    /recognition : Speech recognition software
  679.           AbbotDemo, Ears, Lotec, recnet, sound blaster recognition,
  680.           whistle
  681.  
  682.    /simtel_sound : Mirror of the simtel/msdos/sound directory
  683.           Range of useful software
  684.  
  685.    /simtel_voice : Mirror of the simtel/msdos/voice directory
  686.           Another range of useful software
  687.  
  688.    /synthesis : Speech synthesis software
  689.           Klatt synthesis software, Klatt parameter editor and rsynth.
  690.  
  691.    /tools : Miscelaneous tools
  692.           Part-of-speech tagger, OGI speech tools, sox audio file format
  693.           conversion, SPHERE software and more.
  694.  
  695.  
  696. ___________________________________________________________________________
  697.  
  698.                  Q1.3: Common abbreviations and jargon.
  699.  
  700.      * ANN - Artificial Neural Network.
  701.      * ASR - Automatic Speech Recognition.
  702.      * ASSP - Acoustics Speech and Signal Processing
  703.      * AVIOS - American Voice I/O Society
  704.      * CELP - Code-book Excited Linear Prediction.
  705.      * COLING - COmputational LINGuistics
  706.      * DTW - Dynamic Time Warping.
  707.      * FAQ - Frequently Asked Questions.
  708.      * HMM - Hidden Markov Model.
  709.      * IEEE - Institute of Electrical and Electronics Engineers
  710.      * JASA - Journal of the Acoustic Society of America
  711.      * LPC - Linear Predictive Coding.
  712.      * LVQ - Learned Vector Quantisation.
  713.      * MFCC - Mel Frequency Cepstral Coefficients
  714.      * NLP - Natural Language Processing.
  715.      * NN - Neural Network.
  716.      * TIMIT - A speech corpus with phoneme labels - see Q1.7
  717.      * TTS - Text-To-Speech (i.e. speech synthesis).
  718.      * VQ - Vector Quantisation.
  719.  
  720.  
  721. ___________________________________________________________________________
  722.  
  723.               Q1.4: Related newsgroups and mailing lists.
  724.  
  725. Newsgroups
  726.  
  727.    comp.ai - Artificial Intelligence newsgroup.
  728.           Postings on general AI issues, language processing and AI
  729.           techniques. The comp.ai FAQ covers NLP, NN and other AI
  730.           information.
  731.  
  732.    comp.ai.nat-lang - Natural Language Processing Group
  733.           Postings regarding Natural Language Processing. Set up to cover
  734.           a broard range of related issues and different viewpoints. A
  735.           comp.ai.nat-lang FAQ posting is available.
  736.  
  737.    comp.ai.nlang-know-rep - Natural Language Knowledge Representation
  738.           Moderated group.
  739.  
  740.    comp.ai.neural-nets - discussion of Neural Networks and related
  741.           issues.
  742.           There are often posting on speech related matters - phonetic
  743.           recognition, connectionist grammars and so on. A
  744.           comp.ai.neural-nets FAQ posting is available.
  745.  
  746.    comp.compression - occasional articles on compression of speech.
  747.           The comp.compression FAQ has some info on audio compression
  748.           standards.
  749.  
  750.    comp.dcom.telecom - Telecommunications newsgroup.
  751.           Has occasional articles on voice products.
  752.  
  753.    comp.dsp - discussion of signal processing - hardware and algorithms
  754.           and more.
  755.           Has a good FAQ posting which is also available on the WWW and
  756.           by ftp (addresses below). Has a regular posting of a
  757.           comprehensive list of Audio File Formats.
  758.  
  759.           + http://www.bdti.com/faq/dsp_faq.htm
  760.           + ftp://rtfm.mit.edu/pub/usenet/comp.dsp/
  761.  
  762.    comp.multimedia - Multi-Media discussion group.
  763.           Has occasional articles on voice I/O.
  764.  
  765.    sci.lang - Language.
  766.           Discussion about phonetics, phonology, grammar, etymology and
  767.           lots more. A sci.lang FAQ is available.
  768.  
  769.    alt.sci.physics.acoustics
  770.           Some discussion of speech production & perception.
  771.  
  772.    alt.binaries.sounds.* - posting and discussion of sound samples.
  773.  
  774. Mailing Lists
  775.  
  776.    Voice-Users Mailing List
  777.           For discussion of any aspect of using voice recognition
  778.           systems.
  779.  
  780.           + Using such systems safely, without muscle or voice strain
  781.           + Techniques for improving recognition accuracy
  782.           + How to set up the physical voice workstation
  783.           + Tips for effective use of voice interfaces
  784.           + Configuration of specific systems, troubleshooting, etc
  785.  
  786.           To subscribe fill out the web-based subscription form
  787.           Posts to the list should go to:
  788.           voice-users@voicerecognition.com
  789.  
  790.    Colibri
  791.           News about language, speech, logic and information.
  792.           Email: colibri@let.ruu.nl
  793.           WWW: http://colibri.let.ruu.nl/
  794.  
  795.    ECTL - Electronic Communal Temporal Lobe
  796.           Founder & Moderator: David Leip. Moderated mailing list for
  797.           researchers with interests in computer speech interfaces. This
  798.           list serves a broad community including persons from signal
  799.           processing, AI, linguistics and human factors. To subscribe,
  800.           send your name, institute, department, daytime phone and email
  801.           address to:
  802.  
  803.           + ectl-request@snowhite.cis.uoguelph.ca
  804.  
  805.           The ECTL archive site is
  806.           ftp://snowhite.cis.uoguelph.ca/pub/ectl
  807.  
  808.    Prosody Mailing List
  809.           Unmoderated mailing list for discussion of prosody. The aim is
  810.           to facilitate the spread of information relating to the
  811.           research of prosody by creating a network of researchers in the
  812.           field. If you want to participate, send the following one-line
  813.           message to
  814.  
  815.           + listserv@msu.edu
  816.           + subscribe prosody Your Name
  817.  
  818.    foNETiks
  819.           A moderated monthly newsletter distributed by e-mail. It
  820.           carries job advertisements, notices of conferences, and other
  821.           news of general interest to phoneticians, speech scientists and
  822.           others. The editors are Linda Shockey and Gerry Docherty. To
  823.           subscribe send the following 1 line message to
  824.  
  825.           + mailbase@mailbase.ac.uk
  826.           + join fonetiks your_first_name your_second_name
  827.  
  828.    Digital Mobile Radio
  829.           Covers lots of areas include some speech topics including
  830.           speech coding and speech compression. Mail Peter Decker
  831.           dec@dfv.rwth-aachen.de to subscribe.
  832.  
  833.  
  834. ___________________________________________________________________________
  835.  
  836.               Q1.5: Associations, Journals and Conferences
  837.  
  838.    [Note: Also see the list provided in Shikano's WWW site on Speech and
  839.    Acoustics:
  840.    http://www.aist-nara.ac.jp/IS/Shikano-lab/database/internet-resource/e
  841.    -www-site.html.]
  842.  
  843. Associations
  844.  
  845.     Institute of Electrical and Electronics Engineers (IEEE)
  846.  
  847.      * Publications: include IEEE Transactions on Signal Processing, IEEE
  848.        Transactions on Speech and Audio (from Jan 93), IEEE Transactions
  849.        on Acoustics, Speech, and Signal Processing (now obsolete), IEEE
  850.        Signal Processing Magazine. (More information on the WWW:
  851.        http://www.ieee.org/sp/index.html).
  852.      * Speech-Related Conferences: ICASSP - Intl. Conf. Acoustics,
  853.        Speech, and Signal Processing. IEEE also runs speech technology
  854.        related workshops and many other conferences. (Does anyone have a
  855.        list?)
  856.      * Contact: IEEE Service Center
  857.        445 Hoes Lane, PO Box 1331, Piscataway, NJ 08855, USA
  858.        Phone: 1-800-678-IEEE or (201) 981-0060
  859.      * WWW: IEEE: http://www.ieee.org/
  860.        IEEE Signal Processing Society http://www.ieee.org/sp/index.html
  861.  
  862.     The Acoustical Society of America (ASA)
  863.  
  864.      * Publications: Journal of the Acoustical Society of America (JASA)
  865.      * Conferences: ASA holds four meetings a year. Information is
  866.        available on the WWW: http://asa.aip.org/meetings.html.
  867.      * Contact: ASA Office Manager,
  868.        500 Sunnyside Blvd, Woodbury, NY 11797-2999, USA
  869.        Ph: (516) 576-2360, FAX (516) 576-2377
  870.        Email: asa@aip.org
  871.      * WWW: http://asa.aip.org/
  872.  
  873.     European Speech Communication Association (ESCA)
  874.  
  875.      * Publications: Speech Communications
  876.      * Conferences: EUROSPEECH is held every two years. E'97 will take
  877.        place in Patras, Greece, in September 1997. ESCA organises regular
  878.        speech-related workshops: see their WWW pages for details.
  879.      * Contact: Secretariat ESCA
  880.        ICP, Universite Stendhal,
  881.        BP 25X, F38400 Grenoble Cedex 9, France
  882.        Ph: (+33).76.82.43.36 Fax (+33).76.82.43.35
  883.        Email: esca@icp.grenet.fr
  884.      * WWW: http://ophale.icp.grenet.fr/esca/esca.html
  885.  
  886.     Association for Computational Linguistics (ACL)
  887.  
  888.      * Publications: Computational Linguistics
  889.      * SIGPHON: Special Interest Group for Computational Phonology. The
  890.        home page is provided by the Centre for Cognitive Science at the
  891.        University of Edinburgh. A special issue on Computational
  892.        Phonology appeared in Vol 20, Num 3 of Computational Linguistics
  893.        and included an Introduction to Computational Phonology by Steven
  894.        Bird
  895.      * Conferences: COLING is held bi-annually. ACL also organises a
  896.        range of workshops. See the WWW pages for details.
  897.      * Contact: P.O. Box 6090
  898.        Somerset, NJ 08875, USA
  899.        Ph: (908) 873 3893
  900.        Email: acl@bellcore.com
  901.      * WWW: http://www.cs.columbia.edu:80/~acl/
  902.  
  903.     American Voice Input/Output Society (AVIOS)
  904.  
  905.      * Description: AVIOS is a not-for-profit organization, dedicated to
  906.        disseminating information about applications using speech
  907.        technology. It aims "to bridge the gap between emerging voice
  908.        technology and its application, by providing an interactive forum
  909.        for the technologists, students, system developers, business
  910.        managers, and users actively involved in or with an interest in
  911.        the field of voice processing."
  912.      * Publications: International Journal of Speech Technology (with
  913.        Kluwer Academic Publishers)
  914.        The Journal of the American Voice Input/Output Society was
  915.        published from 1984 to 1994.
  916.      * Conferences: The International Voice Input/Output Applications
  917.        Conference is held annually (since 1982): Sept 10-12, San Jose,
  918.        CA.
  919.      * Contact: 4010 Moorpark Avenue, Suite 105M, San Jose, CA 95117, USA
  920.  
  921.        Ph: +1-408-248-1353, Fax: +1-408-248-0251
  922.        Email: avios@pilot.net
  923.        WWW: http://www.avios.com/
  924.  
  925.     European Language Resources Association
  926.  
  927.      * Description: The European Language Resources Association was
  928.        established in Luxembourg in February, 1995, with the goal of
  929.        creating an organization to promote the creation, verification,
  930.        and distribution of language resources in Europe. A non-profit
  931.        organization, ELRA aims to serve as a central focal point for
  932.        information related to language resources in Europe, It will help
  933.        users and developers of European language resources, as well as
  934.        government agencies and other interested parties, exploit language
  935.        resources for a wide variety of uses. It will also oversee the
  936.        distribution of language resources via CD-ROM and other means and
  937.        promote standards for such resources.
  938.      * More info: see the ELRA Home page for membership information,
  939.        lists of resources etc.
  940.      * Contact: K. Choukri, Executive Director ELRA
  941.        87, Avenue d'Italie, 75013 Paris, FRANCE
  942.        Ph: +33 1 45 86 53 00, Fax: +33 1 45 86 44 88
  943.        Email: elra@calvanet.calvacom.fr
  944.        WWW: http://www.icp.grenet.fr/ELRA/home.html
  945.  
  946.     ASSTA: Australian Speech Science and Technology Association
  947.  
  948.      * Conference: SST, the Australian conference on Speech Science and
  949.        Technology, is held bi-annually. SST-96 will be held in Adelaide.
  950.      * WWW: Home Page: http://cslab.anu.edu.au/~bruce/assta/
  951.        List of members: http://ciips.ee.uwa.edu.au/~roberto/assta-users/
  952.  
  953.     SALT: UK Speech and Language Technology Club
  954.  
  955.      * WWW home page: http://salt.essex.ac.uk/salt/
  956.  
  957.     Linguistic Associations
  958.  
  959.      * A comprehensive list of linguistic associations and linguistic WWW
  960.        links is available at
  961.        http://engserve.tamu.edu/files/linguistics/linguist/associations.h
  962.        tml
  963.  
  964. Industry Publications
  965.  
  966.     ASR News
  967.  
  968.      * Description: Monthly newsletter covering developments in the
  969.        speech recognition and speech synthesis marketplace.
  970.      * Note: Voice Information Associates also publish "Automatic Speech
  971.        Recognition: A study of the world-wide market" (revised 1995) and
  972.        "Text-to-Speech Technology Markets: 1995-2000" (revised 1995)
  973.      * Contact: Voice Information Associates, Inc.
  974.        14 Glen Road South, P.O. Box 625, Lexington, MA 02173, USA
  975.        Ph: +1-617-861-6680, Fax: +1-617-863-8790
  976.        Email: asrnews@tiac.net
  977.        WWW: http://www.tiac.net/users/asrnews/
  978.  
  979.     Voice News
  980.  
  981.      * Description: Monthly newsletter reporting on voice mail, voice
  982.        response, speech recognition, speech synthesis, digital voice
  983.        record/playback and related technologies, markets and company
  984.        activities. Review copy available on request.
  985.      * Contact: Stoneridge Technical Services
  986.        P.O. Box 1891, Rockville, MD, 20849, USA
  987.        Ph: +1-301-424-0114, Fax: +1-301-424-8971
  988.        Email: info@stoneridgetech.com
  989.        WWW: http://www.stoneridgetech.com/
  990.  
  991.     Speech Recognition Update
  992.  
  993.      * Description: Monthly news and analysis of speech recognition
  994.        markets, applications and technology.
  995.        A free sample copy is available by contacting TMA Associates.
  996.      * Also: TMA Associates also publishes market studies, including The
  997.        Advanced Speech Technology Market: Recognition, Synthesis and
  998.        Compression (1996) and Voice ID (1996)
  999.  
  1000.    .
  1001.  
  1002.      Contact: TMA Associates
  1003.    6021 Wish Avenue, Encino, CA 91316, USA
  1004.    Ph: +1-818-708-0962, Fax: +1-818-345-2980
  1005.    Email: 72162.3172@compuserve.com
  1006.    http://www.tmaa.com/
  1007.  
  1008.     Voice Technology and Services News
  1009.  
  1010.      * Description: Follows integrated PC LAN messaging (voice, fax,
  1011.        mail, video) and speech technology. It follows the merging
  1012.        computer and telephone technologies, provides insights into
  1013.        business and marketing opportunities and offers executive timely
  1014.        information on industry trend analysis.
  1015.      * Contact: Phillips Business Information
  1016.        1201 Seven Locks Rd., Potomac, Maryland, 20854, USA
  1017.        Ph: 1-800-777-5006 OR +1-301-340-1520
  1018.        Subscription FAX: +1-301-309-3847
  1019.        Editorial FAX: +1-424-4297
  1020.  
  1021.     Telleconnect
  1022.  
  1023.      * Contact: +1-212-691-8215
  1024.  
  1025.     Computer Telephony
  1026.  
  1027.      * Contact: +1-212-691-8215
  1028.  
  1029.     Voice Processing Magazine
  1030.  
  1031.      * Contact: 1-800-854-3112
  1032.  
  1033.     Speech Technology
  1034.  
  1035.      * Description: No longer published
  1036.  
  1037. Technical and Research Publications
  1038.  
  1039.     Computer Speech and Language
  1040.  
  1041.      * Price: $US170 (Institutions), $US75 (Individuals), 4 issues per
  1042.        year.
  1043.      * Publisher: Academic Press Limited
  1044.        24-28 Oval Road, London NW1, England
  1045.        WWW: http://www.apnet.com/
  1046.  
  1047.     Speech Communication
  1048.  
  1049.      * Contact: ESCA (see above)
  1050.      * Publisher: Elsevier Science B.V.
  1051.        P.O. Box 521, 1000 AM Amsterdam, The Netherlands.
  1052.        WWW: http://www.elsevier.com/
  1053.  
  1054.     IEEE Transactions on Speech and Audio Processing,
  1055.  
  1056.     IEEE Signal Processing Magazine,
  1057.  
  1058.     IEEE Transactions on Acoustics, Speech, and Signal Processing: OBSOLETE
  1059.  
  1060.      * Contact: IEEE (see above)
  1061.  
  1062.     Free Speech Journal
  1063.  
  1064.      * Description: A Web Journal dedicated to the state of the art in
  1065.        human language technology. Past volumes, editorial and submission
  1066.        information, and so on are
  1067.      * Contact: Editor-In-Chief: Ron Cole: cole@cse.ogi.edu
  1068.        WWW: http://www.cse.ogi.edu/CSLU/fsj/html/masthead.html
  1069.  
  1070.     Linguistics Abstracts Online
  1071.  
  1072.      * Description: online access to all abstracts published in
  1073.        Linguistics Abstracts since 1985, plus all current material as it
  1074.        becomes available. Over 250 publications are indexed. Free trial
  1075.        available.
  1076.        http://www.blackwellpublishers.co.uk/labs/
  1077.  
  1078.     Computational Linguistics
  1079.  
  1080.      * Contact: Published by Computational Linguistics Assoc. (see above)
  1081.  
  1082.     Journal of the Acoustical Society of America (JASA)
  1083.  
  1084.      * Contact: Published by Acoustical Society of America (see above)
  1085.  
  1086.     International Journal of Speech Technology (was the AVIOS Journal)
  1087.  
  1088.      * Description: Focuses on speech technology and its applications,
  1089.        and promotes research and description of all aspects of speech
  1090.        input and output: applications, base technology, theory, approach,
  1091.        experiment, and testing.
  1092.      * Publisher: Kluwer Academic Publishers
  1093.        101 Philip Drive, Norwell, MA 02061, USA
  1094.        Ph: +1-617-871-6300, Fax: +1-617-871-0449
  1095.      * Submissions to: International Journal of Speech Technology
  1096.        Journals Editorial Office, Ms. Kelly Riddle
  1097.        Kluwer Academic Publishers
  1098.        (Address, phone, fax as above)
  1099.        Email: krkluwer@world.std.com
  1100.  
  1101. Conferences
  1102.  
  1103.    ICSLP: Intl. Conference on Spoken Language Processing
  1104.           Next: 30 Nov to 4 Dec, 1998, Sydney, Australia
  1105.           Held in even years.
  1106.  
  1107.    ICASSP - Intl. Conf. Acoustics, Speech, and Signal Processing
  1108.  
  1109.    Eurospeech
  1110.  
  1111.    Computational Linguistics (COLING), held bi-annually
  1112.  
  1113.    International Voice Input/Output Applications Conference
  1114.  
  1115.    SST: Australian Speech Science and Technology Conference
  1116.  
  1117.    Also see the following lists on the WWW:
  1118.  
  1119.    Shikano's WWW site on Speech and Acoustics
  1120.           http://www.aist-nara.ac.jp/IS/Shikano-lab/database/internet-res
  1121.           ource/e-www-site.html
  1122.  
  1123.    Institute of Phonetic Sciences WWW list
  1124.           http://fonsg3.let.uva.nl/Other_pages.html#Meetings
  1125.  
  1126.  
  1127. ___________________________________________________________________________
  1128.  
  1129.                           Q1.6: Handicap Aids
  1130.  
  1131.    The following are products and companies which support users who can
  1132.    benefit from the use of speech technology in a user interface. Please
  1133.    feel free to submit information on relevant products, names of
  1134.    companies and links to useful information on the Internet (especially
  1135.    WWW sites).
  1136.    [Of course, most of the products listed in Q5.5 and Q6.5 are useful.]
  1137.  
  1138.           * Man-Machine Interfacing
  1139.           * SpeechViewer II
  1140.  
  1141.  
  1142.  
  1143. Man-Machine Interfacing
  1144.  
  1145.      * Description: Offers a service designed for people with physical
  1146.        challenges. Can successfully implement a computerized voice
  1147.        controlled system adapted to unique needs.
  1148.        They have developed a free-standing microphone and signal
  1149.        processing system to compensate for speech/articulation
  1150.        distortions, and background noise produced by electronic devices
  1151.        such as wheelchairs and respirators.
  1152.      * Contact: Man-Machine Interfacing
  1153.        P.O. Box 5371, Evanston, IL 60204
  1154.        Ph: 1-888-425-2001, Fax : (847) 328-7975
  1155.        Email: jwhite@mcs.com
  1156.        WWW: http://www.speechrec.com/
  1157.  
  1158.  
  1159.  
  1160. SpeechViewer II
  1161.  
  1162.      * Platform: IBM Machines from Mod 25 on.
  1163.      * Description: SpeechViewer II is a speech therapy tool. It provides
  1164.        graphical feedback of various speech features so that speech
  1165.        impaired individuals can improve their speech. It works with an
  1166.        audio bandwidth of 7.3 Khz and thus allows the therapist to work
  1167.        with sustained vowels and fricatives. A wide range of graphics are
  1168.        used to provide adequate variability to hold client interest. An
  1169.        extensive set of statistics are gathered which allows a therapist
  1170.        to do research or keep therapy records. The speech therapy modules
  1171.        are:
  1172.           + Awareness - Sound, Loudness, Pitch, Voicing Onset, Voicing
  1173.           + Skill Building - Pitch, Voicing, Phonology
  1174.           + Patterning - Pitch & Loudness - Waveform & Spectrogram,
  1175.             Spectra
  1176.           + Clinical Management - Profiles, Models, Client Data
  1177.        A multilingual option is available which provides support for 12
  1178.        languages: Danish, Dutch, Finnish, French, German, Icelandic,
  1179.        Italian, Norwegian, Portuguese, Spanish, Swedish, and UK English.
  1180.        With the Multilingual Option, clinicians can use SpeechViewer II
  1181.        as a training tool for English as a second language and for
  1182.        foreign language training.
  1183.      * Hardware: Requires an IBM M-ACPA (Multimedia-Audio Capture
  1184.        Playback Adapter). It has a TI TMS320C25 DSP chip. The input
  1185.        sampling rate is 44.1 Khz stereo, 88.2 Khz mono. This is a 16 bit
  1186.        card. It has the following jacks: mic in, stereo line in, stereo
  1187.        line out, speaker out. Note: This card is being replaced by Mwave
  1188.        technology. For more info on Mwave contact Texas Instruments.
  1189.      * Price:
  1190.           + The software is $2130 list, $1491 educational, part number
  1191.             92F2066.
  1192.           + The M-ACPA is $370 list, $222 educational, part number
  1193.             92F3378.
  1194.           + The MicroChannel adapter part number is 92F3379 (same price).
  1195.      * Contact: IBM Special Needs Information
  1196.        1000 N. W. 51st Street, Internal Zip 5432, Boca Raton, Florida
  1197.        33431, USA
  1198.        Ph: 1-800-426-4832, TDD: 1-800-426-4833, Fax: 1-407-982-6059
  1199.        Email: IBM_SPEC_NEEDS_INFO@vnet.ibm.com
  1200.        WWW: http://www.austin.ibm.com/pspinfo/snsspv2.html
  1201.  
  1202.  
  1203. ___________________________________________________________________________
  1204.  
  1205.                          Q1.7: Speech databases
  1206.  
  1207.    A wide range of speech databases have been collected. These databases
  1208.    are primarily for the development of speech synthesis/recognition and
  1209.    for linguistic research.
  1210.  
  1211.    Some databases are free but most are not. The databases normally
  1212.    require lots of storage space (100's of MBytes is not unusual). Do not
  1213.    expect to be able to ftp large amounts of speech data.
  1214.  
  1215.    In addition to the descriptions of speech databases and speech
  1216.    database providers below, information can be obtained from
  1217.  
  1218.     LDC: Linguistic Data Consortium
  1219.           Provides a very wide range of speech and text data to research
  1220.           and commercial users: see below.
  1221.  
  1222.     COCOSDA Home Page: http://www.itl.atr.co.jp/cocosda/
  1223.           The International Committee for the Co-ordination and
  1224.           Standardisation of Speech Databases and Assesment Techniques
  1225.           for Speech Input/Output.
  1226.  
  1227.     Shikano's WWW site on Speech and Acoustics
  1228.           http://www.aist-nara.ac.jp/IS/Shikano-lab/database/internet-res
  1229.           ource/e-www-site.html
  1230.  
  1231.     RELATOR Project
  1232.           European resource initiative: see below.
  1233.  
  1234.    The following speech data resources are described in the FAQ.
  1235.  
  1236.           * Bavarian Archive for Speech Signals
  1237.           * BUPT Spoken Digit Database (Chinese)
  1238.           * Center for Spoken Language Understanding (CSLU)
  1239.           * Examples of IPA Symbols
  1240.           * Linguistic Data Consortium (LDC)
  1241.           * NOISEX
  1242.           * Oxford Acoustic Phonetic Database
  1243.           * Phonemic Samples
  1244.           * RELATOR project
  1245.           * ShATR
  1246.           * University of Victoria Phonetic Database
  1247.  
  1248.  
  1249.  
  1250. Bavarian Archive for Speech Signals
  1251.  
  1252.      * Description: The Bavarian Archive for Speech Signals (BAS) was
  1253.        founded in January 1995 as an initiative of the Institute of
  1254.        Phonetics at the University of Munich, Germany. The BAS will
  1255.        develop, validate, administrate and disseminate corpora of spoken
  1256.        German to the speech community as well as to speech engineering
  1257.        industry. Presently the following German speech corpora are
  1258.        available on ISO 9660 CDROM:
  1259.  
  1260.         Siemens 1000 - SI1000
  1261.                 5 CDROMs, newspaper corpus, read speech, 10 speakers x
  1262.                 1000 utterances
  1263.  
  1264.         Siemens 100 - SI100
  1265.                 7 CDROMs, read speech, 101 speakers x 100 sentences
  1266.  
  1267.         PhonDat 1 - PD1
  1268.                 6 CDROMs, new edition in preparation, read speech, 201
  1269.                 speakers x 450+ sentences
  1270.  
  1271.         PhonDat 2 - PD2
  1272.                 1 CDROM, read speech, 2nd edition, 16 speakers x 200
  1273.                 sentences, various labelled information
  1274.  
  1275.         Verbmobil
  1276.                 Spontaneous speech recorded in a dialog task (appointment
  1277.                 scheduling). More information on the VERBMOBIL project:
  1278.                 http://www.dfki.uni-sb.de/verbmobil/
  1279.  
  1280.        Corpora in Preparation
  1281.  
  1282.         PhonDat I - PD1: 2nd extended edition (Jul 1995)
  1283.  
  1284.         Strange Corpora - SC
  1285.                 Reference Corpora that reflect certain well known
  1286.                 problems in speech processing, like accents, repair,
  1287.                 breaks, hesitations, repetitions, extreme F0, backround
  1288.                 noise, pathological speech, speaker adaptation. The first
  1289.                 SC corpus (SC1 Accents) will be edited in Jul 1995.
  1290.  
  1291.         BAS Edition of Verbmobil Corpora - VM: 2nd extended edition
  1292.  
  1293.         Articulatory data - AD: EMA data of speakers of SI1000 corpus
  1294.  
  1295.         ERBA: 10000 utterances from a train inquiry task
  1296.  
  1297.      * Misc: BAS is currently developing tools for the automatic
  1298.        annotation and segmentation of very large speech corpora. This
  1299.        includes the automatic detection of variants of pronunciation, a
  1300.        statistical based alignment and a rule-based refinement of the
  1301.        outcome. The BAS seeks to cooperate with public institutions as
  1302.        well as with industrial partners to further develop new German
  1303.        speech databases. BAS can be a platform to re-distribute existing
  1304.        German speech.
  1305.      * Contact and More Information: The BAS is located at the University
  1306.        of Munich, Germany.
  1307.        BAS c/o Institut fuer Phonetik
  1308.        Schellingstr. 3/II
  1309.        80799 Muenchen, Germany
  1310.        Ph: +49-89-21802758, Fax: +49-89-2800362
  1311.        Email: bas@sun1.phonetik.uni-muenchen.de
  1312.        WWW: http://www.phonetik.uni-muenchen.de/BASSeng.html
  1313.  
  1314.  
  1315.  
  1316. BUPT Spoken Digit Database (Chinese)
  1317.  
  1318.      * Vocabulary : {0, 1/yi/, 2, 3, 4, 5, 6, 7, 8, 9, 1/yao/, /dui/,
  1319.        /cuo/ }, 13 words in total.
  1320.      * Size: 1202 speakers in total, 789 Males and 413 Females. Each
  1321.        speaker utters each word 2 times. Total of 31252 utterances.
  1322.      * Format: 8000Hz 14bit sampling. One utterance per file.
  1323.      * Contact:
  1324.  
  1325.     GLuck Co.
  1326.     195 Berlioz 1C, Nun's Island
  1327.     Verdun H3E 1C1, Canada
  1328.     e-mail: weigang@zaphod.math.mcgill.ca
  1329.  
  1330.  
  1331.  
  1332. Center for Spoken Language Understanding (CSLU)
  1333.  
  1334.      * The ISOLET speech database of spoken letters of the English
  1335.        alphabet. The speech is high quality (16 kHz with a noise
  1336.        cancelling microphone). 150 speakers x 26 letters of the English
  1337.        alphabet twice in random order. The ISOLET data base can be
  1338.        purchased for $100 by sending an email request to
  1339.        vincew@cse.ogi.edu. (This covers handling, shipping and medium
  1340.        costs). The data base comes with a technical report describing the
  1341.        data.
  1342.      * CSLU has a telephone speech corpus of 1000 English alphabets.
  1343.        Callers recite the alphabet with brief pauses between letters.
  1344.        This database is available to not-for-profit institutions for
  1345.        $100. The data base is described in the proceedings of the
  1346.        International Conference on Spoken Language Processing.
  1347.           + Contact vincew@cse.ogi.edu if interested.
  1348.      * CSLU has released for universities its Continuous English Speech
  1349.        Corpus. The corpus contains recorded speech from 690 different
  1350.        speakers, with label files at various levels - including word
  1351.        level and phonetic labels. The data were collected as part of the
  1352.        OGI Multi-language telephone corpus. CSLU provides speech corpora
  1353.        to all universities without charge. To order a corpus, print the
  1354.        license agreement/order form, complete it, and fax it to the CSLU.
  1355.        A description of the corpora and an order form are available:
  1356.  
  1357.                 http://www.cse.ogi.edu/CSLU/
  1358.                 ftp://speech.cse.ogi.edu/pub/releases
  1359.  
  1360.      * Contact: Mike Noel: noel@cse.ogi.edu
  1361.  
  1362.  
  1363.  
  1364. Examples of IPA Symbols
  1365.  
  1366.   UCLA Sounds of the World's Languages
  1367.  
  1368.      * Description: The UCLA Sounds of the World's Languages are
  1369.        available for Macintosh users (no DOS based system currently
  1370.        available). The sounds are stored in a Hypercard database
  1371.        developed at the UCLA Phonetics Laboratory. The aim is to
  1372.        illustrate and teach about the range of sounds used in human
  1373.        languages with material on more than 80 languages. The set
  1374.        demonstrates particular highlights of the sound systems focusing
  1375.        especially on rarer sounds that students may not otherwise have a
  1376.        chance to hear from a native speaker. The recordings are based on
  1377.        the archives of recordings collected at UCLA, with additional
  1378.        contributions from outside collaborators. All the languages can be
  1379.        accessed from the list of language names, or by clicking on the
  1380.        language name in a set of maps. Support for part of this work was
  1381.        provided by NSF. The database currently includes examples of
  1382.        languages from Agul and Akan to Zulu.
  1383.      * Availability: 15 DSDD disks, requiring about 35 meg of disk space
  1384.        when expanded. Available for $50 individual $100 institutions.
  1385.        Prepayment in US dollars (checks or international money orders
  1386.        payable to "UC Regents") must accompany all orders.
  1387.      * Contact: The UCLA Phonetics Laboratory
  1388.        Linguistics Department, UCLA, Los Angeles, CA 90095 1543
  1389.        Tel: (310) 825-1254
  1390.        E-mail: oldfogey@ucla.edu
  1391.  
  1392.   John Eslings "IPA Labels"
  1393.  
  1394.      * Description: A HyperCard stack which is available for free or a
  1395.        nominal fee.
  1396.      * Contact: John Esling can be reached by email: pdb@uvvm.uvic.ca.
  1397.  
  1398.  
  1399.  
  1400. Linguistic Data Consortium (LDC)
  1401.  
  1402.    The LDC was established to broaden the collection and distribution of
  1403.    speech and natural language data bases for the purposes of research
  1404.    and technology development in automatic speech recognition, natural
  1405.    language processing and other areas where large amounts of linguistic
  1406.    data are needed. Detailed information on the LDC is now available on
  1407.    the WWW: http://www.ldc.upenn.edu/. The LDC WWW server provides
  1408.    information on membership agreements, license agreements, and
  1409.    summaries of speech and text corpora available.
  1410.  
  1411.     Speech Corpora
  1412.  
  1413.      * TIMIT Acoustic-Phonetic Continuous Speech Corpora and NYNEX
  1414.        Telephone Version of TIMIT Corpus (NTIMIT)
  1415.      * Resource Management Corpora
  1416.      * Air Travel Information System (ATIS) Corpora (multiple)
  1417.      * ARPA Continuous Speech Recognition Corpora (WSJ etc)
  1418.      * Switchboard Corpus of Recorded Telephone Conversations and
  1419.        Switchboard Corpus Excerpts (Credit Card Conversations)
  1420.      * Texas Instruments 46-Word Speaker-Dependent Isolated Word Corpus
  1421.        (TI46)
  1422.      * Texas Instruments Speaker-Independent Connected-Digit Corpus
  1423.        (TIDIGITS)
  1424.      * Road Rally Conversational Speech Corpus
  1425.      * HCRC Map Task Corpus
  1426.      * Air Traffic Control Corpus (ATC0)
  1427.      * SPIDRE Speaker Identification Corpus
  1428.      * YOHO Speaker Verification Corpus
  1429.      * OGI Multi-Language Corpus and OGI Spelled and Spoken Telephone
  1430.        Corpus
  1431.      * BRAMSHILL
  1432.      * MACROPHONE
  1433.      * King Corpus for Speaker Verification Research
  1434.      * WSJCAM0: Cambridge Read News Corpus
  1435.      * TRAINS Spoken dialog corpus
  1436.      * NYNEX PhoneBook Database
  1437.      * Frontiers in Speech Processing
  1438.  
  1439.     Text Corpora
  1440.  
  1441.      * Association for Computational Linguistics Data Collection
  1442.        Initiative (ACL/DCI)
  1443.      * The Penn Treebank Project - Release 2
  1444.      * TIPSTER Information Retrieval Text Research Collection
  1445.      * United Nations Parallel Text Corpus (English, French, Spanish)
  1446.      * Japanese Language Financial New
  1447.      * European Corpus Initiative-1
  1448.  
  1449.     Lexical Databases
  1450.  
  1451.      * CELEX Lexical Database
  1452.      * COMLEX : COMmon LEXical Database of English (English syntax and
  1453.        pronunciation)
  1454.  
  1455.     Contact information:
  1456.  
  1457.    Linguistic Data Consortium
  1458.    3615 Market Street, Suite 200, Philadelphia, PA, 19104-2608, USA.
  1459.    Phone: +1 (215) 898-0464 Fax: +1 (215) 573-2175
  1460.    e-mail: ldc@ldc.upenn.edu
  1461.    WWW: http://www.ldc.upenn.edu/
  1462.  
  1463.  
  1464. NOISEX-92
  1465.  
  1466.      * Description: Database of recording of various noises available on
  1467.        2 CDROMs. Some material from the same source is available by
  1468.        anonymous ftp in the IEEE's Signal Processing Information Base.
  1469.        The samples include
  1470.           + Voice babble
  1471.           + Factory noise
  1472.           + HF radio channel noise, pink noise, white noise
  1473.           + Various military noises; fighter jets (Buccaneer, F16),
  1474.             destroyer noises (engine room, operations room), tank noise
  1475.             (Leopard, M109), machine gun
  1476.           + Volvo 340
  1477.      * Availability 1: The cost of this database is 135 Pounds Sterling
  1478.        for the set of two CD-ROMs. Send payment with order to:
  1479.        The Speech Research Unit,
  1480.        Ex1, DRA Malvern, St.Andrew's Road,
  1481.        Malvern, Worcestershire, WR14 3PS, UK
  1482.        Tel +44-684-894074 Fax +44-684-894384
  1483.        Note: The supply of CD-ROMs is limited so please check that they
  1484.        are still available before placing an order. The only acceptable
  1485.        methods of payment are cheques (from the UK only) or bank drafts
  1486.        in Pounds Sterling drawn on a UK bank. They should be made payable
  1487.        to:-
  1488.        Public Sub Account HMG 4768.
  1489.      * Availability 2: Information on how to obtain a copy of the NATO
  1490.        RSG.10 NOISE-ROM-0 can be obtained from the DRA Speech Research
  1491.        Unit (address above) or from:
  1492.        Dr. Herman Steeneken,
  1493.        TNO Institute for Perception,
  1494.        P.O. Box 23, 3769 ZG Soesterberg,
  1495.        The Netherlands.
  1496.      * Availability 3 (WWW): Examples of the NOISEX database are
  1497.        available on the Rice University Digital Signal Processing (DSP)
  1498.        group home page. (Note the files are large (>20MB).
  1499.        http://spib.rice.edu/spib/select_noise.html
  1500.  
  1501.  
  1502.  
  1503. Oxford Acoustic Phonetic Database
  1504.  
  1505.      * Available on compact disc, from J. Pickering and B. Rosner. It
  1506.        contains data on vowel-consonant and consonant-vowel combinations
  1507.        in both stressed and unstressed locations. The language covered
  1508.        include French, German, Hungarian, Italian, Japanese, British
  1509.        English, Spanish and English. For further information write to
  1510.  
  1511.     Electronic Publishing, Oxford University
  1512.     Press, Walton Street, Oxford OX2 6DP, UK.
  1513.     The ISBN is 0-19-268086-2
  1514.      * Contact:
  1515.  
  1516.     Prof. B. Rosner
  1517.     Dept. of Experimental Psychology
  1518.     South Parks Rd, Oxford, OX1 3UD, UK
  1519.     email: burton.rosner@wolfson.ox.ac.uk
  1520.  
  1521.  
  1522.  
  1523. Phonemic Samples
  1524.  
  1525.      * Some basic data. The following ftp sites have samples of English
  1526.        phonemes (American accent I believe) in Sun audio format files.
  1527.        See Question 1.8 for information on audio file formats.
  1528.  
  1529.           ftp://sounds.sdsu.edu/.1/phonemes: This ftp site appears to be
  1530.           obsolete. Does anyone know a new address?
  1531.  
  1532.           ftp://phloem.uoregon.edu/pub/Sun4/lib/phonemes: There appears
  1533.           to be some config problem with this ftp server.
  1534.  
  1535.           ftp://sunsite.unc.edu/pub/multimedia/sun-sounds/phonemes
  1536.  
  1537.  
  1538.  
  1539. The RELATOR project
  1540.  
  1541.      * Description: RELATOR is a European-wide consortium of researchers
  1542.        who, with the support of the European Commission, are striving to
  1543.        establish a European repository of linguistic resources.
  1544.        Linguistic resources comprise a variety of spoken and written
  1545.        language materials, including lexicons, grammars, corpora, and
  1546.        spoken language databases. RELATOR will ensure that the
  1547.        requirements of the European language processing community receive
  1548.        attention.
  1549.        The RELATOR WWW pages provide information on the consortium, The
  1550.        languages currently covered by the RELATOR consortium include
  1551.        Danish, Dutch, English, French, German, Greek, Italian,
  1552.        Portuguese, Spanish plus multilingual resources. The resources
  1553.        include both text and speech.
  1554.      * WWW: http://cristal.icp.grenet.fr/Relator/homepage.html
  1555.  
  1556.  
  1557.  
  1558. ShATR
  1559.  
  1560.      * Description: Multi-simultaneous-speaker corpus available on one
  1561.        CDROM. This specialised corpus is primarily intended to provide
  1562.        acoustic material for studies in auditory scene analysis. However
  1563.        many researchers in the speech sciences, ranging from acoustics to
  1564.        discourse analysis may find it a valuable source of information.
  1565.        The corpus has been transcribed and aligned at four different
  1566.        levels of analysis. An overlap analysis between the individual
  1567.        speaker channels and word counts are available. There is also a
  1568.        general tool for accessing concurrent events in transcribed
  1569.        multi-sound-source databases.
  1570.      * Cost: 30 Pounds Sterling for one CD-ROM. Availability, licensing
  1571.        and ordering information is provided on ShATR's home page.
  1572.      * Examples: Samples of the ShATR database are available on ShATR's
  1573.        home page and by anonymous ftp
  1574.        ftp://ftp.dcs.shef.ac.uk/share/spandh/ShATR/
  1575.      * Contact: Speech and Hearing Research Group
  1576.        Department of Computer Science, University of Sheffield
  1577.        Regents Court, 211 Portobello Street, Sheffield S1 4DP, U.K.
  1578.        WWW:
  1579.        http://www.dcs.shef.ac.uk/research/groups/spandh/pr/ShATR/ShATR.ht
  1580.        ml
  1581.  
  1582.  
  1583.  
  1584. University of Victoria Phonetic Database
  1585.  
  1586.      * Platform: Computerized Speech Lab CSL4300, MultiSpeech on Winxx or
  1587.        Win95 with any multimedia card, or a SoundBlaster16 option with
  1588.        support from the PDBAUDIO program.
  1589.      * Description: Phonetic database consisting of proprietary format
  1590.        digitized speech samples from 45 world languages on CDROM. The
  1591.        CDROM is supported by hardcopy documentation containing the
  1592.        phonetic inventory of each language, transcriptions and
  1593.        orthography of each digitized speech sample. The PDB depicts and
  1594.        compares the the sounds, symbols and conventions of transcription
  1595.        used by these languages. More information is available from the
  1596.        STR web site.
  1597.      * Contact: Speech Technology Research Ltd.,
  1598.        Suite B - 1623 McKenzie Avenue, Victoria, B.C. V8N 1A6, Canada
  1599.        Ph: +1-250-477-0544
  1600.        Email: products@speechtech.com
  1601.        WWW: http://www.speechtech.com/home/speechtech/
  1602.  
  1603.  
  1604. ___________________________________________________________________________
  1605.  
  1606.                 Q1.8: Speech File Formats and Conversion
  1607.  
  1608.    Q2.7 of this FAQ has information on mu-law coding.
  1609.  
  1610.    A very good and very comprehensive list of audio file formats is
  1611.    prepared by Guido van Rossum. The list is posted regularly to comp.dsp
  1612.    and alt.binaries.sounds.misc, amongst others. It includes information
  1613.    on sampling rates, hardware, compression techniques, file format
  1614.    definitions, format conversion, standards, programming hints and lots
  1615.    more. It is also available by ftp from
  1616.  
  1617.           WWW: ftp://ftp.cwi.nl/pub/audio/index.html
  1618.  
  1619.           Text: ftp://ftp.cwi.nl/pub/audio/AudioFormats.part1,2
  1620.  
  1621.    A useful source of software (Sox, ulaw conversion, SoundKit etc) is:
  1622.  
  1623.           http://peace.wit.com/sounds/SoundConversion/
  1624.  
  1625.  
  1626. ___________________________________________________________________________
  1627.  
  1628.          Q1.9: Speech Laboratory Environments and Audio Editors
  1629.  
  1630.    First, what is a Speech Laboratory Environment? A speech lab is a
  1631.    software package which provides the capability of recording, playing,
  1632.    analysing, processing, displaying and storing speech. Your computer
  1633.    will require audio input/output capability. The different packages
  1634.    vary greatly in features and capability - best to know what you want
  1635.    before you start looking around.
  1636.  
  1637.    Most general purpose audio editing packages will be able to process
  1638.    speech but do not necessarily have some specialised capabilities for
  1639.    speech (e.g. formant analysis).
  1640.  
  1641.    The following article provides a good survey.
  1642.  
  1643.      * Read, C., Buder, E., & Kent, R. "Speech Analysis Systems: An
  1644.        Evaluation" Journal of Speech and Hearing Research, pp 314-332,
  1645.        April 1992.
  1646.  
  1647.    The following is a list of the speech labs described in the FAQ.
  1648.  
  1649.           * CSRE: Computerized Speech Research Environment
  1650.           * DADiSP from DSP Development Corporation
  1651.           * Entropic Signal Processing System (ESPS) and Waves
  1652.           * GoldWave
  1653.           * Kay Elemetrics Computer Speech Lab
  1654.           * Khoros
  1655.           * Matlab plus Signal Processing Toolbox
  1656.           * MacSpeech Lab II
  1657.           * N!Power
  1658.           * OGI Speech Tools
  1659.           * Ptolemy
  1660.           * Quadravox Speech Processing Products - Qbox
  1661.           * Speech Filing System (SFS)
  1662.           * Signalyze 3.0 from InfoSignal
  1663.           * SoundScope
  1664.  
  1665.  
  1666.  
  1667. CSRE: Computerized Speech Research Environment
  1668.  
  1669.      * Platform: DOS
  1670.      * Description: CSRE (pronounced "Caesar") is a speech processing
  1671.        system for the PC. It provides
  1672.           + Signal recording and playback
  1673.           + Signal editing
  1674.           + Pitch and spectral analysis and formant analysis
  1675.           + Speech synthesis with an implementation of the Klatt-1980
  1676.             parametric speech synthesizer
  1677.      * Requirements: PC compatible (80486DX), 1 Meg RAM (recommend 4M),
  1678.        DOS 3.2 (recommend 6.22), VGA graphics (640x480; 16 colors) 30 Meg
  1679.        of hard disk space (5 Meg for CSRE plus space for audio
  1680.        recordings), and a supported audio card .
  1681.      * Cost: See AVAAZ WWW Pages
  1682.      * Contact: AVAAZ Innovations Inc.
  1683.        P.O.Box 8040, 1225 Wonderland Rd. N, London, Ontario, CANADA, N6G
  1684.        2B0
  1685.        Ph: +1-519-472-7944, Fax: +1-519-472-7814
  1686.        Email: info@avaaz.com
  1687.        WWW: http://www.icis.on.ca/homepages/avaaz/
  1688.      * Note: See also the CSRE entry in Q5.5 on speech synthesisers.
  1689.  
  1690.  
  1691.  
  1692. DADiSP from DSP Development Corporation
  1693.  
  1694.      * Platform: Windows and various Unix
  1695.      * Description: DADiSP is designed for scientists and engineers to
  1696.        collect, analyze, and display scientific and technical data.
  1697.        Packages available include AdvDSP, Controls, DADiMP, Filters,
  1698.        GPIBLab, NeuralNet, and Stats.
  1699.        A description of the application of DADiSP to speech processing is
  1700.        provided on the DSP Development Corporation WWW site.
  1701.        Detailed product information is available on the DSP Development
  1702.        Corporation WWW site and by filling out a WWW form.
  1703.      * Cost: Unknown
  1704.      * Availability: See the DSP Development Corporation WWW site
  1705.        A free, fully featured demo of DADiSP 4.0 is available from the
  1706.        DSP Development Corporation WWW site and can be mailed on floppy
  1707.        disk.
  1708.        A special Student Edition of DADiSP is available for free.
  1709.      * Contact: DSP Development Corporation
  1710.        One Kendall Square, Cambridge, MA 02139, USA
  1711.        Ph: (617) 577-1133 Fax: (617) 577-8211
  1712.        EMail: info@dadisp.com
  1713.        WWW: http://www.dadisp.com/
  1714.  
  1715.  
  1716.  
  1717. Entropic Signal Processing System (ESPS) and Waves
  1718.  
  1719.      * Platform: Range of Unix platforms.
  1720.      * Description: ESPS is a comprehensive set of speech
  1721.        analysis/processing tools for the UNIX environment. The package
  1722.        includes UNIX commands, and a comprehensive C library (which can
  1723.        be accessed from other languages). Waves is a graphical front-end
  1724.        for speech processing. Speech waveforms, spectrograms, pitch
  1725.        traces etc can be displayed, edited and processed in X windows and
  1726.        Openwindows (versions 2 & 3). Waves also includes a signal
  1727.        labelling utility which provides multiple feature labelling and
  1728.        useful features for fast labelling of large speech databases.
  1729.        Other Entropic products are HTK (see Q6.5) and TrueTalk (see
  1730.        Q5.5).
  1731.      * Misc: A more detailed description is provided on the Entropic WWW
  1732.        pages (http://www.entropic.com/esps.html).
  1733.      * Cost: On request.
  1734.      * Contact:
  1735.  
  1736.     Entropic Research Laboratory, Washington Research Laboratory
  1737.     600 Pennsylvania Ave, S.E. Suite 202, Washington, D.C. 20003
  1738.     (202) 547-1420
  1739.     email: info@entropic.com
  1740.     WWW: http://www.entropic.com/
  1741.  
  1742.  
  1743.  
  1744. GoldWave
  1745.  
  1746.      * Platform: Windows
  1747.      * Description: GoldWave is a digital audio editor for Microsoft
  1748.        Windows. It features realtime amplitude/spectrum oscilloscopes,
  1749.        large file editing, effects, and support for a wide variety of
  1750.        sound formats.
  1751.           + Editing of multiple waveforms and large waveforms
  1752.           + Realtime amplitude/spectrum oscilloscopes
  1753.           + Resizable device controls window for accessing audio devices
  1754.           + Realtime fast forward and rewind playback
  1755.           + Effects: distortion, Doppler, echo, filter, mechanize,
  1756.             offset, pan, volume shaping, invert, resample, transpose, etc
  1757.           + Multiple file formats and conversions: .WAV, .AU, .IFF, .VOC,
  1758.             .SND, .MAT, .AIFF, and raw data
  1759.           + CD-ROM controls window
  1760.        More information is available on the GoldWave home page.
  1761.      * Cost: Shareware
  1762.      * Availability: Through the GoldWave home page:
  1763.        http://web.cs.mun.ca/~chris3/goldwave/goldwave.html
  1764.      * Contact: Chris Craig: chris3@cs.mun.ca
  1765.  
  1766.  
  1767.  
  1768. Kay Elemetrics CSL (Computer Speech Lab) 4300
  1769.  
  1770.      * Platform: Minimum IBM PC-AT compatible with extended memory (min
  1771.        2MB) with at least VGA graphics. More powerful machines
  1772.        preferable.
  1773.      * Description: Speech analysis package, with optional separate LPC
  1774.        program for analysis/synthesis. Uses its own file format for data,
  1775.        but has some ability to export data as ascii. The main
  1776.        editing/analysis prog (but not the LPC part) has its own macro
  1777.        language, making it easy to perform repetitive tasks.
  1778.        Options - more information on the Kay Elemetrics Corp. WWW site:
  1779.           + Multi-Dimensional Voice Program (MDVP)
  1780.           + Voice Range Profile (Phonetograph)
  1781.           + Real-Time Spectrogram
  1782.           + Sona-Match
  1783.           + Palatometer Database
  1784.           + IPA Transcription Tutorial
  1785.           + Delayed Auditory Feedback (DAF)
  1786.           + Disordered Voice Database
  1787.           + Auditory Perception Program and Database
  1788.           + Motor Speech Profile Program
  1789.           + CSL-Pitch
  1790.           + Real-Time EGG Processing
  1791.           + Signal Enhancement in Noise Program
  1792.           + Synthesis Program
  1793.           + DAT Interface and Four Channel Input
  1794.           + Phonetic Database
  1795.           + Direct-to-Disk Program
  1796.           + Programmers Kit
  1797.           + Condenser Microphone
  1798.           + Multi-Speech
  1799.      * Cost: Contact Kay Elemetrics Corp.
  1800.      * Contact: Kay Elemetrics Corp.
  1801.        2 Bridgewater Lane, Lincoln Park, NJ 07035, USA
  1802.        Ph: +1-201-628-6200, Fax: +1-201-628-6363
  1803.        Toll free tel. 1-800-289-5297
  1804.        [WWW: http://www.kayelemetrics.com/ - available soon]
  1805.  
  1806.  
  1807.  
  1808. Khoros
  1809.  
  1810.      * Platform: Any Unix - source code available.
  1811.      * Description: Khoros is a technical computing environment for image
  1812.        and signal processing, visual programming and software
  1813.        development.
  1814.      * Price: On request.
  1815.      * Availability: Khoral Research Inc.
  1816.        6001 Indian School Rd. NE Suite 200, Albuquerque, NM 87110, USA
  1817.        Ph: (505)837-6500, Fax: (505) 881-3842
  1818.        Email: info@khoral.com
  1819.        ftp: ftp://ftp.khoral.com/
  1820.        WWW: http://www.khoral.com/
  1821.  
  1822.  
  1823.  
  1824. Matlab plus Signal Processing Toolbox
  1825.  
  1826.      * Platform: Wide range
  1827.      * Description: Matlab (MATrix LABoratory) is a technical computing
  1828.        environment for numerical computation and visualization based on a
  1829.        matrix oriented, interpreted programming language. The programming
  1830.        environment provides support for the development of customized
  1831.        operations, along with debugging facilities and a graphical user
  1832.        interface toolkit. Audio output is provided.
  1833.        A specialised Signal Processing Toolbox is available which
  1834.        provides many functions which are useful for speech analysis. It
  1835.        includes filter design, spectral estimation, statistical signal
  1836.        processing, waveform generation, and signal and spectrogram
  1837.        display.
  1838.        A specialised Auditory Toolbox is available which contains
  1839.        functions useful to people interested in auditory/cochlear models.
  1840.        A more detailed description is given in Q1.10.
  1841.      * Price: On request.
  1842.      * Contact: The Math Works Inc. 24 Prime Park Way, Natick, MA
  1843.        01760-1500 USA
  1844.        Ph: 1-508-653 1415 Fax: 1-508-653 6284
  1845.        Email: info@mathworks.com
  1846.        ftp: ftp://ftp.mathworks.com
  1847.        WWW: http://www.mathworks.com/
  1848.  
  1849.  
  1850.  
  1851. MacSpeech Lab II (MSL II)
  1852.  
  1853.      * Platform: Macintosh
  1854.      * Description: A sound analysis and acquisition for Macs. MSL II
  1855.        delivers the most common functions for speech analysis (FFTs,
  1856.        LPCs, f0 extraction, etc.) & produces grayscale spectrographic
  1857.        displays. Can be used for various speech technology and phonetic
  1858.        training tasks.
  1859.      * Hardware: Requires MacADIOS ("Macintosh Analog/Digital
  1860.        Input/Output System") hardware for speech I/O at 12/16 bits.
  1861.      * Misc: Software no longer updated by GW Instruments; MSL
  1862.        soft/hardware will not perform input/output on Quadras, for
  1863.        example, though analysis seems fine. Known to operate properly on
  1864.        systems as high as IIcx & II fx.
  1865.      * Availability: MSL has been replaced by SoundScope; see the
  1866.        SoundScope entry for more detail.
  1867.      * Contact:
  1868.  
  1869.     GW Instruments
  1870.     35 Medford Street, Somerville, MA 02143, USA
  1871.     Phone: (617) 625-4096 Fax: (617) 625-1322
  1872.  
  1873.  
  1874.  
  1875. N!Power
  1876.  
  1877.      * Platform: SUN, DEC and HP workstations.
  1878.      * Description: An object-oriented software package with a MOTIF GUI
  1879.        interface and a range of functionality for data analysis/editing,
  1880.        signal analysis, speech processing, real-time A/D and D/A, and
  1881.        2D/3D interactive graphics. N!Power replaces ILS.
  1882.        N!Power can provide a Block Diagram user interface, menus,
  1883.        pop-ups, and a high-level IEEE standard symbolic scripting
  1884.        language. You can customize the blocks, menus and pop-ups with
  1885.        mouse point-and-click operations.
  1886.      * Contact: Signal Technology, Inc.
  1887.        104 W. Anapamu, Suite J, Santa Barbara, CA 93101-3126
  1888.        Phone: +1-805-899-8300, Fax: +1-805-899-4344
  1889.        Email: stisales@signal.com
  1890.        WWW: http://www.silcom.com/~stilarry/
  1891.  
  1892.  
  1893.  
  1894. OGI Speech Tools
  1895.  
  1896.      * Developers from the Center for Spoken Language Understanding
  1897.        (CSLU) at the Oregon Graduate Institute of Science and Technology
  1898.        (Portland Oregon)
  1899.      * Platform: Unix
  1900.      * Description: The OGI Speech tools include :
  1901.           + An X windows display tool (LYRE) for displaying data in a
  1902.             time synchronous fashion for a. the speech signal b.
  1903.             spectrograms c. phoneme labels, and other information.
  1904.           + A Neural Network (NOPT) training package.
  1905.           + An set of C library routines (LIBNSPEECH) for the
  1906.             manipulation of speech data, including: a. PLP Analysis, b.
  1907.             Rasta PLP Analysis, c. Linear Predictive Coding, d. Mel
  1908.             Cepstrum Coding, e. Fast Fourier Transform
  1909.           + A set of utilities for converting file formats such as ADC,
  1910.             NIST, mu-law, binary files, and ascii. Includes filtering.
  1911.           + A database utility (find_phone) to automate speech database
  1912.             related enquiries. It allows the user to specify a particular
  1913.             label or set of labels in a given context, display all
  1914.             occurrences of the label, and relabel the occurrences if
  1915.             desired.
  1916.           + A Vector-Quantizer based on the Linde Buzo and Gray (LBG)
  1917.             algorithm.
  1918.           + A set of PERL Scripts which have been used mainly to automate
  1919.             the use of the OGI Speech Tools.
  1920.           + MAN Pages for all routines and programs developed, as well as
  1921.             a User manual in both in postscript and tex format.
  1922.      * Misc: Software is written in ANSI C.
  1923.      * Contact: Email: tools@cse.ogi.edu
  1924.        WWW: http://www.cse.ogi.edu/CSLU/
  1925.        ftp: ftp://speech.cse.ogi.edu/pub/tools/
  1926.  
  1927.  
  1928.  
  1929. Ptolemy
  1930.  
  1931.      * Platform: Sun SPARC, DecStation (MIPS), HP (hppa).
  1932.      * Description: Ptolemy provides a highly flexible foundation for the
  1933.        specification, simulation, and rapid prototyping of systems. It is
  1934.        an object oriented framework within which diverse models of
  1935.        computation can co-exist and interact. Ptolemy can be used to
  1936.        model entire systems.
  1937.        Ptolemy has been used for a broad range of applications including
  1938.        signal processing, telecomunications, parallel processing,
  1939.        wireless communications, network design, radio astronomy, real
  1940.        time systems, and hardware/software co-design. Ptolemy has also
  1941.        been used as a lab for signal processing and communications
  1942.        courses. Ptolemy has been developed at UC Berkeley over the past 3
  1943.        years. Further information, including papers and the complete
  1944.        release notes, is available from the FTP site.
  1945.      * Cost: Free
  1946.      * Availability: The source code, binaries, and documentation are
  1947.        available by anonymous ftp from
  1948.  
  1949.                  ftp://ptolemy.berkeley.edu/pub/README
  1950.  
  1951.  
  1952.  
  1953. Quadravox Speech Processing Products - Qbox
  1954.  
  1955.      * Platform: Windows 3.1, Windows 95
  1956.      * Description: Qbox comprises a Windows-based LPC-12 analysis and
  1957.        editing sytem and a parallel-port driven programmer for
  1958.        one-time-programmable TI TSP50P11 synthesis chips. The analysis
  1959.        software utilizes standard 11025Hz, 16bit monaural .wav files for
  1960.        input and allows graphical editing of the coded pitch, gain, and
  1961.        reflection coefficients. It can also be used to define
  1962.        concatenation sequences of individual phrases. Data rates depend
  1963.        on the original sound, but are typically below 2000bits/sec. The
  1964.        processed data can then be merged with synthesis and control
  1965.        routines and programmed into the TI synthesizer. The
  1966.        Quadravox-developed synthesis routine accepts run-time
  1967.        modifications of pitch and frame-length (speed), as well as
  1968.        externally defined concatenation sequences. The synthesis chip
  1969.        interface can be defined as a matrixed-keyboard drive, a simple
  1970.        parallel control, or a serial bus control supporting up to 31
  1971.        individually addressed devices and modules.
  1972.      * Cost: $90-$150 depending on options selected.
  1973.      * Contact: Quadravox, Inc.
  1974.        1701 N. Greenville Ave., Suite 608, Richardson, TX, 75081 USA
  1975.        Ph: 214-669-4002
  1976.        Email: info@quadravox.com
  1977.        WWW: http://www.quadravox.com/
  1978.  
  1979.  
  1980.  
  1981. Speech Filing System (SFS)
  1982.  
  1983.      * Platform: Unix and DOS
  1984.      * Description: SFS provides a computing environment for conducting
  1985.        speech research. It comprises software tools, file and data
  1986.        formats, subroutine libraries, graphics, standards and special
  1987.        programming languages. It performs standard operations such as
  1988.        recording, replay, waveform editing and labelling, spectrographic
  1989.        and formant analysis and fundamental frequency estimation. For
  1990.        more information, see
  1991.        ftp://pitch.phon.ucl.ac.uk/pub/sfs/README
  1992.      * Misc: SFS is copyrighted University College London, but is
  1993.        currently supplied free of charge to research establishments for
  1994.        non-profit use.
  1995.      * Availability: SFS source code is available by anonymous FTP from:
  1996.        ftp://pitch.phon.ucl.ac.uk/pub/sfs/
  1997.      * Contact: Mark Huckvale
  1998.        University College London, Gower Street, London WC1E 6BT, UK
  1999.        Email: SFS@phonetics.ucl.ac.uk
  2000.        ftp: ftp://pitch.phon.ucl.ac.uk/pub/sfs/
  2001.  
  2002.  
  2003.  
  2004. Signalyze 3.0 from InfoSignal
  2005.  
  2006.      * Platform: Macintosh
  2007.      * Description: Signalyze is an interactive program for the analysis
  2008.        of speech and other acoustic material. Signalyze's basic concept
  2009.        revolves around the display of up 100 signals in HyperCard
  2010.        fashion. The program offers a range of signal editing features,
  2011.        spectral analysis tools, manual scoring tools, pitch extraction
  2012.        routines, signal manipulation tools, and extensive input-output
  2013.        capacity. It also has a range of capabilities for creating,
  2014.        editing and manipulating label files with flexibility in labelling
  2015.        format.
  2016.        Signalyze handles the following file formats: Signalyze, MacSpeech
  2017.        Lab, AudioMedia, SoundDesigner II, SoundEdit/MacRecorder,
  2018.        SoundWave, sound resource formats, and ASCII-text.
  2019.        Sound I/O: Direct sound input from Apple 8- or 16-bit sound input
  2020.        Sound output via Macintosh 8- or 16-bit sound.
  2021.      * Compatibility: MacPlus and higher. Takes advantage of large
  2022.        screens, multiple screens and 16/256 color/grayscales. System 7.0
  2023.        compatible. Runs in background with adjustable priority.
  2024.      * Misc: Manuals and tutorials included (250 pp.). Program is
  2025.        switchable to English, French, and German. For more information
  2026.        and demo:
  2027.        WWW: http://www.agoralang.com:2410/pubdirsoftware.html
  2028.        WWW: http://www.agoralang.com:2410/signalyze.html
  2029.        Gopher: gopher://uldns1.unil.ch:70/11/unilgophers/gopher_lett/LAIP
  2030.      * Cost: Individual licence US$450, departmental license US$750,
  2031.        organisational license US$1250, plus shipping. Upgrades from
  2032.        version 2.0 are available.
  2033.      * Contact: The Americas: Network Technology Corporation
  2034.        91 Baldwin St., Charlestown, MA 02129, USA
  2035.        Phone: +1-617-241-9205, Fax: +1-617-241-5064
  2036.        ---
  2037.        Elsewhere: InfoSignal Inc.
  2038.        C.P. 73, 1015 LAUSANNE, Switzerland,
  2039.        Fax: +41 21 691-1372,
  2040.        Email: 76357.1213@COMPUSERVE.COM
  2041.  
  2042.  
  2043.  
  2044. SoundScope
  2045.  
  2046.      * Platform: Macintosh: 68K and PowerPC native
  2047.      * Description: The SoundScope product family is used primarily in
  2048.        speech teaching & research, with some applications in animal
  2049.        sounds, forensics, and general acoustic analysis. It can record,
  2050.        view, analyze, play, copy, paste, store and print sound waveforms.
  2051.        Analysis functions include spectrogram, fundamental frequency
  2052.        (Fo), Linear Predictive Coding (LPC) including formant tracking,
  2053.        LPC residual, jitter (pitch perturbation), shimmer (amplitude
  2054.        perturbation), HNR, frequency spectrum, spectral slice, envelope,
  2055.        energy and zero crossing. Includes limited built-in filtering,
  2056.        runs any filter created with WLFDAP. An integrated text editor
  2057.        stores notes and calculation results. SoundScope lets you design
  2058.        your own custom "instrument" screen, tasks (macros) and menus.
  2059.        Supplied instruments include 1 channel analyser (dual snap, dual
  2060.        time, spectrogram, spectrum), 2 channel analyser, segment
  2061.        analyser, multi-channel recorder, etc.
  2062.      * Note: Supercedes MacSpeech Lab II.
  2063.      * Price: $490 to $4990, less educational discount
  2064.      * Availability: In North America, directly from GW Instruments.
  2065.        Contact the company for international distributors.
  2066.      * Contact: GW Instruments
  2067.        35 Medford Street, Somerville, MA 02143, USA
  2068.        Ph: +1-617-625-4096, Fax: +1-617-625-1322
  2069.        Email: info@gwinst.com
  2070.  
  2071.  
  2072. ___________________________________________________________________________
  2073.  
  2074.                       Q1.10: Speech Research Sites
  2075.  
  2076.    Rather than try to list the places round the world which perform
  2077.    speech research this FAQ lists sites on the WWW where other
  2078.    comprehensive lists are maintained. Try the following:
  2079.  
  2080.     Shikano's WWW site on Speech and Acoustics
  2081.           http://www.aist-nara.ac.jp/IS/Shikano-lab/database/internet-res
  2082.           ource/e-www-site.html
  2083.           Lists of speech research sites by country. Currently includes
  2084.           around 100 sites. The list of Japanese sites is particularly
  2085.           comprehensive.
  2086.  
  2087.     Mambo Speech Research List
  2088.           http://mambo.ucsc.edu/psl/speech.html
  2089.           Lists about 50 speech research sites and related information
  2090.           sources. Very nice presentation!
  2091.  
  2092.     ESCA: European Speech Communication Association
  2093.           http://ophale.icp.grenet.fr/esca/labos.html
  2094.           Links to around 15 European speech research sites and around 15
  2095.           related sources of information.
  2096.  
  2097.     Institute for Perception Research: Speech on the Web
  2098.           http://www.tue.nl/ipo/hearing/webspeak.htm
  2099.           Jan Roelof de Pijper at the Institute for Perception Research
  2100.           has a long list of research sites plus links to lots of other
  2101.           speech material on the WWW.
  2102.  
  2103.     Russ Wilcox's list of Commercial Speech Recognition
  2104.           http://www.tiac.net/users/rwilcox/speech.html
  2105.           Links to information on speech technology vendors, speech
  2106.           research labs, speech resources, on-line demos and more.
  2107.  
  2108.     Speech Groups List: Leeds University Cognitive Psychology
  2109.           Research Group
  2110.           http://lethe.leeds.ac.uk/research/cogn/speechlab/other.html
  2111.           List of about 25 research sites.
  2112.  
  2113.     Institute of Phonetic Sciences, Amsterdam
  2114.           http://fonsg3.let.uva.nl/Other_pages.html#Phonetics
  2115.           Good list of European sites.
  2116.  
  2117.     Speech and Hearing Research Group, University of Sheffield,
  2118.           UK
  2119.           http://www.dcs.shef.ac.uk/research/groups/spandh/world/misclink
  2120.           s.html
  2121.           Links to sites in the UK, USA, Europe and the rest of the
  2122.           world.
  2123.  
  2124.     Duncan M. Forrest's Speech Recognition Resource List
  2125.           http://www.skye.co.za/dmf/speech/
  2126.  
  2127.    Most speech research sites have links to other speech research sites
  2128.    somewhere in their WWW pages.
  2129.  
  2130.  
  2131. ___________________________________________________________________________
  2132.  
  2133.               Q1.11: Miscellaneous Software and Resources.
  2134.  
  2135.    Speech Interface Standards: APIs etc
  2136.  
  2137.           * ASAPI: Advanced Speech API (AT&T)
  2138.           * SAPI: Microsoft Windows Speech API
  2139.           * SRAPI: Speech Recognition API
  2140.           * TAPI: Microsoft Windows Telephony API
  2141.  
  2142.    Network "Phone" Software
  2143.  
  2144.           * CUSeeMe
  2145.           * CyberPhone
  2146.           * DigiPhone
  2147.           * InterFACE from Hijinx
  2148.           * FAQ: How can I use the Internet as a telephone?
  2149.           * Nautilus: Secure Computer Telephony
  2150.           * NEVOT (1.4v) from AT&T BL
  2151.           * PGPfone
  2152.           * Speak Freely
  2153.           * Internet Phone from VocalTec
  2154.           * WebPhone
  2155.           * WebTalk
  2156.  
  2157.    Audio Processing Software
  2158.  
  2159.           * AF version AF3R1
  2160.           * Voice E-Mail from Bonzi Software
  2161.           * MicNotePad Recording Software for Macs
  2162.           * MixViews
  2163.           * Network Audio System Release 1.1
  2164.           * NIST Software - SPHERE and SCORE
  2165.           * Sound Processing Kit
  2166.           * TCPplay
  2167.  
  2168.    Human Audio Perception
  2169.  
  2170.    Other useful information on Auditory Modeling can be found in
  2171.  
  2172.    Malcolm Slaney's home page
  2173.           http://www.interval.com/~malcolm/
  2174.  
  2175.    Martin Cooke's home page
  2176.           Speech and Hearing Research Group, Dept of Computer Science,
  2177.           University of Sheffield, UK.
  2178.           http://www.dcs.shef.ac.uk/~martin/
  2179.  
  2180.           * Auditory Modeller 1
  2181.           * Auditory Modeller 2
  2182.           * Auditory Toolbox for Matlab
  2183.           * Human Audio Perception Document
  2184.  
  2185.    Dictionaries and other Lexical Tools
  2186.  
  2187.           * BEEP dictionary
  2188.           * CMU dictionary
  2189.           * CUVOLAD dictionary (Oxford Dictionary)
  2190.           * Comprehensive Word List
  2191.           * EAT: Edinburgh Associative Thesaurus
  2192.           * Homophone List
  2193.           * Moby Lexical Resources
  2194.           * MRC Psycholinguistic Database
  2195.           * WordNet
  2196.           * Dictionaries on the WWW
  2197.  
  2198.    Phonetic Fonts and Phonetic Samples
  2199.  
  2200.           * International Phonetic Alphabet
  2201.           * WWW: Phonetic Fonts and Examples Online
  2202.           * Summer Institute of Linguistics IPA Fonts
  2203.           * Phonetic Fonts for TeX and LaTeX
  2204.           * Yamada Language Center
  2205.  
  2206.    Subjective Evaluation of Speech Quality
  2207.  
  2208.    Dynastat, Inc.
  2209.           Speech Intelligibility Testing with Diagnostic Rhyme Test
  2210.           (DRT), Modified Rhyme Test (MRT), Phonetically Balanced Word
  2211.           Lists (PB), Diagnostic Medial Consonant Test (DMCT), Diagnostic
  2212.           Alliteration Test (DALT), ICAO Spelling Alphabet Test (SpAT)
  2213.           Speech Quality (Acceptability) Evaluation with Diagnostic
  2214.           Acceptability Measure (DAM), Mean Opinion Score (MOS),
  2215.           Degredation Mean Opinion Score (DMOS)
  2216.           Contact: Dynastat, Inc.
  2217.           2704 Rio Grande, Suite 4, Austin, TX 78705, USA
  2218.           Ph: +1-512-476-4797, Fax: 512/472-2883
  2219.           Email: sharpley@dynastat.com
  2220.           WWW: http://www.bga.com/dynastat/
  2221.  
  2222.    ANSI S3.2-1989: American National Standard for Measuring the
  2223.           Intelligibility of Speech Over Connunication Systems
  2224.           Available from American National Standards Institute (ANSI)
  2225.           Ph: +1-212-642-4900, Fax: +1-212-398-0023
  2226.           WWW: http://www.ansi.org/
  2227.  
  2228.    Louis Pols' List of References on Synthesis Development And Assessment
  2229.  
  2230.           700 references:
  2231.           http://www.itl.atr.co.jp/cocosda/output/synth.refs
  2232.  
  2233.    Very Miscellaneous
  2234.  
  2235.           * The vOICe
  2236.           * The Learning Company's Language Training
  2237.           * Wildfire - an Electronic Assistant
  2238.  
  2239.  
  2240.  
  2241. ASAPI: Advanced Speech API (AT&T)
  2242.  
  2243.      * Description: The AT&T ASAPI Specification is a open,
  2244.        cross-platform, easy-to-use speech API that can support speech
  2245.        engines from AT&T and other vendors. ASAPI does not replace the
  2246.        Microsoft Speech API, but it provides extensions and enhancements
  2247.        to the Microsoft SAPI Specification including support for
  2248.        SAPI-compatible applications.
  2249.        The ASAPI Specification defines two types of interfaces. The
  2250.        "ASAPI Extensions" interface which provides extensions to the
  2251.        MS-SAPI interface as well as C++ class encapsulation of SAPI
  2252.        functionality. The "Visual ASAPI" interface provides an even
  2253.        higher-level abstraction of SAPI/ASAPI low-level functionality
  2254.        such that application developers can quickly and easily embed
  2255.        speech technology into existing or new applications. Special
  2256.        Purpose Recognizers are examples of Visual ASAPI interfaces which
  2257.        integrate lower-level functionality that an application developer
  2258.        can access via a simple interface.
  2259.      * More information: Contact Jose Garcia at AT&T on (908) 957-5457 or
  2260.        by email: jrg@att.com. For more information on the WATSON Speech
  2261.        Engine which supports ASAPI and news about ASAPI please visit the
  2262.        AT&T Advanced Speech Products Group home page or call
  2263.        1-800-5-WATSON.
  2264.  
  2265.  
  2266.  
  2267. SAPI: Microsoft Windows Speech API
  2268.  
  2269.      * Platform: Windows 95 and Windows NT 3.51
  2270.      * Description: The Microsoft Speech API provides applications with
  2271.        the ability to incoporate speech recognition (command & control or
  2272.        dictation) or text-to-speech, using either C/C++ or Visual Basic.
  2273.        SAPI follows the OLE Component Object Model (COM) architecture. It
  2274.        is supported by many major speech technology vendors. The major
  2275.        interfaces are
  2276.           + Voice Commands: high level speech recognition API for command
  2277.             and control.
  2278.           + Voice Text: simple high level text-to-speech API.
  2279.           + Speech Recognition: provides detailed control of a speech
  2280.             recognition engine for both command-and-control and
  2281.             dictation.
  2282.           + Text-to-Speech: provides detailed interface to a
  2283.             text-to-speech engine for control of playback, speaking
  2284.             style, voice quality etc.
  2285.           + Multimedia Audio Objects: audio I/O for microphones,
  2286.             headphones, speakers, telephone lines, files etc.
  2287.      * Availability: Download Microsoft's latest speech technology,
  2288.        including the Microsoft Speech SDK, command and control
  2289.        recognition, the Microsoft dictation research demonstration and
  2290.        text-to-speech.
  2291.      * More information: Email: MSSpeech@Microsoft.Com
  2292.        WWW: The Microsoft Speech API
  2293.        WWW: An Overview of the Microsoft Speech API
  2294.        Documentation included with the Microsoft SDK.
  2295.      * See also: TAPI: Microsoft Telephone API
  2296.  
  2297.  
  2298.  
  2299. SRAPI: Speech Recognition API
  2300.  
  2301.      * Platform: Various
  2302.      * Description: The SRAPI provides support for speech recognition,
  2303.        text-to-speech and other media playback. The SRAPI Committee is a
  2304.        nonprofit Utah corporation with the goal of providing solutions
  2305.        for interaction of speech technology with applications.
  2306.        Core members include: Novell, Inc., Dragon Systems, IBM, Kurzweil
  2307.        AI, Intel, and Philips Dictation Systems. Additional contributing
  2308.        members include Articulate Systems, DEC, Kolvox Communications,
  2309.        Lernout and Hauspie, Syracuse Language Systems, Voice Control
  2310.        Systems, Corel, Verbex and Voice Processing Corporation.
  2311.      * More information: WWW: http://www.srapi.com/
  2312.        Email: For more information on the SRAPI Developer CD, send email
  2313.        to srapi@srapi.com with Subject "SRAPI CD Info".
  2314.  
  2315.  
  2316.  
  2317. TAPI: Microsoft Windows Telephony API
  2318.  
  2319.      * Description: TAPI allows applications to support telephone
  2320.        communication. TAPI facilitates include:
  2321.           + Connecting directly to a telephone network.
  2322.           + Automatic phone dialing.
  2323.           + Transmission of data (files, faxes, electronic mail).
  2324.           + Access to data (news, information services).
  2325.           + Conference calling.
  2326.           + Voice mail.
  2327.           + Caller identification.
  2328.           + Control of a remote computer.
  2329.           + Collaborative computing over telephone lines.
  2330.        Windows 95 comes with a telephony application, DIALER.EXE, that
  2331.        can dial voice calls, act as a proxy for applications making
  2332.        simple telephony requests, and maintain a call log.
  2333.      * More information: The Win32 Software Development Kit (SDK)
  2334.        contains documentation, tools, and sample code for TAPI including
  2335.        the Microsoft Telephony Programmer's Reference and the Microsoft
  2336.        Telephony Service Provider Interface (TSPI) for Telephony.
  2337.        WWW: Tapping in TAPI, TAPI White Paper
  2338.      * See also: SAPI: Microsoft Speech API
  2339.  
  2340.  
  2341.  
  2342. CUSeeMe
  2343.  
  2344.      * Platform: Macintosh and Windows
  2345.      * Description: Cornell University software for audio and video
  2346.        conferencing over the Internet.
  2347.      * Requirments: Macintosh to RECEIVE video:
  2348.           + Macintosh platform with a 68020 processor or higher
  2349.           + System 7 or higher operating system
  2350.           + Minimum 16-level-grayscale (e.g. color)
  2351.           + IP network connection and MacTCP
  2352.           + Apple's QuickTime, to receive slides with SlideWindow
  2353.        Macintosh to SEND video:
  2354.           + All the above plus
  2355.           + Quicktime installed
  2356.           + video digitizer (with vdig software) and Camera
  2357.        For Windows:
  2358.           + Video receive only 386SX, Video send & receive 386DX, Video
  2359.             receive w/Audio 486SX, Video send & receive w/Audio 486DX
  2360.           + Windows 3.1 or higher running in Enhanced Mode.
  2361.           + Winsock
  2362.           + 256 color (8 bit) video driver
  2363.           + Video camera and a video capture board that supports
  2364.             Microsoft Video For Windows
  2365.           + For audio: Windows Sound board that conforms to the Windows
  2366.             MultiMedia Specification, speakers and a microphone
  2367.      * Availability: Mac: http://cu-seeme.cornell.edu/get_cuseeme.html
  2368.        Windows: http://cu-seeme.cornell.edu/PC.CU-SeeMeCurrent.html
  2369.      * More information: http://cu-seeme.cornell.edu/
  2370.  
  2371.  
  2372.  
  2373. CyberPhone
  2374.  
  2375.      * Platform: Sun Workstations running Solaris 2.x (SunOS 5.x)
  2376.      * Description: Provides voice communications over the internet. Has
  2377.        a graphical user interface and requires no additional hardware. An
  2378.        optional centralized server system is available to make finding
  2379.        and connecting to other users easier.
  2380.      * Availability: a free demonstration is available by anonymous ftp
  2381.  
  2382.                 ftp://magenta.com/pub/cyberphone
  2383.  
  2384.      * Contact: Email: cyberphone@magenta.com. More information is
  2385.        available on the WWW: http://magenta.com/cyberphone/.
  2386.  
  2387.  
  2388.  
  2389. DigiPhone
  2390.  
  2391.      * Platform: Macintosh, Windows 3.1 and Windows 95
  2392.      * Description: DigiPhone provides two-way phone conversations by
  2393.        dialing direct and over the Internet. Includes encryption for
  2394.        privacy, caller ID, call screening, call timer, adjustable sound
  2395.        and compression quality, messaging, and access to the Global
  2396.        Directory providing a database of DigiPhone users.
  2397.           + DigiPhone v1.03: provides the standard features listed above.
  2398.             [ More information].
  2399.           + DigiPhone Deluxe: provides the standard features of DigiPhone
  2400.             v1.03 and adds conference calling, mute, speed dial, call
  2401.             recording and playback, voice effects, customizations, and
  2402.             internet tools. [ More information].
  2403.           + DigiPhone for Mac: provides the standard features listed
  2404.             above, plus cross-platform compatibility and mute. [ More
  2405.             information].
  2406.      * Requirements: DigiPhone v1.03 requires 386DX/33 or faster, 4MB
  2407.        RAM, 9,600 bps modem, Sound Blaster 16 card (or any compatible
  2408.        half or full duplex card), and a local internet connection with
  2409.        SLIP or PPP. [Recommend 486DX/33 and 14,400 bps modem]
  2410.        DigiPhone Deluxe has the same requirements on v1.03 but requires
  2411.        486DX/33 or faster.
  2412.        DigiPhone for Mac requires a 68030 33Mhz, 68040 25Mhz or Power PC,
  2413.        4 MB RAM, System 7.x, 14,400 bps modem or better, Sound Manager
  2414.        3.x for System 7, microphone and speakers, MacTCP or Open
  2415.        Transport and a local internet connection with SLIP or PPP.
  2416.      * Price and Availability: Contact Third Planet Publishing for
  2417.        pricing. Trial software is available from Third Planet Publishing.
  2418.        Orders and Upgrades can be made on the Web. Also available through
  2419.        many retailers.
  2420.      * Contact: Third Planet Publishing, Inc.
  2421.        17770 Preston Rd, Dallas, Texas 75252, USA
  2422.        Ph: +1-972-733-3005, Fax: +1-972-380-8712
  2423.        Email: 3pp@planeteers.com
  2424.        WWW: http://www.planeteers.com/
  2425.  
  2426.  
  2427.  
  2428. InterFACE from Hijinx
  2429.  
  2430.      * Platform: Windows
  2431.      * Description: InterFACE provides voice communication on the
  2432.        Internet through IRC (Internet Relay Chat) services.
  2433.      * Requirments: Recommend a 486DX, 8meg Ram, Windows, VGA Monitor and
  2434.        a 16 bit sound card.
  2435.      * Availability: Available on CD Only for $60.00 US, which includes,
  2436.        postage and handling.
  2437.        Demo versions available from the HiJiNX WWW site.
  2438.      * Contact: HiJiNX, Brisbane, Australia
  2439.        Email: jester@hijinx.com.au
  2440.        WWW: http://www.hijinx.com.au/
  2441.  
  2442.  
  2443.  
  2444. FAQ: How can I use the Internet as a telephone?
  2445.  
  2446.      * Description: Kevin M. Savetz and Andrew Sears have prepared an FAQ
  2447.        document titled _FAQ: How can I use the Internet as a telephone?_
  2448.        The current document has the following sections:
  2449.           + Can I use the Internet as a telephone?
  2450.           + What do I need to call others on the Internet?
  2451.           + How does it work?
  2452.           + How do I make calls using a modem?
  2453.           + Is the sound quality as good as a regular telephone?
  2454.           + Is there a noticeable delay in hearing the other user?
  2455.           + What is the difference between full duplex and half duplex?
  2456.           + What is multicasting?
  2457.           + Can I talk to users of other phone software?
  2458.           + What software is available?
  2459.        The section on available software covers the following:
  2460.           + Mac: Maven, NetPhone, CU-Seeme, PGPfone
  2461.           + Windows: Speak Freely, CU-Seeme, Internet Phone, Digiphone,
  2462.             Internet Voice Chat, Internet Global Phone, Web Phone
  2463.           + UNIX: Speak Freely, nevot, vat, mtalk, ztalk
  2464.      * Availability:
  2465.  
  2466.         By Email
  2467.                 Mail voice-faq-request@northcoast.com
  2468.                 with "Subject: archive"
  2469.                 and "Body: send voice-faq"
  2470.  
  2471.         FTP
  2472.                 ftp://rtfm.mit.edu/pub/usenet/alt.internet.services/FAQ:_
  2473.                 How_can_I_use_the_Internet_as_a_telephone?
  2474.  
  2475.         WWW:
  2476.                 http://rpcp.mit.edu/~asears/voice-faq.html
  2477.  
  2478.      * Contact: Andrew Sears: asears@mit.edu
  2479.        Kevin Savetz: savetz@northcoast.com
  2480.  
  2481.  
  2482.  
  2483. Nautilus: Secure Computer Telephony
  2484.  
  2485.      * Platform: DOS, Linux, SunOS, Solaris.
  2486.      * Description: Nautilus is software which allows two users to hold a
  2487.        secure conversation with either over ordinary phone lines or over
  2488.        a computer network. Nautilus uses your computer's audio hardware
  2489.        to digitize and play back your speech using speech compression
  2490.        algorithms built into the program. It encrypts the compressed
  2491.        speech using your choice of the Blowfish, Triple DES, or IDEA
  2492.        block ciphers, and transmits the encrypted packets over the
  2493.        internet or your modem to another computer. At the other end, the
  2494.        process is reversed. Nautilus operates in half duplex mode like a
  2495.        speakerphone -- only one person can talk at a time. Either user
  2496.        can hit a key to switch between talking and listening. Audio
  2497.        quality ranges from fair to very good depending on which of the
  2498.        four speech coders is selected. The Nautilus WWW page provides
  2499.        more detailed information.
  2500.      * Requirements: Nautilus runs on IBM PC-compatible computers
  2501.        (386DX25 or faster) under MSDOS or Linux as well as audio-capable
  2502.        Sun workstations running SunOS or Solaris. The MSDOS version of
  2503.        Nautilus requires a Soundblaster compatible sound card and
  2504.        currently only runs over ordinary phone lines with a modem. To use
  2505.        Nautilus over ordinary telephone lines, a modem capable of
  2506.        connecting at 4800 bps or faster is required.
  2507.      * Availability: Nautilus is available in three different formats. As
  2508.        a DOS executable, it is available as an archive in zip format
  2509.        along with it's associated documentation. In source format, it is
  2510.        available as either a zip-ed archive, or a gzip-compressed tar
  2511.        archive.
  2512.        Nautilus is distributed freely (subject to US export restrictions)
  2513.        with full source code. This insures that its security can be
  2514.        independently examined and verified. Follow the instructions in
  2515.        the following README files to obtain Nautilus.
  2516.           + ftp://ftp.csn.org/mpj/README
  2517.           + ftp://ripem.msu.edu/pub/crypt/README
  2518.      * More information: WWW: http://www.lila.com/nautilus/
  2519.      * Contacts: The Nautilus development team includes Bill Dorsey, Paul
  2520.        Rubin, Andy Fingerhut, Paul Kronenwetter, Bill Soley, and Pat
  2521.        Mullarky. To contact the developers, send email to
  2522.        nautilus@lila.com.
  2523.  
  2524.  
  2525.  
  2526. NEVOT (1.4v) from AT&T BL
  2527.  
  2528.      * Platforms: Sun Sparc Station (SunOS 4.1.x) and Silicon Graphics
  2529.      * Description: Audio-conferencing tool which supports both
  2530.        point-to-point and broadcasting of audio using multicast IP. Audio
  2531.        encoding:
  2532.           + PCM 64kb/s 8-bits u-law encoded 8KHz PCM (G.711)
  2533.           + ADPCM 32 kb/s [Sun only] (G.721)
  2534.           + DVI ADPCM 32 kb/s
  2535.           + ADPCM 24 kb/s [Sun only] (G.723)
  2536.           + CELP 4.8 kb/s
  2537.           + LPC 2.4 kb/s
  2538.      * Availability: by anonymous ftp from
  2539.  
  2540.                  ftp://gaia.cs.umass.edu/pub/hgschulz/nevot
  2541.  
  2542.      * Contact: Henning Schulzrinne (hgs@researh.att.com)
  2543.  
  2544.  
  2545.  
  2546. PGPfone
  2547.  
  2548.      * Platform: Macintosh and Windows
  2549.      * Description: Pretty Good Privacy Phone is free secure audio
  2550.        connection software for the internet. It uses speech compression
  2551.        and strong cryptography protocols to give you the ability to have
  2552.        a real-time secure telephone conversation via a modem-to-modem
  2553.        connection.
  2554.      * Requirements (Mac): Fast modem: at least 14.4 Kbps V.32bis (28.8
  2555.        Kbps V.34 recommended). An Apple Macintosh with at least a 25MHz
  2556.        68LC040 processor (PowerPC recommended), running System 7.1 or
  2557.        above, Thread Manager 2.0.1, ThreadsLib 2.1.2, and Sound Manager
  2558.        3.0. (These are available from Apple's FTP sites.)
  2559.      * Requirements (Windows): Fast modem: at least 14.4 Kbps V.32bis
  2560.        (28.8 Kbps V.34 recommended). A multimedia PC running Windows 95
  2561.        or NT, with at least a 66 MHz 486 CPU (Pentium recommended), sound
  2562.        card, microphone, and speakers or headphones.
  2563.      * Contact: Jeffrey I. Schiller
  2564.        Email: jis@mit.edu
  2565.        WWW: http://web.mit.edu/network/pgpfone/
  2566.  
  2567.  
  2568.  
  2569. Speak Freely
  2570.  
  2571.      * Platform: Windows and Unix
  2572.      * Description: Free "Internet Phone" software supporting voice mail,
  2573.        multicasting, encryption and several coding methods. Includes 4
  2574.        forms of data compression and encryption with DES, IDEA and PGP.
  2575.        The Windows and Unix versions are compatible. You can designate a
  2576.        bitmap file to be sent to users who connect so they can see who
  2577.        they're talking to. The Unix version does not have the graphical
  2578.        user interface of the Windows edition, but supports all its
  2579.        compression and encryption modes.
  2580.      * More information:
  2581.        http://www.fourmilab.ch/netfone/windows/speak_freely.html
  2582.  
  2583.  
  2584.  
  2585. Internet Phone from VocalTec
  2586.  
  2587.      * Platforms: IBM Compatible
  2588.      * Description: Supports real-time conversations with Internet users
  2589.        by compressing speech. Voice-activation feature and interactive
  2590.        display. Features an graphical interface and on-line help. Up to
  2591.        date listing of all on-line users running Internet Phone. Join or
  2592.        create topics for conversation with people from all over the
  2593.        globe. Supports private topics for private conversations with
  2594.        family or with business associates.
  2595.      * Requirements: 486SX PC - 25 MHZ, 8MB RAM (recommended)
  2596.        An Internet Winsock 1.1 compatible TCP\IP connection (minimum
  2597.        connection: a 14,400 baud modem SLIP\PPP connection)
  2598.        Windows 3.1
  2599.        Windows-compatible sound card
  2600.      * Cost: $US59 + shipping. You can order on the internet:
  2601.        http://www.vocaltec.com/order.html
  2602.      * More Information: WWW: http://www.vocaltec.com/
  2603.      * Availability:
  2604.  
  2605.                 Demo version: 
  2606.                 ftp://ftp.vocaltec.com/pub/iphone09.exe
  2607.  
  2608.      * Contact: VocalTec Inc.
  2609.  
  2610.     157 Veterans Drive, Northvale, NJ 07647
  2611.     Tel: 201-768-9400 Fax: 201-768-8893
  2612.     E-mail: info@vocaltec.com
  2613.  
  2614.  
  2615.  
  2616. WebPhone
  2617.  
  2618.      * Platform: Windows
  2619.      * Description: WebPhone provides telephone quality, real-time, full
  2620.        duplex, encrypted, point-to-point voice communication over the
  2621.        Internet and other TCP/IP based networks. (More detail provided on
  2622.        the NetSpeak WWW pages).
  2623.      * Requirements: 80486DX-33 MHz running Windows 3.1 or higher, 4 MB
  2624.        of RAM, MCI compliant sound card, Winsock 1.1 compliant stack,
  2625.        14.4Kbps modem, VGA card capable of displaying 256 colors. Full
  2626.        duplex audio card required for full duplex.
  2627.      * Price: $49.95 (US)
  2628.      * Availability: via the WWW: http://www.netspeak.com/getphone.html
  2629.      * Contact: NetSpeak Corporation
  2630.        902 Clint Moore Rd., Boca Raton, Fl. 33487, USA
  2631.        Ph: +1-407-997-4001, Fax: +1-407-997-2401
  2632.        Email: info@netspeak.com
  2633.        WWW: http://www.netspeak.com/
  2634.  
  2635.  
  2636.  
  2637. WebTalk
  2638.  
  2639.      * Platform: Windows 3.1/95
  2640.      * Description: Full-duplex or half duplex, telephone-quality voice,
  2641.        supports many commercial web browsers.
  2642.      * Contact: Quarterdeck Corporation
  2643.        13160 Mindanao Way, 3rd Floor, Marina Del Rey, CA 90292-9705, USA
  2644.        Ph: +1-310-309-3700, Fax: +1-310-309-4217
  2645.        Email: info@quarterdeck.com
  2646.        WWW: http://www.quarterdeck.com/
  2647.  
  2648.  
  2649.  
  2650. AF version AF3R1
  2651.  
  2652.      * Platforms: DEC workstations (Alpha and MIPS), SparcStation, SGI
  2653.      * Description: The AF System is a device-independent
  2654.        network-transparent system including client applications and audio
  2655.        servers. With AF, multiple audio applications can run
  2656.        simultaneously, sharing access to the actual audio hardware.
  2657.        The AF3R1 distribution of AF includes server support for Digital
  2658.        RISC systems running Ultrix, Digital Alpha AXP systems running
  2659.        OSF/1, SGI Indigo running IRIX 4.0.5, Sun Microsystems
  2660.        SPARCstations running SunOS 4.1.3, and Sun Microsystems
  2661.        SPARCstations running Solaris 2.3. The servers support audio
  2662.        hardware ranging from the built-in CODEC audio on SPARCstations
  2663.        and Personal DECstations to 48 KHz stereo audio using the DECaudio
  2664.        TURBOchannel module or the SPARCstation DBRI interface
  2665.      * Availability: The source kit is distributed by anonymous ftp from
  2666.  
  2667.                  ftp://crl.dec.com/pub/DEC/AF
  2668.  
  2669.                 WWW:
  2670.                 http://www.research.digital.com/CRL/projects/AF/home.html
  2671.  
  2672.      * Contact: af-request@crl.dec.com
  2673.  
  2674.  
  2675.  
  2676. Voice E-Mail from Bonzi Software
  2677.  
  2678.      * Description: Voice E-Mail is an extension to regular e-mail which
  2679.        allows recorded voice messages to be transmitted in the same way
  2680.        as normal text messages. Voice E-Mail is available in several
  2681.        forms: Voice E-Mail 3.0 for WinCIM, Voice E-Mail 3.0 for America
  2682.        Online, Voice E-Mail 3.0 for Eudora, and Voice E-Mail 3.0 for
  2683.        Netscape. Voice E-Mail uses digital audio and image compression
  2684.        technology to compress messages before transferring them through
  2685.        CompuServe, America Online, and the Internet.
  2686.      * Availability: Go to the Bonzi home page - http://www.bonzi.com/ -
  2687.        and follow the links to the Internet Shopping Network's
  2688.        "Downloadable Software Division."
  2689.      * Further Information: Bonzi Software
  2690.        WWW: http://www.bonzi.com/
  2691.        Email: info@bonzi.com
  2692.        Fax 805-238-5798
  2693.  
  2694.  
  2695.  
  2696. MicNotePad Recording Software for Macs
  2697.  
  2698.      * Platforms: Macintosh
  2699.      * Description: MicNotePad is audio recording tool designed to
  2700.        improve dictation (a digital replacement for the old-style
  2701.        mechnical tape systems used by typists). It uses the built-in
  2702.        microphone or sound input port and the hard disk to record
  2703.        conversations or speech of arbitrary length. Speech compression
  2704.        techniques are used to reduce the disk-space. Once it is recorded,
  2705.        single keystrokes control playback while you type in your word
  2706.        processor.
  2707.      * Contact: Nirvana Research
  2708.        WWW: http://moof.com/nirvana/
  2709.        Email: nirvana@got.net
  2710.  
  2711.  
  2712.  
  2713. MixViews
  2714.  
  2715.      * Description: A Unix/X sound editor. Does waveform play/record, and
  2716.        cut/splice. Has various filters, handles native file formats, FFT,
  2717.        LPC and more
  2718.      * Availability: by anonymous ftp including SunOS 4 and IRIX 5
  2719.        binaries.
  2720.  
  2721.                  ftp://foxtrot.ccmrc.ucsb.edu/pub/MixViews
  2722.  
  2723.  
  2724.  
  2725. Network Audio System Release 1.1
  2726.  
  2727.      * Platforms: Various (includes SunOS, Solaris, SGI)
  2728.      * Description: A device-independent mechanism for transferring,
  2729.        playing and recording audio signals over a network. Has a range of
  2730.        features suited to networks.
  2731.      * Cost: Free
  2732.      * Availability: By anonymous ftp from
  2733.  
  2734.                 ftp://ftp.x.org:/contrib/audio/nas/netaudio-1.2.tar.gz
  2735.  
  2736.        Also available in the same directory are document files and some
  2737.        sample sounds.
  2738.  
  2739.  
  2740.  
  2741. NIST SPeech HEader REsources Package (SPHERE)
  2742.  
  2743.      * Description: Standard speech header software from the National
  2744.        Institute of Standards & Technology (NIST). SPHERE headers
  2745.        represent information about sample frequency, sample format, etc.
  2746.      * Availability: By anonymous ftp from
  2747.  
  2748.         Readme File
  2749.                 ftp://jaguar.ncsl.nist.gov/pub/sphere.README 
  2750.  
  2751.         Source Code
  2752.                 ftp://jaguar.ncsl.nist.gov/pub/sphere_2.5.tar.Z 
  2753.  
  2754. NIST Speech Recognition Scoring Package (SCORE)
  2755.  
  2756.      * Description: Software for scoring results of speech recognition
  2757.        systems from the National Institute of Standards & Technology
  2758.        (NIST) .
  2759.      * Availability: By anonymous ftp from
  2760.  
  2761.         README File
  2762.                 ftp://jaguar.ncsl.nist.gov/pub/score.README 
  2763.  
  2764.         Source Code
  2765.                 ftp://jaguar.ncsl.nist.gov/pub/score_3.6.2.tar.Z 
  2766.  
  2767.  
  2768.  
  2769. Sound Processing Kit
  2770.  
  2771.      * Platforms: UNIX
  2772.      * Description: Sound Processing Kit (SPKit) is an object-oriented
  2773.        class library for audio signal processing. SPKit includes classes
  2774.        for various signal processing tasks and a way of implementing
  2775.        sound processing algorithms in a simple object-oriented manner.
  2776.        Sound Processing Kit is implemented in C++ and is designed to be
  2777.        portable. The current version requires a bare-bones C++ 2.0
  2778.        compatible compiler (templates and exceptions are not needed).
  2779.        ANSI C standard libraries are required. SPKit includes classes for
  2780.           + Sound input and output
  2781.           + Basic signal processing
  2782.           + Dynamics processing (compressor, gating etc)
  2783.           + Filtering
  2784.           + Delay and reverberation
  2785.           + Distortion
  2786.           + Signal routing
  2787.      * Availability:
  2788.  
  2789.         Full documentation on the WWW:
  2790.                 http://www.music.helsinki.fi/research/spkit/documentation
  2791.                 /SPKit.html
  2792.  
  2793.         Software distribution:
  2794.                 http://www.music.helsinki.fi/research/spkit/distribution/
  2795.                 spkit.tar.Z
  2796.  
  2797.      * Contact: Kai Lassfolk
  2798.        University of Helsinki Music Research Laboratory
  2799.        Email: spkit@elisir.helsinki.fi
  2800.  
  2801.  
  2802.  
  2803. TCPplay
  2804.  
  2805.      * Description: TCPPlay lets you use your mac as an audio server for
  2806.        your Unix box. Provided with source code. Written by Bill
  2807.        Stafford, Rich Tsoi and Malcolm Slaney.
  2808.      * Availability: Anonymous ftp from
  2809.        ftp://ftp.apple.com/pub/malcolm/TcpPlay.sit.hqx
  2810.        ftp://worldserver.com/pub/malcolm/TcpPlay.sit.hqx
  2811.  
  2812.  
  2813.  
  2814. Auditory Modeller 1
  2815.  
  2816.      * Description: John Holdsworth's implementation of a gammatone
  2817.        filter bank and Roy Patterson's spiral model, in C (with X-window
  2818.        display).
  2819.      * Availability: By anonymous ftp from
  2820.  
  2821.                  ftp://ftp.mrc-apu.cam.ac.uk/pub/aim
  2822.  
  2823.  
  2824.  
  2825. Auditory Modeller 2
  2826.  
  2827.      * Description:Lowel O'Mard's implementation of peripheral filtering,
  2828.        Ray Meddis's hair cell model and other stuff in C (as a library of
  2829.        routines).
  2830.      * Availability: By anonymous ftp from
  2831.  
  2832.                  ftp://suna.lut.ac.uk/public/hulpo/lutear 
  2833.  
  2834.  
  2835.  
  2836. Auditory Toolbox for Matlab
  2837.  
  2838.      * Description: This toolbox provides extensions to Matlab which are
  2839.        useful to people interested in auditory/cochlear modeling. [Matlab
  2840.        is described is the previous section.] This toolbox has been
  2841.        tested on both Macintosh and Unix computers. It includes the
  2842.        following major models:
  2843.           + Lyon's Passive Long Wave Cochlear Model (our conventional
  2844.             model)
  2845.           + Patterson-Holdsworth ERB Filter bank with Meddis Hair cell
  2846.           + Seneff's Auditory Model (Stages I and II)
  2847.           + MFCC (Mel-scale frequency cepstral coefficients from the ASR
  2848.             world)
  2849.           + Spectrogram
  2850.           + Correlogram generation and pitch modeling
  2851.           + Simple vowel synthesis
  2852.      * Availability: From Malcolm Slaney home page and by anonymous FTP:
  2853.        ftp://ftp.apple.com/pub/malcolm
  2854.        The following files are available:
  2855.           + AuditoryToolbox.mif.Z
  2856.           + AuditoryToolbox.psc.Z
  2857.           + AuditoryToolbox.sea.hqx
  2858.           + AuditoryToolbox.tar
  2859.           + AuditoryToolbox.tar.Z
  2860.        The ".mif.Z" file is a Unix compressed version of the FrameMaker
  2861.        documentation. The ".psc.Z" file is a Unix compressed version of
  2862.        the Postscript documentation. The ".tar" and ".tar.Z" files are
  2863.        Unix TAR archives containing all of the m-functions and C-MEX
  2864.        source code. Finally, the ".sea.hqx" file is a Macintosh
  2865.        self-extracting archive that has been encoded using BinHex. There
  2866.        is precompiled version of the three MEX function for the
  2867.        Macintosh.
  2868.      * Misc: Our lawyers ask you to remind you that there is no warranty.
  2869.        We've done some testing but we undoubtably missed things.
  2870.      * Contact: Malcolm Slaney, Interval Resarch.
  2871.        Email: malcolm@interval.com
  2872.        WWW: http://www.interval.com/~malcolm/
  2873.  
  2874.  
  2875.  
  2876. Human Audio Perception Document
  2877.  
  2878.      * Description: Document prepared by Argiris Kranidiotis on the human
  2879.        audio perception system. It lists a number of references, gives
  2880.        plenty of numbers and some equations.
  2881.      * Availability: by anonymous ftp from the comp.speech archive site
  2882.  
  2883.                 ftp://svr-ftp.eng.cam.ac.uk/comp.speech/info/HumanAudioPe
  2884.                 rception 
  2885.  
  2886.      * Contact: Argiris A. Kranidiotis
  2887.        University Of Athens, Informatics Department
  2888.        email: akra@zeus.di.uoa.ariadne-t.gr
  2889.  
  2890.  
  2891.  
  2892. BEEP dictionary
  2893.  
  2894.      * Description: Phonemic transcriptions of over 250,000 English
  2895.        words. (British English pronunciations)
  2896.      * Availability: By anonymous ftp:
  2897.  
  2898.         BEEP dictionary README file
  2899.                 svr-ftp.eng.cam.ac.uk/comp.speech/dictionaries/beep-0.7.R
  2900.                 EADME
  2901.  
  2902.         BEEP Dictionary (1.1M)
  2903.                 svr-ftp.eng.cam.ac.uk/comp.speech/dictionaries/beep.tar.g
  2904.                 z
  2905.  
  2906.  
  2907.  
  2908. CMU dictionary
  2909.  
  2910.      * Description: Phonemic transcriptions of 100,000 words with
  2911.        American English pronunciation.
  2912.      * Availability - WWW: http://www.speech.cs.cmu.edu/cgi-bin/cmudict
  2913.      * Availability - ftp: By anonymous ftp from the directory
  2914.  
  2915.                 ftp://ftp.cs.cmu.edu/project/fgdata/dict/
  2916.  
  2917.        with the files README, cmudict.0.2.Z, cmulex.0.1.Z, phoneset.0.1
  2918.  
  2919.  
  2920.  
  2921. CUVOLAD dictionary (Oxford Dictionary)
  2922.  
  2923.      * Description: Computer Usable Version of the Oxford Advanced
  2924.        Learner's Dictionary containing 70,000+ entries. Has British
  2925.        English pronunciations and parts of speech.
  2926.      * Availability: Anonymous ftp
  2927.        ftp://ota.ox.ac.uk/pub/ota/public/dicts/710/
  2928.        Documentation:
  2929.        ftp://ota.ox.ac.uk/pub/ota/public/dicts/710/text710.doc
  2930.  
  2931.  
  2932.  
  2933. Comprehensive Word List
  2934.  
  2935.      * Description: A comprehensive word list which should contain most
  2936.        common American words, abbreviations, hyphenations, and even
  2937.        incorrect spellings. The word lists were compiled from a number of
  2938.        sources: commercial news services, UseNet news postings, existing
  2939.        dictionaries, name lists, company lists, UNIX man pages, project
  2940.        Gutenberg's E-texts, project Wordnet, received mailings, etc. The
  2941.        current size is 460,000 words.
  2942.      * Availability: anonymous ftp
  2943.        ftp://wocket.vantage.gte.com/pub/standard_dictionary
  2944.        Note 1: There seems to be some sort of network problem reaching
  2945.        the server.
  2946.        Note 2: There is a README file which explains the file formats.
  2947.  
  2948.  
  2949.  
  2950. EAT: Edinburgh Associative Thesaurus
  2951.  
  2952.      * Description: A set of word association norms showing the counts of
  2953.        word association as collected from subjects.
  2954.      * Availability: Source and WWW interactive versions
  2955.  
  2956.         Interactive version
  2957.                 Provided by Computing and Information Systems Department
  2958.                 (CISD) of Rutherford Appleton Laboratory, UK
  2959.                 http://www.cis.rl.ac.uk/proj/psych/eat.html
  2960.  
  2961.         Set of word association norms
  2962.                 ftp directory. 6 MB
  2963.                 http://www.cis.rl.ac.uk/proj/psych/eat/eat/
  2964.  
  2965.  
  2966.  
  2967. Homophone List
  2968.  
  2969.      * A list of homophones in General American English is available by
  2970.        anonymous FTP from the comp.speech archive site:
  2971.  
  2972.                 ftp://svr-ftp.eng.cam.ac.uk/comp.speech/dictionaries/homo
  2973.                 phones-1.01.txt
  2974.  
  2975.  
  2976.  
  2977. Moby Lexical Resources
  2978.  
  2979.      * Description: A set of lexical resources compiled by Grady Ward.
  2980.        3449 Martha Ct., Arcata, CA 95521-4884, USA
  2981.        Email: grady@netcom.com OR grady@northcoast.com
  2982.      * Availability: Mirrored by Malcolm Crawford
  2983.        (m.crawford@dcs.shef.ac.uk) at the Institute for Language Speech
  2984.        and Hearing, the University of Sheffield.
  2985.        WWW: http://www.dcs.shef.ac.uk/research/ilash/Moby/
  2986.        FTP: ftp://ftp.dcs.shef.ac.uk/share/ilash/Moby/
  2987.      * Contents:
  2988.  
  2989.         Moby Hyphenator: mhyph.tar.Z
  2990.                 185,000 entries fully hyphenated. 980kB.
  2991.  
  2992.         Moby Language: mlang.tar.Z
  2993.                 Word lists in five major languages. 2.3MB.
  2994.  
  2995.         Moby Part-of-Speech: mpos.tar.Z
  2996.                 230,000 entries with part(s) of speech listed in priority
  2997.                 order. 1.2MB.
  2998.  
  2999.         Moby Pronunciator: mpron.tar.Z
  3000.                 175,000 entries fully International Phonetic Alphabet
  3001.                 coded. 3.1MB.
  3002.  
  3003.         Moby Shakespeare: mshak.tar.Z
  3004.                 The complete unabridged works of Shakespeare. 2.3.MB.
  3005.  
  3006.         Moby Thesaurus: mthes.tar.Z
  3007.                 30,000 root words, 2.5 million synonyms and related
  3008.                 words. 12MB.
  3009.  
  3010.         Moby Words: mwords.tar.Z
  3011.                 610,000+ words and phrases. 4.0MB.
  3012.  
  3013.  
  3014.  
  3015. MRC Psycholinguistic Database
  3016.  
  3017.      * Description: A machine usable dictionary containing over 150000
  3018.        words with up to 26 linguistic and psycholinguistic attributes for
  3019.        each (e.g. pronunciation, part of speech, word frequency).
  3020.        Psycholinguistic Database was the basis for the "Oxford
  3021.        Psycholinguistic Database" available for Apple Macs from Oxford
  3022.        University Press.
  3023.      * Availability: Several versions with different formats:
  3024.  
  3025.         Interactive Version of MRC Psycholinguistic Database
  3026.                 Produces lists of words meeting user-definable selection
  3027.                 criteria. Provided by the Dept. of Psychology, University
  3028.                 of Western Australia.
  3029.                 http://www.psy.uwa.edu.au/uwa_mrc.htm
  3030.  
  3031.         ftp'able MRC Psycholinguistic Database
  3032.                 Approximately 12M of data.
  3033.                 ftp://ota.ox.ac.uk/pub/ota/public/dicts/1054/
  3034.                 README:
  3035.                 ftp://ota.ox.ac.uk/pub/ota/public/dicts/1054/readme.
  3036.                 Information: ftp://ota.ox.ac.uk/pub/ota/public/dicts/info
  3037.  
  3038.  
  3039.  
  3040. WordNet
  3041.  
  3042.      * Description: WordNet is an on-line lexical reference system in
  3043.        which English nouns, verbs, adjectives and adverbs are organized
  3044.        into synonym sets, each representing one underlying lexical
  3045.        concept. Different relations link the synonym sets.
  3046.        WordNet was developed in the Cognitive Science Laboratory at
  3047.        Princeton University under the direction of Professor George
  3048.        Miller.
  3049.      * Availability:
  3050.  
  3051.         WWW Interface
  3052.                 http://www.cogsci.princeton.edu/~wn/w3wn.html
  3053.  
  3054.         Source Distributions
  3055.                 Unix (9.1MB), PC (5.8MB), Macintosh (7.5MB), Prolog
  3056.                 (database only, 4.2MB).
  3057.                 ftp://clarity.princeton.edu/pub/wordnet/
  3058.  
  3059.        Extended interfaces developed by WordNet users (for X, Lisp etc)
  3060.        are listed in the WordNet home page.
  3061.      * Further information: Email: wordnet@princeton.edu
  3062.        WWW: WordNet home page: http://www.cogsci.princeton.edu/~wn/
  3063.        README: ftp://clarity.princeton.edu/pub/wordnet/README
  3064.        Publications: ftp://clarity.princeton.edu/pub/wordnet/5papers.ps
  3065.  
  3066.  
  3067.  
  3068. Dictionaries on the WWW
  3069.  
  3070.    For a while, there was a range of dictionaries and other lexical
  3071.    resources on the WWW and elsewhere on the Internet. However, due to
  3072.    copyright reasons, fewer sites are publishing dictionary information.
  3073.    When last checked, the following sites provide dictionaries or links
  3074.    to dictionaries on the net:
  3075.  
  3076.    CMU Dictionary
  3077.           http://www.speech.cs.cmu.edu/cgi-bin/cmudict
  3078.  
  3079.    Institute of Phonetic Sciences, Amsterdam
  3080.           Electronic dictionaries, including French, Norwegian Swahili
  3081.           and English.
  3082.           http://fonsg3.let.uva.nl/Other_pages.html
  3083.  
  3084.    1913 Webster's Revised Unabridged Dictionary
  3085.           Available as a searchable HTML form at the University of
  3086.           Chicago ARTFL project site, and as a tagged working file and
  3087.           downloadable version (45MB) of the HTML at Project Gutenberg.
  3088.  
  3089.    Martin Ramsch's Englisch-Worterbucher aller Art
  3090.           Lists of on-line dictionaries, translation dictionaries,
  3091.           technical dictionaries, etc.
  3092.           http://www.uni-passau.de/forwiss/mitarbeiter/freie/ramsch/engli
  3093.           sch.html
  3094.  
  3095.    Galaxy's list of dictionaries etc.
  3096.           A comprehensive list of dictionaries, acronym lists,
  3097.           translation resources, and a Thesaurus.
  3098.           http://galaxy.einet.net/galaxy/Reference-and-Interdisciplinary-
  3099.           Information/Dictionaries-etc.html
  3100.  
  3101.    Webster's dictionary online
  3102.           http://c.gp.cs.cmu.edu:5103/prog/webster
  3103.  
  3104.  
  3105.  
  3106. International Phonetic Alphabet
  3107.  
  3108.      * Description: The International Phonetic Association
  3109.        (http://www.arts.gla.ac.uk/IPA/ipa.html) defines the International
  3110.        Phonetic Alphabet. It is a standard set of symbols for
  3111.        transcribing the sounds of spoken languages. The full chart of IPA
  3112.        symbols is published on the International Phonetic Association WWW
  3113.        site. Also provided are charts for consonants, vowels, tones and
  3114.        accents, suprasegmentals, diacritics and other symbols. A cassette
  3115.        of sounds is available: see
  3116.        http://www.phon.ucl.ac.uk/home/wells/cassette.htm
  3117.  
  3118.  
  3119.  
  3120. WWW: Phonetic Fonts and Examples Online
  3121.  
  3122.     George L. Dillon's list of phonetic resources
  3123.           [http://weber.u.washington.edu/~dillon/PhonResources.html]
  3124.  
  3125.          Vowel sounds of American English
  3126.                 Examples of standard American vowels along with the IPA
  3127.                 phonetic symbols and links to recordings.
  3128.                 http://weber.u.washington.edu/~dillon/vowels.html
  3129.  
  3130.          Consonant sounds of English
  3131.                 Examples of consonants along with the IPA phonetic
  3132.                 symbols and links to recordings.
  3133.                 http://weber.u.washington.edu/~dillon/consonants.html
  3134.  
  3135.          Vowel Quadrilaterals for American and British English
  3136.                 Charts and audio.
  3137.                 http://weber.u.washington.edu/~dillon/newstart.html
  3138.  
  3139.          IPA-ASCII
  3140.                 A scheme for representing IPA transcriptions in ASCII for
  3141.                 use in Usenet articles and email.
  3142.                 http://weber.u.washington.edu/~dillon/ipaascii.html
  3143.  
  3144.     Some things about studying Speech
  3145.           Information on speech physiology, acoustic phonetics, speech
  3146.           perception, speech recognition and voice recognition.
  3147.           http://www.ccp.uchicago.edu/grad/Francis_Alex/speech.html
  3148.  
  3149.  
  3150.  
  3151. Summer Institute of Linguistics IPA Fonts
  3152.  
  3153.      * Platform: Apple Macintosh and Mircosoft Windows
  3154.      * Description: International Phonetic Alphabet (IPA) fonts are
  3155.        available as freeware from the Summer Institute of Linguistics
  3156.        (SIL). The SIL Encore IPA Fonts are a set of scalable IPA fonts
  3157.        containing the full International Phonetic Alphabet with 1990 Kiel
  3158.        revisions. Three typefaces are included: SIL Doulos (similar to
  3159.        Times), SIL Sophia (similar to Helvetica), and SIL Manuscript
  3160.        (monowidth). Each font contains all the standard IPA discrete
  3161.        characters and non-spacing diacritics as well as some
  3162.        suprasegmental and punctuation marks. Each font comes in both
  3163.        PostScript Type 1 and TrueType formats.
  3164.      * Availability: Via the WWW and Gopher:
  3165.           + WWW: http://www.sil.org/
  3166.           + Gopher:
  3167.             gopher://gopher.sil.org/11/gopher_root/computing/software/fon
  3168.             ts/
  3169.           + Ftp for Windows: ftp://ftp.sil.org/fonts/win/silip12a.exe
  3170.           + Ftp for Mac: ftp://ftp.sil.org/fonts/mac/silipa12.sea_hqx
  3171.        Also available through the SIL email server. Send either of the
  3172.        following commands to MAILSERV@sil.org.
  3173.  
  3174.         Windows:
  3175.                 SEND/MODE=BLOCK/ENCODING=UUENCODE
  3176.                 [FTP.FONTS.WIN]SILIP12A.EXE
  3177.  
  3178.         Mac:
  3179.                 SEND [FTP.FONTS.MAC]SILIPA12.SEA_HQX
  3180.  
  3181.        Finally, they are available on diskette from the address below.
  3182.        $US5 to cover the cost of shipping.
  3183.      * Contact: International Academic Bookstore
  3184.        Summer Institute of Linguistics
  3185.        7500 W. Camp Wisdom Road, Dallas, TX 75236 U.S.A.
  3186.        Ph: 214-709-2404, Fax: 214-709-2433
  3187.        e-mail: academic.books@sil.org
  3188.        WWW: http://www.sil.org/
  3189.  
  3190.  
  3191.  
  3192. Phonetic Fonts for TeX and LaTeX
  3193.  
  3194.     Linguistics/Tex mailing list
  3195.           ling-tex@ifi.uio.no
  3196.           Subscription method unknown.
  3197.  
  3198.     TIPA
  3199.           Created by Rei Fukui: fkr@tooyoo1.l.u-tokyo.ac.jp.
  3200.           Source: ftp://tooyoo.L.u-tokyo.ac.jp/pub/TeX/tipa/
  3201.           Postscript manual:
  3202.           ftp://tooyoo.L.u-tokyo.ac.jp/pub/TeX/tipa/tipaman.ps
  3203.           Compressed postscript manual:
  3204.           ftp://tooyoo.L.u-tokyo.ac.jp/pub/TeX/tipa/tipaman.ps
  3205.  
  3206.     WSUIPA: Washington State University International Phonetic
  3207.           Alphabet fonts
  3208.           A basic WSUIPA font contains 128 phonetic characters and/or
  3209.           diacritics in five different point sizes (8, 9, 10, 11 and 12)
  3210.           and in three typefaces (roman, slanted and bold extended). Each
  3211.           size and typeface includes a TFM (TeX Font Metric) file and its
  3212.           related GF, PK or PXL file. A macro package and manual are
  3213.           provided. Apparently LaTeX 2.09 compatible - not LaTeX 2e
  3214.           compliant.
  3215.           Available from ftp://ftp.wustl.edu/packages/TeX/fonts/wsuipa/
  3216.           OR from CTAN-ftp-archives: e.g.
  3217.           ftp://ftp.digital.com/pub/text/TeX/fonts/wsuipa/
  3218.  
  3219.  
  3220.  
  3221. Yamada Language Center
  3222.  
  3223.      * Platform: Apple Macintosh and Mircosoft Windows
  3224.      * Description: The Yamada Language Center maintains an archive of
  3225.        fonts to assist users who wish to display or type non-English
  3226.        fonts on their computers. Their WWW and ftp sites include five
  3227.        International Phonetic Alphabet fonts (or near IPA). They also
  3228.        have fonts for over 40 languages (American Sign Language, Arabic,
  3229.        Armenian, Bengali, Burmese, Celtic, Cherokee......).
  3230.      * Availability: :
  3231.  
  3232.         WWW Font List
  3233.                 http://babel.uoregon.edu/yamada/fonts.html
  3234.  
  3235.         Windows Fonts
  3236.                 http://babel.uoregon.edu/yamada/winfonts.html
  3237.  
  3238.         IPA Fonts
  3239.                 http://babel.uoregon.edu/yamada/fonts/phonetic.html
  3240.  
  3241.         ftp site
  3242.                 ftp://yftp@www-vms.uoregon.edu/fonts/
  3243.  
  3244.      * Contact: Yamada Language Center, University of Oregon
  3245.  
  3246.  
  3247.  
  3248. The vOICe
  3249.  
  3250.      * Description: Peter Meijer's Java applet/application for sound
  3251.        analysis and synthesis.
  3252.           + Platform: All (where Java VM available)
  3253.           + Interactive spectrographic synthesis: draw your own sound
  3254.           + Image sonification
  3255.           + Mathematical function sonification
  3256.           + Spectrographic sound analysis (Fourier, spectrogram)
  3257.           + Vision substitution research
  3258.      * Contact: Peter Meijer
  3259.  
  3260.  
  3261.  
  3262. The Learning Company's Language Training
  3263.  
  3264.      * Platform: Windows and Macintosh
  3265.      * Description: Foreign-language training software for Spanish,
  3266.        French, German, Italian, Japanese, and English. In the Windows
  3267.        version for English, speech-recognition technology is used to help
  3268.        users improve accents.
  3269.      * Contact: The Learning Company
  3270.        Ph: (800) 852-2255
  3271.        Email: webmaster@learningco.com
  3272.        WWW: http://www.learningco.Inter.net/foreign.html
  3273.  
  3274.  
  3275.  
  3276. Wildfire - an Electronic Assistant
  3277.  
  3278.      * Platform: ?
  3279.      * Description: Wildfire is a phone-based electronic assistant.
  3280.        Functions include:
  3281.           + Screens, routes, and announces incoming calls.
  3282.           + Contact list with voicedialing.
  3283.           + Schedules and reminders for follow-up calls and action items.
  3284.           + Messaging and advanced voicemail features.
  3285.      * Contact: Wildfire Communications, Inc.
  3286.        20 Maguire Road, Lexington, MA 02173 USA
  3287.        Ph: +1-617-674-1500, Fax: 617-674-1501
  3288.        Demo line: 1-800-WILDFIRE
  3289.        Email: info@wildfire.com
  3290.        WWW: http://www.wildfire.com/
  3291.  
  3292.  
  3293. ___________________________________________________________________________
  3294.  
  3295.    Copyright (c) 1993-6 by Andrew Hunt, all rights reserved.
  3296.    This FAQ may be posted to any USENET newsgroup, on-line service, or BBS as
  3297.    long as it is posted in its entirety and includes this copyright statement.
  3298.    This FAQ may not be distributed for financial gain.
  3299.    This FAQ may not be included in any collections or compilations
  3300.    without express permission from the author.
  3301.  
  3302.  
  3303.  
  3304.  ---
  3305.  
  3306. Andrew Hunt
  3307. Speech Applications Group
  3308. Sun Microsystems Laboratories       Ph:  (978) 442-2681
  3309. 2 Elizabeth Drive, MS UCHL03-207    Fax: (978) 250-5067
  3310. Chelmsford, MA 01824, USA           Email: andrew.hunt@east.sun.com
  3311.