home *** CD-ROM | disk | FTP | other *** search
/ OS/2 Shareware BBS: Multimed / Multimed.zip / fest-141.zip / festival / NEWS < prev    next >
Text File  |  1999-11-19  |  8KB  |  208 lines

  1.  
  2. Note that not all features discussed in this file are included in
  3. the standard distribution.
  4.  
  5. HISTORY
  6.  
  7. Nov 21st 1999 1.4.1 Release
  8.    SSFF (for emulabel) track support
  9.    AIX support
  10.    Java fixes
  11.    various minor bug fixes
  12.    WFST with proper quoting
  13.    Wagon sample counts
  14.    gcc-2.95.1 support
  15.  
  16. June 20th 1999 1.4.0 Release 
  17.    becomes free software
  18.  
  19. June 6th 1999 1.3.95 Beta
  20.    size/speed/memory leak overhaul (no memory leaks)
  21.    XML support for relation loading (for SOLE support)
  22.    JSAPI initial support
  23.    GalaxyCommunicator architecture interface
  24.    ked_mttilt_diphone voice built
  25.    Parser trained on MARSEC (prosodic) brackets rather than syntax
  26.    Unisyn_selection fully integrated
  27.    Unisyn_phonology fully integrated 
  28.    viterbi cart/ngram/wfst base LTS prediction (did improve but BIG)
  29.    viterbi cart/ngram based accent prediction (didn't improve)
  30.    tilt working (again)
  31.    audioin (na_record) for many architectures
  32.    viterbi from Scheme (with cart, ngram, wfst models)
  33.  
  34. January 26th 1999 1.3.1 Release
  35.    egcs-1.1.1 support
  36.    tobi_rules update (GM)
  37.    replace readline with editline (+ extensions)
  38.    Lots of little bug fixes
  39.    cluster code tidied up
  40.    kal voice
  41.    ked power normalization
  42.    updated lexicons with addenda for US and UK 
  43.    New LTS models for US and UK English
  44.    "Building Voices in Festival" document
  45.  
  46. August 24th 1998 1.3.0 Release
  47.    UniSun/groupfile optimizations
  48.    Java client support
  49.    Fixed ESPS so both track and wave output works
  50.    Retraining of most modules with new architecture (durations improved)
  51.    rxp, (Richard's XML parser) integrated and Sable XMLified
  52.    Fringe display program for labels and utterances
  53.    Metrical tree synthesis
  54.    A new utterance architecture (Relations and Items)
  55.       utterance save and load work properly now
  56.    Trainable LTS system   
  57.    Lexicon cache system
  58.    Substantial optimization of front end (twice the speed)
  59.    UniSyn, new signal processing and generic waveform synthesis module
  60.    OLS code added
  61.    WFST support for kk rules, regular grammars etc, simple English morphology
  62.  
  63. November 30th 1997 1.2.4 BETA
  64.    Tilt analysis and Tilt intonation modules added.
  65.    make_utts substantially improved (> 100 times faster)
  66.    text2wave script added
  67.    Pitch synchronous lpc analysis and support
  68.    rab consonant clusters labelled
  69.    New duration tree (wagon stepwise) much smaller if not better
  70.    SCFG grammar and parser (scfg_parse_text added as festival script)
  71.    change config stuff (again)
  72.  
  73. October 1st 1997 1.2.1 RELEASE
  74.    preliminary support for Visual C++
  75.    Use path-append rather than string-append (in buckets of places)
  76.    Minor bugs fixes throughout the code (end silences are now *always*
  77.      inserted in tts)
  78.    Linux socket bug fixed (get_url didn't work)
  79.    native irix audio support
  80.  
  81. September 5th 1997 1.2.0 RELEASE
  82.   Proclaim modules and voices
  83.   automatic detection of voices
  84.   Phonset, lexicon, ltsrules listing and printing
  85.   16 bit linear native support for Solaris i386 (sb16)
  86.   Update Festival Tutorial to 1.2.0
  87.  
  88. Aygust 15th 1997 1.1.99 Beta release
  89.   Win NT (and 95) initial support Cygnus win32 and Visual C++
  90.   100 more pages of documentation
  91.   LPC analysis for voices now ESPS independent
  92.   Spanish el voices tidy up (Borja)
  93.   ToBI by rule implementation
  94.   Confirmed support for gcc-2.7.2, gcc-2.6.3, Linux, FreeBSD, SunOS
  95.     Alpha and SunCC port on Solaris
  96.   reference card added
  97.   return s-expressions in server/client mode
  98.   OGI markup mode added.
  99.   Native support for sun16, linux16 and freebsd (compile time option)
  100.   Changed names of .C files to .cc files for bILL  
  101.   wagon integrated into speech tools (plus docs)
  102.   auto-text-mode-alist for automatic selection of text mode from file name
  103.   Associated token tests added
  104.   Many more tokens dealt with (numbers, money, roman, phone, etc.)
  105.     (analysed databases to see what coverage is like)
  106.   A probablistic chart parser (no significant grammars though)
  107.   RJC's new database/units/join/modify modules taking shape
  108.   Some more examples added to the tutorial (with answers)
  109.   Integrated CSLU changes for OGItoolkit including TCL support
  110.   stml support for phrase types and words inline
  111.   ssml -> stml
  112.   Postlexical rules done in Scheme rather than C++
  113.   Rest of functions to allow any manipulation of utterance from scheme
  114.   New duration models trained for both English and American
  115.   New lexicon (CMU based)
  116.   Consonant cluster support (for kd)
  117.   American diphone set   
  118.   Cluster unit selection algorithm more robust
  119.   Ngram backoff smoothing
  120.   Token pos, for numbers (97.5%) but does poor on phone numbers
  121.   New lexicon with final Rs and r deletion as postlex rule
  122.   Update pos prediction (ts39) and phrase break ngrams (faster to load)
  123.   New ngram format (binary files, and smoothing)
  124.   Vowel reduction module
  125.   Sun CC port
  126.   New string class (rjc) remove dependence on libg++
  127.   Update of course notes and new section on building models from dbs
  128.   Yarowsky homograph disambiguation
  129.  
  130. Jan 24th 1997 1.1.1 release (first public release)
  131.   a number of configuration and INSTALL documentation bugs fixed
  132.   SSML tidied up and a festival script provided for it.
  133.   Diphones, again, checked and copyright explicitly added
  134.  
  135. Jan 6th 1997 1.1.0 release
  136.   Roger diphones now default speaker
  137.   A new unit clustering algorithm with acoustic costs and
  138.     optimal coupling
  139.   BSD socket client/server support
  140.   A format function in Scheme (fprintf-like)
  141.   A short course on Speech Synthesis in Festival 
  142.      (with course notes and exercises)
  143.   A programmable form of text modes including externally customizable
  144.      token to word rules.
  145.   Fully programmable intonation module (for ToBI-like theories)
  146.   Backtrace facility in Lisp
  147.   Externally specified Utterance end (for all tts modes) with lookahead
  148.   Roger diphones, first draft
  149.  
  150. Nov 8th 1.0.0 release
  151.   Substantial bug fixes, stabilization and documentation updates
  152.   Added residual excited LPC synthesizer and removed PSOLA code.
  153.   Made sucs and taylor optional modules, new modules
  154.      can be added without modifying the base code
  155.   MOBY lexicon (not as good as cuvoald but free)
  156.   New diphone grouping software
  157.   A new diphone database module (free from adc)
  158.  
  159. Sept 30th 0.1 release
  160.   MBROLA support (good example of external module)
  161.   latest news: read out the latest news (from Time Warner, Pathfinder)
  162.   audio spooler
  163.   --language option on command line
  164.   Spanish synthesis
  165.   Letter to sound rules as external system (replacing all the NRL code)
  166.   Welsh synthesis, making the whole system more language independent
  167.   sucs spoke in reasonably way (gsw_450 and f2b dbs)
  168.   document strings for functions (built in and user) and variables
  169.     access from command line and dumped automatically into texinfo
  170.   cleaned up SSML implementation 
  171.   break prediction integrated using viterbi and pos
  172.   sucs module started (selection of units for concatenative synthesis)
  173.   a part-of-speech tagging system (ngram/viterbi based)
  174.   viterbi code added
  175.   fixes in SIOD for running batch and stdin, also sub_prompts added
  176.   saytime example
  177.   Memory leaks fixed, no leaks for tts  
  178.   
  179. July 30th 0.0 release (just for the sake of it)
  180.   a significiant start at documentation (texinfo -> info & html)
  181.   festival scripts using #! on first line
  182.   donovan diphone support 
  183.   can compile (with too many warnings) under g++ 2.7.2
  184.   copyrights on all files
  185.   memory leak checks (only 8 bytes for "unknown" words)
  186.   SSML (and tts file modes)
  187.   cuvoald cmu and beep lexicons
  188.   lexicon compilation
  189.   web page, emacs interface
  190. June 2nd
  191.   Klatt duration module
  192.   syllabification in phones from letter to sound rules
  193.   Linear Regression model for F0 prediction (from ToBI labels)
  194.   CART (wagon) built trees for duration (zscores), phrase boundaries, 
  195.   accent and endtone prediction.
  196.   ffeatures allowing specification of features of an utterance
  197. May  
  198.   integrated Taylor diphone module
  199.   US Naval Research letter to sound rules
  200.   CSTR lexicon
  201.  
  202. 12th April first words "hello"
  203.  
  204.   start with speech_tools library, scheme-in-one-defun and readline
  205.      and external CSTR diphone synthesizer
  206.  
  207. 7th April 1996 work started
  208.