home *** CD-ROM | disk | FTP | other *** search
/ Magazyn Amiga Shareware Floppies / ma68.dms / ma68.adf / VoiceTest.readme < prev    next >
Text File  |  1996-08-21  |  7KB  |  142 lines

  1. Short:    Narrator setting test program.
  2. Author:   mbarlow@pacific.telebyte.net  (M. L. Barlow)
  3. Type:     util/misc
  4. Date:     21 Aug 1996
  5.  
  6. Description:  This is a simple bare-bones utility for testing 14 of the 
  7. programmable settings of the OS-2.04 Narrator.device.  The primary
  8. function intended for this program is the determination of the "optimum"
  9. voice settings, especially those new settings introduced with OS-2.
  10.  
  11.     This program differs from others of this type in that it runs
  12. continuously on preset internal text, the first 40 or so sentences from a
  13. now public domain novel by Edgar Rice Burroughs.  Thus, the user can focus
  14. on adjusting the parameters without re-entering text.  A scrolling display
  15. shows the exact values of the settings in use.  14, full-height, simple
  16. sliders are provided which correspond to the scroller, top to bottom, left
  17. to right. The program will attempt to load the "clean 8" or "pearl 8" fonts
  18. or use the "topaz 8" font as a last resort.
  19.  
  20.     The default voice settings are the soft and hard voice options I use
  21. in WreadFiles 5.1.  Clicking on the "VoiceTest" Gadget alternately resets
  22. to one of these settings.  The MALE/FEMALE gadget toggles the sex.  The
  23. current sex is displayed. Pot adjustment is rather tricky.  Clicking seems
  24. to work better than dragging.  Multitasking has to be shut down while each
  25. pot is being read to prevent system conflicts.
  26.  
  27.   The standard Amiga voice seems to have a "telephone" sound quality.  Thus
  28. the first preset used has base-boost, treble-cut vocal formant (vocal tract
  29. resonance) amplitude settings to counteract this effect.  Also the formant
  30. frequencies have been spread farther apart to get a wider frequency range. 
  31. The fricative amplitude was boosted to increase intelligibility.  The
  32. second preset has near standard default settings.  I recommend 6 inch
  33. diameter, minimum, hi-fi speakers to off-set the tinny quality of the
  34. voice.
  35.  
  36.    The documentation provided by Commodore in the ROM Kernel Manual states
  37. that "good speech representation requires up to five formants, but only the
  38. lower three are required for intelligibility.  The pre-V37 narrator had
  39. only three formants, while the V37 Narrator has five formants for a better
  40. sounding voice." [RKM Devices, 3rd Ed, pp150.]  Note that software controls
  41. are provided for only three formants.  The Narrator does not appear to be
  42. properly balanced to produce a realistic female voice. When female is
  43. selected "only the formant targets are changed.  The user must still change
  44. the pitch and speaking rate to get a [more] correct sounding voice." [RKM
  45. Devices, 3rd Ed, pp137.]
  46.  
  47.   SoftVoice, http://www.webcom.com/tts/, states that "The Commodore Amiga
  48. had an early SoftVoice text to speech system known as the 'narrator.device'
  49. included in its  operating system."  They are now selling an SVTTS
  50. (SoftVoice Text-To-Speech) system for Windows 95 that seems to sound better
  51. than the Amiga system.  Their product for the Mac was MacinTalk©.
  52.  
  53. Program Controls:
  54.  
  55. The parameters are as follows:
  56.  
  57. 1. pitch:          Baseline pitch in Hertz
  58. 2. sampfreq:       Audio sampling frequency
  59. 3. rate:           Speaking rate (words/minute)
  60. ---
  61. (OS-2.04 Narrator (V37) required for the following sliders to appear)
  62.  
  63. 4. A1adj:          Formant 1 amplitude adjustment in decibels
  64.                    (crackles if (A1adj+AVbias)>1
  65. 5. A2adj:          Formant 2 amplitude adjustment in decibels
  66. 6. A3adj:          Formant 3 amplitude adjustment in decibels
  67. ---
  68. 7. F1adj:          Formant 1 frequency adjustment in 5% steps
  69. 8. F2adj:          Formant 2 frequency adjustment in 5% steps
  70. 9. F3adj:          Formant 3 frequency adjustment in 5% steps
  71. ---
  72. 10. F0enthusiasm:  accent controlled pitch modulation factor
  73.                    (values greater than 32 can produce a crying effect)
  74. 11. articulate:    Transition time multiplier
  75. 12. F0perturb:     Amount random pitch modulation (perturbation).
  76. ---
  77. 13. AVbias:        Vowel amplitude bias
  78. 14. AFbias:        Fricative amplitude bias
  79.  
  80.   Programmers set these values by entering them, and  pointers to the
  81. translated "ARPAbet" phonemes to be spoken and command code (CMD_WRITE) to
  82. be performed and other required data and flags, in a ram data table,
  83. (struct narrator_rb in C) that has been allocated and initialized by an
  84. OpenDevice function call.  Then DoIO, BeginIO, or SendIO is called,
  85. referencing the table.
  86.  
  87.   Only the first three of these parameters can be set by the "say"
  88. command.  For use with "say", set the A-adj, F-adj, A-bias, and F0perturb
  89. controls to zero. Set articulate to 50.
  90.  
  91.   As this is a self-contained function, there is no normal reason to refer
  92. to the Workbench or other screens while this program is being used.  There
  93. are two options provided by the system to access other screens.  You can
  94. use left-Amiga-N and Left-Amiga-M to flip back and forth between screens. 
  95. You can also use Left-Amiga-Left-Mouse to drag any screen down to reveal
  96. the one behind (on any system that provides true Amiga screen support). 
  97.  
  98.   For example, if you wish to watch SnoopDos while this program is running,
  99. put Snoopdos at the top of your Workbench screen and left-Amiga-left-mouse
  100. drag that screen down to reveal the VoiceTest screen behind.
  101.  
  102.   Warning: This is experimental software.  It has not been tested with
  103. other system configurations.  Use at your own risk. Use when valuable
  104. data is ram-resident is not advised [as a general principle with any
  105. software of this type].  A Snoopdos log of this program should not show
  106. any Write accesses except to CON: (scroller window).
  107.  
  108.                                <>MLB<>
  109.  
  110. ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
  111. Recent Modifications: (8/96)
  112. ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
  113. Added F0perturb, AVbias, and AFbias sliders.
  114.  
  115. Grouped Pre-OS2.0 settings together.
  116.  
  117. Added Narrator and Translator Version extraction.
  118.  
  119. Added listing Narrator and Translator versions to scroll-bar.
  120.  
  121. Added SetAccent(American) if Translator version>41 and if all previous
  122. calls in the session were successful.
  123.  
  124. Added function to reconfigure slider display for pre OS2.0
  125.  
  126. Changed the TitleGadget from a "nameplate" to an active gadget.
  127.  
  128. Added a function to alternately reset the sliders to WreadFiles Presets
  129. and to clear and refresh the TitleGadget.
  130.  
  131. Modified the Intuition handler to call the function above.
  132.  
  133. Modified Narrator setup to read all pots in a single block rather than
  134. interleaving each read with a write to console.
  135.  
  136. Replaced Old Newspaper text and GEnie text snips with ERB adventure text.
  137.  
  138. Broke up some of the longer sentences into shorter segments for better
  139. response.
  140.  
  141. Added ID numbers to scroller data and corresponding sliders.
  142.