home *** CD-ROM | disk | FTP | other *** search
/ OS/2 Shareware BBS: Multimed / Multimed.zip / fest-141.zip / festival / lib / f2bf0lr.scm < prev    next >
Text File  |  1999-05-30  |  12KB  |  315 lines

  1. ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
  2. ;;;                                                                       ;;
  3. ;;;                Centre for Speech Technology Research                  ;;
  4. ;;;                     University of Edinburgh, UK                       ;;
  5. ;;;                       Copyright (c) 1996,1997                         ;;
  6. ;;;                        All Rights Reserved.                           ;;
  7. ;;;                                                                       ;;
  8. ;;;  Permission is hereby granted, free of charge, to use and distribute  ;;
  9. ;;;  this software and its documentation without restriction, including   ;;
  10. ;;;  without limitation the rights to use, copy, modify, merge, publish,  ;;
  11. ;;;  distribute, sublicense, and/or sell copies of this work, and to      ;;
  12. ;;;  permit persons to whom this work is furnished to do so, subject to   ;;
  13. ;;;  the following conditions:                                            ;;
  14. ;;;   1. The code must retain the above copyright notice, this list of    ;;
  15. ;;;      conditions and the following disclaimer.                         ;;
  16. ;;;   2. Any modifications must be clearly marked as such.                ;;
  17. ;;;   3. Original authors' names are not deleted.                         ;;
  18. ;;;   4. The authors' names are not used to endorse or promote products   ;;
  19. ;;;      derived from this software without specific prior written        ;;
  20. ;;;      permission.                                                      ;;
  21. ;;;                                                                       ;;
  22. ;;;  THE UNIVERSITY OF EDINBURGH AND THE CONTRIBUTORS TO THIS WORK        ;;
  23. ;;;  DISCLAIM ALL WARRANTIES WITH REGARD TO THIS SOFTWARE, INCLUDING      ;;
  24. ;;;  ALL IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS, IN NO EVENT   ;;
  25. ;;;  SHALL THE UNIVERSITY OF EDINBURGH NOR THE CONTRIBUTORS BE LIABLE     ;;
  26. ;;;  FOR ANY SPECIAL, INDIRECT OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES    ;;
  27. ;;;  WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN   ;;
  28. ;;;  AN ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION,          ;;
  29. ;;;  ARISING OUT OF OR IN CONNECTION WITH THE USE OR PERFORMANCE OF       ;;
  30. ;;;  THIS SOFTWARE.                                                       ;;
  31. ;;;                                                                       ;;
  32. ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
  33. ;;;
  34. ;;;   First attempt at a linear regression model to predict F0 values.
  35. ;;;   This is an attempt to reimplement the work in Black and
  36. ;;;   Hunt ICSLP96, though this model probably isn't as good.
  37. ;;;
  38.  
  39. ;;;start
  40. ;;; R2 = 0.251, F(74, 12711) = 57.5, Prob>F = 0.000
  41. ;;; RMSE = 27.877
  42. ;;;mid
  43. ;;; R2 = 0.332, F(74, 12711) = 85.6, Prob>F = 0.000
  44. ;;; RMSE = 28.293
  45. ;;;end
  46. ;;; R2 = 0.292, F(74, 12711) = 70.8, Prob>F = 0.000
  47. ;;; RMSE = 27.139
  48.  
  49. (define (emph_syl syl)
  50.   (if (string-equal (item.feat syl "tobi_accent") "NONE")
  51.       0.0
  52.       (if (string-equal (item.feat 
  53.              syl "R:SylStructure.parent.R:Token.parent.EMPH") "1")
  54.       2.0
  55.       0.0)))
  56.  
  57. (set! f2b_f0_lr_start
  58. '(
  59. ( Intercept 160.584956 )
  60. ( R:SylStructure.parent.R:Token.parent.EMPH 10.0 )
  61. ( pp.tobi_accent 10.081770 (H*) )
  62. ( pp.tobi_accent 3.358613 (!H*) )
  63. ( pp.tobi_accent 4.144342 (*? X*? H*!H* * L+H* L+!H*) )
  64. ( pp.tobi_accent -1.111794 (L*) )
  65. ( pp.tobi_accent 19.646313 (L*+H L*+!H) )
  66. ( p.tobi_accent 32.081029 (H*) )
  67. ( p.tobi_accent 18.090033 (!H*) )
  68. ( p.tobi_accent 23.255280 (*? X*? H*!H* * L+H* L+!H*) )
  69. ( p.tobi_accent -9.623577 (L*) )
  70. ( p.tobi_accent 26.517095 (L*+H L*+!H) )
  71. ( tobi_accent 5.221081 (H*) )
  72. ( tobi_accent 10.159194 (!H*) )
  73. ( tobi_accent 3.645511 (*? X*? H*!H* * L+H* L+!H*) )
  74. ( tobi_accent -5.720030 (L*) )
  75. ( tobi_accent -6.355773 (L*+H L*+!H) )
  76. ( n.tobi_accent -5.691933 (H*) )
  77. ( n.tobi_accent 8.265606 (!H*) )
  78. ( n.tobi_accent 0.861427 (*? X*? H*!H* * L+H* L+!H*) )
  79. ( n.tobi_accent 1.270504 (L*) )
  80. ( n.tobi_accent 3.499418 (L*+H L*+!H) )
  81. ( nn.tobi_accent -3.785701 (H*) )
  82. ( nn.tobi_accent 7.013446 (!H*) )
  83. ( nn.tobi_accent 2.637494 (*? X*? H*!H* * L+H* L+!H*) )
  84. ( nn.tobi_accent -0.392176 (L*) )
  85. ( nn.tobi_accent -2.957502 (L*+H L*+!H) )
  86. ( pp.tobi_endtone -3.531153 (L-L%) )
  87. ( pp.tobi_endtone 0.131156 (L-) )
  88. ( pp.tobi_endtone 2.729199 (H-L% !H-L% -X?) )
  89. ( pp.tobi_endtone 8.258756 (L-H%) )
  90. ( pp.tobi_endtone 5.836487 (H-) )
  91. ( pp.tobi_endtone 11.213440 (!H- H-H%) )
  92. (  R:Syllable.p.tobi_endtone -28.081359 (L-L%) )
  93. (  R:Syllable.p.tobi_endtone -20.553145 (L-) )
  94. (  R:Syllable.p.tobi_endtone -5.442577 (H-L% !H-L% -X?) )
  95. (  R:Syllable.p.tobi_endtone -6.585836 (L-H%) )
  96. (  R:Syllable.p.tobi_endtone 8.537044 (H-) )
  97. (  R:Syllable.p.tobi_endtone 4.243342 (!H- H-H%) )
  98. ( tobi_endtone -9.333926 (L-L%) )
  99. ( tobi_endtone -0.346711 (L-) )
  100. ( tobi_endtone -0.507352 (H-L% !H-L% -X?) )
  101. ( tobi_endtone -0.937483 (L-H%) )
  102. ( tobi_endtone 9.472265 (H-) )
  103. ( tobi_endtone 14.256898 (!H- H-H%) )
  104. ( n.tobi_endtone -13.084253 (L-L%) )
  105. ( n.tobi_endtone -1.060688 (L-) )
  106. ( n.tobi_endtone -7.947205 (H-L% !H-L% -X?) )
  107. ( n.tobi_endtone -5.471592 (L-H%) )
  108. ( n.tobi_endtone -0.095669 (H-) )
  109. ( n.tobi_endtone 4.933708 (!H- H-H%) )
  110. ( nn.tobi_endtone -14.993470 (L-L%) )
  111. ( nn.tobi_endtone -3.784284 (L-) )
  112. ( nn.tobi_endtone -15.505132 (H-L% !H-L% -X?) )
  113. ( nn.tobi_endtone -11.352400 (L-H%) )
  114. ( nn.tobi_endtone -5.551627 (H-) )
  115. ( nn.tobi_endtone -0.661581 (!H- H-H%) )
  116. ( pp.old_syl_break -3.367677 )
  117. ( p.old_syl_break 0.641755 )
  118. ( old_syl_break -0.659002 )
  119. ( n.old_syl_break 1.217358 )
  120. ( nn.old_syl_break 2.974502 )
  121. ( pp.stress 1.588098 )
  122. ( p.stress 3.693430 )
  123. ( stress 2.009843 )
  124. ( n.stress 1.645560 )
  125. ( nn.stress 1.926870 )
  126. ( syl_in 1.048362 )
  127. ( syl_out 0.315553 )
  128. ( ssyl_in -2.096079 )
  129. ( ssyl_out 0.303531 )
  130. ( asyl_in -4.257915 )
  131. ( asyl_out -2.422424 )
  132. ( last_accent -0.397647 )
  133. ( next_accent -0.418613 )
  134. ( sub_phrases -5.472055 )
  135. ))
  136.  
  137. (set! f2b_f0_lr_mid
  138. '(
  139. ( Intercept 169.183377 )
  140. ( R:SylStructure.parent.R:Token.parent.EMPH 10.0 )
  141. ( pp.tobi_accent 4.923247 (H*) )
  142. ( pp.tobi_accent 0.955474 (!H*) )
  143. ( pp.tobi_accent 1.193597 (*? X*? H*!H* * L+H* L+!H*) )
  144. ( pp.tobi_accent 1.501383 (L*) )
  145. ( pp.tobi_accent 7.992120 (L*+H L*+!H) )
  146. ( p.tobi_accent 16.603350 (H*) )
  147. ( p.tobi_accent 11.665814 (!H*) )
  148. ( p.tobi_accent 13.063298 (*? X*? H*!H* * L+H* L+!H*) )
  149. ( p.tobi_accent -2.288798 (L*) )
  150. ( p.tobi_accent 29.168430 (L*+H L*+!H) )
  151. ( tobi_accent 34.517868 (H*) )
  152. ( tobi_accent 22.349656 (!H*) )
  153. ( tobi_accent 23.551548 (*? X*? H*!H* * L+H* L+!H*) )
  154. ( tobi_accent -14.117284 (L*) )
  155. ( tobi_accent -5.978760 (L*+H L*+!H) )
  156. ( n.tobi_accent -1.914945 (H*) )
  157. ( n.tobi_accent 5.249441 (!H*) )
  158. ( n.tobi_accent -1.929947 (*? X*? H*!H* * L+H* L+!H*) )
  159. ( n.tobi_accent -3.287877 (L*) )
  160. ( n.tobi_accent -4.980375 (L*+H L*+!H) )
  161. ( nn.tobi_accent -6.147251 (H*) )
  162. ( nn.tobi_accent 8.408949 (!H*) )
  163. ( nn.tobi_accent 3.193500 (*? X*? H*!H* * L+H* L+!H*) )
  164. ( nn.tobi_accent 1.323099 (L*) )
  165. ( nn.tobi_accent 9.148058 (L*+H L*+!H) )
  166. ( pp.tobi_endtone 4.255273 (L-L%) )
  167. ( pp.tobi_endtone -1.033377 (L-) )
  168. ( pp.tobi_endtone 11.992045 (H-L% !H-L% -X?) )
  169. ( pp.tobi_endtone 6.989573 (L-H%) )
  170. ( pp.tobi_endtone 2.598854 (H-) )
  171. ( pp.tobi_endtone 12.178307 (!H- H-H%) )
  172. (  R:Syllable.p.tobi_endtone -4.397973 (L-L%) )
  173. (  R:Syllable.p.tobi_endtone -6.157077 (L-) )
  174. (  R:Syllable.p.tobi_endtone 5.530608 (H-L% !H-L% -X?) )
  175. (  R:Syllable.p.tobi_endtone 6.938086 (L-H%) )
  176. (  R:Syllable.p.tobi_endtone 6.162763 (H-) )
  177. (  R:Syllable.p.tobi_endtone 8.035727 (!H- H-H%) )
  178. ( tobi_endtone -19.357902 (L-L%) )
  179. ( tobi_endtone -13.877759 (L-) )
  180. ( tobi_endtone -6.176061 (H-L% !H-L% -X?) )
  181. ( tobi_endtone -7.328882 (L-H%) )
  182. ( tobi_endtone 12.694193 (H-) )
  183. ( tobi_endtone 30.923398 (!H- H-H%) )
  184. ( n.tobi_endtone -17.727785 (L-L%) )
  185. ( n.tobi_endtone -2.539592 (L-) )
  186. ( n.tobi_endtone -8.126830 (H-L% !H-L% -X?) )
  187. ( n.tobi_endtone -8.701685 (L-H%) )
  188. ( n.tobi_endtone -1.006439 (H-) )
  189. ( n.tobi_endtone 6.834498 (!H- H-H%) )
  190. ( nn.tobi_endtone -15.407530 (L-L%) )
  191. ( nn.tobi_endtone -2.974196 (L-) )
  192. ( nn.tobi_endtone -12.287673 (H-L% !H-L% -X?) )
  193. ( nn.tobi_endtone -7.621437 (L-H%) )
  194. ( nn.tobi_endtone -0.458837 (H-) )
  195. ( nn.tobi_endtone 3.170632 (!H- H-H%) )
  196. ( pp.old_syl_break -4.196950 )
  197. ( p.old_syl_break -5.176929 )
  198. ( old_syl_break 0.047922 )
  199. ( n.old_syl_break 2.153968 )
  200. ( nn.old_syl_break 2.577074 )
  201. ( pp.stress -2.368192 )
  202. ( p.stress 1.080493 )
  203. ( stress 1.135556 )
  204. ( n.stress 2.447219 )
  205. ( nn.stress 1.318122 )
  206. ( syl_in 0.291663 )
  207. ( syl_out -0.411814 )
  208. ( ssyl_in -1.643456 )
  209. ( ssyl_out 0.580589 )
  210. ( asyl_in -5.649243 )
  211. ( asyl_out 0.489823 )
  212. ( last_accent 0.216634 )
  213. ( next_accent 0.244134 )
  214. ( sub_phrases -5.758156 )
  215. ))
  216.  
  217.  
  218. (set! f2b_f0_lr_end
  219. '(
  220. ( Intercept 169.570381 )
  221. ( R:SylStructure.parent.R:Token.parent.EMPH 10.0 )
  222. ( pp.tobi_accent 3.594771 (H*) )
  223. ( pp.tobi_accent 0.432519 (!H*) )
  224. ( pp.tobi_accent 0.235664 (*? X*? H*!H* * L+H* L+!H*) )
  225. ( pp.tobi_accent 1.513892 (L*) )
  226. ( pp.tobi_accent 2.474823 (L*+H L*+!H) )
  227. ( p.tobi_accent 11.214208 (H*) )
  228. ( p.tobi_accent 9.619350 (!H*) )
  229. ( p.tobi_accent 9.084690 (*? X*? H*!H* * L+H* L+!H*) )
  230. ( p.tobi_accent 0.519202 (L*) )
  231. ( p.tobi_accent 26.593112 (L*+H L*+!H) )
  232. ( tobi_accent 25.217589 (H*) )
  233. ( tobi_accent 13.759851 (!H*) )
  234. ( tobi_accent 17.635192 (*? X*? H*!H* * L+H* L+!H*) )
  235. ( tobi_accent -12.149974 (L*) )
  236. ( tobi_accent 13.345913 (L*+H L*+!H) )
  237. ( n.tobi_accent 4.944848 (H*) )
  238. ( n.tobi_accent 7.398383 (!H*) )
  239. ( n.tobi_accent 1.683011 (*? X*? H*!H* * L+H* L+!H*) )
  240. ( n.tobi_accent -6.516900 (L*) )
  241. ( n.tobi_accent -6.768201 (L*+H L*+!H) )
  242. ( nn.tobi_accent -4.335797 (H*) )
  243. ( nn.tobi_accent 5.656462 (!H*) )
  244. ( nn.tobi_accent 0.263288 (*? X*? H*!H* * L+H* L+!H*) )
  245. ( nn.tobi_accent 1.022002 (L*) )
  246. ( nn.tobi_accent 6.702368 (L*+H L*+!H) )
  247. ( pp.tobi_endtone 10.274958 (L-L%) )
  248. ( pp.tobi_endtone 3.129947 (L-) )
  249. ( pp.tobi_endtone 15.476240 (H-L% !H-L% -X?) )
  250. ( pp.tobi_endtone 10.446935 (L-H%) )
  251. ( pp.tobi_endtone 6.104384 (H-) )
  252. ( pp.tobi_endtone 14.182688 (!H- H-H%) )
  253. (  R:Syllable.p.tobi_endtone 1.767454 (L-L%) )
  254. (  R:Syllable.p.tobi_endtone -1.040077 (L-) )
  255. (  R:Syllable.p.tobi_endtone 18.438093 (H-L% !H-L% -X?) )
  256. (  R:Syllable.p.tobi_endtone 8.750018 (L-H%) )
  257. (  R:Syllable.p.tobi_endtone 5.000340 (H-) )
  258. (  R:Syllable.p.tobi_endtone 10.913437 (!H- H-H%) )
  259. ( tobi_endtone -12.637935 (L-L%) )
  260. ( tobi_endtone -13.597961 (L-) )
  261. ( tobi_endtone -6.501965 (H-L% !H-L% -X?) )
  262. ( tobi_endtone 8.747483 (L-H%) )
  263. ( tobi_endtone 15.165833 (H-) )
  264. ( tobi_endtone 50.190326 (!H- H-H%) )
  265. ( n.tobi_endtone -16.965781 (L-L%) )
  266. ( n.tobi_endtone -5.222475 (L-) )
  267. ( n.tobi_endtone -7.358555 (H-L% !H-L% -X?) )
  268. ( n.tobi_endtone -7.833168 (L-H%) )
  269. ( n.tobi_endtone 4.701087 (H-) )
  270. ( n.tobi_endtone 10.349902 (!H- H-H%) )
  271. ( nn.tobi_endtone -15.369483 (L-L%) )
  272. ( nn.tobi_endtone -2.207161 (L-) )
  273. ( nn.tobi_endtone -9.363835 (H-L% !H-L% -X?) )
  274. ( nn.tobi_endtone -7.052374 (L-H%) )
  275. ( nn.tobi_endtone 2.207854 (H-) )
  276. ( nn.tobi_endtone 5.271546 (!H- H-H%) )
  277. ( pp.old_syl_break -4.745862 )
  278. ( p.old_syl_break -5.685178 )
  279. ( old_syl_break -2.633291 )
  280. ( n.old_syl_break 1.678340 )
  281. ( nn.old_syl_break 2.274729 )
  282. ( pp.stress -2.747198 )
  283. ( p.stress 0.306724 )
  284. ( stress -0.565613 )
  285. ( n.stress 2.838327 )
  286. ( nn.stress 1.285244 )
  287. ( syl_in 0.169955 )
  288. ( syl_out -1.045661 )
  289. ( ssyl_in -1.487774 )
  290. ( ssyl_out 0.752405 )
  291. ( asyl_in -5.081677 )
  292. ( asyl_out 3.016218 )
  293. ( last_accent 0.312900 )
  294. ( next_accent 0.837992 )
  295. ( sub_phrases -5.397805 )
  296.  
  297. ))
  298.  
  299. ;; groups
  300. ;; tobi_accent_1 25.217589 (H*) )
  301. ;; tobi_accent_2 13.759851 (!H*) )
  302. ;; tobi_accent_3 17.635192 (*? X*? H*!H* * L+H* L+!H*) )
  303. ;; tobi_accent_4 -12.149974 (L*) )
  304. ;; tobi_accent_5 13.345913 (L*+H L*+!H) )
  305.  
  306. ;; tobi_endtone_1 10.274958 (L-L%) )
  307. ;; tobi_endtone_2 3.129947 (L-) )
  308. ;; tobi_endtone_3 15.476240 (H-L% !H-L% -X?) )
  309. ;; tobi_endtone_4 10.446935 (L-H%) )
  310. ;; tobi_endtone_5 6.104384 (H-) )
  311. ;; tobi_endtone_6 14.182688 (!H- H-H%) )
  312.  
  313. (provide 'f2bf0lr)
  314.  
  315.