home *** CD-ROM | disk | FTP | other *** search
/ OS/2 Shareware BBS: 14 Text / 14-Text.zip / arc_7e.zip / SPCHOUT.SAV
Text File  |  1994-04-16  |  120KB  |  3,658 lines

  1. This file uploaded by John Pedersen 76547,357.
  2.  
  3. Messages collected using Golden Commpass 2.1
  4.  
  5. Messages sorted with Recon 2.2
  6.  
  7.  
  8.  
  9. #: 1 S10/Thread Header
  10.     08-Feb-94  16:10:46
  11. Sb: Speech quick interaction
  12. Fm:
  13. To:
  14.  
  15. TITLE: SPEECH QUICK INTERACTION
  16. KEYWORDS: QUICK RESPONSE SPEED PROFILE
  17.  
  18. #: 705 S10/IBM Speech Products ∙5 ∙
  19.     08-Feb-94  16:10:46
  20. Sb: Speech quick interaction
  21. Fm: Dave Briccetti [Zif 72241,557
  22. To: All
  23.  
  24. Hello.
  25.  
  26. I'm using ICSS for the first time, and I like it very much so far.  I'm
  27. looking for pointers to information that will allow me to tune my ICSS
  28. applications for very quick response.  For simple responses, such as "Yes" and
  29. "No," I'd like ICSS to return to my application within 1/2 second after the
  30. speaker stops talking.  Is this done entirely by adjusting the system
  31. parameters, or is there something else I need to do?.
  32.  
  33. Thanks, and keep up the good work.
  34.  
  35. Dave Briccetti
  36. Dave Briccetti & Assoc.
  37. OS/2 Consultant/Developer
  38. Lafayette, CA
  39.  
  40.  
  41. #: 725 S10/IBM Speech Products ∙5 ∙
  42.     09-Feb-94  16:39:51
  43. Sb: #705-Speech quick interaction
  44. Fm: Ora Williamson 71742,2161
  45. To: Dave Briccetti [Zif 72241,557
  46.  
  47. >> For simple responses, such as "Yes" and "No," I'd like ICSS to return to my
  48. application within 1/2 second after the speaker stops talking.
  49.  
  50. Dave: In the User Profile, adjust the Minimum Amount of Silence To Indicate
  51. End Talking variable.  Or, adjust it with the ICSSSetValue API call using the
  52. UttEndSilDuration variable.
  53.  
  54. Hope this helps! Regards, Ora J. Williamson IBM Spoken Language Systems Lab
  55. ICSS Technical Liason
  56.  
  57. #: 1 S10/Thread Header
  58.     27-Jan-94  23:56:29
  59. Sb: Speech Products
  60. Fm:
  61. To:
  62.  
  63. TITLE: SPEECH PRODUCTS
  64. KEYWORDS:  ICSS IPDS
  65.  
  66. #: 575 S10/IBM Speech Products ∙5 ∙
  67.     27-Jan-94  23:56:29
  68. Sb: Speech Products
  69. Fm: R. Glenn Jones 73531,461
  70. To: Ian Wright 73064,3434
  71.  
  72. Ian, I am a little confused about IBM's various speech products. Was the IBM
  73. Dictation system written using ICSS? I have purchased the dicatation system
  74. (have the software but not the card yet) and wonder now if I have bought the
  75. right product.
  76.  
  77. Can you tell me what the differences are between the various products?
  78.  
  79. Thanks R. Glenn Jones (Sears Canada Inc)
  80.  
  81.  
  82. #: 580 S10/IBM Speech Products ∙5 ∙
  83.     29-Jan-94  11:46:38
  84. Sb: #575-Speech Products
  85. Fm: Ian Wright (IBM) 73064,3434
  86. To: R. Glenn Jones 73531,461
  87.  
  88. >>I am a little confused about IBM's various speech products
  89.  
  90. Well, me too.  But here's what I have found.
  91.  
  92. IBM Personal Dictation System ------------------------- * Discrete speech
  93. dictation * 20,000-word vocabulary (World News Today reported 32,000-word
  94. vocab, 20 Nov 93) * 70 words a minute * Needs training * Continuous speech
  95. commands (Solitaire's great fun) * Voice Action Editor to create personal
  96. macros (e.g. to open e-mail when you say "Good morning") * User interface
  97. navigation
  98.  
  99. IBM Speech Server Series -------------------- * Similar to IPDS in function *
  100. Runs under AIX (host and client) or AIX host and OS/2 client * High-end
  101. solution includes networking
  102.  
  103. IBM Continuous Speech Series ------------------------ * Speaker-independent *
  104. Continuous speech * Toolkit for developing Windows, OS/2, and AIX
  105. speech-enabled apps
  106.  
  107.  
  108. VoiceType 2 ---------- * Supports DOS apps such as word processord, databases,
  109. and spreadsheets
  110.  
  111. Voice Type Control for Windows -------------------------- * 64-word vocabulary
  112. command and navigation system for Windows 3.1
  113.  
  114. For Information ------------ Call 1-800-TALK-2ME Ian Wright (IBM)
  115.  
  116.  
  117. #: 598 S10/IBM Speech Products ∙5 ∙
  118.     01-Feb-94  14:00:27
  119. Sb: #575-Speech Products
  120. Fm: Ora Williamson 71742,2161
  121. To: R. Glenn Jones 73531,461
  122.  
  123. >>I am a little confused about IBM's various speech products
  124.  
  125. Time to chime in...
  126.  
  127. IBM's 2 PRIMARY Speech products are IBM Personal Dictation System (IPDS) and
  128. IBM Continuous Speech Series (ICSS).
  129.  
  130. IPDS is a large-vocabulary dictation system which allows you to dictate after
  131. performing an 1 1/2 hour enrollment where you train your voice to the system.
  132. IPDS supports discrete speech - there must be a slight pause between words.
  133. IPDS is currently available for OS/2 and runs about $1000 for the software and
  134. the speech accelerator card.
  135.  
  136. ICSS is a small-vocabulary grammar driven system which allows you to speak
  137. pre-defined words and phrases continuously - without pauses between your
  138. words.  ICSS is speaker-independent - you don't have to train your voice to
  139. the system.  It is great for walk-up-and-use apps.  ICSS ships with an SDK for
  140. speech-enabling applications.  The DLL supplies 12 'C' function calls. For
  141. each application, you can load up to 128 of these grammars (1000 words max per
  142. grammar) and dynamically switch between them, typically from window to window.
  143. ICSS is currently available on OS/2, AIX and Windows.  It supports sound cards
  144. such as the SoundBlaster, Pro Audio Spectrum and IBM Audio Capture and
  145. Playback Adaptor.  ICSS costs $315 for a single development license (which
  146. comes with a runtime license).
  147.  
  148. For information on ANY of IBM's Speech products, call 1-800-TALK2ME.  To order
  149. ICSS, call Indelible Blue at 1-800-776-8284.
  150.  
  151. Ora Williamson ICSS Technical Liason IBM Spoken Language Systems Lab
  152.  
  153.  
  154. #: 604 S10/IBM Speech Products ∙5 ∙
  155.     01-Feb-94  16:47:42
  156. Sb: #598-Speech Products
  157. Fm: Scott Gurvey 70040,156
  158. To: Ora Williamson 71742,2161
  159.  
  160. Ora...
  161.  
  162. Thanks for making the distinction between the speech products clear. Now I
  163. think I've got it. I sure confused them in the first story I did last year. Do
  164. you know if the Personal Dictation Adaptor can serve as the audio input device
  165. for ICSS? SO far the only audio board I have for my PS/2 95 is the
  166. Audiovation/A, and there is no OS/2 support for that.
  167.  
  168. Cheers,
  169.  Scott
  170.  
  171.  
  172. #: 611 S10/IBM Speech Products ∙5 ∙
  173.     01-Feb-94  23:37:06
  174. Sb: #604-Speech Products
  175. Fm: Brandon Booth [IBM] 71042,3144
  176. To: Scott Gurvey 70040,156
  177.  
  178. ICSS can use ACPA, Sound Blaster, and Pro Audio Spectrum cards for audio
  179. input.
  180.  
  181. Brandon
  182.  
  183. ICSS Development
  184.  
  185.  
  186.  
  187.  
  188. #: 622 S10/IBM Speech Products ∙5 ∙
  189.     02-Feb-94  13:23:16
  190. Sb: #611-Speech Products
  191. Fm: Scott Gurvey 70040,156
  192. To: Brandon Booth [IBM] 71042,3144
  193.  
  194. >ICSS can use ACPA, Sound Blaster, and Pro Audio Spectrum cards for audio
  195. input.
  196.  
  197. So.... Can the IPDS card emulate any of those? Can the Audiovation or
  198. Windsurfer? Will ICSS work with either of the last two (the MWave cards) once
  199. OS/2 support is available?
  200.  
  201. Does the idea of needing three IBM audio boards on a computer to support three
  202. different IBM products strike anyone else as a little silly?
  203.  
  204. Cheers,
  205.  Scott
  206.  
  207. #: 677 S10/IBM Speech Products ∙5 ∙
  208.     06-Feb-94  20:52:35
  209. Sb: #622-Speech Products
  210. Fm: Brandon Booth [IBM] 71042,3144
  211. To: Scott Gurvey 70040,156
  212.  
  213. Scott
  214.  
  215. We should be able to use any card supported by MMPM, and so if Windsurfer is
  216. so supported, we should be able to use it.  I really can't comment on our
  217. relationship to IPDS except to say that the two products really do solve
  218. different problems (and is perhaps not as optimal as one would like).
  219.  
  220. Brandon
  221.  
  222. ICSS Development
  223.  
  224.  
  225.  
  226. #: 700 S10/IBM Speech Products ∙5 ∙
  227.     08-Feb-94  14:35:56
  228. Sb: #598-Speech Products
  229. Fm: R. Glenn Jones 73531,461
  230. To: Ora Williamson 71742,2161
  231.  
  232. Ora, The exchange rate must be a little higher than I thought. IBM Canada is
  233. charging roughly $800 each for the software and adapter. I bought IPDS because
  234. I intend to use it as a means of entering data and to a lesser extent to
  235. control programs. Voice control for Windows was mentioned, is this written in
  236. ICSS? R. Glenn Jones (Sears Canada Inc)
  237.  
  238. #: 716 S10/IBM Speech Products ∙5 ∙
  239.     09-Feb-94  10:15:31
  240. Sb: #700-Speech Products
  241. Fm: Ora Williamson 71742,2161
  242. To: R. Glenn Jones 73531,461
  243.  
  244. >> IBM Canada is charging roughly $800 each for the software and adapter.
  245.  
  246. Glenn: The $800 is for the cost of IPDS, not ICSS, right?  IPDS was not part
  247. of the $79 special - only ICSS.
  248.  
  249. >> Voice control for Windows was mentioned, is this written in ICSS?
  250.  
  251. I don't understand the above question.  Are you asking about ICSS for Windows,
  252. or ICSS for OS/2?
  253.  
  254. Regards, Ora J. Williamson IBM Spoken Language Systems Lab ICSS Technical
  255. Liason
  256.  
  257. #: 738 S10/IBM Speech Products ∙5 ∙
  258.     09-Feb-94  23:01:14
  259. Sb: #716-Speech Products
  260. Fm: R. Glenn Jones 73531,461
  261. To: Ora Williamson 71742,2161
  262.  
  263. Ora, yes those figures were for IPDS.
  264.  
  265. I was asking how Voice Control for Windows fit into the picture. I was asking
  266. if Voice Control for Windows was an application that IBM has written using
  267. ICSS. R. Glenn Jones (Sears Canada Inc)
  268.  
  269. #: 1 S10/Thread Header
  270.     06-Feb-94  22:07:02
  271. Sb: ICSS WIN Problem
  272. Fm:
  273. To:
  274.  
  275. TITLE: ICSS WIN PROBLEM
  276. KEYWORDS: ICSS WINDOWS TEST BANDWIDTH
  277.  
  278. #: 679 S10/IBM Speech Products ∙5 ∙
  279.     06-Feb-94  22:07:02
  280. Sb: ICSS WIN Problem
  281. Fm: Dan Devine 76040,215
  282. To: all
  283.  
  284. I have just installed ICSS for Windows.  The installation went smoothly on my
  285. Gateway 486-66 w/ 16M.
  286. I'm getting two errors from what is probably the same problem.  When I try to
  287. run the test I get the
  288. following error when I ACTIVATE the TESTING.CTX file:
  289.  
  290. LoadContext failed, rc:49, Recognition processing could not open the
  291. associated CPDFILE.
  292.  
  293. The error appears when I try to activate the other ctx files as well.  I also
  294. get the second half of this
  295. error (Recognition..CPDFILE) when I load the Stock Market demo.
  296.  
  297. I have a PAS16 card that functions properly.  Any help would be appreciated.
  298.  
  299.  
  300. DAN  
  301.  
  302. #: 689 S10/IBM Speech Products ∙5 ∙
  303.     07-Feb-94  16:41:34
  304. Sb: #679-ICSS WIN Problem
  305. Fm: Ora Williamson 71742,2161
  306. To: Dan Devine 76040,215
  307.  
  308. >> LoadContext failed, rc:49, Recognition processing could not open the
  309. associated CPDFILE.
  310.  
  311. Dan:
  312.  
  313. Do me a favor and look for the file MEDIUM.CPD in the following directory:
  314. \ICSSWIN\MODEL\US_ENG\MEDIUM.
  315.  
  316. If it is in there, then you may have a path problem in the AUTOEXEC, or your
  317. Virtual Memory size is not large enough.  Set Virtual Memory to Permanent and
  318. around 12 - 15 Meg.
  319.  
  320. If you don't have the .CPD file, then I will send it to you.
  321.  
  322. Ora Williamson IBM Spoken Language Systems
  323.  
  324.  
  325. #: 742 S10/IBM Speech Products ∙5 ∙
  326.     10-Feb-94  11:28:19
  327. Sb: #689-ICSS WIN Problem
  328. Fm: Dan Devine 76040,215
  329. To: Ora Williamson 71742,2161
  330.  
  331. Ora,
  332.  
  333. Thanks for your help.  The problem resulted because I had installed the
  334. high banwidth models only, not the medium -  which the included contexts had
  335. been created with.
  336.  
  337. Thanks again,
  338.  
  339. Dan
  340.  
  341. #: 814 S10/IBM Speech Products ∙5 ∙
  342.     16-Feb-94  13:01:28
  343. Sb: #742-ICSS WIN Problem
  344. Fm: Ora Williamson 71742,2161
  345. To: Dan Devine 76040,215
  346.  
  347. >>The problem resulted because I had installed the high banwidth models only,
  348. not the medium
  349.  
  350. Dan: We are updating our documentation to deal with this anomoly.  Thanks for
  351. your patience!
  352.  
  353. Ora.
  354.  
  355. #: 1 S10/Thread Header
  356.     17-Feb-94  09:31:22
  357. Sb: ICSS Prob Determination
  358. Fm:
  359. To:
  360.  
  361. TITLE: ICSS PROB DETERMINATION
  362. KEYWORDS: LIST PROBLEMS SOLUTIONS
  363.  
  364. #: 832 S10/IBM Speech Products ∙5 ∙
  365.     17-Feb-94  09:31:22
  366. Sb: ICSS Prob Determination
  367. Fm: Ora Williamson 71742,2161
  368. To: all
  369.  
  370. To ICSS Users:
  371.  
  372. I have uploaded a file in our section ICSSPD.1 for your perusal.  This file is
  373. a list of common problems that we have seen that you may be encountering.
  374. Possible solutions are included.  As the list grows, we will upload additional
  375. hints/tips in sequential file order (ICSSPD.2, ...).
  376.  
  377. Hope this is helpfulRegards, Ora J. Williamson IBM Spoken Language Systems Lab
  378. ICSS Technical Liasion
  379.  
  380. #: 1 S10/Thread Header
  381.     17-Feb-94  19:21:52
  382. Sb: ICSS API for Phonemes
  383. Fm:
  384. To:
  385.  
  386. TITLE: ICSS API FOR PHONEMES
  387. KEYWORDS: RETURN PHONEMES
  388.  
  389. #: 846 S10/IBM Speech Products ∙5 ∙
  390.     17-Feb-94  19:21:52
  391. Sb: ICSS API for Phonemes
  392. Fm: Tom Vreeland 76711,1075
  393. To: Brandon Booth [IBM] 71042,3144
  394.  
  395. We are currently extending our MEDIAscript OS/2 myltimedia authoring tools to
  396. support speech recognition with ICSS. This will enable developers to use our
  397. tools to build Speech enabled multimedia applications without any C
  398. programming.
  399.  
  400. One important API which is missing from the current support in V 1.0 is the
  401. ability to get a phoneme string back in addition to the text string. This is a
  402. key element in the strategies we would like to use to extend the capabilities
  403. of ICSS. Does such an API exist internally? Could it be provided?
  404.  
  405. This would facilitate lexicon and dictionary construction, and support many
  406. uses in linguistic research using this technology.
  407.  
  408. NOTE: We have also added pen support to our authoring interface and like the
  409. idea that we can load a gesture set and sr context for a given application
  410. element to support both elements of an enhanced mm interface.
  411.  
  412. #: 849 S10/IBM Speech Products ∙5 ∙
  413.     17-Feb-94  22:17:44
  414. Sb: #846-ICSS API for Phonemes
  415. Fm: Bob Cave 73232,2474
  416. To: Tom Vreeland 76711,1075
  417.  
  418. Tom,
  419.  
  420. As far as I know, we have no internal API to get the phoneme string back along
  421. with the recognized text.  I will double check this and get back to you (may
  422. not be until next week as I will be out of the office tomorrow).
  423.  
  424. Regards,
  425.  
  426. Bob Cave, ICSS Development Team
  427.  
  428. #: 892 S10/IBM Speech Products ∙5 ∙
  429.     19-Feb-94  21:23:41
  430. Sb: #846-ICSS API for Phonemes
  431. Fm: Brandon Booth [IBM] 71042,3144
  432. To: Tom Vreeland 76711,1075
  433.  
  434. Hi Tom
  435.  
  436. The stuff you're describing with the multimedia authoring sounds cool.  I'm
  437. sorry we don't have any api to return the phoneme string with the reco'd text.
  438.  You could read our dictionary (icss_us.dic) to get this information.  There
  439. are no plans to add such an api to ICSS.
  440.  
  441. Brandon
  442.  
  443. ICSS Development - IBM
  444.  
  445. #: 1 S10/Thread Header
  446.     08-Feb-94  14:55:06
  447. Sb: Other Language Lexicons
  448. Fm:
  449. To:
  450.  
  451. TITLE: OTHER LANGUAGE LEXICONS
  452. KEYWORDS: LANGUAGES FOREIGN SPEAKER ACCENTS RECOGNITION
  453.  
  454. #: 702 S10/IBM Speech Products ∙5 ∙
  455.     08-Feb-94  14:55:06
  456. Sb: Other Language Lexicons
  457. Fm: James E. Osbourn 74150,2571
  458. To: Brandon Booth 71042,3144
  459.  
  460. Are there ICSS dictionaries/lexicons for other languages than English?  If
  461. yes, which ones? are they available in the US?
  462.  
  463.  
  464. James in Kansas City
  465.  
  466. #: 726 S10/IBM Speech Products ∙5 ∙
  467.     09-Feb-94  16:39:59
  468. Sb: #702-Other Language Lexicons
  469. Fm: Ora Williamson 71742,2161
  470. To: James E. Osbourn 74150,2571
  471.  
  472. >>Are there ICSS dictionaries/lexicons for other languages than English?
  473.  
  474. James: No, there are not, but you can emulate foreign phrases using the
  475. English phoneme set.  Add the foreign words to an addendum dictionary and
  476. create the associated phoneme strings with the U.S. English phonemes provided
  477. with ICSS.
  478.  When doing this, it is best to create the phrases as 1 long word.  For
  479. example:
  480.  
  481. MUCHAS_GRACIAS                    M UW  CH AA S  G R AX  S IY AA S
  482.  
  483. Hope this helps! Regards, Ora J. Williamson IBM Spoken Language Systems Lab
  484. ICSS Technical Liason
  485.  
  486. #: 733 S10/IBM Speech Products ∙5 ∙
  487.     09-Feb-94  21:13:57
  488. Sb: #702-Other Language Lexicons
  489. Fm: Brandon Booth [IBM] 71042,3144
  490. To: James E. Osbourn 74150,2571
  491.  
  492. James
  493.  
  494. I'm sorry, we currently only support American English.
  495.  
  496. Brandon
  497.  
  498. ICSS Development
  499.  
  500.  
  501.  
  502. #: 748 S10/IBM Speech Products ∙5 ∙
  503.     10-Feb-94  12:27:02
  504. Sb: #733-Other Language Lexicons
  505. Fm: Bob Hutchison 72254,1315
  506. To: Brandon Booth [IBM] 71042,3144
  507.  
  508. Brandon,
  509.  
  510. Can you clarify this a bit.  What part of America?  The US has such a wide
  511. range of accents that I cannot quite imagine what you mean.  Certainly in
  512. written english there are differences between American English and the rest of
  513. us, but oral?
  514.  
  515. Bob
  516.  
  517.  
  518. #: 829 S10/IBM Speech Products ∙5 ∙
  519.     16-Feb-94  20:03:18
  520. Sb: #748-Other Language Lexicons
  521. Fm: Ken Solkowitz 72103,2111
  522. To: Bob Hutchison 72254,1315
  523.  
  524. Bob,
  525. With ICSS' speaker independent aspects, it recognizes almost anyone in   the
  526. U.S. I've demonstrated at Comdex for the past two years and it recognized
  527. everyone fine. It truly is speaker independent.
  528.  
  529. Regards,
  530. Ken Solkowitz
  531. IBM Continuous Speech Series
  532. Bethesda, MD
  533. 301-803-3897 
  534.  
  535. #: 833 S10/IBM Speech Products ∙5 ∙
  536.     17-Feb-94  10:36:58
  537. Sb: #829-Other Language Lexicons
  538. Fm: Bob Hutchison 72254,1315
  539. To: Ken Solkowitz 72103,2111
  540.  
  541. Ken,
  542.  
  543. That's what I thought.  Thanks for confirming.
  544.  
  545. Bob
  546.  
  547. #: 872 S10/IBM Speech Products ∙5 ∙
  548.     19-Feb-94  13:09:34
  549. Sb: #829-Other Language Lexicons
  550. Fm: Michael Burgun 100020,1604
  551. To: Ken Solkowitz 72103,2111 (X)
  552.  
  553. Ken,
  554.  
  555. <<<Bob, With ICSS' speaker independent aspects, it recognizes almost anyone in
  556.  the U.S. I've demonstrated at Comdex for the past two years and it recognized
  557. everyone fine. It truly is speaker independent. >>>
  558.  
  559. What about people without funny accents like us Australians?!!?
  560.  
  561. Michael
  562.  
  563. #: 874 S10/IBM Speech Products ∙5 ∙
  564.     19-Feb-94  15:13:52
  565. Sb: #872-Other Language Lexicons
  566. Fm: Ken Solkowitz 72103,2111
  567. To: Michael Burgun 100020,1604
  568.  
  569. Michael,
  570. Actually we have a harder time with UK English speakers than we do with anyone
  571. else. We are working on this by recording UK English speakers. That folded
  572. into our voice models will help. We usually recognize UK English fairly well.
  573. I'll have to send a note to the IBMers in Australia using the product and ask
  574. for their results.
  575.  
  576. Best Regards,
  577. Ken Solkowitz
  578. IBM Continuous Speech Series
  579. Bethesda, MD 20817
  580. 301-803-3897 
  581.  
  582.  
  583.  
  584. #: 904 S10/IBM Speech Products ∙5 ∙
  585.     20-Feb-94  07:20:35
  586. Sb: #874-Other Language Lexicons
  587. Fm: Michael Burgun 100020,1604
  588. To: Ken Solkowitz 72103,2111
  589.  
  590. Ken,
  591.  
  592. I doubt you will have any trouble with Australians - I was just "stirring"
  593. (Australian for teasing).
  594.  
  595. Michael
  596.  
  597.  
  598.  
  599. #: 882 S10/IBM Speech Products ∙5 ∙
  600.     19-Feb-94  21:22:51
  601. Sb: #748-Other Language Lexicons
  602. Fm: Brandon Booth [IBM] 71042,3144
  603. To: Bob Hutchison 72254,1315
  604.  
  605. Hi Bob
  606.  
  607. I don't find American accents change that much (I've lived in New York State,
  608. Maryland, and Oregon, and traveled to much of the rest of the country).  I
  609. don't know of any American accent that ICSS can't handle.  At trade shows we
  610. have seen ICSS work with various foreign accents.
  611.  
  612. Brandon
  613.  
  614. ICSS Development - IBM
  615.  
  616. #: 1 S10/Thread Header
  617.     16-Feb-94  16:27:26
  618. Sb: #378-An Odd Application
  619. Fm:
  620. To:
  621.  
  622. TITLE: AN ODD APPLICATION
  623. KEYWORDS: TIMING TIMESTAMP START
  624.  
  625. #: 819 S10/IBM Speech Products ∙5 ∙
  626.     16-Feb-94  16:27:26
  627. Sb: #378-An Odd Application
  628. Fm: Rufus Laggren 76346,1441
  629. To: Brandon Booth [IBM] 71042,3144
  630.  
  631.  >> The way ICSS works your program tells it when to start gathering
  632.  >> speech data and when ICSS returns with the reco'd text it also returns
  633.  >> timing data (utterance length, reco time).  With this your program should
  634.  >> be able to coordinate it's input sources.  What you will not get from ICSS
  635.  >> is timing information on a word by word basis.
  636.  
  637. Can ICSS emit msg's to the opsys at pre-specified times (such as "start of
  638. sound" or "end of sound")?  Or can it "timestamp" its sound *and* text stream
  639. at predefined intervals?
  640.  
  641. I'm assuming (from complete ignorance) that it emits at least 2 outputs, the
  642. text and sampled sound stream (?).
  643.  
  644. Rufus
  645.  
  646. #: 888 S10/IBM Speech Products ∙5 ∙
  647.     19-Feb-94  21:23:20
  648. Sb: #819-An Odd Application
  649. Fm: Brandon Booth [IBM] 71042,3144
  650. To: Rufus Laggren 76346,1441
  651.  
  652. Rufus
  653.  
  654. ICSS does not currently post messages for Start of Talking, etc.  We have had
  655. this requirement from other customers and it is under consideration.  And yes,
  656. we do return the reco'd text, and you can get the sound stream back if you
  657. want it.
  658.  
  659. Brandon
  660.  
  661. ICSS Development - IBM
  662.  
  663. #: 921 S10/IBM Speech Products ∙5 ∙
  664.     21-Feb-94  01:55:03
  665. Sb: #888-An Odd Application
  666. Fm: Rufus Laggren 76346,1441
  667. To: Brandon Booth [IBM] 71042,3144
  668.  
  669.  >> ICSS does not currently post messages for Start of Talking, etc.  We
  670.  >> have had this requirement from other customers
  671.  
  672. Yes, it seems useful to capture a few "milestones" to maintain a timeline, if
  673. it's not too expensive.  Thnks for you quick note.
  674.  
  675. #: 1 S10/Thread Header
  676.     16-Feb-94  19:05:50
  677. Sb: M-ACPA vs SoundBlaster
  678. Fm:
  679. To:
  680.  
  681. TITLE: M-ACPA VS SOUNDBLASTER
  682. KEYWORDS: M-ACPA MWAVE M-WAVE SOUNDBLASTER SB SOUNDBOARDS
  683.  
  684. #: 826 S10/IBM Speech Products ∙5 ∙
  685.     16-Feb-94  19:05:50
  686. Sb: M-ACPA vs SoundBlaster
  687. Fm: Vernon Harvey 72120,2767
  688. To:  Brandon Booth (IBM) 71042,3144
  689.  
  690. Brandon:
  691.  
  692. I am currently using the ICSS software with the MMPM/2 and a SoundBlaster 16
  693. ASP card.  I have just discovered that the developer's toolkit only allows me
  694. to write PM applications when using the "icssmmpm" device, rather than being
  695. able to write simple text mode C programs.  This is not a big deal, but slows
  696. down prototyping a bit.
  697.  
  698. As a result, I am curious.  What are the pros and cons of the SoundBlaster
  699. versus the M-ACPA card.  Are there any features on the SB card that I cannot
  700. get on the M-ACPA card or vice versa.  And most importantly, will there be any
  701. difference in voice recognition by using one card or the other.
  702.  
  703. I have never seen the M-ACPA card advertised anywhere, so any pricing info and
  704. features lists would be more than welcome.
  705.  
  706. Thanks again.
  707. Vernon Harvey.
  708.  
  709. #: 890 S10/IBM Speech Products ∙5 ∙
  710.     19-Feb-94  21:23:28
  711. Sb: #826-M-ACPA vs SoundBlaster
  712. Fm: Brandon Booth [IBM] 71042,3144
  713. To: Vernon Harvey 72120,2767
  714.  
  715. Hi Vernon
  716.  
  717. Well the basic difference between SB and ACPA is that SB's are very popular
  718. and ACPA's nearly unknown.  In fact IBM is converting over to another series
  719. of cards based on MWAVE technology.  We have not noticed any difference in
  720. reco accuracy between the two cards (16 bit in the case of SB, the 8 bit cards
  721. do reco worse).
  722.  
  723. Brandon
  724.  
  725. ICSS Development
  726.  
  727. #: 939 S10/IBM Speech Products ∙5 ∙
  728.     21-Feb-94  14:51:56
  729. Sb: #890-M-ACPA vs SoundBlaster
  730. Fm: Vernon Harvey 72120,2767
  731. To: Brandon Booth [IBM] 71042,3144
  732.  
  733. Brandon:
  734.  
  735. Thanks for the info on the differences.  I guess I will stick with the SB card
  736. for now, and maybe get the M-Wave card when it is released for OS/2.  Is the
  737. M-Wave card the one that incorporates voice, data, fax and sound card in a
  738. single board.  I remember seeing something at the PACRIM show here, and it
  739. sounded pretty impressive, except for the 9600 baud modem (Personally, I want
  740. V.Fast, but I will settle for 14.4).  The card I saw however, only had Windows
  741.  software, and they said that an OS/2 version was in the works.  Any idea when
  742. its due out?
  743.  
  744. Regards,
  745. Vernon.
  746.  
  747. #: 953 S10/IBM Speech Products ∙5 ∙
  748.     21-Feb-94  20:24:41
  749. Sb: #939-M-ACPA vs SoundBlaster
  750. Fm: Brandon Booth [IBM] 71042,3144
  751. To: Vernon Harvey 72120,2767
  752.  
  753. Vernon
  754.  
  755. I'm sorry, I don't know much about the M-Wave based cards.  You might ask over
  756. on the MMPM section of OS2DF1.
  757.  
  758. Brandon
  759.  
  760. ICSS Development
  761.  
  762. #: 1 S10/Thread Header
  763.     17-Feb-94  17:55:09
  764. Sb: ICSS - H/W & S/W Quests
  765. Fm:
  766. To:
  767.  
  768. TITLE: ICSS - H/W & S/W QUESTS
  769. KEYWORDS: TIMING TIMESTAMP START STORAGE DIGITIZE
  770.  
  771. #: 843 S10/IBM Speech Products ∙5 ∙
  772.     17-Feb-94  17:55:09
  773. Sb: ICSS - H/W & S/W Quests
  774. Fm: Marc S Grushcow 70751,1501
  775. To: Brandon Booth 71042,3144
  776.  
  777. Brandon,
  778.  
  779. It looks like we might have a paying project that will let us use both OS/2
  780. and ICSS.  It will be an interesting way to get our feet wet.  I have some
  781. questions about the ICSS API and hardware...
  782.  
  783. 1) Timing
  784. I want to know when the speaker started an utterance.    ICSSGetSpokenWords
  785. returns AcquisitionTime and RecognitionTime.   Assume that the function just
  786. completed and I immediately get the system time.  How good an estimate of
  787. utterance start time is system time minus the sum of the acquisition and
  788. recognition time?
  789.  
  790. 2) Storage
  791. Is it possible to store the digitized data as well as having it go to ICSS for
  792. processing.  Ideally, I'd like ICSS to give me the digitized data along with
  793. the text, but I can't find any support for this in the manual.  If it could do
  794. this, I wouldn't have to save "silence",  but I would happily settle for a
  795. complete record of the digitized session (yes I know the sample rate is
  796. 22KHz).
  797.  
  798. 3)Processor, memory and disk
  799. We are looking at a 48xDX2 at 66MHz with 16 or 24MB RAM which meets the h/w
  800. requirement.  At 16MB, would we expect to see swapping?  I don't expect tht
  801. our app would be really big. (I know that that isn't a lot of help).  In any
  802. case, we will probably go SCSI for the disk (.5 or 1GB)  and are thinking
  803. about the Adaptec local bus controller (2742 I think).  Any comments?  Again,
  804. we would like to be able to save the digitized data in parallel with speech
  805. analysis.
  806.  
  807. 4)Sound Cards
  808. I gather that ICSS still doesn't support any DSP units.  We will probably get
  809. the Pro Audio Spectrum 16 unless there is a technical reason to go with the
  810. M-ACPA card.
  811.  
  812. 5)A Grammar Question
  813. We will probably go with bigrams based on sample sentences and sentence
  814. fragments.  We have quite a lot of these.  I was wondering about the BNF form
  815. though.  If I write a BNF that can handle...
  816.         Buy grapes, oranges, cheese, and bread and beer.
  817. will it also handle...
  818.   Buy grapes, oranges ...<long pause>... cheesse, and bread and beer.
  819. where <long pause> is longer than Minimum Silence Time?
  820.  
  821. Thanks in advance
  822.  
  823. Marc
  824.  
  825. #: 848 S10/IBM Speech Products ∙5 ∙
  826.     17-Feb-94  22:11:37
  827. Sb: #843-ICSS - H/W & S/W Quests
  828. Fm: Bob Cave 73232,2474
  829. To: Marc S Grushcow 70751,1501
  830.  
  831. Marc,
  832.  
  833. Hi.  I am sitting in for Brandon for a few days, and I think that I can answer
  834. your questions:
  835.  
  836. 1) Timing - the system time minus sum of acquisition time and reco time should
  837. produce a pretty good estimate.  How close does the application need to be?
  838.  
  839. 2) Storing digitized data - No problem here.  You can tell ICSS to record each
  840. utterance while it performs recognition.  Check the system parameter called
  841. Record Session Name.  You give it a path and file name, and ICSS records each
  842. utterance in a separate file with .001, .002, etc. appended to the file name.
  843. I have used this several times, it works great.
  844.  
  845. 3) Hardware reqts - your configuration is quite similar to mine back at the
  846. office.  I do get swapping with 16 MB RAM, but I also tend to have a bunch of
  847. other things running at the same time.  SCSI disk with the Adaptec controller
  848. sounds great...I wish I had one!  If you want to save 22khz samples, go with
  849. the 1GB drive.
  850.  
  851. 4) Sound Cards - PAS 16 is fine, and you are correct--no DSP support.
  852.  
  853. 5) Grammar - when the user is silent for a time greater than the current value
  854. for end talking silence, ICSS will stop listening.  You can increase this
  855. value, but that will make all recognition response times longer.
  856.  
  857. I hope this helps.
  858.  
  859. Bob Cave, ICSS Development Team
  860.  
  861. #: 891 S10/IBM Speech Products ∙5 ∙
  862.     19-Feb-94  21:23:37
  863. Sb: #843-ICSS - H/W & S/W Quests
  864. Fm: Brandon Booth [IBM] 71042,3144
  865. To: Marc S Grushcow 70751,1501
  866.  
  867. Hi Marc
  868.  
  869. On your first question, to be honest I'm not sure how good a number you will
  870. get.  Our acquistion time starts when we start acquiring data (hence the
  871. name).  The start of talking may occur well after that.  We've had customers
  872. ask for messages to be posted back on these kinds of events, and we are
  873. evaluating this enhancement.
  874.  
  875. On saving the speech signal, look at the SetValue function and the
  876. RecordSpeech and RecordSession settings.  That will do what you want.  And you
  877. can use either the 22 kHz or 11 kHz sample rates.
  878.  
  879. 16 meg main ram should not show any swapping, so the disk (which sounds quite
  880. nice) shouldn't factor in (except of course if you are saving the sampled
  881. data).
  882.  
  883. ICSS does not off load DSP processing, so the PAS card is a fine choice.
  884.  
  885. In any case if a user pauses longer than the end silence time, ICSS will think
  886. she has ended the utterance and will begin to process the speech data.  You
  887. can play with this value to get a balance that makes sense to you.
  888.  
  889. Glad I can help.
  890.  
  891. Brandon
  892.  
  893. ICSS Development - IBM
  894.  
  895. #: 929 S10/IBM Speech Products ∙5 ∙
  896.     21-Feb-94  09:12:53
  897. Sb: #891-ICSS - H/W & S/W Quests
  898. Fm: Marc S Grushcow 70751,1501
  899. To: Brandon Booth [IBM] 71042,3144
  900.  
  901. Brandon,
  902.  
  903. I think I liked Bob's answer about identifying the start of speech time better
  904. than yours.  I hate to start an argument, but who is right?  This could be a
  905. sticky problem for us.
  906.  
  907. Our project is dealing with multimodal dialogues - we are getting input from
  908. both voice and gestures (pen, touch screen or mouse).  We can save the "ink"
  909. from the gestures and timestamp them for later analysis.  It looks like speech
  910. is going to be a problem.
  911.  
  912. Two things... First we want to know when the utterance occured (start time and
  913. duration).  Second, I think that we want to have the whole voice sessions
  914. recorded, not just the slices where ICSS thinks that it found something.  The
  915. scientists involved will want to be able to playback the digitized voice and
  916. see where ICSS found things at least until they are confident that it is
  917. working.
  918.  
  919. ??
  920. Marc  
  921.  
  922.  
  923.  
  924. #: 940 S10/IBM Speech Products ∙5 ∙
  925.     21-Feb-94  15:04:17
  926. Sb: #929-ICSS - H/W & S/W Quests
  927. Fm: Vernon Harvey 72120,2767
  928. To: Marc S Grushcow 70751,1501
  929.  
  930. Hi Mark:
  931.  
  932. Your system sounds a bit similar to my home system on the H/W level.  You
  933. might want to check the availability of OS/2 2.1 drivers for the Adaptec VLB
  934. controller.  When I bought my system in December, Adaptec had the VLB
  935. controller, but no driver support for OS/2.  As a result, I went with the
  936. BusLogic BT-445S (I think that's the right model), and it is working without
  937. any problems.  Adaptec was supposed to have drivers
  938. available sometime in January.
  939.  
  940. Regards,
  941. Vernon Harvey.
  942.  
  943. #: 951 S10/IBM Speech Products ∙5 ∙
  944.     21-Feb-94  20:24:33
  945. Sb: #929-ICSS - H/W & S/W Quests
  946. Fm: Brandon Booth [IBM] 71042,3144
  947. To: Marc S Grushcow 70751,1501
  948.  
  949. Hi Marc
  950.  
  951. I'm sorry, but I believe I am correct about the timings returned.  Let me make
  952. a destinction between the entire audio data and the utterance data, which is
  953. from the start of talking (when the speech signal rises above the threshold)
  954. to the end of talking (when the speech signal falls below the threshold).  In
  955. the shipping products we return the acquistion time, which is the first of
  956. these.  Customers have requested being notified of the events in the second of
  957. these.  We are evaluating this request.  Also,  you can record all of the
  958. audio data from the time the card is opened until the time it is closed, and
  959. analyse this if you wish.
  960.  
  961. Brandon
  962.  
  963. ICSS Development
  964.  
  965. #: 983 S10/IBM Speech Products ∙5 ∙
  966.     22-Feb-94  21:13:53
  967. Sb: #929-ICSS - H/W & S/W Quests
  968. Fm: Bob Cave 73232,2474
  969. To: Marc S Grushcow 70751,1501 (X)
  970.  
  971. Marc,
  972.  
  973. Sorry, but I must yield to Brandon on this one.  He is much closer to that
  974. part of the code than I am.
  975.  
  976. Bob
  977.  
  978. #: 1 S10/Thread Header
  979.     03-Feb-94  00:57:24
  980. Sb: ICSS problem
  981. Fm:
  982. To:
  983.  
  984. TITLE: ICSS PROBLEM
  985. KEYWORDS: WINDOWS INSTALLVIRTUAL MEMORY SWAPFILE BANDWIDTH MICROPHONE WIN32
  986.  
  987. #: 634 S10/IBM Speech Products ∙5 ∙
  988.     03-Feb-94  00:57:24
  989. Sb: ICSS problem
  990. Fm: Harry R. Crowe 72677,2714
  991. To: sysop
  992.  
  993. I have just received the ICSS package for Windows v3.1 My install failed.  The
  994. process accepted all 9 disks, and then reported that I did not have Virtual
  995. Memory activated. My environment is
  996.   MSDOS v6.2
  997.   PC = Clone 486DX2/66 with 20M installed RAM
  998.   Disks are C=170M and D=130M
  999.   Memory management is via native mode MS drivers
  1000.     (himem.sys and emm386.exe)
  1001.   Chosen installation area is D-drive with 40M free When I tried to access the
  1002. test program (Developer's Toolkit) the system responded by
  1003.   NO load
  1004.   NO action
  1005.   RETURN to Program Manager Nothing else in the ICSS window worked properly.
  1006. The DOS path had been ammended and re-boot was performed. I then blew away the
  1007. installed programs on D: and attempted to re-install the system.  This was not
  1008. smoothe.  The same result occurred, and I have now given up (in disgust).....
  1009. Can you help me???????
  1010.  
  1011. #: 642 S10/IBM Speech Products ∙5 ∙
  1012.     03-Feb-94  15:46:43
  1013. Sb: #634-ICSS problem
  1014. Fm: Ora Williamson 71742,2161
  1015. To: Harry R. Crowe 72677,2714
  1016.  
  1017. >>I have just received the ICSS package for Windows v3.1 My install failed.
  1018.  
  1019. Harry:
  1020.  
  1021. Did you restart Windows before trying anything?
  1022.  
  1023. In the Control Panel under 386 Enhanced, check your Virtual Memory size.  Can
  1024. your swap file grow to 12 Meg or larger?  If not, set it up as thus, and try,
  1025. try again.
  1026.  
  1027. Don't get upset!  Once you are correctly configured, you'll be very happy!
  1028.  
  1029. Regards, Ora Williamson IBM Spoken Language Systems Lab
  1030.  
  1031. #: 671 S10/IBM Speech Products ∙5 ∙
  1032.     05-Feb-94  22:15:02
  1033. Sb: #642-ICSS problem
  1034. Fm: Harry R. Crowe 72677,2714
  1035. To: Ora Williamson 71742,2161
  1036.  
  1037. Thank you for your response.  You proposed two steps to start my path to
  1038. success
  1039. with ICSS:
  1040.  1.  Restart Windows
  1041.  2.  Generate a 12M swapfile
  1042. I honestly do not remember if I first restarted windows, but now any time I go
  1043. into the Developers Toolkit the screen blackens momentarily and then returns
  1044. to the Program Manager.  I have not yet implemented the 12M Swap File.  I will
  1045. do so now with my new 345M hard disk and see what happens - remember from my
  1046. first message:  I have 20M (!) of installed RAM.  Do I still need such a swap
  1047. file???
  1048. I may be checking back!
  1049. thanks again...
  1050. HC
  1051.  
  1052. #: 673 S10/IBM Speech Products ∙5 ∙
  1053.     06-Feb-94  01:07:36
  1054. Sb: #642-ICSS problem
  1055. Fm: Harry R. Crowe 72677,2714
  1056. To: Ora Williamson 71742,2161
  1057.  
  1058. Ora:
  1059.  This is one of those times when my extensive computer background is feeling
  1060. like a light shirt on a cold night...  I have messaged you once since my first
  1061. call for help regarding ICSS for Windows.  This email is before any reply to
  1062. my second message would be possible for you (I think).  At your suggestion, I
  1063. created a >12M swap file.  But I also re-installed the system to my C-drive
  1064. (instead of D).  The install went more smoothely, and I can now bring up the
  1065. Developer's Toolkit.  But I cannot DO anything.  If I attempt to TEST the
  1066. system, I get various non-useful responses of the type that make one crazy.
  1067. The TechRef manual says to go to the DevToolKit and select Context from the
  1068. Actions pull-down menus....  There IS no Context Menu Item!!  As a matter of
  1069. fact, the manual does not seem to correspond to any screens that I have
  1070. intially found!  This is most frustrating.  By sheer stubborn menu-hunting I
  1071. have found a Grammars/BNF/File/Context  item that seems to locate the Testing
  1072. context.  But then God help me if I try to do anything with it (such as
  1073. ACTIVATE it, as stated in the manual).  HELP!  I only have one life and do not
  1074. wish to spend it on ICSS-in-the-dark!  Do I have the wrong manual for the
  1075. software I was sent???...
  1076. For reference, my environment is as follows.  I have a 486dx2/66 with MSDOS
  1077. v6.2, which performs other multi-media operations fine.  The sound card is a
  1078. Sound Blaster 16/ASP that DOES record in SB software - so I know the hardware
  1079. works...  Any assistance would be greatly appreciated.  I can call on a voice
  1080. line during working hours, but the machine is at home and you know how hard it
  1081. is to trouble shoot something you are not in front of!
  1082. Thanks,
  1083. HC
  1084.  
  1085.  
  1086.  
  1087. #: 682 S10/IBM Speech Products ∙5 ∙
  1088.     06-Feb-94  22:38:14
  1089. Sb: #673-ICSS problem
  1090. Fm: Brandon Booth [IBM] 71042,3144
  1091. To: Harry R. Crowe 72677,2714
  1092.  
  1093. Harry
  1094.  
  1095. When Ora was speaking about testing ICSS, she was refering to the Test Context
  1096. program (wtstctx.exe).  This can be invoked from the Development Environment
  1097. panel from the Speech pulldown (I think this is correct, I don't quite
  1098. remember).  You need to load a compiled context that is shipped with ICSS.
  1099. These have extension .ctx.  Please make sure you have the ICSSDIR environment
  1100. variable set to the install directory of ICSS (if its installed on the C:
  1101. drive than ICSSDIR should be set to C:\ICSSWIN).  The Grammar pulldown is for
  1102. compiling contexts.  Your machine config sound fine.  Please make sure that
  1103. you can record and play back audio with your setup.
  1104.  
  1105. Brandon
  1106.  
  1107. ICSS Development
  1108.  
  1109. #: 688 S10/IBM Speech Products ∙5 ∙
  1110.     07-Feb-94  16:35:46
  1111. Sb: #673-ICSS problem
  1112. Fm: Dan Devine 76040,215
  1113. To: Harry R. Crowe 72677,2714
  1114.  
  1115. Harry,
  1116.  
  1117. I was getting a similar problem when I tried to activate the testing context
  1118. (see my
  1119. other post).  I spoke to tech support today and they said I was getting the
  1120. error
  1121. because I only loaded the High not the Medium.  The included contexts were
  1122. created with the Medium so I need to install that as well.  This was not
  1123. stated in
  1124. the manual either.  Hope this helps.
  1125.  
  1126. Dan
  1127.  
  1128.  
  1129.  
  1130. #: 694 S10/IBM Speech Products ∙5 ∙
  1131.     07-Feb-94  22:59:00
  1132. Sb: #688-ICSS problem
  1133. Fm: Brandon Booth [IBM] 71042,3144
  1134. To: Dan Devine 76040,215
  1135.  
  1136. Dan is quite correct.  The ICSS contexts are input sample rate specific.  We
  1137. have two input rates: High(22050 kHz) and Medium (11025 kHz).  The contexts
  1138. that we ship are compiled in the Medium rate (bandwidth).  You need to have
  1139. the Medium models installed in order to do reco with a Medium context.
  1140.  
  1141. Brandon
  1142.  
  1143. ICSS Development
  1144.  
  1145.  
  1146.  
  1147. #: 710 S10/IBM Speech Products ∙5 ∙
  1148.     09-Feb-94  00:37:45
  1149. Sb: #694-ICSS problem
  1150. Fm: Harry R. Crowe 72677,2714
  1151. To: Brandon Booth [IBM] 71042,3144
  1152.  
  1153. BB:
  1154. Thank you for your response.  With Ora's and your help, the system now seems
  1155. to be up and running!  I re-installed with the Medium format and the
  1156. Test/Sample operations worked fine....  By the way, just what does the WIN32S
  1157. component provide?  I took a removable (ICSS installed) disk from home to
  1158. work, and the DevToolKit would not come up claiming (in one of those fast,
  1159. dark screen blips before going back to the program manager that "This program
  1160. does not work in DOS mode").  Is this because I had not done an INSTALL on the
  1161. work computer?  Should I do an incremental install of the WIN32S component to
  1162. funtion on both?  This is a matter of curiosity, but I WOULD like to know!
  1163. Also, while perusing the HELP documents, I noticed a query regarding other
  1164. processors.  Is the MathCo absolutely necessary (I have a 486dx2/66 at home,
  1165. so I am OK there)??  Will a 386/40 work by itself?  And if not would it with a
  1166. MathCo?
  1167. Thanks for your input...
  1168. HC
  1169.  
  1170. #: 734 S10/IBM Speech Products ∙5 ∙
  1171.     09-Feb-94  21:16:18
  1172. Sb: #710-ICSS problem
  1173. Fm: Brandon Booth [IBM] 71042,3144
  1174. To: Harry R. Crowe 72677,2714
  1175.  
  1176. Hi Harry
  1177.  
  1178. Glad you got running.  Ora is an amazing help to a lot of people (she's a lot
  1179. more people oriented than I; I'm more of a like to program in a cave sort). We
  1180. use the Microsoft Win32s support to provide linear memory (as opposed to
  1181. segmented memory normal to Windows 3.1), and this is mostly because we ported
  1182. from OS/2.  ICSS will not work unless Win32s support is installed (although
  1183. some components will come up, as they don't use Win32s).  Part of ICSS heavily
  1184. uses floating point operations and the program is computationally intensive
  1185. enough that a 486 DX 33 mHz machine is the smallest machine I'd recommend.  A
  1186. 486 DX2 66 mHz is a very nice machine for ICSS (I develop on one at work - a
  1187. clone actually).  Did I answer all of your questions?
  1188.  
  1189. Brandon
  1190.  
  1191. ICSS Development
  1192.  
  1193.  
  1194. #: 747 S10/IBM Speech Products ∙5 ∙
  1195.     10-Feb-94  12:27:00
  1196. Sb: #734-ICSS problem
  1197. Fm: Bob Hutchison 72254,1315
  1198. To: Brandon Booth [IBM] 71042,3144
  1199.  
  1200. Brandon,
  1201.  
  1202. I purchased ICSS for windows unaware that it required win32s.  Now, this
  1203. wouldn't normally be a problem, but for some reason win32s will not run with
  1204. my windows drivers (S3) -- really annoying, but not your problem.
  1205.  
  1206. Why do you use win32s?  If it is for 32bit support you can get that with
  1207. Watcom's compiler and you would be able to run on just about any windows
  1208. machine.
  1209.  
  1210. Bob
  1211.  
  1212. #: 881 S10/IBM Speech Products ∙5 ∙
  1213.     19-Feb-94  21:22:47
  1214. Sb: #747-ICSS problem
  1215. Fm: Brandon Booth [IBM] 71042,3144
  1216. To: Bob Hutchison 72254,1315
  1217.  
  1218. Bob
  1219.  
  1220. We use Win32s for the flat memory addressing as we ported from our OS/2 2.1
  1221. version.  We felt it was the best solution.
  1222.  
  1223. Brandon
  1224.  
  1225. ICSS Development - IBM
  1226.  
  1227. #: 932 S10/IBM Speech Products ∙5 ∙
  1228.     21-Feb-94  10:49:58
  1229. Sb: #881-ICSS problem
  1230. Fm: Bob Hutchison 72254,1315
  1231. To: Brandon Booth [IBM] 71042,3144
  1232.  
  1233. Brandon,
  1234.  
  1235. I guess the cost to me is that I cannot develop for OS/2 and Windows at the
  1236. same time.  Unless you know something I don't about Win32s under OS/2.
  1237.  
  1238. Bob
  1239.  
  1240. #: 952 S10/IBM Speech Products ∙5 ∙
  1241.     21-Feb-94  20:24:38
  1242. Sb: #932-ICSS problem
  1243. Fm: Brandon Booth [IBM] 71042,3144
  1244. To: Bob Hutchison 72254,1315
  1245.  
  1246. Bob
  1247.  
  1248. If it helps, developing ICSS for all of the operating systems that we do is as
  1249. much (or more) of a headache.  I'm sorry we can help.
  1250.  
  1251. Brandon
  1252.  
  1253. ICSS Development
  1254.  
  1255. #: 961 S10/IBM Speech Products ∙5 ∙
  1256.     22-Feb-94  01:03:03
  1257. Sb: #952-ICSS problem
  1258. Fm: Richard Frank 73511,3406
  1259. To: Brandon Booth [IBM] 71042,3144
  1260.  
  1261. Brandon,
  1262.  
  1263.   Is a Sony F-VX500 mic good enough to use?  I have no frame of reference yet.
  1264.  
  1265.   RIchard
  1266.  
  1267. #: 989 S10/IBM Speech Products ∙5 ∙
  1268.     22-Feb-94  23:34:20
  1269. Sb: #961-ICSS problem
  1270. Fm: Brandon Booth [IBM] 71042,3144
  1271. To: Richard Frank 73511,3406 (X)
  1272.  
  1273. Richard
  1274.  
  1275. I don't know.  We've used the mics listed in the tech ref (Sennheiser 410,
  1276. 518, 431; Conneaut Audio Devices 89; Electro-Voice 857; Radio Shack 33-1037,
  1277. 33-1067).  If you have good results, let us know.
  1278.  
  1279. Brandon
  1280.  
  1281. ICSS Development
  1282.  
  1283. #: 1008 S10/IBM Speech Products ∙5 ∙
  1284.     23-Feb-94  15:50:25
  1285. Sb: #952-ICSS problem
  1286. Fm: Bob Hutchison 72254,1315
  1287. To: Brandon Booth [IBM] 71042,3144
  1288.  
  1289. Brandon,
  1290.  
  1291. I'm trying not to criticise too much :-)  I appreciate the work you are faced
  1292. with.
  1293.  
  1294. Bob
  1295.  
  1296.  
  1297.  
  1298. #: 711 S10/IBM Speech Products ∙5 ∙
  1299.     09-Feb-94  00:37:47
  1300. Sb: #688-ICSS problem
  1301. Fm: Harry R. Crowe 72677,2714
  1302. To: Dan Devine 76040,215
  1303.  
  1304. Dan:
  1305. Thanks for your input.  I was in the same boat:  "High Bandwidth only"...  I
  1306. then  installed the Medium and all was fine!  This area is exploration for me,
  1307. but what are people (e.g. you) doing with this??  It is obviously something
  1308. that would be served by a better version of OLE!?  Like Interactive Object
  1309. Embedding?  The program development route is pretty long, with many
  1310. corners!...
  1311. Anyway thanks for the response...
  1312. HC
  1313.  
  1314.  
  1315.  
  1316. #: 669 S10/IBM Speech Products ∙5 ∙
  1317.     05-Feb-94  21:58:46
  1318. Sb: ICSS problem
  1319. Fm: Terry Jones 73131,3137
  1320. To: sysop
  1321.  
  1322. I appear to have a couple of problems with the Windows development kit I
  1323. bought and hope you can help.
  1324.  
  1325. When I was installing the software everything went fine up to disk 9, the
  1326. WIN32S diskette. When it started up it looked at the A: drive despite all the
  1327. others were loaded on the B: drive, and it wasn't possible to load it. How do
  1328. I load this?
  1329.  
  1330. The second problem is that when I followed instructions on testing the ICSS
  1331. installation I got the error
  1332.  
  1333. "StartConversation failed rc:15, Invalid ADCIF Number has been
  1334.         specified"
  1335.  
  1336. after selecting TEST CONTEXT in SPEECH. I tried the stock exchange demo and I
  1337. got the following error:
  1338.  
  1339. "Invalid ADCIF Number has been specified"
  1340.  
  1341. Any idea what is causing this, and how to solve it?
  1342.  
  1343. My system is a 486 clone, I am using a SoundBlaster board and am using QEMM.
  1344.  
  1345. Hope you can help,
  1346.  
  1347.  
  1348. Terry Jones
  1349.  
  1350. (703) 832-7802
  1351.  
  1352.  
  1353.  
  1354. #: 681 S10/IBM Speech Products ∙5 ∙
  1355.     06-Feb-94  22:38:08
  1356. Sb: #669-ICSS problem
  1357. Fm: Brandon Booth [IBM] 71042,3144
  1358. To: Terry Jones 73131,3137
  1359.  
  1360. Terry
  1361.  
  1362. You have to have the Win32s support installed for ICSS to work.  I don't know
  1363. why the Win32s disk was looking for the A drive.  What you should do is call
  1364. our bug report number (800 - 627 - 8822) and describe your problem to Dan (the
  1365. guy who answers that line - he's good at it).  The ADCIF message means that it
  1366. (ICSS) thinks you have the wrong card number (this is set in one of the
  1367. profiles - see the info in the tech ref on profiles).  If you have a single
  1368. audio card installed, I believe 0 is the card number to use.    However, I
  1369. would distrust any error messages until you have Win32s correctly installed.
  1370.  
  1371. Brandon
  1372.  
  1373. ICSS Development
  1374.  
  1375. #: 1 S10/Thread Header
  1376.     28-Feb-94  09:34:24
  1377. Sb: ICSS questions
  1378. Fm:
  1379. To:
  1380.  
  1381. TITLE: ICSS QUESTIONS
  1382. KEYWORDS: VISUAL BASIC VBX CONFIDENCE CERTAINTY SPEED BANDWIDTH
  1383.  
  1384. #: 1094 S10/IBM Speech Products ∙5!∙
  1385.     28-Feb-94  09:34:24
  1386. Sb: ICSS questions
  1387. Fm: Stephen Ng 70302,1510
  1388. To: all
  1389.  
  1390. I've been playing with ICSS/Windows and have been quite impressed with it.  I
  1391. have a couple of comments/questions/suggestions:
  1392.  
  1393. 1. I got ICSS working with Visual Basic; it wasn't too bad except I had to
  1394. write 2 small C routines to do type conversions, and I also had to use the
  1395. MessageBlaster VBX to handle the ICSS reply messages.  Of course what would
  1396. really be nice here would be a VBX--would anyone else be interested in such a
  1397. creature?
  1398.  
  1399. 2. I hooked up ICSS to my telephone, and have been getting decent results.  I
  1400. have a little restaurant locator app running on a Dialogic board, and you can
  1401. select from among 20 different cuisines by speaking the name of the cuisine
  1402. (French, Italian, etc.)  (617-643-EATS in case you want to try it.)  It seems
  1403. to have the most trouble recognizing single syllable words (it always wants to
  1404. interpret "French" as "Greek").  The radio shack gadget for getting a
  1405. mic-level output from the phone seems pretty cheap and may be adding some
  1406. distortion.  I also need to fool with the sound card mixer settings to make
  1407. sure volume is optimal.  Nevertheless, what about adding some kind of
  1408. certainty rating to the API so I can see how good the match is?  And also a
  1409. way to get the next-closest-guess so I can ask the user about the choices?
  1410.  
  1411. 3. I know I'm really pushing ICSS, since it's designed to work with
  1412. high-quality microphones directly into a sound card, and not the telephone
  1413. handsets over phone lines.  But I'm trying to make things easier by keeping
  1414. the grammars trivial, and the vocabularies small.  Is it possible to adjust
  1415. sound model for typical telephone handset acoustics by using a graphic
  1416. equalizer or doing some signal processing on the sound?  Can I adjust the data
  1417. tables ICSS uses?  Or, since it seems to have a propensity to think that most
  1418. single-syllable cuisines are "greek" I can bias the bigram table so that
  1419. "greek" is less likely?  (I can upload the .bnf/.ctx/.wav files if it would
  1420. help.)
  1421.  
  1422. 4. I read that ICSS may use the first utterance to adjust for the particular
  1423. mike.  Does that mean the first utterance since the ICSS was started?  Or per
  1424. conversation?  My application uses a single conversation for multiple phone
  1425. calls--should I use different conversations for different calls so it can
  1426. readjust for different phones?
  1427.  
  1428. 5. Perhaps ICSS has a hard time distinguishing the vowels in "French/Greek".
  1429. So would it help if I changed my grammar such that the user had to say
  1430. "please" after the cuisine name?  I.e. "French, please?"  ICSS would know that
  1431. the second word was "please", and perhaps that could help it figure out that
  1432. the vowel in "french" was not the same sound???
  1433.  
  1434. 6. The 1000-word "limit"--does the performance degrade linearly or
  1435. exponentially as we approach this limit?  Another way to ask the question is,
  1436. what if I got a machine twice as fast as my 486/66--could I recognize 2000
  1437. words as quickly as 1000 words now?
  1438.  
  1439. Thanks for your help,
  1440.  
  1441. --Steve
  1442.  
  1443.  
  1444.  
  1445.  #: 1106 S10/IBM Speech Products ∙5!∙
  1446.     28-Feb-94  21:05:44
  1447. Sb: #1094-ICSS questions
  1448. Fm: Ken Solkowitz 72103,2111
  1449. To: Stephen Ng 70302,1510
  1450.  
  1451. Stephen -
  1452. I am going to bring your post into work and have Bob take a look at it.
  1453. Knowing Bob, he'll take care of this tonight making tomorrow's discussion a
  1454. mute point.
  1455.  
  1456. Regards,
  1457. Ken Solkowitz
  1458. IBM Continuous Speech Series
  1459. Bethesda, MD 20817
  1460. 301-803-3897 
  1461.  
  1462. #: 1111 S10/IBM Speech Products ∙5!∙
  1463.     28-Feb-94  23:41:42
  1464. Sb: #1094-ICSS questions
  1465. Fm: Bob Cave 73232,2474
  1466. To: Stephen Ng 70302,1510
  1467.  
  1468. Stephen,
  1469.  
  1470. That is quite a post!  I can answer some of your questions now, others will
  1471. require some consultation "back at the ranch".
  1472.  
  1473. >1)...the ICSS reply messages.  Of course what would really be nice here would
  1474. >be a VBX--would anyone else be interested in such a creature?
  1475.  
  1476. Given some of the discussion in this topic over the past couple of days, I
  1477. think the answer is definitely "yes".
  1478.  
  1479. 2) We are investigating the notion of adding some type of "confidence"
  1480. indicator to the response for a recognition.  I am not sure about returning
  1481. the next best response...I will look into it.
  1482.  
  1483. >3. I know I'm really pushing ICSS, since it's designed to work with
  1484. high-quality >microphones directly into a sound card, and not the telephone
  1485. handsets over >phone lines.
  1486.  
  1487. This is true: you are pushing ICSS quite hard, possibly beyond its
  1488. capabilities.  What is your hardware configuration?  How are you getting voice
  1489. data into ICSS?  Are you splitting the phone line, with one end going into the
  1490. Dialogic card and the other end into a sound card?  The difficulties with
  1491. using ICSS over the phone come from the reduced bandwidth present in the sound
  1492. samples.  Our speech models are tuned for microphone input bandwidth.  I don't
  1493. think an equalizer will help much.  The models ("data tables") cannot be
  1494. modified by an application.  In general, the longer and more distinct your
  1495. words are, the better recognition you will get.
  1496.  
  1497. >4. I read that ICSS may use the first utterance to adjust for the particular
  1498. mike.
  1499.  
  1500. This is true, and the adjustment is per StartConversation call, I believe.
  1501. Using a new conversation for each call would add overhead to your calls.  You
  1502. can minimize this by making sure that there is always at least one context
  1503. loaded.  The initial LoadContext call causes a large file called a Common
  1504. Probability Distribution file to be loaded, and this can take several seconds.
  1505.   Once it is loaded, all contexts use it and subsequent LoadContext calls are
  1506. quite fast.
  1507.  
  1508. >5. Perhaps ICSS has a hard time distinguishing the vowels in "French/Greek".
  1509. >So would it help if I changed my grammar such that the user had to say
  1510. "please" >after the cuisine name?
  1511.  
  1512. I do not think this will buy you anything, but I will check it out.
  1513.  
  1514. >6. The 1000-word "limit"--does the performance degrade linearly or
  1515. exponentially >as we approach this limit?
  1516.  
  1517. Performance for ICSS recognition is affected more by the branching factor
  1518. (number of choices for the next word at any given point within a grammar)
  1519. within a context than the number of different words.  In any case, a faster
  1520. machine will definitely produce faster recognition, but not necessarily more
  1521. words.
  1522.  
  1523. I hope this helps.  Please post back if you have any more questions.
  1524.  
  1525. Bob Cave, ICSS Development
  1526.  
  1527. #: 1155 S10/IBM Speech Products ∙5!∙
  1528.     02-Mar-94  10:58:44
  1529. Sb: #1111-ICSS questions
  1530. Fm: Stephen Ng 70302,1510
  1531. To: Bob Cave 73232,2474
  1532.  
  1533. Bob,
  1534.  
  1535. Thanks for your very helpful response!  I look forward to any more info you
  1536. may have about my questions; meanwhile here are some responses to some of your
  1537. questions:
  1538.  
  1539. You write:
  1540. "Given some of the discussion in this topic over the past couple of days, I
  1541. think the answer is definitely "yes"."
  1542.  
  1543. I will look into developing a VBX interface to ICSS and possibly distributing
  1544. it as shareware.  (Would anyone care to volunteer how much this would be worth
  1545. to them?  "IBM should provide it for free" is a valid, though not encouraging
  1546. to me, response.)
  1547.  
  1548. You write:
  1549. "What is your hardware configuration?  How are you getting voice data into
  1550. ICSS?  Are you splitting the phone line, with one end going into the Dialogic
  1551. card and the other end into a sound card?  The difficulties with using ICSS
  1552. over the phone come from the reduced bandwidth present in the sound samples.
  1553. "
  1554.  
  1555. I'm running a 486/66DX2 with 16 meg under Windows 3.1, using a Pro Audio
  1556. Studio 16, but I'm certainly open to using upgrading my hardware if it will
  1557. help.  Yes, I'm splitting the phone line just as you say.  I realize this is a
  1558. difficult problem, but I am hopeful that ICSS will provide at least as good a
  1559. solution as some of the dedicated hardware voice recognition solutions
  1560. designed for just telephones (speaker-independent, discrete speech, small
  1561. vocabulary).
  1562.  
  1563. You write:
  1564. "In general, the longer and more distinct your words are, the better
  1565. recognition you will get."
  1566.  
  1567. That has definitely been my experience; my biggest problem is with recognizing
  1568. a single syllable word.
  1569.  
  1570. You write:
  1571. ">4. I read that ICSS may use the first utterance to adjust for the particular
  1572. mike.
  1573. This is true, and the adjustment is per StartConversation call, I believe."
  1574.  
  1575. Interesting, so perhaps at the start of each phone call, the I should do a
  1576. StartConversation, and ask the user to say "hello"?
  1577.  
  1578. You write:
  1579. "Performance for ICSS recognition is affected more by the branching factor
  1580. (number of choices for the next word at any given point within a grammar)
  1581. within a context than the number of different words.  In any case, a faster
  1582. machine will definitely produce faster recognition, but not necessarily more
  1583. words."
  1584.  
  1585. So I should keep the grammar perplexity down if ICSS gets too slow.  But what
  1586. if I have a trivial grammar?  I don't understand your comment that a faster
  1587. machine will not buy me more words....the manual says that 1000 words is not a
  1588. hard limit, but that I simply won't like the performance as I approach 1000
  1589. words.  Doesn't that mean that I can go over 1000 with a really really fast
  1590. machine?
  1591.  
  1592. Thanks,
  1593.  
  1594.  
  1595. Steve
  1596.  
  1597. #: 1163 S10/IBM Speech Products ∙5!∙
  1598.     02-Mar-94  17:18:52
  1599. Sb: #1155-ICSS questions
  1600. Fm: Vernon Harvey 72120,2767
  1601. To: Stephen Ng 70302,1510
  1602.  
  1603. Stephen:
  1604.  
  1605. I seem to recall when I was playing with the Dialogic voice card, that there
  1606. was an interface bus which allows you to take the audio signal directly off
  1607. the card and feed it to another card.  If your audio card has an input
  1608. connector, maybe you could patch them together to provide a cleaner audio
  1609. connection, possibly with less signal loss.
  1610.  
  1611. Regards,
  1612. Vernon.
  1613.  
  1614. #: 1172 S10/IBM Speech Products ∙5!∙
  1615.     02-Mar-94  21:48:04
  1616. Sb: #1163-ICSS questions
  1617. Fm: Bob Cave 73232,2474
  1618. To: Vernon Harvey 72120,2767
  1619.  
  1620. Vernon,
  1621.  
  1622. The interface bus used by the Dialogic cards is proprietary, although that is
  1623. opening up with the new Signal Computing Systems Archtecture (SCSA) standards.
  1624. One can, however, use a Dialogic matrix switch card to provide input to the
  1625. sound card through its audio input jack.  (I wish I had though to mention this
  1626. in my previous reply to Steve <g>).
  1627.  
  1628. Thanks,
  1629.  
  1630. Bob Cave, ICSS Developoment
  1631.  
  1632. #: 1182 S10/IBM Speech Products ∙5!∙
  1633.     03-Mar-94  13:44:11
  1634. Sb: #1155-ICSS questions
  1635. Fm: Vernon Harvey 72120,2767
  1636. To: Stephen Ng 70302,1510 (X)
  1637.  
  1638. Stephen:
  1639.  
  1640. I did a quick look through my technical info on the Dialogic card last night.
  1641. If you have a D/4X series card, there is a 20 pin bus connector which allows
  1642. you to get audio from the card for any of the 4 channels.  I found the info in
  1643. the appendix, and it may be of some use to connect to card to your sound card
  1644. for speech recognition.  The connector is referred to as a P3 audio connection
  1645. bus in my Dialogic manual.  I don't think that you need the Dialogic Matrix
  1646. switch in order to connect the two cards, however, you may want to check with
  1647. Dialogic tech support to be sure.
  1648.  
  1649. Regards,
  1650. Vernon.
  1651.  
  1652. #: 1333 S10/IBM Speech Products ∙5!∙
  1653.     11-Mar-94  11:03:39
  1654. Sb: #1182-ICSS questions
  1655. Fm: Stephen Ng 70302,1510
  1656. To: Vernon Harvey 72120,2767
  1657.  
  1658. Vernon,
  1659.  
  1660. Thanks for the tip!  What publication are you looking at?  I've looked my D/4x
  1661. Hardware reference book, but it seems to just refer me to other docs.  I'll
  1662. try to get the info from Dialogic directly....  I would like to try hooking up
  1663. to the bus directly to see if I can get a cleaner signal.  (The main issue
  1664. appears to be making sure my sound card doesn't get fried when the phone
  1665. rings.)
  1666.  
  1667. --Steve
  1668.  
  1669. #: 1344 S10/IBM Speech Products ∙5!∙
  1670.     11-Mar-94  18:06:11
  1671. Sb: #1333-ICSS questions
  1672. Fm: Vernon Harvey 72120,2767
  1673. To: Stephen Ng 70302,1510
  1674.  
  1675. Stephen:
  1676.  
  1677. Sorry for the delay in replying, I have not been online lately (Busy cruising
  1678. around in my new car!).   The manual which I found this information in was the
  1679. Dialog/4X User's Guide, version 2.30, which appears to date back to about
  1680. 1988.  It was in one of the appendices.  I have come to the point where I
  1681. never throw out the old manuals, as it seems that there are always ommissions
  1682. in the future releases.  Particularily when the company decides that it can
  1683. make more money selling the information.
  1684.  
  1685. Glad to have been able to help.
  1686.  
  1687. Regards,
  1688. Vernon Harvey
  1689. Rydex Industries Corporation.
  1690.  
  1691. #: 1242 S10/IBM Speech Products ∙5!∙
  1692.     06-Mar-94  18:20:14
  1693. Sb: #1155-ICSS questions
  1694. Fm: Rufus Laggren 76346,1441
  1695. To: Stephen Ng 70302,1510
  1696.  
  1697. >... Shareware VBX for ICSS...  value ??
  1698.  
  1699. IMHO:
  1700.  
  1701. Workable -> $30+
  1702.  
  1703. Very good -> $50+
  1704.  
  1705. Just a guess, I'm afraid, and biased to the low-medium end.  I.e., if the base
  1706. package becomes available for about $200 or less (hopefully), it allows
  1707. "impulse purchase" experimentation by many developers and a VBX priced as
  1708. above would fit that market.  However, I confess to usually being low in my $$
  1709. estimates.
  1710.  
  1711. Would suggest that you include a nag screen (not too gross), and configure
  1712. your release to allow some material enhancement to be provide through
  1713. registration.  E.g., distribute a fully usable package, but provide optimized
  1714. dll's or some small useful enhancements with registration...  I judge others
  1715. by myself, and I think that such a "reminder" is needed in shareware, and that
  1716. although it's a departure from the pure free test traditionally provided, it's
  1717. justified and fair and ultimately acceptable.
  1718.  
  1719. I'd like to shareware continue to produce fine products, and I think that many
  1720. people which otherwise would just use the product forever free would consider
  1721. registering  to gain a some small-but-not-purely-symbolic enhancement if they
  1722. indeed find the base product fairly useful.
  1723.  
  1724. Hope you find it do-able.  Good luck.
  1725.  
  1726. #: 1243 S10/IBM Speech Products ∙5!∙
  1727.     06-Mar-94  18:20:21
  1728. Sb: #1111-ICSS questions
  1729. Fm: Rufus Laggren 76346,1441
  1730. To: Bob Cave 73232,2474
  1731.  
  1732.  >> The difficulties with using ICSS over the phone come from the reduced
  1733.  >> bandwidth present in the sound samples.  Our speech models are tuned for
  1734.  >> microphone input bandwidth.
  1735.  
  1736. Is it possible to utilize different "speech models"?  Perhaps one optimized
  1737. for telephony?   Is it feasible to create a speech model through a training
  1738. session using the actual equipment with a specific limited speech/text stream
  1739. which gets recorded and then corrected or "set" into the speech model?  Note
  1740. opportunity for additonal products here <g> (various speeck models,
  1741. "mastering" software to create speech models...).
  1742.  
  1743.  >> Performance for ICSS recognition is affected more by the branching
  1744.  >> factor (number of choices for the next word at any given point within a
  1745.  >> grammar) within a context than the number of different words.
  1746.  
  1747. Hmm.  Accruacy depends on the "number of choices for the next word..", but not
  1748. the "..number of different words"? .....  ??????
  1749.  
  1750. Can I *preset* the branching profile for the next incoming speech stream *and*
  1751. preset the available vocalbulary selection such that amoung very limited
  1752. choices the hit-rate or confidence level rises substantially?  Or is this
  1753. already an automatic part of the ICSS functionality?
  1754.  
  1755. No rush.  When you get a chance.  Thanks.
  1756.  
  1757. #: 1245 S10/IBM Speech Products ∙5!∙
  1758.     06-Mar-94  21:07:13
  1759. Sb: #1243-ICSS questions
  1760. Fm: Bob Cave 73232,2474
  1761. To: Rufus Laggren 76346,1441
  1762.  
  1763. Rufus,
  1764.  
  1765.  >>Is it possible to utilize different "speech models"?
  1766.  >>Perhaps one optimized for telephony?
  1767.  
  1768. Yes, this is possible, and I agree with regard to the additional product
  1769. opportunities.  Many of our customers (and potential customers) have expressed
  1770. a requirement for a version of ICSS which works in a telephony environment.
  1771.  
  1772.  >>Hmm.  Accruacy depends on the "number of choices for the next word..",
  1773.  >>but not the "..number of different words"? .....  ??????
  1774.  
  1775. When I said "performance" in the quote you included, I was referring to
  1776. recognition speed, not recognition accuracy.  I should have been more
  1777. explicit.
  1778.  
  1779. >> Can I *preset* the branching profile for the next incoming speech stream
  1780. >>*and* preset the available vocalbulary selection such that amoung very
  1781. >> limited choices the hit-rate or confidence level rises substantially?  Or
  1782. is
  1783. >>this already an automatic part of the ICSS functionality?
  1784.  
  1785. You can have multiple vocabularies (or "contexts" in ICSS terminology) loaded
  1786. into memory at any given time.  Each time you perform recognition, you can
  1787. select any one of the loaded contexts.  You will get the best accuracy by
  1788. defining small contexts with words which are distinct from one another rather
  1789. than putting all possible responses into a single context.  Does this answer
  1790. the question?
  1791.  
  1792. Regards,
  1793.  
  1794. Bob Cave, ICSS Development
  1795.  
  1796.  
  1797. #: 1259 S10/IBM Speech Products ∙5!∙
  1798.     07-Mar-94  23:39:08
  1799. Sb: #1245-ICSS questions
  1800. Fm: Rufus Laggren 76346,1441
  1801. To: Bob Cave 73232,2474
  1802.  
  1803.  >>  You will get the best accuracy by defining small contexts with words
  1804.  >> which are distinct from one another rather than putting all possible
  1805.  >> responses into a single context
  1806.  
  1807. Yes, does answer my question, point on.  Thanks.  I was wondering what would
  1808. improve the "greek" interpretation of "French" over the phone.  Seems by
  1809. defining small context for a particular expected response, even 1 sylable
  1810. words would be recognized accurately.
  1811.  
  1812. Incidentally, how *does* one build a speech model?
  1813.  
  1814. Thanks for you quick note.  Rufus
  1815.  
  1816. #: 1284 S10/IBM Speech Products ∙5!∙
  1817.     08-Mar-94  21:52:44
  1818. Sb: #1259-ICSS questions
  1819. Fm: Bob Cave 73232,2474
  1820. To: Rufus Laggren 76346,1441
  1821.  
  1822. Rufus,
  1823.  
  1824. >> Incidentally, how *does* one build a speech model?
  1825.  
  1826. The truth is, I know very little about that part of the process.  I know that
  1827. we start with several thousand recorded utterances and transcripts, and the
  1828. whole thing ties up a high-end Risc System/6000 for 24 hours or so.  Beyond
  1829. that, it may as well be magic <g>.
  1830.  
  1831. Perhaps Brandon knows more than I do on this one?
  1832.  
  1833. Regards,
  1834.  
  1835. Bob Cave, ICSS Development
  1836.  
  1837.  
  1838.  
  1839. #: 1187 S10/IBM Speech Products ∙5!∙
  1840.     03-Mar-94  17:05:11
  1841. Sb: #1170-ICSS questions
  1842. Fm: Stephen Ng 70302,1510
  1843. To: Bob Cave 73232,2474
  1844.  
  1845. Bob,
  1846.  
  1847. Of course what's frustrating/tantalizing about this is that it seems to work
  1848. perfectly for a while, then it has periods of not matching at all.  I've
  1849. started recording the sessions as you've suggested.
  1850.  
  1851. I uploaded two files "Barbe00.wav" and "desse00.wav" which are me saying
  1852. "French" and ICSS matching "barbecue" and "dessert".  Can you tell me if there
  1853. is any mangling I can do to these files to make them match better?
  1854.  
  1855. Thanks,
  1856.  
  1857. Steve
  1858.  
  1859. #: 1197 S10/IBM Speech Products ∙5!∙
  1860.     03-Mar-94  22:29:45
  1861. Sb: #1187-ICSS questions
  1862. Fm: Bob Cave 73232,2474
  1863. To: Stephen Ng 70302,1510
  1864.  
  1865. Steve,
  1866.  
  1867. I have downloaded the files and will take them to work and listen to them
  1868. tomorrow.  It would also be helpful if you could upload your BNF file and tell
  1869. me what parameters you are using when you create the context.  This will allow
  1870. me to see if I can duplicate the results you are getting.
  1871.  
  1872. Thanks,
  1873.  
  1874. Bob Cave, ICSS Development
  1875.  
  1876. #: 1199 S10/IBM Speech Products ∙5!∙
  1877.     04-Mar-94  11:52:07
  1878. Sb: #1197-ICSS questions
  1879. Fm: Stephen Ng 70302,1510
  1880. To: Bob Cave 73232,2474
  1881.  
  1882. Bob,
  1883.  
  1884. I really appreciate your taking the time to look at this, especially since I'm
  1885. really pushing ICSS to its limits.
  1886.  
  1887. With the fax I received from Vernon, I hooked up the line in on the Pro Audio
  1888. Studio card directly to the Dialogic card this morning.  I *think* I'm getting
  1889. cleaner audio; I'll send you a sample file by mail (I can't upload files onto
  1890. the conference).
  1891.  
  1892. I'll be doing some testing over the next few days to try to get some idea
  1893. about whether this improves things.
  1894.  
  1895. Yesterday I tried a quick test of the "<cuisine>, please" and "please,
  1896. <cuisine>, please" idea but it didn't seem to help things.  Starting a new
  1897. conversation for each phone call didn't seem to improve the accuracy much
  1898. either.
  1899.  
  1900. Thanks again,
  1901.  
  1902. --Steve
  1903.  
  1904. #: 1244 S10/IBM Speech Products ∙5!∙
  1905.     06-Mar-94  20:48:08
  1906. Sb: #1199-ICSS questions
  1907. Fm: Bob Cave 73232,2474
  1908. To: Stephen Ng 70302,1510
  1909.  
  1910. Steve,
  1911.  
  1912. I got your file and will look at it on Monday.
  1913.  
  1914. The other files you sent had a considerable amount of distortion in the
  1915. background (an audible hum).  When I brought up the files under the Test
  1916. Context function, and looked at the waveform, it was clear that there was a
  1917. problem.  The distortion was well above the default thresholds, and ICSS would
  1918. have attempted to perform recognition on it.
  1919.  
  1920. Regards,
  1921.  
  1922. Bob Cave, ICSS Development
  1923.  
  1924.  
  1925.  
  1926. #: 1200 S10/IBM Speech Products ∙5!∙
  1927.     04-Mar-94  11:52:09
  1928. Sb: #1192-ICSS questions
  1929. Fm: Stephen Ng 70302,1510
  1930. To: Vernon Harvey 72120,2767
  1931.  
  1932. Vernon,
  1933.  
  1934. Thanks for the fax from the manual page; it's exactly what I needed.  (Makes
  1935. me wonder why I paid 30% more for my board to get it direct from Dialogic when
  1936. their tech support wasn't that helpful--why so desperate for my 45 bucks?)
  1937.  
  1938. I hooked up pin 1 (line 1) and pin 2 (line 2) of P3 to the left and right
  1939. signal lines, and pin 20 to the ground line.  Seems to work fine.  But ICSS
  1940. appears to respond to only one side...no big deal.
  1941.  
  1942. Dialogic told me it's about 3db less than tip and ring coming straight off the
  1943. phone line, and that they weren't sure if the 12 volts (or whatever) that you
  1944. get when the phone rings would come in through these lines ("probably not, but
  1945. find a friend who is handy with a voltmeter").  Well, I tested it myself,
  1946. there is no signal on those lines until a connection is made.
  1947.  
  1948. I'll be testing today to see if this actually improves my ICSS performance.
  1949.  
  1950. Thanks again,
  1951.  
  1952. Steve
  1953.  
  1954.  
  1955.  
  1956. #: 1207 S10/IBM Speech Products ∙5!∙
  1957.     04-Mar-94  16:49:34
  1958. Sb: #1200-ICSS questions
  1959. Fm: Vernon Harvey 72120,2767
  1960. To: Stephen Ng 70302,1510 (X)
  1961.  
  1962. Stephen:
  1963.  
  1964. If I understand you correctly, it sounds like you are trying to connect a mono
  1965. telephone output to a stereo input on your sound card.  The AUD1 is audio
  1966. output for telephone line 1, while AUD2 is for your second phone line.
  1967. Remember, the Dialogic card supports up to 4 incoming telephone lines on a
  1968. single card.  If possible, see if you can connect to the microphone input on
  1969. your sound card, as that should be a mono input (Unless you have left and
  1970. right mike inputs).
  1971.  
  1972. Regards,
  1973. Vernon.
  1974.  
  1975. #: 1250 S10/IBM Speech Products ∙5!∙
  1976.     07-Mar-94  10:25:15
  1977. Sb: #1207-ICSS questions
  1978. Fm: Stephen Ng 70302,1510
  1979. To: Vernon Harvey 72120,2767
  1980.  
  1981. Vernon,
  1982.  
  1983. My last message wasn't too clear.
  1984.  
  1985. I have a phone simulator on line 1 of the dialogic card, and my actual phone
  1986. on line 2.  While testing, I want the sound card to take input from line 1,
  1987. and during production to take input from line 2.  So I thought I could hook up
  1988. line 1 to the left channel, and line 2 to the right.  This works fine as far
  1989. as the sound card is concerned, but ICSS doesn't seem to recognize input from
  1990. one of the channels (the right channel?).  No big deal, as it just means I
  1991. need to plug and unplug phone some phone lines when going from testing to
  1992. production.  For real multi-line support, I'll need an audio mixer or an AMX
  1993. card.....
  1994.  
  1995. --Steve
  1996.  
  1997. #: 1256 S10/IBM Speech Products ∙5!∙
  1998.     07-Mar-94  21:37:21
  1999. Sb: #1250-ICSS questions
  2000. Fm: Brandon Booth [IBM] 71042,3144
  2001. To: Stephen Ng 70302,1510
  2002.  
  2003. Steve
  2004.  
  2005. ICSS only deals with mono.  It would be very confused with stereo input.  Or
  2006. did I misunderstand your post?
  2007.  
  2008. Brandon
  2009.  
  2010. ICSS Development
  2011.  
  2012. #: 1258 S10/IBM Speech Products ∙5!∙
  2013.     07-Mar-94  22:52:23
  2014. Sb: #1250-ICSS questions
  2015. Fm: Bob Cave 73232,2474
  2016. To: Stephen Ng 70302,1510
  2017.  
  2018. Steve,
  2019.  
  2020. I had a look at the new files you sent today.  They are definitely better
  2021. sounding than the previous set, but I did not have much luck using them for
  2022. recognition with the BNF you provided (although it worked fine when I used the
  2023. microphone).  When I looked at the waveforms under Test Context, there was
  2024. still a fair amount of noise showing up.  You may want to consider raising the
  2025. Start Talking and End Talking thresholds, since the noise does not seem that
  2026. loud.
  2027.  
  2028. Regards,
  2029.  
  2030. Bob Cave, ICSS Development
  2031.  
  2032. #: 1309 S10/IBM Speech Products ∙5!∙
  2033.     09-Mar-94  23:31:43
  2034. Sb: #1258-ICSS questions
  2035. Fm: Stephen Ng 70302,1510
  2036. To: Bob Cave 73232,2474
  2037.  
  2038. Bob,
  2039.  
  2040. Thanks, I will try raising the thresholds and see if that improves things.
  2041.  
  2042. Brandon:  Did my subsequent message clear up the stereo input comment I had?
  2043. I basically am using the left channel for one phone line, and the right phone
  2044. line for another phone line, but I never have both lines active at once
  2045. (certainly it would be understandable for this to confuse ICSS).  However ICSS
  2046. doesn't seem to hear one of the channels.  This is a minor point for me(it may
  2047. even be a glitch with my setup).
  2048.  
  2049. --Steve
  2050.  
  2051. #: 1 S10/Thread Header
  2052.     14-Mar-94  09:50:38
  2053. Sb: ICSS Spelling Letters
  2054. Fm:
  2055. To:
  2056.  
  2057. TITLE: ICSS SPELLING LETTERS
  2058. KEYWORDS: ALPHABET
  2059.  
  2060. #: 1362 S10/IBM Speech Products ∙5!∙
  2061.     14-Mar-94  09:50:38
  2062. Sb: ICSS Spelling Letters
  2063. Fm: Office Automation 100012,3267
  2064. To: All
  2065.  
  2066.  
  2067. Hello,
  2068.  
  2069. I am using ICSS under OS/2 2.1 with a IBM PC 486 66Mhz with 16M of ram.
  2070. I need to be able to spell names to ICSS but I have big problems because
  2071. the accuracy is very very bad. Is it normal and is there a solution to solve
  2072. this problem?
  2073.  
  2074. Ian GAMBINI, AMADEUS Company
  2075.  
  2076.  
  2077.  
  2078.  
  2079. #: 1366 S10/IBM Speech Products ∙5!∙
  2080.     14-Mar-94  14:06:02
  2081. Sb: #1362-ICSS Spelling Letters
  2082. Fm: Vernon Harvey 72120,2767
  2083. To: Office Automation 100012,3267
  2084.  
  2085. Ian:
  2086.  
  2087. How are you doing the spelling?  Are you using single phoneme based spelling
  2088. characters, such as "ay", "bee" "see", etc.  If so, you will probably have
  2089. recognition problems as ICSS seems to work best with multi-syllable
  2090. recognition (probably because there is more data to recognize).  You may want
  2091. to try a military based spelling operation such as "FOXTROT ROMEO ALPHA NANCY
  2092. CHARLIE INDIGO EDWARD" to spell "Francis" (I don't think I have the correct
  2093. words in the example, but I think you see what I am getting at).  As I recall,
  2094. I think there was a dictionary or BNF file in one of the ICSS directories
  2095. which contains the police car vocabulary.  That demo used the same sort of
  2096. logic to enter license plate numbers, so you could probably scalp the word
  2097. list from there.
  2098.  
  2099. Regards,
  2100. Vernon Harvey.
  2101.  
  2102. #: 1379 S10/IBM Speech Products ∙5!∙
  2103.     15-Mar-94  04:46:21
  2104. Sb: #1366-ICSS Spelling Letters
  2105. Fm: Denis Lacroix 100012,3270
  2106. To: Vernon Harvey 72120,2767
  2107.  
  2108. First, thank you for your answer.
  2109. Is there really no other solution to spell letters, because in this case you
  2110. have to learn all the correspondance between letters and words ( A-ALPHA,
  2111. B-BRAVO,...).
  2112. You can't ask everybody to learn this syntax just for spelling.
  2113.  
  2114. I am using a DX 66, do you think it will be really better if I use a Pentium ?
  2115.  
  2116. Regards,
  2117. Ian GAMBINI, AMADEUS Company
  2118.  
  2119. #: 1393 S10/IBM Speech Products ∙5!∙
  2120.     15-Mar-94  20:52:43
  2121. Sb: #1379-ICSS Spelling Letters
  2122. Fm: Bob Cave 73232,2474
  2123. To: Denis Lacroix 100012,3270
  2124.  
  2125. Basically, what Vernon said was correct.  Recognizing individual letters for
  2126. the purpose of spelling names is extremely difficult.  There is simply not
  2127. enough information available for ICSS to reliably distinguish between the
  2128. choices.  The military alphabet was created to solve this problem of speech
  2129. recognition between humans. It can be used with ICSS also, and will produce
  2130. far better results than saying the letters by themselves.  I recognize the
  2131. impracticality of having everyone memorize the military alphabet for the
  2132. purpose of talking to a computer.
  2133.  
  2134. If there is a very limited set of valid combinations of letters, they can be
  2135. added to a context as words (ABC = EY B IY S IY in ICSS phonemes).
  2136.  
  2137. Regards,
  2138.  
  2139. Bob Cave, ICSS Development 
  2140.  
  2141.  
  2142.  
  2143. #: 1469 S10/IBM Speech Products ∙5!∙
  2144.     19-Mar-94  12:30:04
  2145. Sb: #1379-ICSS Spelling Letters
  2146. Fm: Rufus Laggren 76346,1441
  2147. To: Denis Lacroix 100012,3270
  2148.  
  2149.  >> Is there really no other solution to spell letters, because in this
  2150.  >> case you
  2151.  
  2152. FWI. (I'm no expert).  You have 1000 words to play with for a context (and you
  2153. can switch contexts instantly).  So you are not limited to the words used by
  2154. police or military.  If you know which letters (or numbers, etc) *must* occur
  2155. next, you can limit the selection further, as is suggested elsewhere here.
  2156.  
  2157. I don't know if this will help, but you if you favor the letter sound very
  2158. much, you may also try *pre*-fixing the actual sound by saying "letter" so the
  2159. machine hear "letter-ay", for example.  Not sure this will help or not.
  2160.  
  2161. Think how much your understanding of what *you* hear depends on the *context*,
  2162. rather than on the sound stream.  You're a lot more complex than ICSS, and I
  2163. think you would have trouble gathering data w/out the context.
  2164.  
  2165. Best luck, Rufus
  2166.  
  2167.  
  2168.  
  2169. #: 1374 S10/IBM Speech Products ∙5!∙
  2170.     14-Mar-94  23:28:51
  2171. Sb: #1362-ICSS Spelling Letters
  2172. Fm: Brandon Booth [IBM] 71042,3144
  2173. To: Office Automation 100012,3267
  2174.  
  2175. Ian
  2176.  
  2177. All speech recognizers that I know about have trouble recognizing single
  2178. phoneme utterances.  This is also true of people!  The problem stems from the
  2179. fact that there is no data about preceeding and succeeding phones (as it is a
  2180. single phone), and so there is no data to distinguish confusible phones (e.g.,
  2181. 'b' and 'p').  As a subsequent post mentions using the military "foxtrot,
  2182. tango" style (or any equivalent) works much better.
  2183.  
  2184. Brandon
  2185.  
  2186. ICSS Development
  2187.  
  2188. #: 1380 S10/IBM Speech Products ∙5!∙
  2189.     15-Mar-94  05:01:52
  2190. Sb: #1374-ICSS Spelling Letters
  2191. Fm: Denis Lacroix 100012,3270
  2192. To: Brandon Booth [IBM] 71042,3144
  2193.  
  2194.  
  2195. First, thank you for your answer.
  2196. Is there really no other solution to spell letters, because in this case you
  2197. have to learn all the correspondance between letters and words ( A-ALPHA,
  2198. B-BRAVO,...).
  2199. You can't ask everybody to learn this syntax just for spelling.
  2200.  
  2201. I am using a DX 66, do you think it will be really better if I use a Pentium ?
  2202.  
  2203. Regards,
  2204. Ian GAMBINI, AMADEUS Company
  2205.  
  2206.  
  2207.  
  2208. #: 1398 S10/IBM Speech Products ∙5!∙
  2209.     15-Mar-94  23:08:38
  2210. Sb: #1380-ICSS Spelling Letters
  2211. Fm: Brandon Booth [IBM] 71042,3144
  2212. To: Denis Lacroix 100012,3270
  2213.  
  2214. Denis
  2215.  
  2216. I'm sorry, but a fast machine isn't the answer (at least in this case!).  The
  2217. problem stems from the length of the utterance.
  2218.  
  2219. Brandon
  2220.  
  2221. ICSS Development
  2222.  
  2223. #: 1 S10/Thread Header
  2224.     24-Mar-94  11:00:06
  2225. Sb: ICSS Accuracy
  2226. Fm:
  2227. To:
  2228.  
  2229. TITLE: ICSS ACCURACY
  2230. KEYWORDS: CONFIDENCE CERTAINTY RECOGNITION
  2231.  
  2232. #: 1534 S10/IBM Speech Products ∙5!∙
  2233.     24-Mar-94  11:00:06
  2234. Sb: ICSS Accuracy
  2235. Fm: Office Automation 100012,3267
  2236. To: All 72120,2767
  2237.  
  2238.  
  2239. Hello,
  2240.  
  2241. I have a big problem with the ICSS recognition, because I have always an
  2242. answer. Is there no solution to know if the recognition is good enough to be
  2243. accepted. For example, if I say "AVAILABILITY TO TOKYO", sometimes the ICSS
  2244. answer is "MOVE UP" !!!  For my project, it's impossible to do something
  2245. really good with this problem.
  2246.  
  2247. I have also another question. Is it possible to say "I WOULD LIKE AN
  2248. AVAILABILITY FROM..." and to ignore all the speech before the word
  2249. AVAILABILITY ?
  2250. If not, is it possible to ask ICSS which phonemes have been recognized?
  2251.  
  2252. Ian GAMBINI, AMADEUS Company
  2253.  
  2254.  
  2255.  
  2256. #: 1547 S10/IBM Speech Products ∙5!∙
  2257.     24-Mar-94  21:36:39
  2258. Sb: #1534-ICSS Accuracy
  2259. Fm: Bob Cave 73232,2474
  2260. To: Office Automation 100012,3267
  2261.  
  2262. Ian,
  2263.  
  2264. The current version of ICSS does not return a confidence factor.  It is up to
  2265. the application to parse the response to determine if it is usable.  We are
  2266. looking into ways to enhance the product in this area.
  2267.  
  2268. >>  Is it possible to say "I WOULD LIKE AN AVAILABILITY FROM..." and to
  2269. >> ignore all the speech before the word AVAILABILITY ?
  2270.  
  2271. No.  ICSS will use all of the speech input for recognition.  It does not
  2272. perform word spotting.
  2273.  
  2274. >> If not, is it possible to ask ICSS which phonemes have been recognized?
  2275.  
  2276. ICSS can not directly return the phonemes that were recognized.  Your best bet
  2277. would be to look up the recognized words in the dictionary to get the
  2278. associated phonemes.
  2279.  
  2280. Regards,
  2281.  
  2282. Bob Cave, ICSS Development, IBM
  2283.  
  2284. #: 1612 S10/IBM Speech Products ∙5!∙
  2285.     28-Mar-94  23:20:50
  2286. Sb: #1534-ICSS Accuracy
  2287. Fm: Brandon Booth [IBM] 71042,3144
  2288. To: Office Automation 100012,3267
  2289.  
  2290. Ian
  2291.  
  2292. Our recognition is quite good if you have your system configured properly. You
  2293. should record a speech file with your mic and sound card setup and listen to
  2294. it, looking for excessive noise.  If you continue to have a problem, you may
  2295. want to call our tech support line 1-800-627-8363.
  2296.  
  2297. Brandon
  2298.  
  2299. ICSS Development
  2300.  
  2301. #: 1 S10/Thread Header
  2302.     30-Mar-94  06:16:29
  2303. Sb: Headset
  2304. Fm:
  2305. To:
  2306.  
  2307. TITLE: HEADSET
  2308. KEYWORDS: 
  2309.  
  2310. #: 1640 S10/IBM Speech Products ∙5!∙
  2311.     30-Mar-94  06:16:29
  2312. Sb: Headset
  2313. Fm: Tim M. Heagarty 71541,1432
  2314. To: All
  2315.  
  2316. Folks,
  2317.  
  2318. I am looking for a headset that could be used with the ICSS system and a SB-16
  2319. card.  Anyone out there have one that they like?  You could save me a lot of
  2320. looking and spec. checking.  I want an operator to be able to sit and speak to
  2321. their system and hear the answer without disrupting all others around them.
  2322. It should cut down on background noise too.
  2323.  
  2324. Thanks for your assistance.
  2325.  
  2326. Tim Heagarty
  2327.  
  2328. #: 1655 S10/IBM Speech Products ∙5!∙
  2329.     30-Mar-94  23:12:20
  2330. Sb: #1640-Headset
  2331. Fm: Brandon Booth [IBM] 71042,3144
  2332. To: Tim M. Heagarty 71541,1432
  2333.  
  2334. Tim
  2335.  
  2336. The headset that we are familiar with is the Sennheiser 410.  This works quite
  2337. well, but is a probably a little expensive.
  2338.  
  2339. Brandon
  2340.  
  2341. ICSS Development
  2342.  
  2343. #: 1 S10/Thread Header
  2344.     21-Mar-94  06:47:06
  2345. Sb: #1480-ICCS
  2346. Fm:
  2347. To:
  2348.  
  2349. TITLE: ICCS
  2350. KEYWORDS: THRESHOLD NOISE NOISY ENVIRONMENT
  2351.  
  2352. #: 1482 S10/IBM Speech Products ∙5!∙
  2353.     21-Mar-94  06:47:06
  2354. Sb: #1480-ICCS
  2355. Fm: Ken Solkowitz 72103,2111
  2356. To: Richard Frank 73511,3406
  2357.  
  2358. Richard -
  2359. Do you know how to adjust the thresholds when you're in a noisy environment?
  2360. At comdex we use 1500-1750. Here in the office we use around 750. I will check
  2361. on the Airborne shipment. The mic was originally for Norm but how about if I
  2362. allow you to keep it and use it to promote ICSS the best that you can. Don't
  2363. publicize that I gave you the mic. But do publicize if we've been responsive
  2364. and helpful. If you need anything else, glossies, fact sheets, demos sent to
  2365. someone, please contact me.
  2366.  
  2367. Regards,
  2368. Ken Solkowitz
  2369. IBM Continuous Speech Series
  2370. Bethesda, MD 20817
  2371. 301-803-3897
  2372. Fax: 301-803-3167 
  2373.  
  2374. #: 1486 S10/IBM Speech Products ∙5!∙
  2375.     21-Mar-94  11:14:51
  2376. Sb: #1482-ICCS
  2377. Fm: Richard Frank 73511,3406
  2378. To: Ken Solkowitz 72103,2111
  2379.  
  2380.  > Do you know how to adjust the thresholds when you're in a noisy
  2381.  > environment? At comdex we use 1500-1750. Here in the office we use
  2382.  > around 750.
  2383.  
  2384.   I went up to 2000 on the thresholds, but no joy.  We used the mixer to
  2385. decrease the mic input and increase the speaker output and it worked fairly
  2386. well.
  2387.  
  2388.  > I will check on the Airborne shipment. The mic was originally for
  2389.  > Norm but how about if I allow you to keep it and use it to promote
  2390.  > ICSS the best that you can.
  2391.  
  2392.   I bought my own mic, but Norm really should have one.  He can reach alot of
  2393. people through his show.
  2394.  
  2395.  > If you need anything else, glossies, fact sheets, demos sent to
  2396.  > someone, please contact me.
  2397.  
  2398.   Once I sort through the left-over literature I'll let you know.  If you have
  2399. some literature on the IPDS I would like to have it.
  2400.  
  2401.   Richard Frank
  2402.  
  2403. #: 1 S10/Thread Header
  2404.     24-Mar-94  00:00:47
  2405. Sb: ICSS not working
  2406. Fm:
  2407. To:
  2408.  
  2409. TITLE: ICSS NOT WORKING
  2410. KEYWORDS: ADCIF SOUNDBLASTER SB
  2411.  
  2412. #: 1525 S10/IBM Speech Products ∙5!∙
  2413.     24-Mar-94  00:00:47
  2414. Sb: ICSS not working
  2415. Fm: Brian Gorrell 70127,1712
  2416. To: Sysop
  2417.  
  2418. I just received my copy of the ICSS Developers Toolkit today.  During the test
  2419. program I get the following message when I press recognize: A failure was
  2420. detected in the ISTG, ISTG restart has been attempted.  I have changed the
  2421. configuration parameters to Identification Number "1" and Input Source Name
  2422. "icssmmpm".  I loaded the TESTING context.  My configuration is a Pentium
  2423. 66MHz machine with a Soundblaster 16 SCSI-2 and its default mike (600 ohms
  2424. input impedence and sensitivity of 10 to 200mV) running on OS/2 2.1, MMPM/2,
  2425. and the service packs for both.  I verified that the mike is working by
  2426. recording some speech with the Digital Audio Since I am running the service
  2427. pack, I UNPACKed the MEMSH.DLL from the original OS/2 2.1 GA CD.  UNPACK
  2428. reported that it did not need to be unpacked so it copied it as is.  The file
  2429. size is slightly smaller than the one that came with the CSD.  It looks
  2430. correct to me.  What can I do to resolve this?  Thanks.  BTW, I did not find
  2431. any mention of this error message in the manual, but since I just got it maybe
  2432. I overlooked it.
  2433.  
  2434. #: 1546 S10/IBM Speech Products ∙5!∙
  2435.     24-Mar-94  21:28:13
  2436. Sb: #1525-ICSS not working
  2437. Fm: Bob Cave 73232,2474
  2438. To: Brian Gorrell 70127,1712
  2439.  
  2440. Brian,
  2441.  
  2442. The symptom you have is the one that occurs with the CSD version of MEMSH.DLL.
  2443. Have you tried recording a file with the ICSS utility for recording files
  2444. (under the Speech pull-down)?  I am sitting here at home without my tech
  2445. reference, and I cannot remember if MMPM wants the ACDIFNumber for the first
  2446. card to be 0 or 1.  Try setting it to 0.
  2447.  
  2448. Regards,
  2449.  
  2450. Bob Cave, ICSS Development
  2451.  
  2452.  
  2453.  
  2454. #: 1551 S10/IBM Speech Products ∙5!∙
  2455.     24-Mar-94  23:09:18
  2456. Sb: #1546-ICSS not working
  2457. Fm: Christopher R. Peck 74214,3567
  2458. To: Bob Cave 73232,2474
  2459.  
  2460. I received the exact same message (I check the  ACDIF # with the Digital Audio
  2461. App under MMPM like the readme said to & it's 1 for my SB16).  I copied the
  2462. MEMSH.DLL file from the original OS/2 2.1 CD & still got the same error (I
  2463. went out & bought a new mike to be sure it wasn't that).  I then tried the
  2464. "Stock Market" & that seemed to work ok (it missed alot of the numbers & said
  2465. - but it did pick up what i said).  Any suggestions???
  2466.  
  2467.  
  2468.  
  2469.  
  2470. #: 1570 S10/IBM Speech Products ∙5!∙
  2471.     26-Mar-94  02:03:01
  2472. Sb: #1546-ICSS not working
  2473. Fm: Brian Gorrell 70127,1712
  2474. To: Bob Cave 73232,2474
  2475.  
  2476. Thank you for your response, but I still am having the same problem.  I double
  2477. checked the MEMSH.DLL file.  It is 13968 bytes dated 5-07-93 at 12:18pm.  I
  2478. copied the Service Pack version to a backup directory before putting the GA
  2479. version in the \MMOS2\DLL directory.  The SP version is 14848 bytes dated
  2480. 2-08-94 at 7:19pm.  So this can not be the problem.  As for the ACDIFNumber,
  2481. trying it at 0 made no difference.  I believe 1 is correct though.  I also
  2482. tried your other suggestion of recording a file.  The recording went okay and
  2483. I then went into the test program and tried to use the recorded file as the
  2484. input.  It went through without an error this time, but it recognized "Testing
  2485. testing testing, one two three" as "Zero zero six two zero six one two three
  2486. six."  I then tried loading the RL context and used the sample WAV file
  2487. included and it correctly recognized "Where is the nearest french restaurant."
  2488. What else can I do to resolve this?  Thanks.
  2489.  
  2490.  
  2491.  
  2492.  
  2493. #: 1608 S10/IBM Speech Products ∙5!∙
  2494.     28-Mar-94  21:54:08
  2495. Sb: #1570-ICSS not working
  2496. Fm: Bob Cave 73232,2474
  2497. To: Brian Gorrell 70127,1712
  2498.  
  2499. Brian,
  2500.  
  2501. Did you record the your sample file at 11 khz ("medium" setting in the record
  2502. function, I believe)?  The testing context and the RL context are delivered
  2503. for medium bandwidth only.
  2504.  
  2505. I will need to check out my setup back at the office to confirm the MEMSH.DLL
  2506. sizes, and will post back tomorrow.
  2507.  
  2508. Regards,
  2509.  
  2510. Bob Cave, ICSS Development, IBM
  2511.  
  2512. #: 1635 S10/IBM Speech Products ∙5!∙
  2513.     29-Mar-94  22:54:43
  2514. Sb: #1608-ICSS not working
  2515. Fm: Bob Cave 73232,2474
  2516. To: Bob Cave 73232,2474
  2517.  
  2518. I installed the OS/2 2.1 Service Pack and the MMPM/2 Service Pack.  The
  2519. service pack for MMPM definitely kills ICSS.  I tried using the GA version of
  2520. MEMSH.DLL to no avail, ICSS was still broken.  I was able to fix ICSS by using
  2521. the SB16 drivers (SB16D2.SYS) from the GA version, however, and they work with
  2522. either version of MEMSH.DLL.  Using the CSD version of SB16D2.SYS seems to
  2523. cause the problem with ICSS.  The GA version of the driver is dated 5/7/93,
  2524. and the size is 41956 bytes.
  2525.  
  2526. I have downloaded new drivers from the Creative Labs forum here on CIS, and I
  2527. will try those tomorrow (although I think they may be the same as the drivers
  2528. that came in the MMPM CSD).
  2529.  
  2530. Stay tuned...I should have more info tomorrow evening.
  2531.  
  2532. Bob Cave, ICSS Development, IBM
  2533.  
  2534. #: 1657 S10/IBM Speech Products ∙5!∙
  2535.     30-Mar-94  23:12:26
  2536. Sb: #1635-ICSS not working
  2537. Fm: Brandon Booth [IBM] 71042,3144
  2538. To: Bob Cave 73232,2474
  2539.  
  2540. Bob Cave did have good luck with the Sound Blaster drivers he downloaded from
  2541. CompuServ.  He'll have to give the details, as I forgot the paper I printed
  2542. off at work.
  2543.  
  2544. Brandon
  2545.  
  2546. ICSS Development
  2547.  
  2548. #: 1687 S10/IBM Speech Products ∙5!∙
  2549.     01-Apr-94  18:41:54
  2550. Sb: #1657-ICSS not working
  2551. Fm: Bob Cave 73232,2474
  2552. To: Brandon Booth [IBM] 71042,3144
  2553.  
  2554. Here is what I found regarding MMPM and ICSS:
  2555.  
  2556. For best results, use the GA version of MEMSH.DLL with either the GA
  2557. SB16D2.SYS, or the latest version available in the Creative Labs section here
  2558. on CIS (sb_os2.exe in library 3, I think).  I was not able to get ICSS to work
  2559. with the SP versions of MEMSH.DLL and SB16D2.SYS.
  2560.  
  2561. I hope this clears things up.
  2562.  
  2563. Bob Cave, ICSS Development, IBM
  2564.  
  2565.  
  2566.  
  2567. #: 1706 S10/IBM Speech Products ∙5!∙
  2568.     02-Apr-94  13:35:27
  2569. Sb: #1687-ICSS not working
  2570. Fm: Brandon Booth [IBM] 71042,3144
  2571. To: Bob Cave 73232,2474
  2572.  
  2573. Thanks for looking into that, Bob.
  2574.  
  2575. Brandon
  2576.  
  2577. ICSS Development
  2578.  
  2579. #: 1614 S10/IBM Speech Products ∙5!∙
  2580.     28-Mar-94  23:20:54
  2581. Sb: #1546-ICSS not working
  2582. Fm: Brandon Booth [IBM] 71042,3144
  2583. To: Bob Cave 73232,2474
  2584.  
  2585. Bob
  2586.  
  2587. For MMPM the ADCIFNumber (Analog to Digital Conversion InterFace Number,
  2588. horrible acronym!) of 0 means use the current default, if you have one card
  2589. this should be the same as using 1.
  2590.  
  2591. Brandon
  2592.  
  2593. ICSS Development
  2594.  
  2595. #: 1613 S10/IBM Speech Products ∙5!∙
  2596.     28-Mar-94  23:20:52
  2597. Sb: #1525-ICSS not working
  2598. Fm: Brandon Booth [IBM] 71042,3144
  2599. To: Brian Gorrell 70127,1712
  2600.  
  2601. Brian
  2602.  
  2603. The MMPM folks (over on OS2DF1 forum) told us that it was enough to keep the
  2604. original memsh.dll, so I'm not sure what the problem is.  You might try using
  2605. the GA MMPM.  Do make sure to install the medium models as the supplied
  2606. contexts (e.g., the testing context) are compiled in medium.
  2607.  
  2608. Brandon
  2609.  
  2610. ICSS Development
  2611.  
  2612. #: 1712 S10/IBM Speech Products ∙5!∙
  2613.     02-Apr-94  16:00:42
  2614. Sb: #1613-ICSS not working
  2615. Fm: Brian Gorrell 70127,1712
  2616. To: Brandon Booth [IBM] 71042,3144
  2617.  
  2618.  >> Brian  The MMPM folks (over on OS2DF1 forum) told us that it was enough
  2619.  >> to keep the original memsh.dll, so I'm not sure what the problem is.
  2620.  >>  You might try using the GA MMPM.  Do make sure to install the medium
  2621.  >> models as the supplied contexts (e.g., the testing context) are
  2622.  >> compiled in medium.  Brandon  ICSS Development
  2623.  
  2624. Brandon
  2625.  
  2626. Going back to the GA MMPM fixed my problems, however, I would like to see a
  2627. fix for this so that I can use the CSD version of MMPM.  I need it to fix some
  2628. SoundBlaster 16 problems with the original GA MMPM.  Only replacing the
  2629. MEMSH.DLL as has been suggested will not fix the problem with ICSS.  Thanks.
  2630.  
  2631. #: 1748 S10/IBM Speech Products ∙5!∙
  2632.     04-Apr-94  21:13:59
  2633. Sb: #1712-ICSS not working
  2634. Fm: Brandon Booth [IBM] 71042,3144
  2635. To: Brian Gorrell 70127,1712
  2636.  
  2637. Brian
  2638.  
  2639. My Co-worker Bob Cave has had some success using the latest Sound Blaster
  2640. drivers available from the Creative Labs section of CompuServ (Go BLASTER I
  2641. think), with the corrective service version of MMPM.  You might want to try
  2642. that.
  2643.  
  2644. Brandon
  2645.  
  2646. ICSS Development
  2647.  
  2648. There is 1 Reply.
  2649.  
  2650. #: 1750 S10/IBM Speech Products ∙5!∙
  2651.     04-Apr-94  21:55:22
  2652. Sb: #1748-ICSS not working
  2653. Fm: Bob Cave 73232,2474
  2654. To: Brandon Booth [IBM] 71042,3144
  2655.  
  2656. Brandon,
  2657.  
  2658. To clarify -- I was not able to get the SP version of MEMSH.DLL to work with
  2659. any
  2660. SB16 drivers (I know, I told you I did, but when I did further testing, it
  2661. turned out to still be broken...worked for two recos, then hung...my
  2662. apologies).  I was able to use the SP version of MMPM with the GA MEMSH.DLL,
  2663. however, with either the GA SB16 drivers or the new drivers from CIS.
  2664.  
  2665. It seems that this is a "your mileage may vary" situation.  Some folks are
  2666. able to get things working by only replacing the DLL.  This was not the case
  2667. for me, and a couple of other people.  This problem has been reported with
  2668. ACPA cards also.  The MMPM folks are working hard to find out what is wrong.
  2669.  
  2670. Bob Cave, ICSS Development, IBM
  2671.  
  2672. #: 1837 S10/IBM Speech Products ∙5!∙
  2673.     09-Apr-94  12:26:58
  2674. Sb: #1750-ICSS not working
  2675. Fm: Brandon Booth [IBM] 71042,3144
  2676. To: Bob Cave 73232,2474
  2677.  
  2678. Thanks Bob,
  2679.  
  2680. Steve C. is continuing to look at the situation for us.  The problem has
  2681. turned out to be more difficult than we first thought, and it is uncertain
  2682. when it will be resolved.
  2683.  
  2684. Brandon
  2685.  
  2686. ICSS Development
  2687.  
  2688. #: 1712 S10/IBM Speech Products ∙5!∙
  2689.     02-Apr-94  16:00:42
  2690. Sb: #1613-ICSS not working
  2691. Fm: Brian Gorrell 70127,1712
  2692. To: Brandon Booth [IBM] 71042,3144
  2693.  
  2694.  >> Brian  The MMPM folks (over on OS2DF1 forum) told us that it was enough
  2695.  >> to keep the original memsh.dll, so I'm not sure what the problem is.
  2696.  >>  You might try using the GA MMPM.  Do make sure to install the medium
  2697.  >> models as the supplied contexts (e.g., the testing context) are
  2698.  >> compiled in medium.  Brandon  ICSS Development
  2699.  
  2700. Brandon
  2701.  
  2702. Going back to the GA MMPM fixed my problems, however, I would like to see a
  2703. fix for this so that I can use the CSD version of MMPM.  I need it to fix some
  2704. SoundBlaster 16 problems with the original GA MMPM.  Only replacing the
  2705. MEMSH.DLL as has been suggested will not fix the problem with ICSS.  Thanks.
  2706.  
  2707. #: 1 S10/Thread Header
  2708.     11-Feb-94  13:55:33
  2709. Sb: Minor ICSS/2 problem.
  2710. Fm:
  2711. To:
  2712.  
  2713. TITLE: MINOR ICSS/2 PROBLEM.
  2714. KEYWORDS: CSD
  2715.  
  2716. #: 769 S10/IBM Speech Products ∙5 ∙
  2717.     11-Feb-94  13:55:33
  2718. Sb: Minor ICSS/2 problem.
  2719. Fm: Vernon Harvey 72120,2767
  2720. To: Brandon Booth 71042,3144
  2721.  
  2722. Brandon:
  2723.  
  2724. Well, I just received and installed my ICSS for OS/2, however, I seem to have
  2725. a minor problem.  I am using a SoundBlaster 16 ASP, with a cheap micro-phone
  2726. for now (still waiting for my Sennheiser) on a 80486DX 50MHz VLB system which
  2727. has 16M of memory.  The ICSS software installed fine, and the Stock Market
  2728. demo works (recognition is a bit weak due to the low quality microphone).
  2729.  
  2730. The TSTCTXPM test program does not seem to work.  I can start the program,
  2731. load the "TESTING" context, and change the settings to accept input from the
  2732. "icssmmpm" device.  When I press the recognize button, and start speaking
  2733. immediately, I get a "Spoke too soon" message like I am supposed to get.  If I
  2734. wait for the "Start speaking" prompt and then start to speak, no waveform
  2735. information information is displayed, and a few seconds after I finish
  2736. speaking, I get the message "A failure was detected in the ISTG; ISTG restart
  2737. has been attempted".
  2738.  
  2739. Any ideas?
  2740.  
  2741. Regards,
  2742. Vernon Harvey.
  2743.    
  2744.  
  2745.  
  2746. #: 774 S10/IBM Speech Products ∙5 ∙
  2747.     11-Feb-94  22:30:35
  2748. Sb: #769-Minor ICSS/2 problem.
  2749. Fm: H. V. Belton 75470,3670
  2750. To: Vernon Harvey 72120,2767
  2751.  
  2752. Vernon,
  2753.  
  2754. Check that :
  2755.  
  2756.         ?:\MMOS2\DSP - Where "?" is the Drive where MMPM is installed
  2757.  
  2758. was added to your LIBPATH in config.sys
  2759.  
  2760.  
  2761.  
  2762. #: 798 S10/IBM Speech Products ∙5 ∙
  2763.     15-Feb-94  18:58:14
  2764. Sb: #774-Minor ICSS/2 problem.
  2765. Fm: Vernon Harvey 72120,2767
  2766. To: H. V. Belton 75470,3670
  2767.  
  2768. Hello H.V.
  2769.  
  2770. I have a "C:\MMOS2\DLL" in the LIBPATH statement, but no "DSP".  I tried
  2771. adding "C:\MMOS2\DSP" as you suggested, but still no luck on the TSTCTXPM.EXE.
  2772.  
  2773. Any other suggestions are more than welcome.
  2774.  
  2775. Regards,
  2776. Vernon.
  2777.  
  2778.  
  2779.  
  2780. #: 827 S10/IBM Speech Products ∙5 ∙
  2781.     16-Feb-94  19:39:50
  2782. Sb: #769-Minor ICSS/2 problem.
  2783. Fm: Bob Cave 73232,2474
  2784. To: Vernon Harvey 72120,2767
  2785.  
  2786. Vernon,
  2787.  
  2788. We have noticed this symptom when using the latest SB 16 ASP device drivers
  2789. provided with MMPM/2 (part of a corrective service package).  Are you using
  2790. these drivers?  If so, your best bet may be to go back to the previous level.
  2791. We are currently working on a solution.
  2792.  
  2793. If you are not using new drivers, post back here and I will see what else I
  2794. can find out.
  2795.  
  2796. Bob Cave, ICSS Development (sitting in for Brandon on the net for a few days)
  2797.  
  2798. #: 862 S10/IBM Speech Products ∙5 ∙
  2799.     18-Feb-94  17:35:47
  2800. Sb: #827-Minor ICSS/2 problem.
  2801. Fm: Vernon Harvey 72120,2767
  2802. To: Bob Cave 73232,2474
  2803.  
  2804. Bob:
  2805.  
  2806. Yes, I am using the MMPM/2 CSD.  I will switch back and see it solves the
  2807. problem.
  2808.  
  2809. Regards,
  2810. Vernon. 
  2811.  
  2812. #: 885 S10/IBM Speech Products ∙5 ∙
  2813.     19-Feb-94  21:23:06
  2814. Sb: #769-Minor ICSS/2 problem.
  2815. Fm: Brandon Booth [IBM] 71042,3144
  2816. To: Vernon Harvey 72120,2767
  2817.  
  2818. Hi Vernon
  2819.  
  2820. We do have a known problem with the OS/2 2.1 CSD version.  Are you using that
  2821. version?  I'm not sure how available this version is.  It seems strange that
  2822. the stock demo would work, but not test context as they exercise the same code
  2823. path. Do you have PATH and LIBPATH set correctly?  Do you have the environment
  2824. variables (ICSSDIR particularly) set correctly.  I kind of grasping at straws
  2825. here.  It would be really great if you could write a small demo program and
  2826. see how that works.  If you want to register a bug (or for phone tech support)
  2827. call our level 1 support at 1-800-627-8363.
  2828.  
  2829. Brandon
  2830.  
  2831. ICSS Development - IBM
  2832.  
  2833. #: 938 S10/IBM Speech Products ∙5 ∙
  2834.     21-Feb-94  14:45:43
  2835. Sb: #885-Minor ICSS/2 problem.
  2836. Fm: Vernon Harvey 72120,2767
  2837. To: Brandon Booth [IBM] 71042,3144
  2838.  
  2839. Brandon:
  2840.  
  2841. Bob Cave was kind enough to step in and mention the problem with the CSD for
  2842. the MMPM/2 software.  I am currently using the CSD version, so I will revert
  2843. back to the original MMPM/2 and see if that resolves the problem.
  2844.  
  2845. Regards,
  2846. Vernon.
  2847.  
  2848.  
  2849.  
  2850. #: 946 S10/IBM Speech Products ∙5 ∙
  2851.     21-Feb-94  18:31:56
  2852. Sb: #938-Minor ICSS/2 problem.
  2853. Fm: Vernon Harvey 72120,2767
  2854. To: Vernon Harvey 72120,2767
  2855.  
  2856. Brandon:
  2857.  
  2858. With regards to your suggestion of writing a small demo program, I am also in
  2859. the process of doing just that.  I originally tried to compile and use the
  2860. RECO.C test program, but dicovered that apparently I must write PM
  2861. applications when using ICSS via a SoundBlaster card.  I guess RECO.C is only
  2862. valid if using the ACPA card.
  2863.  
  2864. If you know of a ways that I can write non-PM applications to work with the SB
  2865. card, please let me know, as I am not yet a PM pro.
  2866.  
  2867. Regards,
  2868. Vernon Harvey. 
  2869.  
  2870. #: 954 S10/IBM Speech Products ∙5 ∙
  2871.     21-Feb-94  20:55:42
  2872. Sb: #946-Minor ICSS/2 problem.
  2873. Fm: Brandon Booth [IBM] 71042,3144
  2874. To: Vernon Harvey 72120,2767
  2875.  
  2876. Vernon
  2877.  
  2878. If you are going to use the ICSS MMPM support (as for Sound Blaster), you have
  2879. to write a PM application (the decision was forced on us).  Learning PM isn't
  2880. really that hard and I recommend giving it a shot.
  2881.  
  2882. Brandon
  2883.  
  2884. ICSS Development
  2885.  
  2886. #: 1125 S10/IBM Speech Products ∙5!∙
  2887.     01-Mar-94  16:10:36
  2888. Sb: #885-Minor ICSS/2 problem.
  2889. Fm: Vernon Harvey 72120,2767
  2890. To: Brandon Booth [IBM] 71042,3144
  2891.  
  2892. Brandon:
  2893.  
  2894. Now that the OS/2 2.1 Service Pack is out, I was considering installing it on
  2895. my system.  You mentioned that the MMPM/2 CSD had a problem when using ICSS
  2896. with a SB16 ASP sound card.  Does this problem still exist with the OS/2 2.1
  2897. Service Pack?  I would rather move forward than back to the initial release of
  2898. the MMPM/2 software if I can.
  2899.  
  2900. Regards,
  2901. Vernon Harvey.
  2902.  
  2903. #: 1136 S10/IBM Speech Products ∙5!∙
  2904.     01-Mar-94  21:47:28
  2905. Sb: #1125-Minor ICSS/2 problem.
  2906. Fm: Bob Cave 73232,2474
  2907. To: Vernon Harvey 72120,2767
  2908.  
  2909. Vernon,
  2910.  
  2911. We will be checking this out over the next couple of days.  I am not sure if
  2912. the problems were reported on a beta of the MMPM/2 CSD or on the released
  2913. version.
  2914.  
  2915. Bob Cave, ICSS Development
  2916.  
  2917. #: 1140 S10/IBM Speech Products ∙5!∙
  2918.     01-Mar-94  22:25:07
  2919. Sb: #1125-Minor ICSS/2 problem.
  2920. Fm: Brandon Booth [IBM] 71042,3144
  2921. To: Vernon Harvey 72120,2767
  2922.  
  2923. Vernon
  2924.  
  2925. My understanding is that the OS/2 2.1 service pack changes in MMPM don't
  2926. coexist well with the current version of ICSS for OS/2.  I'm sorry, but we
  2927. don't have any fixes for this problem right now.
  2928.  
  2929. Brandon
  2930.  
  2931. ICSS Development
  2932.  
  2933. #: 1162 S10/IBM Speech Products ∙5!∙
  2934.     02-Mar-94  17:09:24
  2935. Sb: #1140-Minor ICSS/2 problem.
  2936. Fm: Vernon Harvey 72120,2767
  2937. To: Brandon Booth [IBM] 71042,3144
  2938.  
  2939. Brandon:
  2940.  
  2941. 1:  Is there a fix in the works yet?
  2942. 2:  Can I still install the Service pack and leave the MMPM/2 at its
  2943.     current level (Ie: Initial release before all the problems with
  2944.     MMPM/2 CSD and Service Pack software updates?
  2945. 3:  Is the problem in ICSS or in the MMPM/2 software?
  2946. 4:  If a fix is in the works, any idea when it will be available?
  2947. 5:  If I go to an IBM ACPA card, can I use the new MMPM/2?
  2948. 6:  Should I report this as a problem to IBM support?  Will it help
  2949.     to speed up the fix.
  2950.  
  2951. I am starting to get into ICSS pretty heavily, but don't want to hit a wall
  2952. waiting for the service pack or ICSS fixes if I can get around it. I actually
  2953. got my first ICSS PM program working a few nights ago, and am now getting to
  2954. really understand the APIs.  It really is pretty slick.
  2955.  
  2956. I have noticed a few problems with recognition, but I think it may be related
  2957. to a problem with MMPM/2.  I have noticed that when I record audio passages
  2958. using the ICSS record or the MMPM/2 Digital audio, I have static in the
  2959. recording (It may be in the playback, I'm not sure yet.  I am going to take a
  2960. look on the Multimedia forum for OS/2 to see if there is a resolution.
  2961.  
  2962. Regards,
  2963. Vernon.
  2964.  
  2965.  
  2966.  
  2967.  
  2968. #: 1168 S10/IBM Speech Products ∙5!∙
  2969.     02-Mar-94  19:16:48
  2970. Sb: #1162-Minor ICSS/2 problem.
  2971. Fm: Ken Solkowitz 72103,2111
  2972. To: Vernon Harvey 72120,2767
  2973.  
  2974. Vernon -
  2975. I might be over stepping my bounds here and I'll hand off to Brandon as the
  2976. "authority" but I think you should call IBM and initiate a problem report.
  2977. Basically, they released the MMPM code and it broke existing product code and
  2978. potentially your product. That will help.
  2979.  
  2980. Regards,
  2981. Ken Solkowitz
  2982. IBM Continuous Speech Series
  2983. Bethesda, MD 20817
  2984. 301-803-3897 
  2985.  
  2986.  
  2987.  
  2988. #: 1194 S10/IBM Speech Products ∙5!∙
  2989.     03-Mar-94  20:50:31
  2990. Sb: #1162-Minor ICSS/2 problem.
  2991. Fm: Brandon Booth [IBM] 71042,3144
  2992. To: Vernon Harvey 72120,2767
  2993.  
  2994. Vernon
  2995.  
  2996. I'm sorry, there is no fix for the problem ICSS and the MMPM service pack
  2997. currently available.  I don't know if it makes sense to install the OS/2
  2998. update and not install if for MMPM (that is I don't what interaction there
  2999. is).  You might ask that question in the OS2DF1 MMPM section.  I don't know if
  3000. it is ICSS or MMPM, but we worked well together before MMPM changed, so I (of
  3001. course) suspect MMPM :-).  I you use an ACPA card you do not have to use the
  3002. icssmmpm input source dll.  You can use the icssacpa input source dll. This
  3003. later dll does not use MMPM at all (but is limited to ACPA cards only),
  3004. thereby bypassing the problem.  Reporting the problem to to IBM support might
  3005. actually help light the right fires (its screwy how things work).
  3006.  
  3007. On your static problem, are you using an 8-bit card right now?  That can be a
  3008. source of added noise.  Static will definitely interfere with recognition.
  3009. Placing the audio card away from other cards and the system fan might help.
  3010.  
  3011. Brandon
  3012.  
  3013. ICSS Development
  3014.  
  3015. #: 1206 S10/IBM Speech Products ∙5!∙
  3016.     04-Mar-94  16:32:28
  3017. Sb: #1194-Minor ICSS/2 problem.
  3018. Fm: Vernon Harvey 72120,2767
  3019. To: Brandon Booth [IBM] 71042,3144
  3020.  
  3021. Brandon:
  3022.  
  3023. Thanks for your info in the ICSS and MMPM/2 problems.  I guess I will submit a
  3024. problem report to IBM to get that ball rolling.  I think in the mean time I
  3025. might go buy an ACPA card to ensure that I have something working.
  3026.  
  3027. With regards to the SoundBlaster card, it is a 16 bit card in a 16 bit slot,
  3028. so I assume that is not the problem.  I will try re-arranging my card to see
  3029. if that eliminates the problem with the static.  It is sitting in between my
  3030. VLB SCSI and Diamond Stealth card right now, so maybe there is a problem.
  3031.  
  3032. Regards,
  3033. Vernon.
  3034.  
  3035.  
  3036.  
  3037. #: 1229 S10/IBM Speech Products ∙5!∙
  3038.     05-Mar-94  14:11:01
  3039. Sb: #1206-Minor ICSS/2 problem.
  3040. Fm: Brandon Booth [IBM] 71042,3144
  3041. To: Vernon Harvey 72120,2767
  3042.  
  3043. Hi Vernon
  3044.  
  3045. Moving cards around is one thing I can suggest.  We have seen problems in the
  3046. past with placing the audio card near the system fan or other cards which
  3047. generate RF (radio frequency) noise.  For instance token ring cards can
  3048. generate a substantial hum.  Naturally, we don't know all of the situations
  3049. which cause problems.  I should say we have used the Sound Blaster 16 card in
  3050. our lab with good results.
  3051.  
  3052. Brandon
  3053.  
  3054. ICSS Development
  3055.  
  3056.  
  3057.  
  3058. #: 1850 S10/IBM Speech Products ∙5!∙
  3059.     10-Apr-94  00:42:56
  3060. Sb: Minor ICSS/2 problem.
  3061. Fm: Bruce Hartwell 72056,1064
  3062. To: Brandon Booth [IBM] 71042,3144
  3063.  
  3064. I am running into the same error message described in this thread:
  3065. "A Failer Has Been Detected In The ISTG, ISTG Restart Has Been Attempted".
  3066.  
  3067. I am running ICSS for OS/2 2.1 on an IBM clone 486 33Mhz with 20MB of RAM and
  3068. a Soundblaster Pro ( old 8 bit version ).  I have not upgraded to the service
  3069. pack yet but
  3070. I am using the lastest Soundblaster drivers.
  3071.  
  3072. I couldn't tell from reading through the messages if a fix had been found or
  3073. not.  Has
  3074. a fix or workaround been found? If not, does this problem create any major
  3075. side-effects
  3076. in applications created using the API?
  3077.  
  3078. Thanks in advance for the info.
  3079.  
  3080.  
  3081.  
  3082. #: 1855 S10/IBM Speech Products ∙5!∙
  3083.     10-Apr-94  18:35:11
  3084. Sb: #1850-Minor ICSS/2 problem.
  3085. Fm: Brandon Booth [IBM] 71042,3144
  3086. To: Bruce Hartwell 72056,1064
  3087.  
  3088. Bruce
  3089.  
  3090. The problem that has been described is using ICSS for OS/2 with the OS/2 2.1
  3091. CSD version of MMPM/2.  Some people have been able to work around it by using
  3092. the original version of MEMSH.DLL.  Others have not gotten this to work.  We
  3093. do not have a fix for this problem, and it is currently under investigation.
  3094. The problem tends to interfere with recognition.  Is this happening to you?
  3095.  
  3096. Brandon
  3097.  
  3098. ICSS Development
  3099.  
  3100. #: 1856 S10/IBM Speech Products ∙5!∙
  3101.     10-Apr-94  21:56:10
  3102. Sb: Minor ICSS/2 problem.
  3103. Fm: Bruce Hartwell 72056,1064
  3104. To: Brandon Booth [IBM] 71042,3144
  3105.  
  3106. Brandon:
  3107.  
  3108. The sample app that comes with ICSS ( stockmarket ) seems to work (
  3109. recognition is
  3110. weak, but that is likely due to my low quality board and mic ). I haven't
  3111. gotten into
  3112. the API enough yet to really test overall performance.
  3113.  
  3114. I am in the intial investigation phase of a project that requires fairly
  3115. consistent
  3116. voice recognition on an OS/2 box.  I was concerned when I read through several
  3117. messages describing errors.
  3118.  
  3119. Any idea when a fix might be forthcoming?  In your opinion, would this be a
  3120. good product to use in developing an educational system that required strong
  3121. voice recognition?
  3122.  
  3123. Thanks for your help!
  3124.  
  3125. #: 1977 S10/IBM Speech Products ∙5!∙
  3126.     14-Apr-94  21:27:39
  3127. Sb: #1856-Minor ICSS/2 problem.
  3128. Fm: Brandon Booth [IBM] 71042,3144
  3129. To: Bruce Hartwell 72056,1064
  3130.  
  3131. Bruce
  3132.  
  3133. Our ICSS for OS/2 works very well on the original OS/2 2.1 with MMPM, if you
  3134. use a reasonable card and mic.  A 16 bit card (such as a Creative Labs or
  3135. Media Vision 16 bit card) is a better choice than a 8 bit card (because we
  3136. have to scale the 8 bit samples to 16; there is more noise in the result and
  3137. less information).  We give a list of mics that we've used successfully in the
  3138. tech ref.  In evaluating your system, I recommend using the Test Context
  3139. program tstctxpm.exe.   It will allow you to interact directly with a context,
  3140. and it will display the waveform.  This will allow you to see how much noise
  3141. there is in your system.  We also have a record/playback feature.  You should
  3142. record and play some files and listen to the results.  If you hear lots of
  3143. noise, this will be a problem for speech recognition.
  3144.  
  3145. As for the problem with the MMPM CSD, it is being worked on by the MMPM group
  3146. and our group together.  I do not have a date for when the problem will be
  3147. found (these things sometimes take time).
  3148.  
  3149. Brandon
  3150.  
  3151. ICSS Development
  3152.  
  3153. #: 1 S10/Thread Header
  3154.     15-Mar-94  21:00:17
  3155. Sb: ICSS & MMPM/2 CSD Fix
  3156. Fm:
  3157. To:
  3158.  
  3159. TITLE: ICSS & MMPM/2 CSD FIX
  3160. KEYWORDS: CSD SB16 CREATIVE
  3161.  
  3162. #: 1394 S10/IBM Speech Products ∙5!∙
  3163.     15-Mar-94  21:00:17
  3164. Sb: ICSS & MMPM/2 CSD Fix
  3165. Fm: Bob Cave 73232,2474
  3166. To: all
  3167.  
  3168. Hello all.
  3169.  
  3170. Thanks to the folks down in the MMPM development group, we now have a
  3171. work-around for the problems you have encountered when using ICSS with the new
  3172. MMPM/2 CSD.  Before installing the CSD, copy x:\MMOS2\DLL\MEMSH.DLL to another
  3173. directory.  After installing, copy MEMSH.DLL back over the copy included with
  3174. the service pack.  According to the MMPM developers, there should be no
  3175. negative ramifications of using the  G.A. version of MEMSH.DLL with the CSD.
  3176.  
  3177. Regards,
  3178.  
  3179. Bob Cave, ICSS Development
  3180.  
  3181. #: 1397 S10/IBM Speech Products ∙5!∙
  3182.     15-Mar-94  22:56:38
  3183. Sb: #1394-ICSS & MMPM/2 CSD Fix
  3184. Fm: Steve Weeks 70541,646
  3185. To: Bob Cave 73232,2474
  3186.  
  3187.  > Before installing the CSD, ........
  3188.  
  3189. Thanks Bob, I know about 6 people that will need to know this and will pass it
  3190. on.
  3191.  
  3192. Steve Weeks
  3193.  
  3194. #: 1426 S10/IBM Speech Products ∙5!∙
  3195.     16-Mar-94  18:19:55
  3196. Sb: #1394-ICSS & MMPM/2 CSD Fix
  3197. Fm: AL COLE 71552,2526
  3198. To: Bob Cave 73232,2474
  3199.  
  3200. I've order ICSS am on back order, but I have already installed the OS/2 2.1
  3201. CSD. What should I do when I install ICSS?
  3202.  
  3203. Thanks Al Cole
  3204.  
  3205. #: 1454 S10/IBM Speech Products ∙5!∙
  3206.     17-Mar-94  21:35:04
  3207. Sb: #1426-ICSS & MMPM/2 CSD Fix
  3208. Fm: Brandon Booth [IBM] 71042,3144
  3209. To: AL COLE 71552,2526
  3210.  
  3211. Hi Al
  3212.  
  3213. If you are using the OS/2 2.1 CSD, you need to save x:\mmos2\dll\memsh.dll
  3214. from your GA (pre CSD) installation.  After the CSD install, overwrite the csd
  3215. dll with the earlier version.  This information is from the MMPM folks.
  3216.  
  3217. Brandon
  3218.  
  3219. ICSS Development
  3220.  
  3221. #: 1456 S10/IBM Speech Products ∙5!∙
  3222.     17-Mar-94  22:31:22
  3223. Sb: #1426-ICSS & MMPM/2 CSD Fix
  3224. Fm: Bob Cave 73232,2474
  3225. To: AL COLE 71552,2526
  3226.  
  3227. This refers specifically to the MMPM portion of the CSD.  If you have already
  3228. installed it, you should (I think) be able to extract the original GA version
  3229. of MEMSH.DLL from your MMPM install disks or CD.  Can anyone confirm this?
  3230.  
  3231. Regards,
  3232.  
  3233. Bob Cave, IBM
  3234. ICSS Development
  3235.  
  3236.  
  3237.  
  3238. #: 1544 S10/IBM Speech Products ∙5!∙
  3239.     24-Mar-94  21:04:50
  3240. Sb: #1456-ICSS & MMPM/2 CSD Fix
  3241. Fm: Christopher R. Peck 74214,3567
  3242. To: Bob Cave 73232,2474
  3243.  
  3244. Perhaps you could place memsh.dll from the GA mmpm disk on here & your ftp
  3245. sites
  3246. for downloading?  Or simple instructions to get it (do I use unpack?)...
  3247.  
  3248.  
  3249.  
  3250. #: 1545 S10/IBM Speech Products ∙5!∙
  3251.     24-Mar-94  21:16:45
  3252. Sb: #1544-ICSS & MMPM/2 CSD Fix
  3253. Fm: Bob Cave 73232,2474
  3254. To: Christopher R. Peck 74214,3567
  3255.  
  3256. Christopher,
  3257.  
  3258. >>Perhaps you could place memsh.dll from the GA mmpm disk on here & your ftp
  3259. >>sites for downloading?  Or simple instructions to get it (do I use
  3260. unpack?)...
  3261.  
  3262. I will look into this...it seems like a good idea.  At the least I will try to
  3263. get some instructions for getting the GA version off of the diskettes.  It may
  3264. take a couple of days, since I will be out of the office tomorrow.
  3265.  
  3266. Bob Cave, ICSS Development
  3267.  
  3268. #: 1552 S10/IBM Speech Products ∙5!∙
  3269.     24-Mar-94  23:12:24
  3270. Sb: #1545-ICSS & MMPM/2 CSD Fix
  3271. Fm: Christopher R. Peck 74214,3567
  3272. To: Bob Cave 73232,2474
  3273.  
  3274. Geez - do you live on here?  I just posted that question...
  3275. I have the CD version of OS/2 2.1 & the file didn't appear to be in packed
  3276. format on there - but the test program still doesn't work correctly.  The
  3277. Stock
  3278. program seems to be fine.
  3279. Can I get away with the smaller C compiler (the $99 kit) for doing
  3280. applications
  3281. or do I need the full C/Set & OS/2 Toolkit?
  3282. -thanks (I hope)
  3283.  Chris
  3284.  
  3285. #: 1606 S10/IBM Speech Products ∙5!∙
  3286.     28-Mar-94  21:38:58
  3287. Sb: #1552-ICSS & MMPM/2 CSD Fix
  3288. Fm: Bob Cave 73232,2474
  3289. To: Christopher R. Peck 74214,3567
  3290.  
  3291. Christopher,
  3292.  
  3293. Timing is everything, I guess...
  3294.  
  3295. As far as I know, you should be able to use the smaller compiler.  ICSS does
  3296. not require the toolkit.
  3297.  
  3298. Your problem with the Test Context program is strange.  I will check out one
  3299. of the systems at the office and see what I can find out.
  3300.  
  3301. Regards,
  3302.  
  3303. Bob Cave, ICSS Development, IBM
  3304.  
  3305. #: 1610 S10/IBM Speech Products ∙5!∙
  3306.     28-Mar-94  23:20:45
  3307. Sb: #1552-ICSS & MMPM/2 CSD Fix
  3308. Fm: Brandon Booth [IBM] 71042,3144
  3309. To: Christopher R. Peck 74214,3567
  3310.  
  3311. Christopher
  3312.  
  3313. Just a bit of advice, you're going to really wish you had the OS/2 toolkit if
  3314. your doing OS/2 programming.  The compiler alone isn't going to cut it.
  3315.  
  3316. Brandon
  3317.  
  3318. #: 1631 S10/IBM Speech Products ∙5!∙
  3319.     29-Mar-94  16:41:30
  3320. Sb: #1610-ICSS & MMPM/2 CSD Fix
  3321. Fm: Erwin Kiss 72202,666
  3322. To: Brandon Booth [IBM] 71042,3144
  3323.  
  3324. Brandon,
  3325.         I recently bought ICSS Toolkit and I am impressed with its
  3326. capabilities. Even though I am only using an 8-bit Sound Blaster Pro card and
  3327. a $35 Radio Shack microphone, I still get pretty good results. My question is
  3328. about the choice of compilers. I use Borland's C++ for OS/2, do you know if
  3329. the ICSS API can be called from Borland? Also, does the IBM OS/2 Toolkit work
  3330. with Borland? And finally, how much does the Toolkit cost, and where can I
  3331. purchase it?
  3332.  
  3333. You have a great product, and I can't wait until I have enough time to speech
  3334. enable my simple home-made text adventure games.
  3335.  
  3336. #: 1653 S10/IBM Speech Products ∙5!∙
  3337.     30-Mar-94  23:01:45
  3338. Sb: #1631-ICSS & MMPM/2 CSD Fix
  3339. Fm: Brandon Booth [IBM] 71042,3144
  3340. To: Erwin Kiss 72202,666
  3341.  
  3342. Erwin
  3343.  
  3344. I believe you can use the Borland compiler.  I think there are couple of
  3345. tricks to know.  I'll ask at work and post the results.  I'm sure the OS/2
  3346. toolkit works with the Borland compiler.  I'm sorry, I don't know how much it
  3347. costs.  I think you can buy it from Indelible Blue: 1-800-776-8284.
  3348.  
  3349. Brandon
  3350.  
  3351. ICSS Development
  3352.  
  3353. #: 1554 S10/IBM Speech Products ∙5!∙
  3354.     24-Mar-94  23:59:14
  3355. Sb: #1545-ICSS & MMPM/2 CSD Fix
  3356. Fm: Christopher R. Peck 74214,3567
  3357. To: Bob Cave 73232,2474
  3358.  
  3359. I just install mmpm/2 from my OS/2 2.1 CD on top of the MMPM/2 csd, the test
  3360. application works just fine now.  I had tried just replacing mapsh.dll - but -
  3361. that didn't fix it (maybe it's the SB16 drivers).  If I have time this weekend
  3362. I'll try installing Creative Labs new MMPM drivers & see what happens.
  3363.  
  3364. #: 1607 S10/IBM Speech Products ∙5!∙
  3365.     28-Mar-94  21:40:35
  3366. Sb: #1554-ICSS & MMPM/2 CSD Fix
  3367. Fm: Bob Cave 73232,2474
  3368. To: Christopher R. Peck 74214,3567
  3369.  
  3370. Chris,
  3371.  
  3372. I saw this note after posting my reply to your previous note.  Let me know how
  3373. it goes with the new drivers from Creative Labs.
  3374.  
  3375. Regards,
  3376.  
  3377. Bob Cave, ICSS Development, IBM
  3378.  
  3379. #: 1611 S10/IBM Speech Products ∙5!∙
  3380.     28-Mar-94  23:20:47
  3381. Sb: #1554-ICSS & MMPM/2 CSD Fix
  3382. Fm: Brandon Booth [IBM] 71042,3144
  3383. To: Christopher R. Peck 74214,3567
  3384.  
  3385. Christopher
  3386.  
  3387. The MMPM folks told us that just using the original memsh.dll with the csd
  3388. mmpm would work, so that's what we're telling people.  If it's not working for
  3389. you, we need to know.
  3390.  
  3391. Brandon
  3392.  
  3393. ICSS Development
  3394.  
  3395. #: 1793 S10/IBM Speech Products ∙5!∙
  3396.     06-Apr-94  17:58:46
  3397. Sb: #1611-ICSS & MMPM/2 CSD Fix
  3398. Fm: Vernon Harvey 72120,2767
  3399. To: Brandon Booth [IBM] 71042,3144
  3400.  
  3401. Brandon:
  3402.  
  3403. I just tried the suggested work around for the MMPM/2 CSD, and seem to be
  3404. semi-operational.  I can use the record and playback operations on the context
  3405. test program, but the test context operation is still giving me the ISTG
  3406. failed message.  Any suggestions other than blasting the MMPM/2 and restoring
  3407. the original version?
  3408.  
  3409. #: 1795 S10/IBM Speech Products ∙5!∙
  3410.     06-Apr-94  21:53:15
  3411. Sb: #1793-ICSS & MMPM/2 CSD Fix
  3412. Fm: Bob Cave 73232,2474
  3413. To: Vernon Harvey 72120,2767
  3414.  
  3415. Vernon,
  3416.  
  3417. Which audio adapter are you using?  If it is the SB16, I suggest also trying
  3418. the GA drivers (SB16D2.SYS) or downloading the latest version from the
  3419. Creative Labs section (sb_os2.exe in library 3).  I was able to get both of
  3420. these drivers to work with ICSS and the GA version of MEMSH.DLL.
  3421.  
  3422. Regards,
  3423.  
  3424. Bob Cave, ICSS Development, IBM
  3425.  
  3426.  
  3427.  
  3428. #: 1806 S10/IBM Speech Products ∙5!∙
  3429.     07-Apr-94  13:57:36
  3430. Sb: #1795-ICSS & MMPM/2 CSD Fix
  3431. Fm: Vernon Harvey 72120,2767
  3432. To: Bob Cave 73232,2474
  3433.  
  3434. Bob:
  3435.  
  3436. Thanks for the suggestion.  Shortly after I posted that last message, I came
  3437. read another message from either yourself or Brandon which mentioned just
  3438. that.  I have obtained the new SB16 drivers from the Creative Labs Forum, and
  3439. will be installing tonight.
  3440.  
  3441. Regards,
  3442. Vernon Harvey. 
  3443.  
  3444.  
  3445.  
  3446. #: 1838 S10/IBM Speech Products ∙5!∙
  3447.     09-Apr-94  12:27:02
  3448. Sb: #1793-ICSS & MMPM/2 CSD Fix
  3449. Fm: Brandon Booth [IBM] 71042,3144
  3450. To: Vernon Harvey 72120,2767
  3451.  
  3452. Vernon
  3453.  
  3454. The one thing I can definitely say is that ICSS works very well on the
  3455. original OS/2 2.1 with original MMPM/2.  It seems likely that the combination
  3456. of the OS/2 2.1 CSD with the original MMPM/2 should work (but is in some ways
  3457. not a great solution).  The other possibility of just using the original
  3458. MEMSH.DLL with the CSD MMPM has apparently worked in some cases, but not all
  3459. (obviously).  I am sorry that is all I know right now.  Detective work on the
  3460. problem is going on right now in our lab and in the MMPM lab.  I do not know
  3461. when the problem will be solved.
  3462.  
  3463. Brandon
  3464.  
  3465. ICSS Development
  3466.  
  3467. #: 1882 S10/IBM Speech Products ∙5!∙
  3468.     11-Apr-94  18:15:58
  3469. Sb: #1838-ICSS & MMPM/2 CSD Fix
  3470. Fm: Vernon Harvey 72120,2767
  3471. To: Brandon Booth [IBM] 71042,3144
  3472.  
  3473. Brandon:
  3474.  
  3475. I finally got around to installing the Creative Labs SB card updates and
  3476. everything now appears to be working properly.
  3477.  
  3478. Thanks for your assistance.
  3479.  
  3480. Regards,
  3481. Vernon Harvey 
  3482.  
  3483. #: 1979 S10/IBM Speech Products ∙5!∙
  3484.     14-Apr-94  21:27:42
  3485. Sb: #1882-ICSS & MMPM/2 CSD Fix
  3486. Fm: Brandon Booth [IBM] 71042,3144
  3487. To: Vernon Harvey 72120,2767
  3488.  
  3489. Hi Vernon
  3490.  
  3491. I'm glad your up and running.
  3492.  
  3493. Brandon
  3494.  
  3495. ICSS Development
  3496.  
  3497. #: 1 S10/Thread Header
  3498.     11-Apr-94  08:21:28
  3499. Sb: Big Processing Time
  3500. Fm:
  3501. To:
  3502.  
  3503. TITLE: BIG PROCESSING TIME
  3504. KEYWORDS: SPEED GRAMMAR
  3505.  
  3506. #: 1859 S10/IBM Speech Products ∙5!∙
  3507.     11-Apr-94  08:21:28
  3508. Sb: Big Processing Time
  3509. Fm: Office Automation 100012,3267
  3510. To: All 72120,2767
  3511.  
  3512. Hello,
  3513.  
  3514. I have a problem with the processing time using ICSS.
  3515. I need a quite big grammar and to have good accuracy, I have to compile it
  3516. with the High Bandwith Model and with a very small value for the Beam
  3517. parameter (0.0000001).
  3518. When I say "AVAILABILITY TO NEW-YORK", I have to wait about 3 or 4 seconds for
  3519. the response (after saying it).
  3520. Is it normal to wait so much ?
  3521. I use a 486 DX 66 with 32 Megabytes.
  3522.  
  3523. Regards,
  3524.  
  3525. Ian GAMBINI, Amadeus Company
  3526.  
  3527.  
  3528.  
  3529. #: 1883 S10/IBM Speech Products ∙5!∙
  3530.     11-Apr-94  18:22:03
  3531. Sb: #1859-Big Processing Time
  3532. Fm: Vernon Harvey 72120,2767
  3533. To: Office Automation 100012,3267
  3534.  
  3535. Ian:
  3536.  
  3537. Check your End Silence duration parameter.  This parameter tells the ICSS
  3538. software how much silence to wait for before assuming that the user has
  3539. stopped speaking.  It probably needs to be a trimmed down a bit.
  3540.  
  3541. Regards,
  3542. Vernon Harvey
  3543.  
  3544. #: 1892 S10/IBM Speech Products ∙5!∙
  3545.     12-Apr-94  07:47:52
  3546. Sb: #1883-Big Processing Time
  3547. Fm: Office Automation 100012,3267
  3548. To: Vernon Harvey 72120,2767
  3549.  
  3550. Harvey:
  3551.  
  3552. First, thank you for your answer, but the End Silence duration parameter was
  3553. set to 0.8 seconds (the default value). I tryed to take 0.4 seconds for this
  3554. parameter but my problem is the same (less 0.4 seconds). I have to wait about
  3555. 3 seconds for a small sentence and up to 10 or more if I say something longer.
  3556. Is it normal to have to wait so much ?
  3557.  
  3558. Regards,
  3559. Ian GAMBINI, Amadeus Company
  3560.  
  3561. #: 1908 S10/IBM Speech Products ∙5!∙
  3562.     12-Apr-94  20:40:28
  3563. Sb: #1859-Big Processing Time
  3564. Fm: Bob Cave 73232,2474
  3565. To: Office Automation 100012,3267
  3566.  
  3567. Ian,
  3568.  
  3569. >>> I need a quite big grammar
  3570.  
  3571. Could you be a little more specific as to how large the grammar is?  The
  3572. combination of a large grammar (more choices at any point in the search) and
  3573. a high bandwidth context will have a negative impact on how long it takes to
  3574. complete a recognition.  Is there any way you can break up your context into
  3575. several smaller ones?  This might even allow you to get away with using the
  3576. medium bandwidth, which will also help performance.
  3577.  
  3578. Regards,
  3579.  
  3580. Bob Cave
  3581. ICSS Development, IBM
  3582.  
  3583. #: 1916 S10/IBM Speech Products ∙5!∙
  3584.     13-Apr-94  09:30:32
  3585. Sb: #1859-Big Processing Time
  3586. Fm: Ora Williamson 71742,2161
  3587. To: Office Automation 100012,3267
  3588.  
  3589. >>I have a problem with the processing time using ICSS.
  3590.  
  3591. Ian: I am from the ICSS development lab.  It sounds like something is up with
  3592. your     grammar.  Are you compiling Finite State or Word Pair?  How nested
  3593. are your productions?  Would you mind faxing us a copy of your grammar, or
  3594. sending us the .BNF and .DIC, so we can test it, tweak it, improve it, and
  3595. send it back to you?
  3596.  
  3597. The fax number is 301-803-3167.  Send it to my attention.
  3598.  
  3599. Regards, Ora Williamson ICSS Technical Liason IBM Spoken Language Systems Lab
  3600.  
  3601. #: 1980 S10/IBM Speech Products ∙5!∙
  3602.     14-Apr-94  21:58:42
  3603. Sb: #1859-Big Processing Time
  3604. Fm: Brandon Booth [IBM] 71042,3144
  3605. To: Office Automation 100012,3267
  3606.  
  3607. Ian
  3608.  
  3609. You would be better off with a group of smaller contexts, if possible.  You'll
  3610. get better accuracy and better speed.  As has been noted you can play with the
  3611. beam width (which is a speed vs. accuracy tradeoff), and the end silence
  3612. duration (where you have to be careful of people who speak slowly).  If you
  3613. can use medium bandwidth, that is faster.  Also you need to pay attention to
  3614. the structure of the bnf.  It is possible to have faster and slower bnf's
  3615. which produce the same results.
  3616.  
  3617. Brandon
  3618.  
  3619. ICSS Development
  3620.  
  3621. #: 1 S10/Thread Header
  3622.     12-Apr-94  20:45:54
  3623. Sb: Installing ICSS from B:
  3624. Fm:
  3625. To:
  3626.  
  3627. TITLE: INSTALLING ICSS FROM B:
  3628. KEYWORDS: 
  3629.  
  3630. #: 1909 S10/IBM Speech Products ∙5!∙
  3631.     12-Apr-94  20:45:54
  3632. Sb: Installing ICSS from B:
  3633. Fm: Bob Cave 73232,2474
  3634. To: all
  3635.  
  3636. Hi all, I couldn't find the original note on this topic, but I would like to
  3637. post the information here anyway...
  3638.  
  3639. There was a post last week from a user who ran into problems installing ICSS
  3640. for Windows from the B: drive.  There is a bug at the end of the ICSS install,
  3641. when it asks for the Win32s diskette.  You can clear this message and complete
  3642. the install.  Then, put the Win32s diskette back in the B: drive and invoke
  3643. the setup program directly.  The diskette is the standard Win32s distribution
  3644. diskette, and has its own setup program.  The ICSS install program simply
  3645. invokes it for you as a last step.
  3646.  
  3647. Any questions, please post.
  3648.  
  3649. Regards,
  3650.  
  3651. Bob Cave
  3652. ICSS Development, IBM
  3653.  
  3654.  
  3655.  
  3656.  
  3657.  
  3658.