home *** CD-ROM | disk | FTP | other *** search
/ ProfitPress Mega CDROM2 …eeware (MSDOS)(1992)(Eng) / ProfitPress-MegaCDROM2.B6I / TEXT / UTILITY / PCKIM386.ZIP / NEWS9105.TXT next >
Encoding:
Text File  |  1991-08-21  |  8.0 KB  |  206 lines

  1.  
  2.                           PC-KIMMO News
  3.                           =============
  4.  
  5.                           May 30, 1991
  6.  
  7. This announcement describes recent developments related to PC-KIMMO (an 
  8. implementation for personal computers of Kimmo Koskenniemi's two-level model 
  9. of word production and recognition).
  10.  
  11. (1) PC-KIMMO version 1.0.5 update
  12.  
  13. (2) KGEN - a rule compiler (table generator) for PC-KIMMO
  14.  
  15. (3) KTEXT - a text-processing application using the PC-KIMMO parser
  16.  
  17. (4) recent articles related to PC-KIMMO
  18.  
  19. The software described below is made freely available to the academic 
  20. community for non-commercial use and redistribution. We invite your feedback 
  21. on these programs. Please note that the software is packaged in compressed 
  22. archives: Zip files for MS-DOS and Stuffit files for Macintosh. In addition, 
  23. if you obtain the files by e-mail, they will arrive in encoded form: 
  24. uu-encoding for MS-DOS and Binhex format for Macintosh. Utility programs for 
  25. handling archives and encoded files are available from computer bulletin 
  26. boards or from your university computing center. (Hint for MS-DOS users: when 
  27. you unzip a file, use the -d option to preserve the subdirectories.) Finally, 
  28. it is possible that the files may not yet be available in some of the places 
  29. listed below. Just wait a few days and try again.
  30.  
  31.  
  32. (1) PC-KIMMO 1.0.5 update
  33.  
  34. PC-KIMMO version 1.0.5 has been available since the end of February. It fixes 
  35. a problem with loading very large lexicons (more than 100 sublexicons). Thanks 
  36. to Elizabeth Hinkelman and her colleagues for finding this bug. This version 
  37. also fixes a couple things that caused crashes on the Macintosh. There are no 
  38. functional changes in version 1.0.5. If you want to upgrade to version 1.0.5, 
  39. you can obtain it as follows:
  40.  
  41.   1. Obtain it via anonymous FTP from the following sources. (I am advised 
  42. that it is best to use the symbolic names rather than the numeric addresses. 
  43. Also, the directory structure is subject to change.)
  44.  
  45.      MS-DOS version:
  46.        msdos.archive.umich.edu  [141.211.165.34]
  47.        msdos/linguistics/pckim105.zip
  48.  
  49.      Macintosh version:
  50.        mac.archive.umich.edu  [141.211.165.34]
  51.        mac/etc/linguistics/pckim105.sit
  52.  
  53.   2. Request it from us via e-mail. Be *sure* to specify which version you want 
  54. (DOS, Mac, UNIX).
  55.  
  56.   3. Send a diskette and a self-addressed, stamped diskette mailer to the 
  57. address below. Be *sure* to specify which version you want (DOS, Mac, UNIX) 
  58. and the disk format.
  59.  
  60.  
  61. (2) KGEN
  62.  
  63. KGEN, a rule compiler for PC-KIMMO, is now available for beta testing. KGEN 
  64. was written by Nathan Miles of Ohio State University. All rights and 
  65. responsibilities pertaining to the program presently belong to Nathan Miles 
  66. (not to the Summer Institute of Linguistics). He can be reached by e-mail at 
  67. miles@cis.ohio-state.edu. Nathan has done a great job at developing this 
  68. program and he deserves our thanks.
  69.  
  70. KGEN takes a two-level rule like this:
  71.  
  72.         y:i => @:C___+:0
  73.  
  74. and translates it into a finite state table like this:
  75.  
  76.            @ y + @
  77.            C i 0 @
  78.         1: 2 0 1 1
  79.         2: 2 3 2 1
  80.         3. 0 0 1 0
  81.  
  82. KGEN accepts as input a file of two-level rules and produces as output a file 
  83. of state tables that is identical in format to PC-KIMMO's rules file. Anything 
  84. that KGEN does not correctly handle can be easily fixed by hand in its output 
  85. file. Everyone who uses PC-KIMMO (or who doesn't use it because they don't 
  86. want to write tables by hand) is welcome to try out KGEN. But what we really 
  87. need are some beta testers who can compare KGEN's output to tables they have 
  88. written by hand. Let us know if you are willing to beta test KGEN for us.
  89.  
  90. Presently KGEN runs only under MS-DOS and UNIX, but we hope to get it compiled 
  91. for the Macintosh soon (any Think C experts out there?). You can obtain KGEN 
  92. as follows. 
  93.  
  94.   1. The MS-DOS version of KGEN is available via anonymous FTP from SIMTEL20:
  95.  
  96.      wsmr-simtel20.army.mil [192.88.110.20]
  97.      pd1:<msdos.linguistics>kgen02.zip
  98.  
  99. SIMTEL20 can also be accessed using LISTSERV commands from BITNET via 
  100. LISTSERV@NDSUVM1, LISTSERV@RPIECS and in Europe from EARN TRICKLE servers 
  101. (for example, FRMOP11 in France). You can also obtain files from SIMTEL20 by 
  102. e-mail. Send this line as the only message to listserv@vm1.nodak.edu (1 = one) 
  103. (this may not work outside the U.S.):
  104.  
  105.      /PDGET MAIL PD1:<MSDOS.LINGUISTICS>KGEN02.ZIP UUENCODE
  106.  
  107. The MS-DOS version of KGEN is also available by anonymous FTP from:
  108.  
  109.      msdos.archive.umich.edu  [141.211.165.34]  (symbolic name recommended)
  110.      msdos/linguistics/kgen02.zip
  111.  
  112.   2. The UNIX version (consisting of the source files which you must compile 
  113. on your own machine) is available by anonymous FTP from the machine TUT:
  114.  
  115.      cis.ohio-state.edu [128.146.8.60]
  116.      pub/kgen/kgen03.tar.Z
  117.  
  118.   3. Request KGEN from us via e-mail. Be *sure* to specify which version you 
  119. want (DOS, UNIX).
  120.  
  121.   4. If all else fails, send a diskette and a self-addressed, stamped diskette 
  122. mailer to the address below. Be *sure* to specify which version you want (DOS,
  123. UNIX) and the disk format.
  124.  
  125.  
  126. (3) KTEXT
  127.  
  128. KTEXT is a new text-processing application that uses the PC-KIMMO parser. It 
  129. accepts as input a text in orthographic form, tokenizes it into words, strips 
  130. off and saves punctuation, capitalization, white space, and formatting codes, 
  131. parses each word, and outputs the result to a quasi-database file with a 
  132. record for each word. Its output data structures are suitable for further 
  133. processing by other programs, such as a text interlinearizer, a syntactic 
  134. parser, or a machine translation system. 
  135.  
  136. KTEXT is a beta test release that is distributed and supported by the Summer 
  137. Institute of Linguistics. It is available for MS-DOS, Macintosh, and UNIX. You 
  138. can obtain it as follows.
  139.  
  140.   1. The MS-DOS version of KTEXT is available from SIMTEL20 as (see above on 
  141. how to access SIMTEL20 by FTP or e-mail):
  142.  
  143.      pd1:<msdos.linguistics>ktext093.zip
  144.  
  145. It is also available via anonymous FTP from:
  146.  
  147.      msdos.archive.umich.edu  [141.211.165.34]  (symbolic name recommended)
  148.      msdos/linguistics/kgen02.zip
  149.  
  150.   2. The Macintosh version of KTEXT is available via anonymous FTP from:
  151.  
  152.      mac.archive.umich.edu  [141.211.165.34]  (symbolic name recommended)
  153.      mac/etc/linguistics/ktext094.sit
  154.  
  155. It is also available via anonymous FTP from:
  156.  
  157.      sumex-aim.stanford.edu [36.44.0.6]
  158.      /info-mac/app/ktext-094.hqx
  159.  
  160. You can also obtain files from SUMEX-AIM by e-mail. Send this line as the only 
  161. message to listserv@ricevm1.rice.edu (1 = one) (this may not work outside the 
  162. U.S.):
  163.  
  164.      $MACARCH GET /info-mac/app/ktext-094.hqx
  165.  
  166.   3. Request KTEXT from us via e-mail. Be *sure* to specify which version you 
  167. want (DOS, UNIX).
  168.  
  169.   4. If all else fails, send a diskette and a self-addressed, stamped diskette 
  170. mailer to the address below. Be *sure* to specify which version you want (DOS,
  171. UNIX) and the disk format.
  172.  
  173.   5. To obtain the UNIX sources, please contact us at the address below.
  174.  
  175.  
  176. (4) Recent articles related to PC-KIMMO:
  177.  
  178. Antworth, Evan L. 1991. Introduction to two-level phonology. Notes on 
  179.   Linguistics, 53:4-18. Dallas, TX: Summer Institute of Linguistics.
  180.  
  181. Antworth, Evan L. 1991. Glossing text with the PC-KIMMO morphological parser. 
  182.   (Manuscript submitted for publication)
  183.  
  184. Simons, Gary F. 1991. A two-level processor for morphological analysis. Notes 
  185.   on Linguistics, 53:19-27. Dallas, TX: Summer Institute of Linguistics.
  186.  
  187. Vanni, Michelle. 1990. Abstract of "PC-KIMMO: a two-level processor for 
  188.   morphological analysis." Georgetown Journal of Languages & Linguistics 
  189.   1.4:498-500.
  190.  
  191.  
  192. Special requests for any of the software or articles described above and/or 
  193. requests for more information should be sent to:
  194.  
  195. Evan Antworth
  196. Academic Computing Department
  197. Summer Institute of Linguistics
  198. 7500 W. Camp Wisdom Road
  199. Dallas, TX  75236
  200. U.S.A.
  201.  
  202. Internet:  evan@txsil.sil.org  <-------- new address as of May 1991
  203. UUCP:      ...!uunet!convex!txsil!evan
  204. phone:     214/709-2418
  205. fax:       214/709-3387
  206.