home *** CD-ROM | disk | FTP | other *** search
/ Black Box 4 / BlackBox.cdr / editors / jdic14.arj / EDICTJ.DOC < prev    next >
Text File  |  1991-10-18  |  8KB  |  202 lines

  1. E D I C T J 
  2. ===========
  3.  
  4. Public Domain Japanese/English Dictionary file,  coordinated  by 
  5. Jim Breen. 
  6.  
  7. CURRENT VERSION
  8. ---------------
  9.  
  10. The version date is now included in  the  dictionary  under  the 
  11. entry "aaaa" in katakana. (This keeps it as the first entry when 
  12. it is sorted.) 
  13.  
  14. The  master  copy  of  EDICTJ is in the pub/Nihongo directory of 
  15. monu6.cc.monash.edu.au.  There are other copies around, but they 
  16. may not be as up-to-date. 
  17.  
  18. INTRODUCTION
  19. ------------
  20.  
  21. EDICTJ is an attempt to produce a public domain Japanese/English 
  22. Dictionary in machine-readable form.  It was intended  initially 
  23. for use with MOKE (Mark's Own Kanji Editor) and related software 
  24. such as JDIC, however it has the potential to be used in a large 
  25. number of packages.  
  26.  
  27. At  present it is in the "public domain",  however consideration 
  28. is being given to placing it under Gnu or  Copyleft  protection, 
  29. mainly  to  prevent  the  work  of  its  many contributors being 
  30. exploited by commercial software developers. 
  31.  
  32. FORMAT
  33. ------
  34.  
  35. EDICTJ is in the "EDICT" format used by MOKE,  which is based on 
  36. the  structure  of the hankan files in the Wnn project.  It uses 
  37. EUC coding for kana and kanji,  however this can be converted to 
  38. JIS or SJIS by any of the several conversion programs around. It 
  39. consists of an ascii file with one entry per line. The format of 
  40. entries is: 
  41.  
  42. KANJI [KANA] /english_1/english_2/.../
  43.  
  44.      or
  45.  
  46. KANA /english_1/.../
  47.  
  48. CONTENTS
  49. --------
  50.  
  51. EDICTJ consists of:
  52.  
  53. (a)  the  basic  EDICT  distributed  with  MOKE  2.0.  This  was 
  54. compiled by MOKE's author,  Mark Edwards,  with assistance  from 
  55. Spencer  Green.  Mark  has very kindly released this material to 
  56. the public domain as part of EDICTJ.  A  number  of  corrections 
  57. have  been  made to the MOKE original,  e.g.  spelling mistakes, 
  58. minor mistranslations,  etc.  It also had a lot of duplications, 
  59. which  have  been  removed.   It  contained  about  1900  unique 
  60. entries. 
  61.  
  62. (b) additions by Jim Breen.  Apart from a  number  of  additions 
  63. made during normal MOKE usage (e.g.  using it to read fj.* news) 
  64. I laboriously keyed in a ~2000 entry dictionary used in my first 
  65. year nihongo course years ago.  I have then worked through other 
  66. vocabulary  lists  and  dictionaries  trying  to make sure major 
  67. entries were not omitted. [All this was terrific revision.] This 
  68. task is continuing, although it has slowed down, and I suspect I 
  69. will run out of energy well before EDICTJ reaches the 6000 entry 
  70. mark. 
  71.  
  72. (c) additions by others.  Many people have  contributed  entries 
  73. and  corrections  to EDICTJ.  A full list is at the back of this 
  74. file. 
  75.  
  76. At 5000+ entries,  EDICTJ is nowhere as big as a good commercial 
  77. dictionary,  which  typically has 20,000+ entries with examples, 
  78. etc.   It  is,   however,   bigger  than  some  of  the  smaller 
  79. dictionaries,    and   when   used   in   conjunction   with   a 
  80. search-and-display program like JDIC it  provides  an  effective 
  81. on-line dictionary service. 
  82.  
  83. COPYRIGHT?
  84. ----------
  85.  
  86. A  word  on copyright.  Of course most of the material in EDICTJ 
  87. came from other  published  lists.  Dictionary  copyright  is  a 
  88. difficult  point,  because  clearly  the first lexicographer who 
  89. published "inu means dog" could not claim a copyright  violation 
  90. over  all  subsequent  Japanese  dictionaries.  What  makes each 
  91. dictionary  unique  (and  copyrightable)   is   the   particular 
  92. selection   of  words,   the  phrasing  of  the  meanings,   the 
  93. presentation of the contents (a very important point in the case 
  94. of EDICTJ),  and the means of publication.  The  advice  I  have 
  95. received  from people who know about these things is that EDICTJ 
  96. is just as much a new dictionary as any others  on  the  market. 
  97. Readers  may  see  an entry which looks familiar,  and say "Aha! 
  98. That comes from the XYZ Jiten!". They may be right, and they may 
  99. be wrong.  After all there aren't too many translations of neko. 
  100. Let me make one thing quite clear.  NONE of this dictionary came 
  101. from commercial machine-readable dictionaries.  I have a case of 
  102. RSI in my right elbow to prove it. 
  103.  
  104. LEXOGRAPHICAL DETAILS
  105. ---------------------
  106.  
  107. EDICTJ is actually a Japanese->English dictionary,  although the 
  108. words within  it  can  be  selected  in  either  language  using 
  109. appropriate  software.  (JDIC  uses  it to provide both E->J and 
  110. J->E functionality.) 
  111.  
  112. The limitations on size inherent in the dictionary  due  to  its 
  113. current usage (MOKE scans it sequentially and JDIC needs to hold 
  114. it  in RAM) has meant that examples of usage cannot be included, 
  115. and inclusion of phrases is very limited. 
  116.  
  117. No inflections of verbs or adjectives have been included, except 
  118. in idiomatic expressions.  Similarly particles  are  handled  as 
  119. separate entries. Adverbs formed from adjectives (-ku or ni) are 
  120. not  included.  Verbs  are,  of  course,  are  in  the  plain or 
  121. "dictionary" form. 
  122.  
  123. In working on EDICTJ,  bearing in mind I want to use it in  MOKE 
  124. and  with  JDIC,  I  have  had to come up with a solution to the 
  125. problem of  adjectival  nouns  [keiyoudoushi]  (e.g.  kirei  and 
  126. kantan) and verbs formed by adding suru (e.g. benkyousuru). If I 
  127. put  entries  in  edict with the "na" and "suru" included,  MOKE 
  128. will not find a match when they are  omitted  or,  the  case  of 
  129. suru,  inflected.  What I have decided to do is to put the basic 
  130. noun into the dictionary and add "(vs)" where it can be used  to 
  131. form  a verb with suru,  and "(an)" if it is an adjectival noun. 
  132. Entries appear as: 
  133.  
  134. KANJI [benkyou] /study (vs)/
  135. KANJI [kantan] /simple (an)/
  136.  
  137. Where  necessary,   verbs  are  marked  with  "(vi)"  or  "(vt)" 
  138. according to whether they are intransitive or transitive.  (Work 
  139. on this aspect is continuing.) I have also  used  (id)  to  mark 
  140. idiomatic  expressions,  (col)  for  colloquialisms,  (pol)  for 
  141. teineigo, etc. 
  142.  
  143. USAGE
  144. -----
  145.  
  146. EDICTJ can be used as  the  dictionary  within  MOKE  simply  by 
  147. renaming it "EDICT". If you are a MOKE user and have been adding 
  148. to  your EDICT using the "Ask English?" option,  you may wish to 
  149. append your additions.  Why not send them to me and I  will  add 
  150. them to EDICTJ? 
  151.  
  152. EDICTJ  can  be  used,  with  acknowledgement,  for  any purpose 
  153. whatever, EXCEPT for inclusion in new commercial products.  Mark 
  154. Edwards can,  of course, use it in later MOKE releases.  Stephen 
  155. Chung may also be using it in his PD "JWP". 
  156.  
  157. CONTRIBUTIONS
  158. -------------
  159.  
  160. I will be delighted if people send me corrections,  suggestions, 
  161. and  ESPECIALLY  additions.  Before  ripping  in  with  a lot of 
  162. suggestions,  make sure you have the latest version,  as  others 
  163. may have already made the same comments. 
  164.  
  165. The  preferred  format  for  submissions  is  a  JIS or EUC file 
  166. (uuencoded  for  safety)  containing  replacement/new   entries. 
  167. Separate the amendments from the new material: e.g. 
  168.  
  169. **Amendments to EDICTJ yyyymmmdd**
  170.  
  171. old entry1
  172. new entry1
  173. old entry2
  174. ........
  175.  
  176. **New Entries**
  177.  
  178. New entry1
  179. New entry2
  180. .........
  181.  
  182. I  prefer  not  to  get  a  "diff" or "patch" file as the master 
  183. edictj may have had quite a few changes since you got your copy. 
  184.  
  185. ACKNOWLEDGEMENTS
  186. ----------------
  187.  
  188. Mark Edwards, Spencer Green, Alina Skoutarides,  Takako Machida, 
  189. Theresa  Martin,   Satoshi  Tadokoro,  Stephen  Chung,  Hidekazu 
  190. Tozaki, Clifford Olling. 
  191.  
  192. Jim Breen
  193. (jwb@monu6.cc.monash.edu.au)
  194. Department of Robotics & Digital Technology
  195. Monash University
  196. Caulfield East 3145
  197. AUSTRALIA
  198.  
  199. 18 October 1991 (approx 5440 entries, 192kbytes) 
  200.  
  201.  
  202.