home *** CD-ROM | disk | FTP | other *** search
/ PDA Software Library / pdasoftwarelib.iso / PILOT / info / ENG2JPN / ENG2JPN.TXT < prev    next >
Encoding:
Text File  |  1997-10-01  |  4.9 KB  |  158 lines

  1. Eng2Jpn - 97-002
  2. ----------------
  3.  
  4. WHAT IS IT?
  5. -----------
  6.  
  7. Eng2Jpn is a conversion/modification of Professor Jim Breen's EDICT_S
  8. dictionary file for Scott Powell's "Dictionary" program which is
  9. available for the US Robotics Palm Pilot PDA.
  10.  
  11.  
  12.  
  13. The original EDICT_S and master EDICT file are available from the main
  14. web site:
  15.  
  16. ftp://ftp.cc.monash.edu.au/pub/nihongo/
  17.  
  18. or any of the mirror sites:
  19.  
  20. ftp://ftp.cdrom.com/pub/japanese/monash/     US - California
  21. ftp://kuso.shef.ac.uk/pub/japanese/monash/   UK
  22. ftp://enterprise.ic.gc.ca/pub/nihongo/       Canada
  23. ftp://ftp.sedl.org/pub/mirrors/nihongo/      US(Texas)
  24. ftp://ftp.uwtc.washington.edu/pub/Japanese/Monash/ US(Washington)
  25. ftp://ftp.xmission.com/pub/users/s/snowhare/nihongo/monash/ US(Utah)
  26. ftp://ftp.u-aizu.ac.jp/pub/SciEng/nihongo/ftp.cc.monash.edu.au/Japan
  27. ftp://ftp.funet.fi/pub/culture/japan/mirrors/monash/ Finland
  28. ftp://ftp.uni-duisburg.de
  29.  
  30.  
  31.  
  32. Scott Powell's "Dictionary" software is available as time-limited
  33. shareware from:
  34.  
  35. http://www.kagi.com/scottpowell/
  36.  
  37. **The dictionary converter program is also available from this
  38. address.
  39.  
  40.  
  41.  
  42.  
  43. THE FILES
  44. ---------
  45.  
  46. Eng2Jpn.pdb - The actual dictionary file for the Pilot
  47. Eng2Jpn.vox - The original unconverted dictionary in text format
  48. Eng2Jpn.txt - This readme file
  49.  
  50.  
  51. WHY?
  52. ----
  53.  
  54. Well, the original E2J dictionary which is distributed with the
  55. "Dictionary" program for the pilot has a number of problems. 
  56. First-off, is the size.  At around 1,600 words, it's a pretty small
  57. dictionary, and doesn't cover a lot of what might be needed for those
  58. studying Japanese, or wanting to look up words which might be a little
  59. more obscure.
  60.  
  61. Secondly, the dictionary uses a rather odd format for some of the
  62. romanizations of the Japanese language.  For example, in the E2J
  63. dictionary, FATHER is translated as "titi".  A better translation is
  64. actually "chichi".
  65.  
  66.  
  67. SOURCE
  68. ------
  69. The EDICT master dictionary file was/is compiled by Professor Jim
  70. Breen of the Monash University in Australia.  Currently at version
  71. 97-004, it weights in at around 61,000 words, it's one of the largest,
  72. and most-complete English/Japanese dictionaries available, and is
  73. highly recommended for people interested in the Japanese language.
  74.  
  75. Unfortunately, at 61,000 words, and approximately 2.7mb, it's a little
  76. large to fit into the Pilot.  For this reason, I used the EDICT_S
  77. dictionary which lands at around 10,600 words.
  78.  
  79. The original EDICT file is actually a combination of high-code
  80. Japanese characters (Kanji/Katakana/Hiragana), which is encoded in one
  81. of the standard 2-byte character sets such as S-JIS, etc.
  82.  
  83. The EDICT_S file which this Pilot dictionary has been created from has
  84. been romanized to remove the high-characters which aren't compatible
  85. with the "Dictionary" software.
  86.  
  87. Here's the original documentation file from the EDICT_S dictionary.
  88.  
  89.     EDICT_S
  90.     -------
  91.  
  92.     The EDICT_S file consists of a selection
  93.     of entries from the  V97-002 edition of
  94.     the EDICT file. These entries have had
  95.     all fields containing kanji removed,
  96.     and all the readings have been
  97.     converted to Hepburn romaji. Note that
  98.     the romaji is in fact "wa-puro-"
  99.     romaji, i.e. it differs slightly from
  100.     the usual Hepburn form as follows:
  101.  
  102.     See the "edict_r.doc" file for
  103.     further information.
  104.  
  105.     The selection of entries in the
  106.     EDICT_S file has been made simply
  107.     by only including those entries
  108.     found in the smaller "JDDICT" file.
  109.  
  110.     jwb@dgs.monash.edu.au
  111.     April/May 1997
  112.  
  113.  
  114. Some further modifications were necessary in order to fit the
  115. dictionary into a reasonable amount of space in the Pilot, and to keep
  116. it from blowing up the conversion program.  These changes were:
  117.  
  118. -Sorted alphabetically
  119. -Truncated to FIRST meaning of a given word where multiple meanings
  120. were present
  121. -Multiples were erased (where a word appears multiple times in
  122. Japanese, with different english translations)
  123. -Japanese words longer than 9 characters in length were removed.
  124. -And some additional (bracketed) information on words was removed.
  125.  
  126. These modifications had the net effect of trimming the dictionary's
  127. size from 10,600 words (362k), down to a more manageable 8,100 words
  128. (145k) - allowing it to fit into the Pilot, and still be compatible
  129. with the "Dictionary" software.
  130.  
  131.  
  132. Version Notes:
  133.  
  134. 1.0 - Initial release
  135. ---
  136. Dictionary at 7,417 words
  137.  
  138.  
  139. 1.1 - Update release
  140. ---
  141. With a new (more robust) conversion program from the author of the
  142. "Dictionary" software, I was able to expand the dictionary slightly,
  143. cutting words larger than 9 letters in length.  It looks like the
  144. "Dictionary" program probly maxes out the the index entries at around
  145. 16,384 entries.  My release uses 16,291.
  146.  
  147. Cutting it rather close ;)
  148.  
  149. Dictionary now at 8116 words (9.5% bigger)
  150.  
  151. Also included is the output "longwords" file, listing what didn't make
  152. it into the file due to word-length.
  153.  
  154.  
  155.  
  156. David S. Griffiths
  157. dgriff@direct.ca
  158.