home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #1 / NN_1993_1.iso / spool / comp / std / internat / 1093 < prev    next >
Encoding:
Internet Message Format  |  1993-01-07  |  1.5 KB

  1. Path: sparky!uunet!olivea!mintaka.lcs.mit.edu!ai-lab!wheat-chex!glenn
  2. From: glenn@wheat-chex.ai.mit.edu (Glenn A. Adams)
  3. Newsgroups: comp.std.internat
  4. Subject: Re: Dumb Americans (was INTERNATIONALIZATION: JAPAN, FAR EAST)
  5. Keywords: Han Kanji Katakana Hirugana ISO10646 Unicode Codepages
  6. Message-ID: <1ii0n7INN6ig@life.ai.mit.edu>
  7. Date: 7 Jan 93 19:36:07 GMT
  8. References: <1993Jan1.114158.17149@prl.dec.com> <1i2emiINN2td@rodan.UU.NET> <1993Jan7.065611.15193@fcom.cc.utah.edu>
  9. Organization: MIT Artificial Intelligence Laboratory
  10. Lines: 16
  11. NNTP-Posting-Host: wheat-chex.ai.mit.edu
  12.  
  13. In article <1993Jan7.065611.15193@fcom.cc.utah.edu> terry@cs.weber.edu (A Wizard of Earth C) writes:
  14. >This example becomes more of a problem when translated to one of a glyph
  15. >variant between Chinese and Japanese.  I agree that the problem is one
  16. >of words, not characters -- however, in ideographic languages, words *are*
  17. >characters.  The example is not as artificial as you make out.
  18.  
  19. I'm afraid this is incorrect.  Ideographic characters in Chinese, Japanese,
  20. Korean, and Vietnamese (chu+" no>m va! chu+" ha'n) *are not* equivalent
  21. to words.  Rather, they are mostly equivalent to morphemes (although there are
  22. a number of multiple character morphemes).  Many words in these languages
  23. are composed from multiple morphemes, e.g., modern Chinese has about 2.2
  24. morphemes (characters) per word on average.  For example, in Chinese
  25. "zhong1guo2" 'China' and "ri4ben3" 'Japan' are single words but contain
  26. two morphemes each.
  27.  
  28. Glenn Adams
  29.