home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #1 / NN_1993_1.iso / spool / comp / std / internat / 1105 < prev    next >
Encoding:
Text File  |  1993-01-08  |  2.5 KB  |  47 lines

  1. Newsgroups: comp.std.internat
  2. Path: sparky!uunet!spool.mu.edu!agate!dog.ee.lbl.gov!hellgate.utah.edu!fcom.cc.utah.edu!cs.weber.edu!terry
  3. From: terry@cs.weber.edu (A Wizard of Earth C)
  4. Subject: Re: Dumb Americans (was INTERNATIONALIZATION: JAPAN, FAR EAST)
  5. Message-ID: <1993Jan8.052641.8028@fcom.cc.utah.edu>
  6. Keywords: Han Kanji Katakana Hirugana ISO10646 Unicode Codepages
  7. Sender: news@fcom.cc.utah.edu
  8. Organization: University of Utah Computer Center
  9. References: <1993Jan1.114158.17149@prl.dec.com> <1i2emiINN2td@rodan.UU.NET> <1993Jan7.065611.15193@fcom.cc.utah.edu> <1ii0n7INN6ig@life.ai.mit.edu>
  10. Date: Fri, 8 Jan 93 05:26:41 GMT
  11. Lines: 34
  12.  
  13. In article <1ii0n7INN6ig@life.ai.mit.edu>, glenn@wheat-chex.ai.mit.edu (Glenn A. Adams) writes:
  14. |> In article <1993Jan7.065611.15193@fcom.cc.utah.edu> terry@cs.weber.edu (A Wizard of Earth C) writes:
  15. |> >This example becomes more of a problem when translated to one of a glyph
  16. |> >variant between Chinese and Japanese.  I agree that the problem is one
  17. |> >of words, not characters -- however, in ideographic languages, words *are*
  18. |> >characters.  The example is not as artificial as you make out.
  19. |> 
  20. |> I'm afraid this is incorrect.  Ideographic characters in Chinese, Japanese,
  21. |> Korean, and Vietnamese (chu+" no>m va! chu+" ha'n) *are not* equivalent
  22. |> to words.  Rather, they are mostly equivalent to morphemes (although there are
  23. |> a number of multiple character morphemes).  Many words in these languages
  24. |> are composed from multiple morphemes, e.g., modern Chinese has about 2.2
  25. |> morphemes (characters) per word on average.  For example, in Chinese
  26. |> "zhong1guo2" 'China' and "ri4ben3" 'Japan' are single words but contain
  27. |> two morphemes each.
  28.  
  29. Ok, partially bad instances (some characters *are* ideographic, or at least
  30. morphographic with single morphemes.  Pick a non-Chinese and non-Japanese
  31. purely ideographic language, and reapply the example to pass the purity of
  32. example requirements (since it *is* possible to produce a non-contrived
  33. example (ie: "chicken" as in "chicken soup") in Chinese, wherein a single
  34. glyph *does* represent a single word.
  35.  
  36.  
  37.                     Terry Lambert
  38.                     terry@icarus.weber.edu
  39.                     terry_lambert@novell.com
  40. ---
  41. Any opinions in this posting are my own and not those of my present
  42. or previous employers.
  43. -------------------------------------------------------------------------------
  44.                                         "I have an 8 user poetic license" - me
  45.  Get the 386bsd FAQ from agate.berkeley.edu:/pub/386BSD/386bsd-0.1/unofficial
  46. -------------------------------------------------------------------------------
  47.