home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #3 / NN_1993_3.iso / spool / comp / std / internat / 1270 < prev    next >
Encoding:
Internet Message Format  |  1993-01-21  |  3.2 KB

  1. Path: sparky!uunet!elroy.jpl.nasa.gov!usc!sol.ctr.columbia.edu!ira.uka.de!yale.edu!yale!mintaka.lcs.mit.edu!ai-lab!wheat-chex!glenn
  2. From: glenn@wheat-chex.ai.mit.edu (Glenn A. Adams)
  3. Newsgroups: comp.std.internat
  4. Subject: Re: Dumb Americans (was INTERNATIONALIZATION: JAPAN, FAR EAST)
  5. Date: 22 Jan 1993 02:17:36 GMT
  6. Organization: MIT Artificial Intelligence Laboratory
  7. Lines: 73
  8. Message-ID: <1jnlg0INN9n4@life.ai.mit.edu>
  9. References: <2676@titccy.cc.titech.ac.jp> <1ippgmINN7af@life.ai.mit.edu> <2770@titccy.cc.titech.ac.jp>
  10. NNTP-Posting-Host: wheat-chex.ai.mit.edu
  11. Keywords: Han Kanji Katakana Hirugana ISO10646 Unicode Codepages
  12.  
  13. In article <2770@titccy.cc.titech.ac.jp> mohta@necom830.cc.titech.ac.jp (Masataka Ohta) writes:
  14. >Consider, for example, a very common radical used for plant-related
  15. >characters, such as grass and flowers (character code from 827C to 864F
  16. >of DIS 10646-1.2).
  17. >
  18. >Its shape in Japanese or mainland China is
  19. >
  20. >        *        *
  21. >     ****************
  22. >        *        *
  23. >
  24. >whose stroke count is 3, while its shape in Taiwan and Korea is
  25. >
  26. >        *        *
  27. >     *******  *******
  28. >        *        *
  29. >
  30. >whose stroke count is 4. But, these different characters with differently
  31. >shaped radicals are unified in Unicode.
  32.  
  33. Yes, this is a good example of where there is a difference in how
  34. people count strokes.
  35.  
  36. No, this is not the way it is counted in these countries.  That is, you
  37. cannot say that all of Taiwan and Korea always count 3 strokes; similarly
  38. you cannot say that all of China and Japan always count 4 strokes.
  39. Different people count (or write) these radicals differently independently
  40. of their country of origin.  Different fonts also make different choices.
  41. However, in all cases there is absolutely no difference in meaning.  One
  42. can freely substitute in writing either form of this radical; few people
  43. will even notice unless they look closely.
  44.  
  45. Take another example, such as the component form of radical radical 163
  46. and 170 (identical except for position), which is counted as either 2 or
  47. 3 strokes.  The different standards and dictionaries have:
  48.  
  49.   GB 2312 = 2 strokes
  50.   JIS = 2 strokes
  51.   CNS = 3 strokes
  52.   No way of telling with KSC, but Dae Jaweon = 3 strokes
  53.   Han-Viet Tu-dien = 3 strokes
  54.  
  55. But that these are not consistent nationally:
  56.  
  57.   China: Kangxi Zidian = 3 strokes
  58.   Japan: Dai Kan-Wa Ziten = 3 strokes
  59.  
  60. In China (PRC), even though the normative dictionary has 3 strokes,
  61. GB2312 has 2; in Japan, even though a normative dictionary has 3 strokes,
  62. JIS has 2.  A count of two is clearly an innovation; the more traditional
  63. sources count 3.
  64.  
  65. The point here is that there is not a consistent treatment of stroke
  66. counting in certain cases in the communities which use these character
  67. forms.  Furthermore, in these cases, stroke count does not change
  68. the meaning of the text whatsoever.  It is like having a dollar sign
  69. glyph with one stroke or two strokes through an S, or having one with
  70. a single vertical stroke that intersects the whole S, or extends vertically
  71. from the top and bottom arches without fully intersecting the S.
  72.  
  73. In these cases, the CJK-JRG chose a normative count to assign to
  74. these characters; doing this does not cause a loss of reliable information,
  75. since,  in these casese, stroke counting isn't reliable in the
  76. first place.
  77.  
  78. Glenn Adams
  79.  
  80.  
  81.  
  82.  
  83.  
  84.  
  85.  
  86.