home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #1 / NN_1993_1.iso / spool / comp / std / internat / 1095 < prev    next >
Encoding:
Text File  |  1993-01-07  |  4.8 KB  |  113 lines

  1. Newsgroups: comp.std.internat
  2. Path: sparky!uunet!cs.utexas.edu!sun-barr!ames!data.nas.nasa.gov!taligent!tseng
  3. From: jenkinsj@blowfish.taligent.com (John H. Jenkins)
  4. Subject: Re: Language tagging
  5. Message-ID: <jenkinsj-070193102220@tseng.taligent.com>
  6. Followup-To: comp.std.internat
  7. Sender: usenet@taligent.com (More Bytes Than You Can Read)
  8. Organization: Taligent, Inc.
  9. References: <1336@blue.cis.pitt.edu> <1993Jan3.203017.232@enea.se> <2609@titccy.cc.titech.ac.jp> <1iav6tINNee2@life.ai.mit.edu> <jenkinsj-050193090315@tseng.taligent.com><2631@titccy.cc.titech.ac.jp>
  10. Date: Thu, 7 Jan 1993 20:37:14 GMT
  11. Lines: 100
  12.  
  13. This is actually a response to three of Ohta-san's postings.  I'm
  14. merging the threads because (1) I think they're germane to each other
  15. and (2) I, for one, find it confusing to deal with so many threads on
  16. pretty much the same topic.  I'm not creating a new thread because I
  17. want to avoid starting another long, acrimonious, and pointless debate
  18. over Han unification.  
  19.  
  20. In <2631@titccy.cc.titech.ac.jp>, he argues:
  21.  
  22. > <I have a plain [ISO 2022] text of a Japanese commentary
  23. > <on the Confucian classics.  Which parts should I display using a
  24. > <"Japanese" font and which using a "Chinese" font?
  25. > <
  26. > <The answer is: As designated by the escape sequences.
  27.  
  28. Presumably by allowing you to switch character sets.  I'm not aware of
  29. any 2022 mechanism for switching fonts per se.  
  30.  
  31. There is, as I understand it, a fundamental assumption about Japanese
  32. which Ohta-san makes.  He feels that Japanese kanji and Chinese hanzi
  33. (and, presumably, Korean hanja, Vietnamese chu nom, and so on) are
  34. inherently distinct, the way the Greek alpha and Latin a are.  He feels
  35. this inherent distinction must be maintained in a character encoding.  
  36.  
  37. I don't share this assumption.  Unicode doesn't share this assumption. 
  38. The CJK-JRG doesn't share this assumption.  The Japanese delegation to
  39. the CJK-JRG doesn't share this assumption.  Japanese lexicographers such
  40. as the people responsible for the Dai Kanwa dictionary don't share this
  41. assumption.  Japanese printers who, in fact, publish Japanese
  42. commentaries on the Confucian classics and print *the* *whole* *thing*
  43. using Japanese fonts don't share this assumption.  
  44.  
  45. If I'm wrong with disagreeing with Ohta-san on this issue, at least I
  46. have the consolation of being in good company.  :-)
  47.  
  48. (Or am I misinterpreting you here?  Are you arguing that, although Han
  49. unification is possible in theory, on computers, it's best to make the
  50. distinction between Japanese and Chinese, French and English an inherent
  51. part of the character code for other reasons?)
  52.  
  53. In <2638@titccy.cc.titech.ac.jp>, he says:
  54.  
  55. >
  56. >The original DIS 10646 was free from CJK unification defect.
  57. >
  58. >Then, Unicoders made 10646 unusable ignoring many rational oppositions.
  59. >
  60.  
  61. Point of information.  Unicode is not responsible for the current
  62. content of 10646.  WG2 is.  It changed 10646 so as to be merged with
  63. Unicode because its member bodies wanted it to.  Their feeling was,
  64. generally, that having the two codes merged was a better alternative
  65. than having two multilingual character set codes in general use.  The
  66. decision to merge 10646 with Unicode had widespread, international
  67. support.  
  68.  
  69. BTW, I would agree that there are rational objections to Han unification
  70. (and other features of Unicode).  I feel that there are also rational
  71. arguments in its favor.  
  72.  
  73. >
  74. >Unicode, as it is now, is unusable and can't be implemented on a usable
  75. >internationalized product.
  76. >
  77.  
  78. Well, the proof here is in the pudding.  Unicode-based products are
  79. starting to be released.  Quite a few will be available by the end of
  80. the millenium.  We'll just have to see how they fly.
  81.  
  82. Finally, in <2639@titccy.cc.titech.ac.jp>, he argues:
  83.  
  84. >
  85. >10646 explicitely assign corresponding C/J/K Han in GB, JIS and KCS
  86. national
  87. >standard to the same code point. Thus, expanding 10646 to 32 bit can't
  88. >re-separate the assignment.
  89. >
  90.  
  91. The Japanese delegation to WG2 has advocated creating a swap zone in
  92. 10646 large enough to allow the swapping in of JIS.  This would make it
  93. possible for Japanese users to maintain an inherent distinction between
  94. Japanese and other Han-derived text based on code-point alone.  This
  95. suggestion did not meet with much international support, but it would
  96. still be possible to define a JIS plane, a GB plane, a KSC plane, and so
  97. on, in UCS-4 which Japanese users could use for a similar purpose.  Such
  98. a mechanism, however, would only be helpful for text created using it.  
  99.  
  100. (I am *not* advocating this -- please nobody bother to tell me it's a
  101. bad idea.  I just want to point out that it is possible.)
  102.  
  103. IMHO, the reseparation problem is not unique to Unicode/10646.  It is an
  104. inherent fact of life deriving from two people, using different
  105. character sets based on different assumptions, trying to talk to each
  106. other.  
  107.  
  108. ----
  109. John H. Jenkins
  110. John_Jenkins@taligent.com
  111.  
  112.