home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #1 / NN_1993_1.iso / spool / comp / std / internat / 1042 < prev    next >
Encoding:
Text File  |  1993-01-05  |  3.9 KB  |  90 lines

  1. Newsgroups: comp.std.internat
  2. Path: sparky!uunet!usc!cs.utexas.edu!sun-barr!ames!data.nas.nasa.gov!taligent!tseng
  3. From: jenkinsj@blowfish.taligent.com (John H. Jenkins)
  4. Subject: Re: Language tagging
  5. Message-ID: <jenkinsj-050193090315@tseng.taligent.com>
  6. Followup-To: comp.std.internat
  7. Sender: usenet@taligent.com (More Bytes Than You Can Read)
  8. Organization: Taligent, Inc.
  9. References: <1336@blue.cis.pitt.edu> <1993Jan3.203017.232@enea.se> <2609@titccy.cc.titech.ac.jp><1iav6tINNee2@life.ai.mit.edu>
  10. Date: Tue, 5 Jan 1993 17:24:18 GMT
  11. Lines: 77
  12.  
  13. In article <1iav6tINNee2@life.ai.mit.edu>, glenn@wheat-chex.ai.mit.edu
  14. (Glenn A. Adams) wrote:
  15. > In article <2609@titccy.cc.titech.ac.jp>
  16. mohta@necom830.cc.titech.ac.jp (Masataka Ohta) writes:
  17. > >If I throw away a short e-mail message from Japan to Japanese
  18. > >friend living in China, how can my friend read the text with
  19. > >the appropriately shaped character?
  20. > Ohta-san,
  21. > Could you be more specific about this claim that [...]
  22. > a Japanese reader cannot read a
  23. > Unicode encoded Japanese text which is displayed with a Chinese
  24. > Unihan font versus a Japanese Unihan font.
  25. > I would be very interested to see any kind of hard data (other than
  26. > your opinion) that would substantiate this claim.  [...]
  27. > I should add that any data on this topic should be keyed to the
  28. > notion of legibility (i.e., readability) and not aesthetic judgment.
  29. > I would contend -- also with hard data to back up my claim -- that
  30. > you are incorrect in your assertion, and that, indeed, Japanese
  31. > readers *can* read Unicode encoded Japanese text displayed with
  32. > a Chinese Unihan font.
  33.  
  34. Looking at the question closely, however, I'm not sure that it's an
  35. issue of legibility so much as an issue of representability.  For
  36. example, suppose I have a plain [Unicode] text of a Japanese commentary
  37. on the Confucian classics.  Which parts should I display using a
  38. "Japanese" font and which using a "Chinese" font?
  39.  
  40. The answer is:  You have to go through by hand and fix it.  (*blech*)
  41.  
  42. Next scenario, however:  I download the King James Bible (say) from an
  43. ftp site in plaintext form.  The KJV uses italics extensively with a
  44. specific semantic.  Which parts should I display using italics?
  45.  
  46. The answer:  You have to go through by hand and fix it.  (*blech*)
  47.  
  48. I want to re-emphasize your fundamental point:  Unicode (and now, by
  49. extension, 10646) was *not* designed to maintain all the formatting
  50. information needed for text documents, any more than ASCII or 8859-x.  
  51.  
  52. >From my understanding of ISO procedures, in fact, it would have been
  53. impossible to design 10646 in such a fashion as to solve all the
  54. potential formatting problems (although Ohta-san's Chinese/Japanese
  55. dichotomy could have been maintained).
  56.  
  57. I am given to understand, in fact, that it is common in Japan for
  58. printers to use Japanese fonts when printing Chinese texts.  This is
  59. considered "improper," but it is done and does not seem to impact
  60. legibility.  
  61.  
  62. The CJK-JRG, which designed the unified Han set used by Unicode and
  63. 10646, is anxious to provide users the information necessary to display
  64. CJK text using the appropriate glyphs for a particular country.  The CJK
  65. section of 10646, when printed, will be using a "four-glyph" format,
  66. showing the typical (or, in some cases, normative) appearance of a
  67. particular character in each of mainland China, Taiwan, Japan, and
  68. Korea.  They will, furthermore, be producing a document later this year
  69. which will outline the systematic differences between the way characters
  70. are written the various CJK countries.  
  71.  
  72. While the CJK-JRG is hardly a neutral group on this issue, there has
  73. never been any sentiment expressed that I've heard to the effect that
  74. two glyphs should be separated simply on the basis that one is written
  75. in a Japanese way and one Chinese.  Just the opposite, in fact.  There
  76. is tacit agreement that higher-level protocols will be needed to
  77. maintain that kind of distinction.  
  78.  
  79.  
  80. ----
  81. John H. Jenkins
  82. John_Jenkins@taligent.com
  83.  
  84.