home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #1 / NN_1993_1.iso / spool / comp / std / internat / 1106 < prev    next >
Encoding:
Internet Message Format  |  1993-01-08  |  5.9 KB

  1. Path: sparky!uunet!zaphod.mps.ohio-state.edu!cs.utexas.edu!sun-barr!sh.wide!wnoc-tyo-news!sranha!anprda!pmcgw!personal-media.co.jp
  2. From: ishikawa@personal-media.co.jp (Chiaki Ishikawa)
  3. Newsgroups: comp.std.internat
  4. Subject: Re: Dumb Americans (was INTERNATIONALIZATION: JAPAN, FAR EAST)
  5. Message-ID: <ISHIKAWA.93Jan8125424@ds5200.personal-media.co.jp>
  6. Date: 8 Jan 93 03:54:10 GMT
  7. References: <1hvu79INN4qf@rodan.UU.NET> <1993Jan1.115424.27258@enea.se>
  8.     <1i2gpvINN3lm@rodan.UU.NET> <1993Jan2.230101.20871@enea.se>
  9.     <1i99qfEINN420@uni-erlangen.de>
  10. Sender: news@pmcgw.personal-media.co.jp
  11. Reply-To: ishikawa@personal-media.co.jp
  12. Organization: Personal Media Corp., Tokyo Japan
  13. Lines: 103
  14. Nntp-Posting-Host: ds5200
  15. In-reply-to: unrza3@cd4680fs.rrze.uni-erlangen.de's message of 4 Jan 93 12:16:15 GMT
  16. X-Md4-Signature: 4349bccdacb4f704e90f68505efdd5c5
  17.  
  18.  
  19. From a Japanese perspective:
  20.  
  21. In article <1i99qfEINN420@uni-erlangen.de> unrza3@cd4680fs.rrze.uni-erlangen.de (Markus Kuhn) writes:
  22.  
  23.    First about keyboard drivers:
  24.  
  25.     [details omitted]
  26.  
  27.    Would be a nice research project ...
  28.  
  29. Agreed. It would not be impossible, but it would require rewriting of
  30. many applications (or input libraries) and would take a long time to
  31. see such changes done everywhere.
  32.  
  33.    And about sorting rules:
  34.  
  35.    As I believe that no one will die if his national sorting rules
  36.    are changed, perhaps it's time to create international ISO sorting rules
  37.    comparable to those defined in DIN 5007. Why shouldn't the people that
  38.    know about these problems at first try to harmonize the rules internationaly
  39.    before they implement complex historically grown sorting rules.
  40.  
  41. May I suggest that before going into ISO arena, each country (or
  42. culture group) codify the existing methods clearly in writing?  And
  43. please note the use of my plural form of method[s]. I don't believe
  44. there is single satisfactory sorting method in each language.  (I
  45. don't know if there is single satisfactory rule for American English,
  46. but it is not clearly in Germany [I read that some publishers dont
  47. follow DIN sorting rule.]  and other places such as Japan.)
  48.  
  49.    One first approach for an ISO sorting standard would be for all latin languages
  50.    to order letters with diacritics directly behind their versions without
  51.    diacritics. Other suggestions for international sorting harmonization
  52.    rules are welcome. The result might be a huge permutation table for
  53.    Unicode. The goal should NOT be to try to cover all EXISTING sorting
  54.    rules (which may trivially proofed as being impossible), but to create
  55.    something acceptable for sorting multilingual textes. Good idea?
  56.  
  57. I doubt if this is a good idea because unless we cover existing
  58. sorting rules (and which are presumably used widely), it would be
  59. useless for many users. Like the German publishers mentioned in this
  60. group, who use a sorting rule different from the one in DIN
  61. standard, there will be people using the existing sorting rule(s). So
  62. why not codify them in freely available (semi-) standard documents?
  63.  
  64.    This ISO sorting standard should be 100% language independend. This surely
  65.    is possible and as I believe would be very very useful.
  66.  
  67. I don't think this language independence is possible.  I hate to give
  68. a very specific example, but IMHO, location-specific examples and
  69. counter-examples are a norm rather than exception.  So here it goes.
  70. Look at Japanese text (or names). When text (or names) are written
  71. using Kanji (chinese characters), the information concerning how to
  72. read it are more or less lost! [It is true that most of the time, a
  73. grownup Japanese can guesstimate the correct reading. But there are so
  74. many exceptions to rely on the human skill :-(] If we want to collate
  75. such text (or names) according to how we read them, we have to have
  76. auxiliary phonetical data (probably given in the hiragana or katakana
  77. letters.)  I wonder if you call such sorting environment language
  78. independent. [Now, granted, the sorting of hiragana only data or
  79. katakana data is more or less straightforward.] In any case, the local
  80. telephone companies use a particular sorting method to list all the
  81. names in telephone book. I don't think it is language-independent
  82. method at all.
  83.  
  84. I believe the correct approach to sorting is to codify the existing
  85. rules of each country/culture/whatever, and then publish them in a
  86. easy to read documents which are understandable by reasonably talented
  87. programmers of other countries. Code examples for each sorting rules
  88. will go a long way. This will help I18N from the bottom.
  89.  
  90.     [bibliographic sorting example deleted]
  91.  
  92.    ASCII also doesn't allow direct sorting. You have to do case conversion,
  93.    punctuation removement, etc. before you can arithmetically compare the
  94.    strings. With ASCII, these algorithms are only so simple, that most people
  95.    don't recognize them. 
  96.  
  97. Unfortunately, some languages of the world require much more complex
  98. preprocessing, or the notion of "sorting" may not apply very well in
  99. the naive sense of the word as perceived, say, American users.
  100. Frankly, I have tough time to explain to overseas visitors how the
  101. names are sorted in the Japanese telephone directory. [It would take a
  102. few minutes in the least and I don't know if the explanation is
  103. understodd at all. I bet you can explain the concept of sorting in
  104. American telephone directory in less than a minute to an intelligent
  105. grownup.]
  106.  
  107.    With ISO 10646, you need the same methods as with ASCII,
  108.    they are only more complex and require much bigger exception tables. There
  109.    is not fundamental difference!
  110.  
  111. I doubt if it is just a complexity issue. The whole concept of
  112. language independence sounds like a pipe dream to me. (see the
  113. discussion of Japanese sorting above.) There is nothing wrong about
  114. language-specific solutions IMHO as long as such solutions (adopted
  115. from existing practices) are freely available in understandable
  116. documentation.
  117.  
  118.  Chiaki Ishikawa,  Personal Media Corp.,  MY Bldg, 1-7-7 Hiratsuka,
  119.  Shinagawa, Tokyo 142, JAPAN. FAX:+81-3-5702-0359, Phone:+81-3-5702-0351
  120.  UUNET: ishikawa@personal-media.co.jp
  121.