home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #1 / NN_1993_1.iso / spool / comp / std / internat / 1011 < prev    next >
Encoding:
Internet Message Format  |  1993-01-04  |  4.6 KB

  1. Path: sparky!uunet!cs.utexas.edu!qt.cs.utexas.edu!yale.edu!ira.uka.de!fauern!uni-erlangen.de!not-for-mail
  2. From: unrza3@cd4680fs.rrze.uni-erlangen.de (Markus Kuhn)
  3. Newsgroups: comp.std.internat
  4. Subject: Re: Dumb Americans (was INTERNATIONALIZATION: JAPAN, FAR EAST)
  5. Date: 4 Jan 1993 13:16:15 +0100
  6. Organization: Regionales Rechenzentrum Erlangen
  7. Message-ID: <1i99qfEINN420@uni-erlangen.de>
  8. References: <1hvu79INN4qf@rodan.UU.NET> <1993Jan1.115424.27258@enea.se> <1i2gpvINN3lm@rodan.UU.NET> <1993Jan2.230101.20871@enea.se>
  9. Reply-To: mskuhn@immd4.informatik.uni-erlangen.de
  10. NNTP-Posting-Host: cd4680fs.rrze.uni-erlangen.de
  11. Lines: 84
  12.  
  13. First about keyboard drivers:
  14.  
  15. sommar@enea.se (Erland Sommarskog) writes:
  16. >Vadim Antonov (avg@rodan.UU.NET) writes:
  17. >>In article <1993Jan1.115424.27258@enea.se> sommar@enea.se (Erland Sommarskog) writes:
  18. >>>So if I type a C then a million key presses later changes puts in
  19. >>>an H after the C how can the keyboard driver handle that? It might
  20. >>>not even be the same driver who are seeing the two!
  21. >>Aw, don't be silly. It's trivial.
  22. >When you can't explain write off the problem as trivial.
  23.  
  24. One solution: You extend the 'keyboard driver' <-> 'application'
  25. interface by a method that allows the keyboard driver to ask the application,
  26. in which context the key should be interpreted. The technical details are
  27. perhaps slightly more complicated, but surely not very difficult
  28. (mathematicians call this 'trivial' :-). 
  29.  
  30. In this way, the application need not be aware of the language and locale,
  31. but in existing systems applications have to be extended to aswer questions
  32. about the environment, in which the new letter will be inserted, from the
  33. keyboard driver and to even allow the keyboard driver to make changes
  34. in this environment. Would be a nice research project ...
  35.  
  36. And about sorting rules:
  37.  
  38. >Nope. Not with German. Look in a German dictionary. Then look in a
  39. >German phonebook. Then you will find that the dotted suckers are
  40. >sorted differently in the two places. If you want to support both,
  41. >you have to know what the user wants. Or do you suggest that the
  42. >user should specify that on input with choosing the correct set of
  43. >dotted characters? What if another user wants the other order?
  44.  
  45. (BTW: German sorting rules are defined in DIN 5007. That's the method
  46. used in the phone books. Some dictionary printers feel, that sorting
  47. a-Umlaut as 'a' and not as 'ae' makes quick searching easier for human
  48. users.)
  49.  
  50. As I believe that no one will die if his national sorting rules
  51. are changed, perhaps it's time to create international ISO sorting rules
  52. comparable to those defined in DIN 5007. Why shouldn't the people that
  53. know about these problems at first try to harmonize the rules internationaly
  54. before they implement complex historically grown sorting rules.
  55.  
  56. One first approach for an ISO sorting standard would be for all latin languages
  57. to order letters with diacritics directly behind their versions without
  58. diacritics. Other suggestions for international sorting harmonization
  59. rules are welcome. The result might be a huge permutation table for
  60. Unicode. The goal should NOT be to try to cover all EXISTING sorting
  61. rules (which may trivially proofed as being impossible), but to create
  62. something acceptable for sorting multilingual textes. Good idea?
  63.  
  64. This ISO sorting standard should be 100% language independend. This surely
  65. is possible and as I believe would be very very useful.
  66.  
  67.  
  68. Sorting is always depends on the type of application you have,
  69. dont' forget this. E.g. in bibliographic systems you have to insert
  70. permutation markers in names, so that
  71.  
  72.       Markus G. *Kuhn     (* represents here the marker control code
  73.                            in your favourite bibliographic control
  74.                            character set. What's the corresponding
  75.                            UNICODE code?)
  76.  
  77. will be sorted as
  78.  
  79.       Kuhn Markus G
  80.  
  81. There are even more complex systems with 2 or 3 markers in use.
  82.  
  83. ASCII also doesn't allow direct sorting. You have to do case conversion,
  84. punctuation removement, etc. before you can arithmetically compare the
  85. strings. With ASCII, these algorithms are only so simple, that most people
  86. don't recognize them. With ISO 10646, you need the same methods as with ASCII,
  87. they are only more complex and require much bigger exception tables. There
  88. is not fundamental difference!
  89.  
  90. Markus
  91.  
  92. -- 
  93. Markus Kuhn, Computer Science student -=-=- University of Erlangen, Germany
  94. Internet: mskuhn@immd4.informatik.uni-erlangen.de  |  X.500 entry available
  95. ----- Anyone participating in the use of MS-DOS, Heroin or Cocaine is -----
  96. ---- simply not getting the most out of life possible. (Brian Downing) ----
  97.