home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #1 / NN_1993_1.iso / spool / comp / std / internat / 1037 < prev    next >
Encoding:
Internet Message Format  |  1993-01-05  |  3.0 KB

  1. Path: sparky!uunet!europa.asd.contel.com!gatech!destroyer!gumby!yale!yale.edu!ira.uka.de!fauern!uni-erlangen.de!not-for-mail
  2. From: unrza3@cd4680fs.rrze.uni-erlangen.de (Markus Kuhn)
  3. Newsgroups: comp.std.internat
  4. Subject: Let's develop ISO sorting rules
  5. Date: 5 Jan 1993 11:03:24 +0100
  6. Organization: Regionales Rechenzentrum Erlangen
  7. Message-ID: <1ibmdcEINNooe@uni-erlangen.de>
  8. References: <1i0vnmINN352@rodan.UU.NET> <8494@charon.cwi.nl> <1i2durINN2pj@rodan.UU.NET> <8496@charon.cwi.nl> <C0Cuz5.2wy@flatlin.ka.sub.org>
  9. Reply-To: mskuhn@immd4.informatik.uni-erlangen.de
  10. NNTP-Posting-Host: cd4680fs.rrze.uni-erlangen.de
  11. Lines: 54
  12. Keywords: Han Kanji Katakana Hirugana ISO10646 Unicode Codepages
  13.  
  14. bad@flatlin.ka.sub.org (Christoph Badura) writes:
  15.  
  16. >>I do not think you understand.  From the AVON (Amtliches Verzeichnis der
  17. >>Ortnetzkennzahlen) edition 1985, which gives area codes for the places in
  18. >>Germany.  The next is a selection of places mentioned ("o is o-umlaut):
  19. >>    Modautal
  20. >>    M"ockm"uhl
  21. >>    ...
  22. >>now come up with a coding that allows this (standard German) sorting.
  23.  
  24. >This is _not_ standard German sorting, it's standard German PTT
  25. >sorting (and quite confusing at times).
  26.  
  27. Well, this is the "Deutsches Einheits ABC" (translate this with German
  28. Standard Sorting) defined in DIN 5007 which clearly defines that
  29. a-Umlaut is sorted as ae. I don't like this rule very much, but at the
  30. moment, it is the most official standard (DIN is our ISO member body)
  31. we have.
  32.  
  33. >The Duden treats umlauts as the corresponding vowel with respect to
  34. >sorting order (i.e. "o sorts the same as o etc.)
  35.  
  36. And many other dictionaries ignore DIN 5007 as well, because sorting
  37. a-Umlaut ("a) as 'a' instead of 'ae' makes searching for humans
  38. much more easier.
  39.  
  40. All this only supports my conclusion again:
  41.  
  42. We have to define international multilingual sorting rules for Unicode
  43. strings that depend NOT on the language and that do NOT try to be
  44. compatible with every existing sorting system, because nearly no
  45. country seems to have well established sorting rules. This seems to
  46. be the only practical approach in my eyes. I see no disadvantages.
  47.  
  48. Believe me, German users who know what they are talking about won't
  49. complan if "a, "o and "u are not sorted as ae, oe and ue. Sorting all
  50. latin characters directly behind their version without a diacritic
  51. will be accepted by 99.9% of people using latin alphabets, because
  52. this rule is easy to learn, easy to understand and language
  53. independend. Then let's insert the cyrillic letters (like in KOI-8?)
  54. and the greek letters (delta sorts near D etc.) in this alphabeth
  55. and we get a beautiful multilingual sorting! Let's start to work on
  56. ISO sorting rules.
  57.  
  58. THE SOLUTION IS SIMPLE ONCE YOU ACCEPTED THAT INCOMPATIBILITY WITH
  59. EXISTING HISTORICAL RULES IS NECESSARY!
  60.  
  61. Markus
  62.  
  63. -- 
  64. Markus Kuhn, Computer Science student -=-=- University of Erlangen, Germany
  65. Internet: mskuhn@immd4.informatik.uni-erlangen.de  |  X.500 entry available
  66. ----- Anyone participating in the use of MS-DOS, Heroin or Cocaine is -----
  67. ---- simply not getting the most out of life possible. (Brian Downing) ----
  68.