home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #1 / NN_1993_1.iso / spool / comp / std / internat / 1143 < prev    next >
Encoding:
Internet Message Format  |  1993-01-11  |  3.2 KB

  1. Path: sparky!uunet!dtix!darwin.sura.net!bogus.sura.net!howland.reston.ans.net!usc!cs.utexas.edu!qt.cs.utexas.edu!yale.edu!ira.uka.de!fauern!uni-erlangen.de!not-for-mail
  2. From: unrza3@cd4680fs.rrze.uni-erlangen.de (Markus Kuhn)
  3. Newsgroups: comp.std.internat
  4. Subject: Re: Let's develop ISO sorting rules
  5. Message-ID: <1iscn0EINNhjt@uni-erlangen.de>
  6. Date: 11 Jan 93 18:02:08 GMT
  7. References: <1iev27EINNmc4@uni-erlangen.de> <maf.726345946@dtek.chalmers.se> <1ihe8gEINNh5q@uni-erlangen.de> <1993Jan8.075233.5262@eecs.nwu.edu>
  8. Reply-To: mskuhn@immd4.informatik.uni-erlangen.de
  9. Organization: Regionales Rechenzentrum Erlangen
  10. Lines: 46
  11. NNTP-Posting-Host: cd4680fs.rrze.uni-erlangen.de
  12.  
  13. hpa@eecs.nwu.edu (H. Peter Anvin N9ITP) writes:
  14.  
  15. >> There are at least a few real world applications (I don't talk about
  16. >> trivialities like UNIX ls), e.g. catalogs of international libraries,
  17. >> where an _easy_ to understand language independend sorting standard would
  18. >> be extremely useful. Why not standardize one for Unicode in an easy
  19. >> _implementable_ way? Then let's see, how many people will adopt it and
  20. >> will quickly forget their traditional rules. Perhaps even many users
  21. >> in Sweden. There are perhaps already some multilingual sorting rules
  22. >> common practice, but I know no one that defines an easy implementable
  23. >> deterministic and total ordering for ISO 10646 strings.
  24.  
  25. >For this application, I think English sorting order is rather well
  26. >established.
  27.  
  28. What the hell is this "English sorting order"? Is it a standard that defines
  29. a deterministic total order of all Unicode strings? Where can I get the
  30. document that defines it? Perhaps we are speaking
  31. about the same idea, an international DEFAULT sorting order, that will be
  32. acceptable in many countries. There is no reason, why the USA and China
  33. can't share a common sorting order, there won't be any collisions.
  34. There won't even be collisions if you add France and Germany.
  35. But I don't know that any has been defined yet. If people in Sweden need
  36. a different order, than they should get their order, no problem.
  37. But it would be a good idea to define a default order that might be 
  38. easily refered to (e.g. as an ISO standard) and that satisfies the
  39. needs of the greatest set of countries for which this is possible with
  40. one sorting order. I am sure, that this is not possible with character
  41. code based sorting, but that it is possible with a SLIGHTLY more
  42. sophisticated algorithm. Why is everyone so uninterested in this idea?
  43. I posted already many details of my suggested framework for this
  44. standard. It consists of an algorithm and a big table that groups
  45. characters that are sorted together (e.g. a, A, and all As with
  46. diacritics are identified by this table to belong to one single group).
  47. All of the many digit 7 versions in Unicode would be another group.
  48. I don't have the experience to create the whole group table and the
  49. (low priority ordering within the groups for totality of the relation),
  50. but I hope, that the experts for CJK languages will also find suitable
  51. sorting groups for these languages.
  52.  
  53. Markus
  54.  
  55. -- 
  56. Markus Kuhn, Computer Science student -=-=- University of Erlangen, Germany
  57. Internet: mskuhn@immd4.informatik.uni-erlangen.de  |  X.500 entry available
  58. --- Wer, wie, was? Wieso, weshalb, warum? Wer nichts fragt bleibt dumm. ---
  59.