home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #1 / NN_1993_1.iso / spool / comp / std / internat / 1115 < prev    next >
Encoding:
Internet Message Format  |  1993-01-08  |  2.8 KB

  1. Path: sparky!uunet!spool.mu.edu!agate!usenet.ins.cwru.edu!gatech!pitt.edu!djbpitt
  2. From: djbpitt+@pitt.edu (David J Birnbaum)
  3. Newsgroups: comp.std.internat
  4. Subject: Ukraine: Language tagging
  5. Message-ID: <1531@blue.cis.pitt.edu>
  6. Date: 8 Jan 93 13:16:17 GMT
  7. References: <1iddeeINN58g@rodan.UU.NET> <TT.93Jan7085019@tarzan.jyu.fi> <1ii6bkINNf6c@rodan.UU.NET>
  8. Sender: news+@pitt.edu
  9. Organization: University of Pittsburgh
  10. Lines: 47
  11.  
  12. >Proto-Latin, proto-Cyrillic etc sorting makes a lot of sense for
  13. >business applications, providing uniformed way to deal with
  14. >multilingual lists (and such sorting has an attractive quality --
  15. >it "automatically" reduces to a national sorting after deletion
  16. >of foreighn letters). Somehow, it is a simplified scheme of
  17. >sorting large libraries use.
  18.  
  19. Multilingual sorting, even for languages that share a script, seems to
  20. me to be first a conceptual, and only second an implementational,
  21. problem. That is, if the soft sign sorts after <ja> in Ukrainian but
  22. several letters before it in other Slavic languages written in Cyrillic,
  23. what is _the correct_ pan-Cyrillic sorting order? Neither solution will
  24. automatically reduce to correct sorting for all languages if the
  25. Cyrillic inventory contains a single soft sign and a single <ja>. We
  26. could create two soft signs, one for Ukrainian and one for everyone else
  27. (similarly to the solution proposed for certain Latin letters with
  28. diacritics), but then the "proto-Cyrillic" multilingual sort loses much
  29. of its attractiveness. 
  30.  
  31. I see the primary problem as determining how we want multilingual lists
  32. to sort, rather than how we want to implement the sorting. I don't see
  33. any one solution as uniquely and obviously better than all others. The
  34. problem is, for reasons I hope are obvious, even worse when a list mixes
  35. scripts. As a frequent and frustrating real life example, how should I
  36. sort a mixed Russian/English bibliography that cites both English and
  37. Russian publications by a single author whose name begins with "V"? It
  38. makes sense to separate the scripts, but it also makes sense to keep all
  39. works by a single author in the same place. 
  40.  
  41. (It should be noted that a 1990 Ukrainian orthographic manual proposes
  42. reordering the Ukrainian alphabet to conform to Russian and other
  43. languages, so that the soft sign will no longer follow <ja>. How
  44. comprehensively this is applied in practice remains to be determined.
  45. Meanwhile, the problem is nonetheless real and general, viz. the similar
  46. examples from Latin-alphabet orthographies.)
  47.  
  48. >Ukrain, say, use characters of both Cyrillic and Latin scripts, etc.
  49.  
  50. ??? What Latin-script letters does Ukrainian use?
  51.  
  52. --David
  53. --
  54. -- 
  55. Professor David J. Birnbaum         djbpitt+@pitt.edu [Internet]
  56. The Royal York Apartments, #802     djbpitt@pittvms   [Bitnet]
  57. 3955 Bigelow Boulevard              voice: 1-412-687-4653
  58. Pittsburgh, PA  15213  USA          fax:   1-412-624-9714
  59.