home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #19 / NN_1992_19.iso / spool / comp / std / internat / 635 < prev    next >
Encoding:
Internet Message Format  |  1992-09-04  |  1.8 KB

  1. Path: sparky!uunet!mcsun!sunic!dkuug!login.dkuug.dk!keld
  2. From: keld@login.dkuug.dk (Keld J|rn Simonsen)
  3. Newsgroups: comp.std.internat
  4. Subject: Re: International character sets
  5. Message-ID: <keld.715616932@login.dkuug.dk>
  6. Date: 4 Sep 92 14:28:52 GMT
  7. References: <2aa64e90.cursci@cursci.UUCP>
  8. Sender: news@slyrf.dkuug.dk
  9. Lines: 35
  10.  
  11. andrew@cursci.co.uk (Andrew Trotman) writes:
  12.  
  13.  
  14. >Anyone out there got a description of any character sets and collating
  15. >sequences that include all the roman characters and accented roman
  16. >characters?
  17.  
  18. I am not sure if anybody really knows how many roman letters and
  19. accented letters there exist, but a fair part have been tabled and
  20. sorted in some POSIX compliant locales available at dkuug.dk in
  21. the directory i18n. The locales also include specification of
  22. greek and Cyrillic and Kana sorting.
  23.  
  24. As noted in another article the sorting sequences are different for
  25. at least some languages. The locales available at Dkuug.dk covers 
  26.  
  27.                         da_DK                 Danish
  28.                         en_DK                 English
  29.  
  30. The English one is actually intended to be quite general, also
  31. covering languages as German, French, Italian, Portuguese, Dutch,
  32. Vietnamese, Greek, Russian and Japanese
  33.  
  34. >Someone was telling me about ISO stuff and how there were a whole load of
  35. >8-bit sets that define most of the european characters.  That would be kind
  36. >of useful, but what I really want is a full description of either a 16-bit or
  37. >32-bit character sequences that will include all the roman chars and their
  38. >accented chars in a sequence that I can sort on.
  39.  
  40. There are also provided POSIX charmaps for ISO 10646 - only a part tho,
  41. something like 2000 characters. And about 100 other character sets
  42. like the ISO 8859 series, PC codepages, EBCDICs are also described
  43. via POSIX charmaps.
  44.  
  45. Keld Simonsen
  46.