home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #20 / NN_1992_20.iso / spool / comp / std / internat / 645 < prev    next >
Encoding:
Text File  |  1992-09-09  |  1.5 KB  |  35 lines

  1. Newsgroups: comp.std.internat
  2. From: gtoal@pizzabox.demon.co.uk (Graham Toal)
  3. Path: sparky!uunet!pipex!demon!pizzabox.demon.co.uk!gtoal
  4. Subject: Latin unification in ISO 10646 
  5. Distribution: world
  6. References: <1992Sep9.163417.8803@corax.udac.uu.se>
  7. Organization: Cuddlehogs Anonymous
  8. Lines: 22
  9. Date: Thu, 10 Sep 1992 12:21:37 +0000
  10. Message-ID: <716144296snx@pizzabox.demon.co.uk>
  11. Sender: usenet@gate.demon.co.uk
  12.  
  13.  
  14. In article <1992Sep9.163417.8803@corax.udac.uu.se> andersa@Riga.DoCS.UU.SE writes:
  15. >Programmers are used to being able to perform case conversion on
  16. >letters of the ASCII table by simply adding or subtracting a certain
  17. >constant to the character code, given that the code is within a
  18. >particular range (A-Z or a-z).  With later ISO standards, this is
  19. >not quite such a simple task due to the sometimes ad-hoc layout of
  20. >lowercase letters with respect to corresponding uppercase letters
  21. >(examples available upon request), but it would still be possible
  22. >using tables showing the relationship.
  23.  
  24. The upper/lower conversions were a fortunate hack that the original 7-bit
  25. character set allowed.  These should nowadays be done by the application,
  26. along with similar functions to add or remove accents.  The invariance
  27. of tolower(toupper(x)) has been broken since ESZET -> "SS" -> "ss" first
  28. happened.
  29.  
  30. Even if you want to use the simple facilities of the language, rather
  31. than writing a custom function, you're still hampered by the <locale.h> stuff
  32. being the trivial implementation in just about every Ansi library around :-(
  33.  
  34. G
  35.