home *** CD-ROM | disk | FTP | other *** search
/ Usenet 1994 January / usenetsourcesnewsgroupsinfomagicjanuary1994.iso / sources / std_unix / volume.18 / text0078.txt < prev    next >
Encoding:
Internet Message Format  |  1990-03-18  |  2.4 KB

  1. From: wheeler@ida.org (David Wheeler)
  2.  
  3. domo@tsa.co.uk (Dominic Dunlop):
  4. = From: Dominic Dunlop <domo@tsa.co.uk>
  5. =        Report on ISO/IEEE JTC1/SC22/WG15 Rapporteur Group on
  6. =              Internationalization Meeting of 5th - 7th
  7. =                   March, 1990, Copenhagen, Denmark
  8. =                 Dominic Dunlop   --  domo@tsa.co.uk
  9. =                       The Standard Answer Ltd.
  10.  
  11. I enjoyed your posting, thank you!  You included a lot of "what this
  12. phrase really means" that I appreciated.
  13.  
  14. =      3. ISO 646[4], the earliest ISO standard for information
  15. =         technology, is the international derivative of ASCII.
  16. =         Its Danish variant replaces ASCII's } with aa.  Around
  17. =         the world, #$@[\]^`{|}~, all of which have a special
  18. =         meaning to the shell, are replaced by other characters
  19. =         in standards derived from ISO 646.  See [5] for much
  20. =         more information.
  21.  
  22. Isn't there an 8-bit standard character set that defines the first 128
  23. characters as a standard set (say as USASCII, provincial I'm afraid but it
  24. would break no Unix tools), then includes all the international
  25. characters as those with values > 127?   If this were used in the POSIX
  26. standard, wouldn't this solve many problems for those using a
  27. Latin-based alphabet? Or is this standard unused in the real world?
  28. Admittedly this eliminates the non-Latin alphabet world, and that
  29. is a weakness.
  30.  
  31. =     Apart from all this organizational stuff, we did review some
  32. =     existing documents.  For example, DTR (draft technical
  33. =     report) 10176, a product of SC14, discusses the treatment of
  34. =     characters appearing in language constructs, variable names,
  35. =     literals and comments, and turns out to have implications
  36. =     for sh, awk, yacc and the other ``little languages'' defined
  37. =     in DP 9945-2, the forthcoming international standard for the
  38. =     shell and tools.  And a document from SC22's study group on
  39. =     character sets suggests that source files should have some
  40. =     means of announcing the character set that they're using.
  41. =     Could this mean typed files or resource forks for POSIX6?
  42. =     Gee.  How would we hide that?
  43.  
  44. Some C programs would have to be fixed to deal with signed characters
  45. but at least the rules would be simple: 128+ are ordinary characters &
  46. can be used in identifiers, etc.
  47.  
  48. Source file tagging for language sounds like an abomination!
  49.  
  50. --- David A. Wheeler
  51.     wheeler@ida.org
  52.  
  53.  
  54. Volume-Number: Volume 18, Number 80
  55.  
  56.