home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #18 / NN_1992_18.iso / spool / comp / std / internat / 620 < prev    next >
Encoding:
Internet Message Format  |  1992-08-17  |  2.0 KB

  1. Xref: sparky comp.std.internat:620 comp.misc:3232
  2. Path: sparky!uunet!pipex!unipalm!uknet!mcsun!sunic!aun.uninett.no!nuug!ifi.uio.no!enag
  3. From: enag@ifi.uio.no (Erik Naggum)
  4. Newsgroups: comp.std.internat,comp.misc
  5. Subject: Re: ISO 10646 the final character set?
  6. Message-ID: <23304A@erik.naggum.no>
  7. Date: 14 Aug 92 17:48:44 GMT
  8. References: <Bswu4x.80r@immd4.informatik.uni-erlangen.de> <23303A@erik.naggum.no> <jenkinsj-130892151628@tseng.taligent.com> <1992Aug14.051609.8673@jyu.fi>
  9. Organization: Department of Informatics, University of Oslo, Norway
  10. Lines: 26
  11.  
  12. Markku Sakkinen <sakkinen@jyu.fi> writes:
  13. |
  14. |   I don't think that the stupid idiosyncrasies of one particular
  15. |   programming language should be taken into account when a long-time
  16. |   universal character code is defined.
  17.  
  18. There are such things as "installed base" to consider when doing things.
  19. Although I share your emotional reaction, I also know that standards
  20. that change too much of the way things work will never fly.  I'd like to
  21. see ISO 10646 fly.
  22.  
  23. I don't know whether this is relevant, but ISO 10646 suffers from "byte
  24. order" problems when it's a word or half-word (word being 32 bits) code,
  25. whereas well-known multiple-octet coded character sets such as JIS X0208
  26. define a byte order.  ISO 10646 has a "signature" (FEFF) and an unused
  27. (or prohibited, actually) value which corresponds to the byte-swapped
  28. signature (FFFE), and so allow brain-damaged hardware to look like real
  29. hardware.  (Talk about idiosyncracies!)
  30.  
  31. Aside from the hardware problem which makes it impossible to view raw
  32. ISO 10646 as a word or half-word code to portable C programs, the zero
  33. terminator could be defined to be a word or half-word, and everybody
  34. would be happy.
  35.  
  36. Best regards,
  37. </Erik>
  38. --
  39. Erik Naggum             |  ISO  8879 SGML     |      +47 295 0313
  40.                         |  ISO 10744 HyTime   |
  41. <erik@naggum.no>        |  ISO 10646 UCS      |      Memento, terrigena.
  42. <enag@ifi.uio.no>       |  ISO  9899 C        |      Memento, vita brevis.
  43.