home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #18 / NN_1992_18.iso / spool / comp / std / internat / 617 < prev    next >
Encoding:
Text File  |  1992-08-13  |  2.0 KB  |  46 lines

  1. Newsgroups: comp.std.internat
  2. Path: sparky!uunet!sun-barr!ames!data.nas.nasa.gov!taligent!tseng.taligent.com!user
  3. From: jenkinsj@blowfish.taligent.com (John H. Jenkins)
  4. Subject: Re: ISO 10646 the final character set?
  5. Message-ID: <jenkinsj-130892151628@tseng.taligent.com>
  6. Followup-To: comp.std.internat,comp.misc
  7. Sender: usenet@taligent.com (More Bytes Than You Can Read)
  8. Organization: Taligent, Inc.
  9. References: <BstGEq.7E7@immd4.informatik.uni-erlangen.de> <q++ygqb@rpi.edu> <1992Aug11.221914.7798@csc.ti.com> <23302B@erik.naggum.no> <jenkinsj-120892082033@tseng.taligent.com> <23302J@erik.naggum.no> <Bswu4x.80r@immd4.informatik.uni-erlangen.de> <23303A@erik.naggum.no>
  10. Date: Thu, 13 Aug 1992 22:26:27 GMT
  11. Lines: 33
  12.  
  13. In article <23303A@erik.naggum.no>, enag@ifi.uio.no (Erik Naggum) wrote:
  14. > Markus Kuhn <mskuhn@immd4.informatik.uni-erlangen.de> writes:
  15. > |
  16. > |   What means UCS (after ISO 10646) in Erik Naggum's .sig? United Character
  17. > |   Set? What other terms are defined in ISO 10646 (MBP, ...)?
  18. > That's the abbreviation after the standard's full name, which is (was,
  19. > at DIS stage, anyway):
  20. >     Information technology -- Universal Multiple-Octet Coded
  21. >     Character Set (UCS)
  22. > I seem to remember that somebody wanted "multiple-octet" removed from
  23. > the title.  Anybody else know the details on this?
  24.  
  25. I don't know if it came up at WG2 in Seoul, but it did come up at X3L2 last
  26. month.  
  27. I'd have to actually dig through my list of country comments to see if
  28. anybody in fact suggested the name change (I believe somebody did), but I'm
  29. too lazy to do that right now.  
  30.  
  31. The problem with the name "multiple-octet" is that it implies that 10646
  32. text can be processed as a series of bytes instead of as a series of words
  33. or longwords.  This can be disastrous in C because of the NUL octets in
  34. some character codes.   Changing the name to avoid this implication would
  35. be nice, but ISO regulations would consider changing the standard's name a
  36. major revision, which would require a third ballot, and *nobody* wanted a
  37. third ballot. 
  38.  
  39. John H. Jenkins
  40. John_Jenkins@taligent.com
  41.