home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #18 / NN_1992_18.iso / spool / comp / std / unix / 387 < prev    next >
Encoding:
Internet Message Format  |  1992-08-17  |  2.0 KB

  1. Path: sparky!uunet!uunet!not-for-mail
  2. From: mskuhn@immd4.informatik.uni-erlangen.de (Markus Kuhn)
  3. Newsgroups: comp.std.unix
  4. Subject: ISO 10646 files
  5. Date: 17 Aug 1992 14:40:06 -0700
  6. Organization: CSD., University of Erlangen, Germany
  7. Lines: 38
  8. Sender: sef@ftp.UU.NET
  9. Approved: sef@ftp.uucp (Moderator, Sean Eric Fagan)
  10. Message-ID: <16p6bmINNs1l@ftp.UU.NET>
  11. NNTP-Posting-Host: ftp.uu.net
  12. X-Submissions: std-unix@uunet.uu.net
  13.  
  14. Submitted-by: mskuhn@immd4.informatik.uni-erlangen.de (Markus Kuhn)
  15.  
  16. How UCS-2 files have to be handeled under future OS versions (e.g. UNIX)
  17. seems to be quite obvious:
  18.  
  19.   - Every UCS-2 file begins with feff. If it begins with fffe, than library
  20.     routines will activate a 'byte order swap mode' that corrects the
  21.     data from an otherendian machine.
  22.  
  23.   - In this way, every UNIX tool (cc, cat, ...) can easily determine,
  24.     how the file has to be interpreted, because everything starting
  25.     with something else is considered to be an 8-bit Latin 1 encoded
  26.     file (if it is interpreted as a 'text file' at all).
  27.  
  28. But how may UCS-4 files be identified? Do they always begin with 0000feff
  29. and are converted if they begin with fffe0000 or other permutations?
  30. Does ISO 10646 say anything about this or will any future POSIX extension do?
  31.  
  32. It should be not too complicated to develop C library routines that
  33. are based on new types (lets call them ucs2_t or ucs4_t) that hide
  34. the 8-bit vs. UCS-2 difference completely from the programmer.
  35. With these things once spezified writing 16-bit orientated operating systems
  36. and applications should be quite simple. I think we need a standard for
  37. this NOW, otherwise UCS-2 files won't be as simple to handle as ASCII
  38. files.
  39.  
  40. What do you think?
  41.  
  42. Markus
  43.  
  44. -- 
  45. Markus Kuhn, Computer Science student -=-=- University of Erlangen, Germany
  46. Internet: mskuhn@immd4.informatik.uni-erlangen.de  |  X.500 entry available
  47. -A distributed system is one in which the failure of a computer you didn't-
  48. -even know existed can render your own computer unusable. (Leslie Lamport)-
  49.  
  50.  
  51. Volume-Number: Volume 28, Number 102
  52.