home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #30 / NN_1992_30.iso / spool / comp / std / internat / 912 < prev    next >
Encoding:
Internet Message Format  |  1992-12-21  |  2.2 KB

  1. Xref: sparky comp.std.internat:912 news.admin.misc:850
  2. Path: sparky!uunet!mcsun!sunic!corax.udac.uu.se!Riga.DoCS.UU.SE!andersa
  3. From: andersa@Riga.DoCS.UU.SE (Anders Andersson)
  4. Newsgroups: comp.std.internat,news.admin.misc
  5. Subject: Data tagging (was: 8-bit representation, plus an X problem)
  6. Followup-To: comp.std.internat
  7. Date: 19 Dec 1992 00:53:01 GMT
  8. Organization: Uppsala University, Sweden
  9. Lines: 33
  10. Distribution: world
  11. Message-ID: <1gtrpdINN6c4@corax.udac.uu.se>
  12. References: <24426@alice.att.com| <1gpruaINNhfm@frigate.doc.ic.ac.uk> <1gt5a2EINNin3@uni-erlangen.de>
  13. NNTP-Posting-Host: riga.docs.uu.se
  14. Summary: In-band or out-of-band, that's the question...
  15. Keywords: magic codes, portable data
  16.  
  17. [note Followup-To: comp.std.internat]
  18.  
  19. In article <1gt5a2EINNin3@uni-erlangen.de>, unrza3@cd4680fs.rrze.uni-erlangen.de (Markus Kuhn) writes:
  20. > It should also be noted, that at least one existing OS (Windows NT)
  21. > uses a 2 byte encoding both internally (e.g. in filenames in Fnodes
  22. > on the disc) as well as in text files. Text files always begin with
  23.                           ^^
  24. > FEFF as a magic code for ISO 10646 textes. This code also indicates,
  25. > whether it is a littleendian file.
  26.  
  27. Is this magic code visible to the user without any special tricks,
  28. or is it filtered away by the operating system when the file is
  29. opened for reading?  Suppose I obtain a file, that is labeled as
  30. containing IS 10646 text, via FTP from a server running Windows NT,
  31. to a client running a different system--will I then get this 0xFEFF
  32. magic code (which is meaningless on my system) too, or will I get a
  33. 'clean' IS 10646 text?
  34.  
  35. I remember seeing text files containing an explicit ^Z (0x1A) at
  36. the end, due to their origin on some home computer where ^Z was the
  37. ordinary EOF marker, even though I was sitting on a system with
  38. perfectly functional EOF pointers in the file descriptor blocks...
  39.  
  40. I hope the above isn't yet another version of that problem (non-
  41. standard tags or markers floating around with standards-compliant
  42. data on systems not understanding them)?
  43.  
  44. Alternatively, does this magic code have any chance of becoming
  45. a standard itself?
  46. --
  47. Anders Andersson, Dept. of Computer Systems, Uppsala University
  48. Paper Mail: Box 325, S-751 05 UPPSALA, Sweden
  49. Phone: +46 18 183170   EMail: andersa@DoCS.UU.SE
  50.