home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #30 / NN_1992_30.iso / spool / comp / std / internat / 818 < prev    next >
Encoding:
Internet Message Format  |  1992-12-12  |  2.0 KB

  1. Xref: sparky comp.std.internat:818 news.admin.misc:707
  2. Path: sparky!uunet!noc.near.net!news.Brown.EDU!qt.cs.utexas.edu!cs.utexas.edu!zaphod.mps.ohio-state.edu!magnus.acs.ohio-state.edu!usenet.ins.cwru.edu!agate!forney.berkeley.edu!jbuck
  3. From: jbuck@forney.berkeley.edu (Joe Buck)
  4. Newsgroups: comp.std.internat,news.admin.misc
  5. Subject: Re: 8-bit news
  6. Date: 12 Dec 1992 20:40:00 GMT
  7. Organization: U. C. Berkeley
  8. Lines: 34
  9. Message-ID: <1gdin0INN2rm@agate.berkeley.edu>
  10. References: <Bz2298.11K@zoo.toronto.edu> <4yyNVB4w165w@blues.kk.sub.org> <th0efeo@rhyolite.wpd.sgi.com>
  11. NNTP-Posting-Host: forney.berkeley.edu
  12.  
  13. Given: we want to update to 8-bit news.
  14.  
  15. Also given: quite a few sites will not update, no matter how much we
  16. scream.  How to solve this?  Here's a suggestion:
  17.  
  18. For any news article that has 8-bit characters in it, include a special
  19. header indicating the fact.  This header itself will contain eight-bit
  20. characters, and will be structured in such a way that it is very likely
  21. to be trashed by a 7-bit link, but that a recognizable residue will
  22. come through.  Something like:
  23.  
  24. Character-Set: <stuff with 8-bit characters and a checksum here>
  25.  
  26. This header can also be used to specify which character set is in use,
  27. where it matters.
  28.  
  29. Now there are three cases:
  30.  
  31. First, the article may go through an 8-bit-clean link.  If so, it comes
  32. out OK.
  33.  
  34. Second, the article may go through a 7-bit link with intelligent
  35. system administrators on both ends.  The articles are encoded using
  36. some protocol and decoded on the other end, so that an 8-bit-clean
  37. link is produced on top of a 7-bit channel.
  38.  
  39. In either of these cases, the article comes out unscathed.  The final case
  40. is the one everyone is worried about: such articles go through a seven-bit
  41. link using old software.  At the other end, the Character-Set header is
  42. altered: the leading "Character-Set:" comes through, but what follows will
  43. not be correct.  Sites with up-to-date software know that such articles
  44. are likely to be corrupt, and simply drop them on the floor.
  45. --
  46. Joe Buck    jbuck@ohm.berkeley.edu
  47.