home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #30 / NN_1992_30.iso / spool / comp / std / internat / 869 < prev    next >
Encoding:
Internet Message Format  |  1992-12-15  |  6.1 KB

  1. Xref: sparky comp.std.internat:869 news.admin.misc:781
  2. Path: sparky!uunet!not-for-mail
  3. From: avg@rodan.UU.NET (Vadim Antonov)
  4. Newsgroups: comp.std.internat,news.admin.misc
  5. Subject: Re: 8-bit news
  6. Date: 15 Dec 1992 23:08:30 -0500
  7. Organization: UUNET Technologies Inc, Falls Church, VA
  8. Lines: 126
  9. Message-ID: <1gma3uINN2e6@rodan.UU.NET>
  10. References: <CKD.92Dec15185902@loiosh.eff.org> <1glu1sINNoth@rodan.UU.NET> <CKD.92Dec15215407@loiosh.eff.org>
  11. NNTP-Posting-Host: rodan.uu.net
  12.  
  13. In article <CKD.92Dec15215407@loiosh.eff.org> ckd@eff.org (Christopher Davis) writes:
  14. > VA> What's the difference between putting X- to the header line and
  15. > VA> adding 0200 to the character code?
  16. >
  17. >The first is explicitly allowed by the relevant standard (RFC822).  The
  18. >second is explicitly forbidden by the relevant standard (RFC821):
  19.  
  20. If any 7-bit encoding will be accepted as standard the corresponding
  21. codewords will not start from X- and therefore will be explicitly
  22. prohibited by the relevant (obsolete) standard.
  23.  
  24. Yours is non-argument. If a standard allowing 8 bits in SMTP will be
  25. accepted the relevant standard (RFC821) will be superceded and therefore
  26. irrelevant.
  27.  
  28. After all, that 7-bit limitation was a mistake in the first place
  29. (and stupid one).  It was evident for a decade but somehow everybody
  30. inertia won and we still have the old stupid mistake plus millions of
  31. machines "compatible" with that mistake.
  32.  
  33. >The whole reason the
  34. >Internet works as well as it does is that multiple independent
  35. >implementations all follow a system-independent standard and not "the
  36. >source code and behavior of <x> is the standard". 
  37.  
  38. The whole reason Internet works is because standards follow the
  39. practice (instead of standard commitees deciding what's good and what's
  40. bad (OSI, X.25, X.400, X.500 -- where are they?)). Unfortunately it
  41. seems that standard-making frenzy is going to get over Internet too.
  42.  
  43. We don't need new standards to patch holes in old standards. It's
  44. better done by relevant amending existing standars/software.
  45.  
  46. As for practice -- the real life in countries where non-ASCII
  47. character sets were necessary decided against 7-bit "solution" long
  48. time ago -- if you ever bothered to look how it works in Europe and
  49. Russia.
  50.  
  51. >SMTP is bloated?  I'll trade you SOML, SEND, SAML, and TURN for an
  52. >eight-bit negotiation mechanism.  We'll still slim it by a command or two.
  53.  
  54. It already has features nobody uses (VRFY, EXPN, SOML, SAML, TURN)
  55. and simply useless (HELO). Most implementations simply don't know
  56. what to do with all that (i know because i had a pleasure of
  57. implementing SMTP stuff).
  58.  
  59. > VA> As i already said a lot of people in Europe already closed that
  60. > VA> discussion using the simpliest solution. As every simple solution it's
  61. > VA> easy to implement (no need to write new code -- just *remove* some
  62. > VA> old), it works (for couple dozens of countries) and it provides easy
  63. > VA> way for future extensions (aka UTF -- it you have 8-bit transparency
  64. > VA> now it'll be really easy to switch to UTF tomorrow).
  65.  
  66. >And it breaks old code.  And it only works with cooperating sites, but has
  67. >no way to tell whether the site it's talking to is cooperating or not.  And
  68. >it can silently lose information by talking to an uncooperative (but
  69. >standards-conforming) site that clips bits.
  70.  
  71. You don't send 8 bits to a site which does not understand it. It simply
  72. makes no sense -- they don't have appopriate fonts on their terminals
  73. anyway. If they do not coopearte they do not have you proposed bang-whiz
  74. 7-bit decoder as well and are unable to read the message anyway.
  75.  
  76. As for receiving 8-bit information with MSB trimmed off - it still
  77. will be readable. FYI (if you didn't know that before) the old ISO
  78. standard 8-bit codes were designed to have exactly this property.
  79. For example, the standard Cyrillic code (USSR standard KOI-8) has
  80. letters sorted in phonetical correpondence to the Latin alphabet,
  81. not in the Russian alphabetical order.
  82.  
  83.     V lesu rodilasx elo^ka w lesu ona rosla
  84.  
  85. is MUCH MUCH more readable than
  86.  
  87.     MHHASDHWENSDJJWEHSDASKJWENASDJWEDJH
  88.  
  89. The advice to check your logic remains.
  90.  
  91. >I demand no encoding; I'd just as soon use Content-Transfer-Encoding: 8bit.
  92.  
  93. What for? What is really needed is the name of character set --
  94. USASCII, ISO8859/1, etc.
  95.  
  96. >However, if I'm shipping it over SMTP, I either encode it or extend SMTP to
  97. >transmit the 8th bit safely.
  98.  
  99. You need not "extend" SMTP to transmit the 8th bit safely.
  100. The only necessary thing is to fix the old bug in the standard.
  101.  
  102. >Fine.  So join the ietf-smtp list, get an 8-bit-compatible SMTP, and you're
  103. >set for life.
  104.  
  105. Why bother? I already did it for my native country.
  106.  
  107. >Encodings are necessary for 8-bit data over 7-bit paths.  Eliminating those
  108. >paths safely takes a new standard (admittedly, not much of an extension to
  109. >the old one). 
  110.  
  111. Argh. What a faulty logic. You need a new standard in places which
  112. supposedly won't switch to a (different) new standard. If they won't
  113. fix their software to provide 8-bit-clean links how are you going
  114. to make them to add the new code for handling 7-bit encoding?
  115.  
  116. I'm calling for REALLY minor changes in the EXISTING software
  117. (and those changes are necessary only on relay machines -- end users
  118. can live without it if they have no use for 8-bit transparency).
  119. 7-bit hardware paths are virtually non-existant. Hardware people
  120. overcame that idiocy twenty years ago.
  121.  
  122. You're calling for implementing the entirely new standard in EVERY piece
  123. of mailing software (including end users') and making already 
  124. bloated mailing software even more bloated. What do you want to gain
  125. this way? More bugs? Or job security for system administrators?
  126.  
  127. >Someday most of us (never all of us, after all the Host
  128. >Table still reigns on MILNET) will be shipping around mail in its full
  129. >binary glory without encoding.  But we'll have some way to know when we hit
  130. >aging-tops-20.army.mil and feed them our mail properly encoded so they can
  131. >pull it down to their DeskCrays and see it in the full glory of 10646.
  132.  
  133. How naive... The only way you can make such people to do something
  134. is to force them to do it. With "8 bit is good but you still can use
  135. 7 bits..." you'll *never* get them to fix their software toward 
  136. 8-bit transparency.
  137.  
  138. --vadim
  139.