home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #19 / NN_1992_19.iso / spool / bit / listserv / notabene / 645 next >
Encoding:
Text File  |  1992-08-23  |  3.4 KB  |  79 lines

  1. Comments: Gated by NETNEWS@AUVM.AMERICAN.EDU
  2. Path: sparky!uunet!paladin.american.edu!auvm!UTAFLL.UTA.EDU!ROBIN
  3. Message-ID: <9208230649.AA24130@utafll.uta.edu>
  4. Date:         Sat, 22 Aug 92 23:49:48 CDT
  5. Sender:       Nota Bene List <NOTABENE@TAUNIVM>
  6. From:         Robin Cover <robin@UTAFLL.UTA.EDU>
  7. Subject:      UUENCODE unsafe (annual reminder)
  8. Comments: To: notabene@vm.tau.ac.il
  9. Newsgroups: bit.listserv.notabene
  10. Lines: 67
  11.  
  12.  
  13. Allan Needell writes on UUENCODE:
  14.  
  15. > From: Allan Needell <NASSH100%SIVM.BITNET@ricevm1.rice.edu>
  16. > Subject:      The trouble with UUENCODE
  17.  
  18. > Dorothy, et. al.,
  19.  
  20. > The character set used by the uuencode program includes the right
  21. > and left square brackets &&; as many will see, these
  22. > characters get corrupted during some stage of the email process.
  23. > In my case they arrive as vertical hyphens (the shifted character to
  24. >  the immediate left for the backspace key on the 101-key keyboard.
  25. > (Sorry--don't know the ascii #). Because I don't know which
  26. > (right or left) each represents, I can't run a ci routine on the
  27. > file and so I can't uudecode the messages.
  28.  
  29. > Could you all use xxencode instead? Specifically, Dorothy, could you
  30. >  resent an xxendoced copy of NOCZ2?
  31.  
  32. Allan confirms what network wisdom already knows to be true: UUENCODE
  33. is **NOT** a safe transmission form for "7 bit" network traffic.  Most
  34. people just ignore this and hope that the plague will not hit "them."
  35. The TAUNIVM server supports XXencode as one of the options, but many
  36. sites do not support XXencode.   A real pity.
  37.  
  38. Here's another annual warning:
  39. --------------------------------------
  40.  
  41. The ISO 646 subset contains the following (non-national) characters
  42. which do not commonly cause misinterpretation of the data when shipped
  43. across networks, from ASCII to EBCDIC machines or vice versa, or across
  44. national boundaries:
  45.  
  46.     a b c d e f g h i j k l m n o p q r s t u v w x y z
  47.     A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
  48.     0 1 2 3 4 5 6 7 8 9
  49.     " % & ' ( ) * + , - . / : ; < = > ? _   and space (dec 32)
  50.  
  51. OK everyone? *THOSE* are the safe characters; all others are fragile,
  52. including left-single-quote and others on the top row of a standard
  53. QWERTY Keyboard.  Note that even those who use SGML need to be
  54. careful, since. . ....(self-quoting again)...  By my count, five characters
  55. in the SGML reference concrete syntax fall outside this "ISO 646
  56. subset" (so-called in TEI Guidelines) given above:
  57.  
  58.                          Example in      IRV     Decimal
  59. Character Name           SGML markup   ISO 646   Number    Test Column
  60. ----------------------------------------------------------------------
  61. exclamation mark           MDO           2/1       33          !
  62. left-square-bracket        DSO           5/11      91          [
  63. right-square-bracket       DSC           5/13      93          ]
  64. number/hash/pound          RNI           2/3       35          #
  65. (broken) vertical bar      OR            7/12      124         |
  66.  
  67. ---The bottom line is, here: if all five characters in column five
  68. "Test Column" look OK to *YOU*, that just means that this file
  69. travelled safely from Texas to where you are now; via any other
  70. path, the results on your system could be different.
  71.  
  72. In a word, I think Allan is correct: the mutation caused by (mostly
  73. IBM EBCDIC) machines on the networks will map two different characters
  74. onto ONE character, so the process is irreversible.  In a word: use
  75. UUencode at your own peril.  I use it, but I never EXPECT it to work,
  76. and sometimes indeed it fails.
  77.  
  78. Robin Cover
  79.