home *** CD-ROM | disk | FTP | other *** search
/ Internet Info 1997 December / Internet_Info_CD-ROM_Walnut_Creek_December_1997.iso / rfc / rfc1555 < prev    next >
Text File  |  1993-12-22  |  9KB  |  284 lines

  1.  
  2.  
  3.  
  4.  
  5.  
  6.  
  7. Network Working Group                                      H. Nussbacher
  8. Request for Comments: 1555                      Israeli Inter-University
  9. Category: Informational                                  Computer Center
  10.                                                              Y. Bourvine
  11.                                                        Hebrew University
  12.                                                            December 1993
  13.  
  14.  
  15.             Hebrew Character Encoding for Internet Messages
  16.  
  17. Status of this Memo
  18.  
  19.    This memo provides information for the Internet community.  This memo
  20.    does not specify an Internet standard of any kind.  Distribution of
  21.    this memo is unlimited.
  22.  
  23. Abstract
  24.  
  25.    This document describes the encoding used in electronic mail [RFC822]
  26.    for transferring Hebrew.  The standard devised makes use of MIME
  27.    [RFC1521] and ISO-8859-8.
  28.  
  29. Description
  30.  
  31.    All Hebrew text when transferred via e-mail must first be translated
  32.    into ISO-8859-8, and then encoded using either Quoted-Printable
  33.    (preferable) or Base64, as defined in MIME.
  34.  
  35.    The following table provides the four most common Hebrew encodings:
  36.  
  37.                        PC    IBM     PC     ISO
  38.            Hebrew                           8859-8
  39.            letter     8-bit         7-bit   8-bit
  40.                       Ascii  EBCDIC Ascii   Ascii
  41.            ---------- -----  ------ -----   ------
  42.            alef        128     41    96     224
  43.            bet         129     42    97     225
  44.            gimel       130     43    98     226
  45.            dalet       131     44    99     227
  46.            he          132     45   100     228
  47.            vav         133     46   101     229
  48.            zayin       134     47   102     230
  49.            het         135     48   103     231
  50.            tet         136     49   104     232
  51.            yod         137     51   105     233
  52.            kaf sofit   138     52   106     234
  53.            kaf         139     53   107     235
  54.            lamed       140     54   108     236
  55.  
  56.  
  57.  
  58. Nussbacher & Bourvine                                           [Page 1]
  59.  
  60. RFC 1555               Hebrew Character Encoding           December 1993
  61.  
  62.  
  63.            mem sofit   141     55   109     237
  64.            mem         142     56   110     238
  65.            nun sofit   143     57   111     239
  66.            nun         144     58   112     240
  67.            samekh      145     59   113     241
  68.            ayin        146     62   114     242
  69.            pe sofit    147     63   115     243
  70.            pe          148     64   116     244
  71.            tsadi sofit 149     65   117     245
  72.            tsadi       150     66   118     246
  73.            qof         151     67   119     247
  74.            resh        152     68   120     248
  75.            shin        153     69   121     249
  76.            tav         154     71   122     250
  77.  
  78.    Note: All values are in decimal ASCII except for the EBCDIC column
  79.    which is in hexadecimal.
  80.  
  81.    ISO 8859-8 8-bit ASCII is also known as IBM Codepage 862.
  82.  
  83.    The default directionality of the text is visual.  This means that
  84.    the Hebrew text is encoded from left to right (even though Hebrew
  85.    text is entered right to left) and is transmitted from left to right
  86.    via the standard MIME mechanisms.  Other methods to control
  87.    directionality are supported and are covered in the complementary RFC
  88.    1556, "Handling of Bi-directional Texts in MIME".
  89.  
  90.    All discussion regarding Hebrew in email, as well as discussions of
  91.    Hebrew in other TCP/IP protocols, is discussed in the ilan-
  92.    h@vm.tau.ac.il list.  To subscribe send mail to listserv@vm.tau.ac.il
  93.    with one line of text as follows:
  94.  
  95.                     subscribe ilan-h firstname lastname
  96.  
  97. MIME Considerations
  98.  
  99.    Mail that is sent that contains Hebrew must contain the following
  100.    minimum amount of MIME headers:
  101.  
  102.          MIME-Version: 1.0
  103.          Content-type: text/plain; charset=ISO-8859-8
  104.          Content-transfer-encoding: BASE64 | Quoted-Printable
  105.  
  106.    Users should keep their text to within 72 columns so as to allow
  107.    email quoting via the prefixing of each line with a ">".  Users
  108.    should also realize that not all MIME implementations handle email
  109.    quoting properly, so quoting email that contains Hebrew text may lead
  110.    to problems.
  111.  
  112.  
  113.  
  114. Nussbacher & Bourvine                                           [Page 2]
  115.  
  116. RFC 1555               Hebrew Character Encoding           December 1993
  117.  
  118.  
  119.    In the future, when all email systems implement fully transparent 8-
  120.    bit email as defined in RFC 1425 and RFC 1426 this standard will
  121.    become partially obsolete.  The "Content-type:" field will still be
  122.    necessary, as well as directionality (which might be implicit for
  123.    8BIT, but is something for future discussion),  but the "Content-
  124.    transfer-encoding" will be altered to use 8BIT rather than Base64 or
  125.    Quoted-Printable.
  126.  
  127. Optional
  128.  
  129.    It is recommended, although not required, to support Hebrew encoding
  130.    in mail headers as specified in RFC 1522.  Specifically, the Q-
  131.    encoding format is to be the default method used for encoding Hebrew
  132.    in Internet mail headers and not the B-encoding method.
  133.  
  134. Caveats
  135.  
  136.    Within Israel there are in excess of 40 Listserv lists which will now
  137.    start using Hebrew for part of their conversations.  Normally,
  138.    Listserv will deliver mail from a distribution list with a
  139.    "shortened" header, one that does not include the extra MIME headers.
  140.    This will cause the MIME encoding to be left intact and the user
  141.    agent decoding software will not be able to interpret the mail.  Each
  142.    user is able to customize how Listserv delivers mail.  For lists that
  143.    contain Hebrew, users should send mail to Listserv with the following
  144.    command:
  145.  
  146.                              set listname full
  147.  
  148.    where listname is the name of the list which the user wants full,
  149.    unabridged headers to appear.  This will update their private entry
  150.    and all subsequent mail from that list will be with full RFC822
  151.    headers, including MIME headers.
  152.  
  153.    In addition, Listserv usually maintains automatic archives of all
  154.    postings to a list.  These archives, contained in the file "listname
  155.    LOGyymm", do not contain the MIME headers, so all encoding
  156.    information will be lost.  This is a limitation of the Listserv
  157.    software.
  158.  
  159.  
  160.  
  161.  
  162.  
  163.  
  164.  
  165.  
  166.  
  167.  
  168.  
  169.  
  170. Nussbacher & Bourvine                                           [Page 3]
  171.  
  172. RFC 1555               Hebrew Character Encoding           December 1993
  173.  
  174.  
  175. Example
  176.  
  177.    Below is a short example of Quoted-Printable encoded Hebrew email:
  178.  
  179.    Date:         Sun, 06 Jun 93 15:25:35 IDT
  180.    From:         Hank Nussbacher <HANK@VM.BIU.AC.IL>
  181.    Subject:      Sample Hebrew mail
  182.    To:           Hank Nussbacher <Hank@BARILVM>,
  183.                  Yehavi Bourvine <yehavi@hujivms>
  184.    MIME-Version: 1.0
  185.    Content-Type: Text/plain; charset=ISO-8859-8
  186.    Content-Transfer-Encoding: QUOTED-PRINTABLE
  187.  
  188.    The end of this line contains Hebrew            .=EC=E0=F8=F9=E9 =F5=
  189.    =F8=E0=EE =ED=E5=EC=F9
  190.  
  191.  
  192.    Hank Nussbacher                                  =F8=EB=E1=F1=E5=
  193.    =F0 =F7=F0=E4
  194.  
  195. Acknowledgements
  196.  
  197.    Many thanks to Rafi Sadowsky and Nathaniel Borenstein for all their
  198.    help.
  199.  
  200. References
  201.  
  202.    [ISO-8859] Information Processing -- 8-bit Single-Byte Coded
  203.               Graphic Character Sets, Part 8: Latin/Hebrew alphabet,
  204.               ISO 8859-8, 1988.
  205.  
  206.    [RFC822]   Crocker, D., "Standard for the Format of ARPA Internet
  207.               Text Messages", STD 11, RFC 822, UDEL, August 1982.
  208.  
  209.    [RFC1425]  Klensin, J., Freed N., Rose M., Stefferud E., and
  210.               D. Crocker, "SMTP Service Extensions", RFC 1425,
  211.               United Nations University, Innosoft International, Inc.,
  212.               Dover Beach Consulting, Inc., Network Management
  213.               Associates, Inc., The Branch Office, February 1993.
  214.  
  215.    [RFC1426]  Klensin, J., Freed N., Rose M., Stefferud E., and
  216.               D. Crocker, "SMTP Service Extension for 8bit-MIME
  217.               Transport", RFC 1426, United Nations University, Innosoft
  218.               International, Inc., Dover Beach Consulting, Inc., Network
  219.               Management Associates, Inc., The Branch Office, February
  220.               1993.
  221.  
  222.  
  223.  
  224.  
  225.  
  226. Nussbacher & Bourvine                                           [Page 4]
  227.  
  228. RFC 1555               Hebrew Character Encoding           December 1993
  229.  
  230.  
  231.    [RFC1521]  Borenstein N., and N. Freed, "MIME (Multipurpose
  232.               Internet Mail Extensions) Part One: Mechanisms for
  233.               Specifying and Describing the Format of Internet Message
  234.               Bodies", Bellcore, Innosoft, September 1993.
  235.  
  236.    [RFC1522]  Moore K., "MIME Part Two: Message Header Extensions for
  237.               Non-ASCII Text", University of Tennessee, September 1993.
  238.  
  239. Security Considerations
  240.  
  241.    Security issues are not discussed in this memo.
  242.  
  243. Authors' Addresses
  244.  
  245.    Hank Nussbacher
  246.    Computer Center
  247.    Tel Aviv University
  248.    Ramat Aviv
  249.    Israel
  250.  
  251.    Fax: +972 3 6409118
  252.    Phone: +972 3 6408309
  253.    EMail: hank@vm.tau.ac.il
  254.  
  255.  
  256.    Yehavi Bourvine
  257.    Computer Center
  258.    Hebrew University
  259.    Jerusalem
  260.    Israel
  261.  
  262.    Phone: +972 2 585684
  263.    Fax:   +972 2 527349
  264.    EMail: yehavi@vms.huji.ac.il
  265.  
  266.  
  267.  
  268.  
  269.  
  270.  
  271.  
  272.  
  273.  
  274.  
  275.  
  276.  
  277.  
  278.  
  279.  
  280.  
  281.  
  282. Nussbacher & Bourvine                                           [Page 5]
  283.  
  284.