home *** CD-ROM | disk | FTP | other *** search
/ Handbook of Infosec Terms 2.0 / Handbook_of_Infosec_Terms_Version_2.0_ISSO.iso / text / rfcs / rfc1557.txt < prev    next >
Text File  |  1996-05-07  |  9KB  |  181 lines

  1.  
  2.  
  3.  
  4.  
  5.  
  6.  
  7. Network Working Group                                            U. Choi Request for Comments: 1557                                       K. Chon Category: Informational                                            KAIST                                                                  H. Park                                                      Solvit Chosun Media                                                            December 1993 
  8.  
  9.              Korean Character Encoding for Internet Messages 
  10.  
  11. Status of this Memo 
  12.  
  13.    This memo provides information for the Internet community.  This memo    does not specify an Internet standard of any kind.  Distribution of    this memo is unlimited. 
  14.  
  15. Introduction 
  16.  
  17.    This document describes the encoding method being used to represent    Korean characters in both header and body part of the Internet mail    messages [RFC822].  This encoding method was specified in 1991, and    has since then been used.  It has now widely being used in Korean IP    networks. 
  18.  
  19.    This document also describes the name of the encoding method which is    to be used in order to match the message header and body format of    MIME [MIME1, MIME2]. 
  20.  
  21.    This document describes only the encoding method for plain text.    Other text subtypes, rich text and similar forms of text, are beyond    the scope of this document. 
  22.  
  23. Description 
  24.  
  25.    It is assumed that the starting code of the message is ASCII.  ASCII    and Korean characters can be distinguished by use of the shift    function.  For example, the code SO will alert us that the upcoming    bytes will be a Korean character as defined in KSC 5601.  To return    to ASCII the SI code is used. 
  26.  
  27.    Therefore, the escape sequence, shift function and character set used    in a message are as follows: 
  28.  
  29.            SO           KSC 5601            SI           ASCII            ESC $ ) C    Appears once in the beginning of a line                             before any appearance of SO characters. 
  30.  
  31.  
  32.  
  33.  Choi, Chon & Park                                               [Page 1] 
  34.  RFC 1557               Korean Character Encoding           December 1993 
  35.  
  36.     The KSC 5601 [KSC5601] character set that includes Hangul, Hanja    (Chinese ideographic characters), graphic and foreign characters,    etc., is two bytes long for each character. 
  37.  
  38.    For more information about Korean character sets please refer to the    KSC 5601-1987 document.  Also, for more detailed information about    the escape sequence and the shift function you can look for the ISO    2022 [ISO2022] document. 
  39.  
  40. Formal Syntax 
  41.  
  42.    Where this document in its formal syntax does not agree with the    description part, priority should be given to the formal syntax of    the document. 
  43.  
  44.    The notations used in this section of the document are according to    those used in STD 11, RFC 822 [RFC822] with the same meaning. 
  45.  
  46.         * (asterisk) has the following meaning :              l*m "anything" 
  47.  
  48.    The above means that "anything" has to be used at least l times and    at most m times.  Default values for l and m are 0 and infinitive,    respectively. 
  49.  
  50.    body            = *e-line *1( designator *( e-line / h-line )) 
  51.  
  52.    designator      = ESC "$" ")" "C" 
  53.  
  54.    e-line          = *text CRLF 
  55.  
  56.    h-line          = *text 1*( segment *text ) CRLF 
  57.  
  58.  
  59.  
  60.     segment         = SO 1*(one-of-94 one-of-94 SI 
  61.  
  62.                                                ; ( Octal, Decimal.) 
  63.  
  64.    ESC             = <ISO 2022 ESC, escape>    ; ( 33, 27.) 
  65.  
  66.    SO              = <ASCII SO, shift out>     ; ( 16, 14.) 
  67.  
  68.    SI              = <ASCII SI, shift in>      ; ( 17, 15.) 
  69.  
  70.    SP              = <ASCII SP, space>         ; ( 40, 32.) 
  71.  
  72.  
  73.  
  74.  Choi, Chon & Park                                               [Page 2] 
  75.  RFC 1557               Korean Character Encoding           December 1993 
  76.  
  77.     one-of-94       = <any char in 94-char set> ; (41-176, 33.-126.) 
  78.  
  79.    CHAR            = <any ASCII character>     ; ( 0-177, 0.-127.) 
  80.  
  81.    text            = <any CHAR, including bare CR & bare LF, but NOT                       including CRLF, and not including ESC, SI, SO> 
  82.  
  83. MIME and RFC 1522 Considerations 
  84.  
  85.    The name to be used for the Hangul encoding scheme in the contents is    "ISO-2022-KR".  This name when used in MIME message form would be: 
  86.  
  87.                 Content-Type: text/plain; charset=iso-2022-kr 
  88.  
  89.    Since the Hangul encoding is done with 7 bit format in nature, the    Content-Transfer-Encoding-header does not need to be used. However,    while using the Hangul encoding, current Hangul message softwares    does not support Base64 or Quoted-Printable encoding applied on    already encoded Hangul messages. 
  90.  
  91.    The Hangul encoded in the header part of the message is Korean EUC    [EUC-KR].  In the EUC-KR encoding, the bytes with 8th bit set will be    recognized as KSC-5601 characters.  To use Hangul in the header part,    according to the method proposed in RFC 1522, the encoded Hangul are    "B" or "Q" encoded. When doing so, the name to be used will be EUC-    KR. 
  92.  
  93. Background Information 
  94.  
  95.    The Hangul encoding system is based on the ISO 2022 [ISO2022]    environment according to its 4/4 announcement.  However, the Hangul    encoding does not include the announcement's escape sequence. 
  96.  
  97.    The KSC 5601 used in this document is, in definition, identical to    the KSC 5601-1987, KSC 5601-1989 and KSC 5601-1992's 94x94 octet    definition.  Therefore, any revision that refers to KSC-5601 after    1992 is to be considered as having the same meaning. 
  98.  
  99.    At present, the Hangul encoding system is based on the experience    acquired from the former widely used "N-Byte Hangul" among UNIX    users.  Actually, the encoding method, "N-Byte Hangul", using SO and    SI was the encoding method used in SDN before KSC 5601 was made a    national standard. 
  100.  
  101.    This code is intended to be used for the information interchange of    Hangul messages; any other use of the code is not considered    appropriate. 
  102.  
  103.  
  104.  
  105.  Choi, Chon & Park                                               [Page 3] 
  106.  RFC 1557               Korean Character Encoding           December 1993 
  107.  
  108.  References 
  109.  
  110.    [ASCII] American National Standards Institute, "Coded character set            -- 7-bit American national standard code for information            interchange", ANSI X3.4-1968 
  111.  
  112.    [ISO2022] International Organization for Standardization (ISO),              "Information processing -- ISO 7-bit and 8-bit coded              character sets -- Code extension techniques",              International Standard, 1986, Ref. No. ISO 2022-1986 (E). 
  113.  
  114.    [KSC5601] Korea Industrial Standards Association, "Code for              Information Interchange (Hangul and Hanja)," Korean              Industrial Standard, 1987, Ref. No. KS C 5601-1987. 
  115.  
  116.    [EUC-KR] Korea Industrial Standards Association, "Hangul Unix             Environment," Korean Industrial Standard, 1992, Ref. No.             KS C 5861-1992. 
  117.  
  118.    [RFC822] Crocker, D., "Standard for the Format of ARPA Internet             Text Messages", STD 11, RFC 822, UDEL, August 1982. 
  119.  
  120.    [MIME1] Borenstein, N., and N. Freed, "MIME (Multipurpose            Internet Mail Extensions): Part One: Mechanisms for            Specifying and Describing the Format of Internet Message            Bodies", RFC 1521, Bellcore, Innosoft, September 1993. 
  121.  
  122.    [MIME2] Moore, K., "MIME (Multipurpose Internet Mail Extensions)            Part Two: Message Header Extensions for Non-ASCII Text",            RFC 1522, University of Tennessee, September 1993. 
  123.  
  124. Security Considerations 
  125.  
  126.    Security issues are not discussed in this memo. 
  127.  
  128. Acknowledgments 
  129.  
  130.    The authors wants to thank all the people who assisted in writing    this document.  In particular, we thank Erik von der Poel, Felix M.    Villarreal, Ienup Sung, Kyoung Namgoong, and Kyuho Kim. 
  131.  
  132.  
  133.  
  134.  
  135.  
  136.  
  137.  
  138.  
  139.  
  140.  
  141.  
  142. Choi, Chon & Park                                               [Page 4] 
  143.  RFC 1557               Korean Character Encoding           December 1993 
  144.  
  145.  Authors' Addresses 
  146.  
  147.    Uhhyung Choi    Korea Advanced Institute of Science and Technology    Department of Computer Science    Taejon, 305-701, Republic of Korea 
  148.  
  149.    Phone: +82-42-869-8718    Fax: +82-42-869-3510    EMail: uhhyung@kaist.ac.kr 
  150.  
  151.     Kilnam Chon    Korea Advanced Institute of Science and Technology    Department of Computer Science    Taejon, 305-701, Republic of Korea 
  152.  
  153.    Phone: +82-42-869-3514    Fax: +82-42-869-3510    EMail: chon@cosmos.kaist.ac.kr 
  154.  
  155.     Hyunje Park    Solvit Chosun Media, Inc.    748-16 Yeoksam-Dong, Kangnam-Gu    Seoul, 135-080, Republic of Korea 
  156.  
  157.    Phone: +82-2-561-0361    Fax: +82-2-569-4847    EMail: hjpark@dino.media.co.kr 
  158.  
  159.  
  160.  
  161.  
  162.  
  163.  
  164.  
  165.  
  166.  
  167.  
  168.  
  169.  
  170.  
  171.  
  172.  
  173.  
  174.  
  175.  
  176.  
  177.  
  178.  
  179. Choi, Chon & Park                                               [Page 5] 
  180.  
  181.