home *** CD-ROM | disk | FTP | other *** search
/ OS/2 Shareware BBS: 8 Other / 08-Other.zip / czsloven.zip / CZ_SLOEN.HTML
Text File  |  2002-05-10  |  17KB  |  430 lines

  1.  
  2. The Czech and Slovak Character Encoding Mess Explained
  3. ******************************************************
  4. Version: $Id: cs-encodings-faq,v 1.10 1996/06/19 13:28:27 luki Exp $
  5.  
  6. Contents of this file is Public Domain and may be used without
  7. restriction.  It is NOT warranted to be correct.  Please send
  8. any corrections and additions to Lukas Petrlik <luki@kiv.zcu.cz>.
  9.  
  10.  
  11. This text is an informal description of some of the character encodings,
  12. which are currently used in Czech Republic and Slovakia (former
  13. Czechoslovakia).  These are: Kamenicky, PC Latin 2, ISO Latin 2, KOI-8 CS2,
  14. cp1250 (MS Windows CS and EE) and Cork.  All of them (except Cork) are ASCII
  15. extensions.
  16.  
  17. There are other encodings as well, esp. Macintosh CE and EBCDIC-based
  18. encodings for mainframes.  These are not covered here.
  19.  
  20.  
  21. Kamenicky
  22. *********
  23.  
  24. Kamenicky encoding (aka KEYBCS2) is used on IBM compatible PC's.  It is
  25. defined by the behavior of the Public Domain "KEYBCS2" utility, written by
  26. brothers Kamenicky.  Until recently, it was the most popular encoding on
  27. PC's, because it saved all the graphical symbols.  Many printers can print
  28. Kamenicky-encoded texts, the FidoNET people and many others still use it.
  29.  
  30. When IBM and Microsoft came with PC Latin 2 (cp852), the situation slowly
  31. changed towards its acceptance.
  32.  
  33. Some of the local software vendors use the cp895 for Kamenicky encoding (the
  34. first localized FoxPro used it), but this code page is defined by neither
  35. IBM nor Microsoft (according to a message from Jan Toman
  36. <janto@microsoft.com>, there is no official cp895 specification).  Some
  37. software comes in both cp852 (PC Latin 2) and cp895 (Kamenicky) versions.
  38.  
  39.  
  40. PC Latin 2
  41. **********
  42.  
  43. The PC Latin 2 (alias PC L2) is used on PC's.  Most of the current DOS and
  44. OS/2 programs use it by default or have an option for using it, because IBM
  45. and Microsoft use it and the Czechoslovak standard CSN 36 9103 recommends
  46. its use on PC's.  It has all of the ISO 8859-2 printable characters, but the
  47. accented letters have different positions.  The encoding is defined by IBM
  48. as Code Page 852.
  49.  
  50. Most Czech and Slovak users know only its name Latin 2 and don't even know
  51. that PC Latin 2 is very different from ISO Latin 2.
  52.  
  53.  
  54. ISO Latin 2
  55. ***********
  56.  
  57. ISO Latin 2 is the ISO 8859-2 (1987) standard.  It is used on Unices and
  58. other Nice Systems.  [IBM code page 912 is the same as ISO 8859-2.]
  59.  
  60. An almost ISO 8859-2 compliant character encoding is defined by CSN 36 9103
  61. under the name KOI-8 L2 (see "The CSN 36 9103 Standard" below).  The
  62. encoding is registered by ISO under the registration number 139.
  63.  
  64.  
  65. KOI-8 CS2
  66. *********
  67.  
  68. This encoding is defined by CSN 36 9103.  It treats `ch' and `CH' as single
  69. letters (as used in the Czech alphabet) and you can get the most used
  70. accented character positions simply by setting the sign bit.  This encoding
  71. was used on old terminals, but now it seems to be dead.  Some well known
  72. software (the T602 text editor) still has options for using it.
  73.  
  74.  
  75. MS Windows Encoding
  76. *******************
  77.  
  78. The MS Windows (3.1, WfW, W95 and NT) CS and EE editions use cp1250, which
  79. has all the printable characters of ISO Latin 2, but 14 characters have
  80. different positions (8 of them are used in Czech/Slovak).  It also uses the
  81. positions 128-159 for printable characters (this is the C1 area, which is
  82. used for control purposes in ISO Latin 2 and other ISO 2022 conforming
  83. codes).
  84.  
  85. Thus it not true that cp1250 is a superset of ISO 8859-2.
  86.  
  87.  
  88. Cork
  89. ****
  90.  
  91. The Cork (aka T1) encoding is used by most European TUGs (national TeX Users
  92. Groups) for TeX internal T1 font encoding.  The encoding was defined in 1990
  93. on the Cork meeting of TUG.  The TeX DC font family is T1-encoded.
  94.  
  95. This encoding is not ASCII extension, because it contains printable
  96. characters in the lowest 32 positions (0 - 31), which are used for control
  97. purposes in ASCII.
  98.  
  99.  
  100. The CSN 36 9103 Standard
  101. ************************
  102.  
  103. The standard uses an obscure language and requires careful reading.  If you
  104. cannot understand the following text, it is because I followed its "good"
  105. example. :)
  106.  
  107. The Czechoslovak standard CSN 36 9103 defines the following character
  108. encodings: KOI-8 K1, KOI-8 L2, KOI-8 CS2, DKOI K1, DKOI K2, DKOI L2 and DKOI
  109. CS2.  KOI-8 codes conform to ISO recommendations (they are ASCII-based) and
  110. DKOI don't (DKOI are EBCDIC-based encodings).
  111.  
  112. The standard is Czechoslovak extension of the SEV standard ST SEV 358-88.
  113. The new encodings (which aren't defined in the SEV standard) are KOI-8 L2,
  114. KOI-8 CS2, DKOI L2 and DKOI CS2.  The remaining encodings are for the
  115. cyrillic alphabet used for communication within SEV -- these were never in
  116. regular use in our country.  The definition of KOI-8 L2 is stated to conform
  117. to ISO 8859-2 (1987), except for the characters $, _ and the currency symbol
  118. (164), which have different graphic representations.  KOI-8 L2 is also known
  119. as "charset CSN_369103" by RFC 1345, because it is the only character
  120. encoding registered by ISO (ISO IR 139).
  121.  
  122. The Appendix 5 ``8-bit Codes for Personal Computers'' contains an
  123. informative description of the character encoding PC Latin 2 defined by IBM.
  124. This encoding is known as IBM Code Page 852, but the cp number is not
  125. mentioned in the standard.
  126.  
  127.  
  128.  
  129. Tables
  130. ******
  131.  
  132. Table of English and Czech Accent Names Used in ISO Latin 2 and KOI-8 L2
  133. English name            Czech Name (CSN 36 9103)
  134. ----------------------------------------------------------------------
  135. acute accent .........  carka nad pismenem, silny prizvuk
  136.                         (c<a'rka nad pi'smenem, silny' pr<i'zvuk)
  137. breve ................  breve
  138. caron ................  hacek                  (ha'c<ek)
  139. cedilla ..............  hacek pod pismenem, cedilie 
  140.                         (ha'c<ek pod pi'smenem, cedilie)
  141. circumflex accent ....  vokan                  (voka'n<)
  142. diaeresis ............  dve tecky nad pismenem, prehlaska
  143.                         (dve< tec<ky nad pi'smenem, pr<ehla'ska)
  144. dot above ............  tecka nad pismenem     (tec<ka nad pi'smenem)
  145. double acute accent ..  dvojcarka              (dvojc<a'rka)
  146. ogonek ...............  ocasek                 (oca'sek)
  147. ring above ...........  krouzek nad pismenem   (krouz<ek nad pi'smenem)
  148. stroke ...............  preskrtnuti            (pres<krtnuti')
  149.  
  150. [Missing: Slovak accent names]
  151.  
  152. TeX and RFC 1345 Accent Representations
  153. English name            TeX                       RFC 1345
  154. ----------------------------------------------------------
  155. acute accent .........  \'{x}, \'{\i}  ...............  x'    ''
  156. breve ................  \u{x}  .......................  x(    '(
  157. caron ................  \v{x}  .......................  x<    '<
  158. cedilla ............... \c{x}  .......................  x,    ',
  159. circumflex accent ....  \^{x}  .......................  x>    '>
  160. diaeresis ............  \"{x}  .......................  x:    ':
  161. dot above ............  \.{x}  .......................  x.    '.
  162. double acute accent ..  \H{x}  .......................  x"    '"
  163. ogonek ...............  \c{x}  .......................  x;    ';
  164. ring above ...........  \accent23{u} .................  x0    '0
  165. stroke ...............  \l, \L, \o, \O  ..............  x/
  166.  
  167.  
  168. The Czech Alphabet
  169. ------------------
  170.  
  171. a   a'  b   c   c<  d   d<  e   e'  e< 
  172. f   g   h   ch  i   i'  j   k   l   m 
  173. n   n<  o   o'  p   q   r   r<  s   s< 
  174. t   t<  u   u'  u0  v   w   x   y   y' 
  175. z   z<
  176.  
  177. The digraph "ch" is treated as single character.
  178. The Czech characters "r<", "e<" and "u0" are not used in the Slovak language.
  179. The ISO 639 code for the Czech language is "cs".
  180.  
  181.  
  182. The Slovak Alphabet
  183. -------------------
  184. a   a'  a:  b   c   c<  d   d<  dz  dz<
  185. e   e'  f   g   h   ch  i   i'  j   k
  186. l   l'  l<  m   n   n<  o   o'  o>  p
  187. q   r   r'  s   s<  t   t<  u   u'  v
  188. w   x   y   y'  z   z<
  189.  
  190. Digraphs "ch", "dz" and "dz<" are treated as single characters in the Slovak
  191. language.  The Slovak characters "a:", "o>", "r'", "l'" and "l<" are not used
  192. in the Czech language.
  193. The ISO 639 code for the Slovak language is "sk".
  194.  
  195.  
  196. Charset Tables
  197. --------------
  198.  
  199. Format of the tables is described in RFC 1345 (see "Sources Used").
  200. The following additional mnemonics are used for characters missing
  201. in RFC 1345:
  202.  
  203.  @CH            CAPITAL CZECH LETTER CH  (the digraph "CH")  [CSN]
  204.  @ch            SMALL CZECH LETTER CH  (the digraph "ch")  [CSN]
  205.  @I,            LATIN CAPITAL LETTER I WITH CEDILLA
  206.  @i,            LATIN SMALL LETTER I WITH CEDILLA
  207.  @j.            LATIN SMALL LETTER I DOTLESS
  208.  @SS            LATIN CAPITAL LETTER SHARP S (German)  (the digraph "SS")
  209.  @U,            LATIN CAPITAL LETTER U WITH CEDILLA
  210.  @u,            LATIN SMALL LETTER U WITH CEDILLA
  211.  
  212. See also comments in the tables.
  213.  
  214.  
  215.   &charset ISO_8859-2:1987
  216.   &rem source: ECMA registry
  217.   &rem Extracted from RFC 1345
  218.   &alias iso-ir-101
  219.   &g1esc x2d42 &g2esc x2e42 &g3esc x2f42
  220.   &alias ISO_8859-2
  221.   &alias ISO-8859-2
  222.   &alias latin2
  223.   &alias l2
  224.   &code 0
  225.   NU SH SX EX ET EQ AK BL BS HT LF VT FF CR SO SI
  226.   DL D1 D2 D3 D4 NK SY EB CN EM SB EC FS GS RS US
  227.   SP ! " Nb DO % & ' ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
  228.   At A B C D E F G H I J K L M N O P Q R S T U V W X Y Z <( // )> '> _
  229.   '! a b c d e f g h i j k l m n o p q r s t u v w x y z (! !! !) '? DT
  230.   PA HO BH NH IN NL SA ES HS HJ VS PD PU RI S2 S3
  231.   DC P1 P2 TS CC MW SG EG SS GC SC CI ST OC PM AC
  232.   NS A; '( L/ Cu L< S' SE ': S< S, T< Z' -- Z< Z.
  233.   DG a; '; l/ '' l< s' '< ', s< s, t< z' '" z< z.
  234.   R' A' A> A( A: L' C' C, C< E' E; E: E< I' I> D<
  235.   D/ N' N< O' O> O" O: *X R< U0 U' U" U: Y' T, ss
  236.   r' a' a> a( a: l' c' c, c< e' e; e: e< i' i> d<
  237.   d/ n' n< o' o> o" o: -: r< u0 u' u" u: y' t, '.
  238.  
  239.  
  240.   &charset IBM852
  241.   &rem source: IBM NLS RM Vol2 SE09-8002-01, March 1990
  242.   &rem Extracted from RFC 1345
  243.   &alias cp852
  244.   &alias 852
  245.   &rem  The following aliases are used by CSN 36 9103, but not by RFC 1345:
  246.   &alias pclatin2
  247.   &alias pcl2
  248.   &code 0
  249.   NU SH SX EX ET EQ AK BL BS HT LF VT FF CR SO SI
  250.   DL D1 D2 D3 D4 NK SY EB CN EM SB EC FS GS RS US
  251.   SP ! " Nb DO % & ' ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
  252.   At A B C D E F G H I J K L M N O P Q R S T U V W X Y Z <( // )> '> _
  253.   '! a b c d e f g h i j k l m n o p q r s t u v w x y z (! !! !) '? DT
  254.   C, u: e' a> a: u0 c' c, l/ e: O" o" i> Z' A: C'
  255.   E' L' l' o> o: L< l< S' s' O: U: T< t< L/ *X c<
  256.   a' i' o' u' A; a; Z< z< E; e; ?? z' C< s, << >>
  257.   .S :S ?S vv vl A' A> E< S, VL VV LD UL Z. z. dl
  258.   ur uh dh vr hh vh A( a( UR DR UH DH VR HH VH Cu
  259.   d/ D/ D< E: d< N< I' U> e< ul dr FB LB T, U0 TB
  260.   O' ss O> N' n' n< S< s< R' U' r' U" y' Y' t, ''
  261.   -- '" ', '< '( SE -: '; DG ': '. u" R< r< fS NS
  262.  
  263.  
  264.   &charset CSN_369103
  265.   &rem source: ECMA registry
  266.   &rem Extracted from RFC 1345
  267.   &alias iso-ir-139
  268.   &g1esc x2d49 &g2esc x2e49 &g3esc x2f49
  269.   &rem  The following name is used by CSN 36 9103, but not by RFC 1345:
  270.   &alias KOI-8_L2
  271.   &alias koi8l2
  272.   &rem  The CSN 36 9103 is a standard which defines 6 other encodings
  273.   &rem  as well, so its name shouldn't be used as an alias for KOI-8_L2.
  274.   &code 0
  275.   NU SH SX EX ET EQ AK BL BS HT LF VT FF CR SO SI
  276.   DL D1 D2 D3 D4 NK SY EB CN EM SB EC FS GS RS US
  277.   SP ! " Nb Cu % & ' ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
  278.   At A B C D E F G H I J K L M N O P Q R S T U V W X Y Z <( // )> '> _
  279.   '! a b c d e f g h i j k l m n o p q r s t u v w x y z (! !! !) '? DT
  280.   PA HO BH NH IN NL SA ES HS HJ VS PD PU RI S2 S3
  281.   DC P1 P2 TS CC MW SG EG SS GC SC CI ST OC PM AC
  282.   NS A; '( L/ DO L< S' SE ': S< S, T< Z' -- Z< Z.
  283.   DG a; '; l/ '' l< s' '< ', s< s, t< z' '" z< z.
  284.   R' A' A> A( A: L' C' C, C< E' E; E: E< I' I> D<
  285.   D/ N' N< O' O> O" O: *X R< U0 U' U" U: Y' T, ss
  286.   r' a' a> a( a: l' c' c, c< e' e; e: e< i' i> d<
  287.   d/ n' n< o' o> o" o: -: r< u0 u' u" u: y' t, '.
  288.  
  289.  
  290.   &charset KEYBCS2
  291.   &rem source: the Reality :)
  292.   &alias KAMENICKY
  293.   &code 0
  294.   NU SH SX EX ET EQ AK BL BS HT LF VT FF CR SO SI
  295.   DL D1 D2 D3 D4 NK SY EB CN EM SB EC FS GS RS US
  296.   SP ! " Nb DO % & ' ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
  297.   At A B C D E F G H I J K L M N O P Q R S T U V W X Y Z <( // )> '> _
  298.   '! a b c d e f g h i j k l m n o p q r s t u v w x y z (! !! !) '? DT
  299.   C< u: e' d< a: D< T< c< e< E< L' I' l< l' A: A'
  300.   E' z< Z< o> o: O' u0 U' y' O: U: S< L< Y' R< t'
  301.   a' i' o' u' n< N< U0 O> s< r< r' R' 14 SE << >>
  302.   .S :S ?S vv vl vL Vl Dl dL VL VV LD UL Ul uL dl
  303.   ur uh dh vr hh vh vR Vr UR DR UH DH VR HH VH uH
  304.   Uh dH Dh Ur uR dR Dr Vh vH ul dr FB LB lB RB TB
  305.   a* b* G* p* S* s* m* t* F* H* W* d* 00 /0 e* (U
  306.   =3 +- >= =< Iu Il -: ?2 Ob .M Sb RT nS 2S fS NS
  307.  
  308.  
  309.   &charset CORK
  310.   &rem source: DC font sources
  311.   &alias T1
  312.   &code 0
  313.   '! '' '> '? ': '" '0 '< '( 'm '. ', '; .9 <1 >1 "6
  314.   "9 :9 << >> -N -M ?? 0s i. @j.
  315.   ff fi fl ffi ffl
  316.   SP ! " Nb DO % & ' ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
  317.   At A B C D E F G H I J K L M N O P Q R S T U V W X Y Z <( // )> '> _
  318.   '! a b c d e f g h i j k l m n o p q r s t u v w x y z (! !! !) '? -1
  319.   A( A; C' C< D< E< E; G( L' L< L/ N' N< NG O" R' R<
  320.   S' S< S, T< T, U" U0 Y: Z' Z< Z. IJ I. d- SE a( a;
  321.   c' c< d< e< e; g( l' l< l/ n' n< ng o" r' r< s' s<
  322.   s, t< t, u" u0 y: z' z< z. ij !I ?I Pd A! A' A> A?
  323.   A: AA AE C, E! E' E> E: I! I' I> I: D- N? O! O' O>
  324.   O? O: OE O/ U! U' U> U: Y' TH @SS a! a' a> a? a: aa
  325.   ae c, e! e' e> e: i! i' i> i: d- n? o! o' o> o? o:
  326.   oe o/ u! u' u> u: y' th ss
  327.  
  328.  
  329.   &charset KOI-8_CS2
  330.   &rem source: CSN 36 9103
  331.   &alias koi8cs2
  332.   &alias koi8cs
  333.   &g1esc x2d49 &g2esc x2e49 &g3esc x2f49
  334.   &code 0
  335.   NU SH SX EX ET EQ AK BL BS HT LF VT FF CR SO SI
  336.   DL D1 D2 D3 D4 NK SY EB CN EM SB EC FS GS RS US
  337.   SP ! " Nb Cu % & ' ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
  338.   At A B C D E F G H I J K L M N O P Q R S T U V W X Y Z <( // )> '> _
  339.   '! a b c d e f g h i j k l m n o p q r s t u v w x y z (! !! !) '? DT
  340.   PA HO BH NH IN NL SA ES HS HJ VS PD PU RI S2 S3
  341.   DC P1 P2 TS CC MW SG EG SS GC SC CI ST OC PM AC
  342.   NS ?? '' ?? '? ?? '( '. ': ?? '0 ', ?? '" '; '<
  343.   Co TM dr dl ur ul hh -v W* SE a* g* e* m* p* w*
  344.   a! a' a< c< d< e< r' @ch u: i' u0 l' l< o: n< o'
  345.   o> a: r< s< t< u' e: e' u" y' z< ?? ?? o" e. ss
  346.   A! A' A< C< D< E< R' @CH U: I' U0 L' L< O: N< O'
  347.   O> A: R< S< T< U' E: E' U" Y' Z< ?? ?? O" E. ??
  348.  
  349.  
  350.   &charset windows-1250
  351.   &rem source: cp1250_WinLatin2 to Unicode table, table version 2.00
  352.   &alias cp1250_WinLatin2
  353.   &rem  Unofficial aliases:
  354.   &alias cp1250
  355.   &alias 1250
  356.   &alias wincs
  357.   &alias winee
  358.   &code 0
  359.   NU SH SX EX ET EQ AK BL BS HT LF VT FF CR SO SI
  360.   DL D1 D2 D3 D4 NK SY EB CN EM SB EC FS GS RS US
  361.   SP ! " Nb DO % & ' ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
  362.   At A B C D E F G H I J K L M N O P Q R S T U V W X Y Z <( // )> '> _
  363.   '! a b c d e f g h i j k l m n o p q r s t u v w x y z (! !! !) '? DT
  364.   ?? ?? .9 ?? :9 .3 /- /= ?? %0 S< <1 S' T< Z< Z'
  365.   ?? '6 '9 "6 "9 Sb -N -M ?? TM s< >1 s' t< z< z' 
  366.   NS '< '( L/ Cu A; BB SE ': Co S, << NO -- Rg Z.
  367.   DG +- '; l/ '' m* PI .M ', a; s, >> L' '" l< z.
  368.   R' A' A> A( A: L' C' C, C< E' E; E: E< I' I> D<
  369.   D/ N' N< O' O> O" O: *X R< U0 U' U" U: Y' T, ss
  370.   r' a' a> a( a: l' c' c, c< e' e; e: e< i' i> d<
  371.   d/ n' n< o' o> o" o: -: r< u0 u' u" u: y' t, '.
  372.  
  373.  
  374.   &charset MacOS_CentralEurope
  375.   &rem source: MacOS_CentralEurope to Unicode table, table version 0.2
  376.   &rem  Unofficial aliases:
  377.   &alias macintosh_ce
  378.   &alias macce
  379.   &code 0
  380.   NU SH SX EX ET EQ AK BL BS HT LF VT FF CR SO SI
  381.   DL D1 D2 D3 D4 NK SY EB CN EM SB EC FS GS RS US
  382.   SP ! " Nb DO % & ' ( ) * + , - . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
  383.   At A B C D E F G H I J K L M N O P Q R S T U V W X Y Z <( // )> '> _
  384.   '! a b c d e f g h i j k l m n o p q r s t u v w x y z (! !! !) '? DT
  385.   A: A- a- E' A; O: U: a' a; C< a: c< C' c' e' Z'
  386.   z' D< i' d< E- e- E. o' e. o> o: o? u' E< e< u:
  387.   /- DG E; Pd SE Sb PI ss Rg Co TM e; ': != g' @I,
  388.   @i, I- =< >= i- K, dP +Z l/ L, l, L< l< L' l' N,
  389.   n, N' NO RT n' N< D* << >> .3 NS n< O" O? o" O-
  390.   -N -M "6 "9 '6 '9 -: Db o- R' r' R< <1 >1 r< R,
  391.   r, S< .9 :9 s< S' s' A' T< t< I' Z< z< U- O' O>
  392.   u- U0 U' u0 U" u" @U, @u, Y' y' k, Z. L/ z. G, '<
  393.  
  394.  
  395. To Do
  396. *****
  397.  
  398. * Slovak accent names.
  399. * English name for RVHP (SEV).
  400. * Script for translating the RFC 1345 tables to "X to Unicode" tables.
  401.   Unicode tables are easier to use, but some of them aren't free.
  402.  
  403.  
  404. Sources Used
  405. ************
  406.  
  407. CSN 36 9103.  Information processing: 8-bit code for information
  408. interchange.
  409. Vydavatelstvi norem Praha, 1989.  (The standard is written in Czech.)
  410.  
  411. D. E. Knuth: The TeXbook.  Addison Wesley, Reading, Massachusetts, 1986.
  412.  
  413. Gasparikova, Z. -- Kamis, A.: Slovensko-cesky slovnik.
  414. SPN Praha 1987.  (The Slovak-Czech Dictionary.)
  415.  
  416. List of IANA Registered Character Sets: 
  417. ftp://ftp.isi.edu/in-notes/iana/assignments/character-sets
  418.  
  419. RFC 1345.  Character Mnemonics & Character Sets.
  420. [Tables for ISO Latin 2 (ISO_8859-2:1987), PC Latin 2 (IBM852)
  421. and KOI-8 L2 (CSN_369103).]
  422. ftp://ftp.zcu.cz/pub/doc/rfc/rfc1345.txt
  423.  
  424. The cp1250_WinLatin2 to Unicode table, 2.00:
  425. ftp://unicode.org/pub/MappingTables/VendorMaps/Microsoft/windows/cp1250.x
  426.  
  427. The MacOS_CentralEurope to Unicode table, 0.2:
  428. ftp://unicode.org/pub/MappingTables/VendorMaps/Apple/MacOS_CentralEuro.txt
  429. [This table also contains verbal description of the code.]
  430.