home *** CD-ROM | disk | FTP | other *** search
/ OS/2 Shareware BBS: 5 Edit / 05-Edit.zip / tcs17.zip / doc / man < prev    next >
Text File  |  2002-07-25  |  3KB  |  112 lines

  1. TCS(1)               User Commands              TCS(1)
  2.  
  3. NAME
  4.      tcs - translate character sets
  5.  
  6. SYNOPSIS
  7.      tcs [ -slcv ] [ -f ics ] [ -t ocs ] [ file ... ]
  8.  
  9. DESCRIPTION
  10.      Tcs interprets the named file(s) (standard input default) as  a
  11.      stream  of     characters from the ics character  set     or  format,
  12.      converts them to runes, and then converts them into a stream of
  13.      characters from the ocs character set or format on the standard
  14.      output.  The  default value for ics and ocs  is  utf,  the     UTF
  15.      encoding described in utf(6). The -l option lists the character
  16.      sets  known  to  tcs.  Processing    continues  in  the  face  of
  17.      conversion     errors (the -s option prevents reporting  of  these
  18.      errors).  The  -c    option forces the  output  to  contain    only
  19.      correctly converted characters; otherwise, 0x80 characters will
  20.      be     substituted  for UTF encoding errors and 0xFFFD  characters
  21.      will substituted for unknown characters.
  22.  
  23.      The   -v    option    generates  various  diagnostic    and  summary
  24.      information  on  standard error, or makes the  -l    output    more
  25.      verbose.
  26.  
  27.      Tcs  recognizes  an  ever changing list of character  sets.  In
  28.      particular,  it  supports a variety  of  Russian  and  Japanese
  29.      encodings. Some of the supported encodings are
  30.       jis-kanji
  31.  
  32.      utf  The Plan 9 UTF encoding, known by ISO as UTF-8
  33.  
  34.      utf1 The deprecated original UTF encoding from ISO 10646
  35.  
  36.      ascii
  37.       7-bit ASCII
  38.  
  39.      8859-1
  40.       Latin-1 (Central European)
  41.  
  42.      8859-2
  43.       Latin-2 (Czech .. Slovak)
  44.  
  45.      8859-3
  46.       Latin-3 (Dutch .. Turkish)
  47.  
  48.      8859-4
  49.       Latin-4 (Scandinavian)
  50.  
  51.      8859-5
  52.       Part 5 (Cyrillic)
  53.  
  54.      8859-6
  55.       Part 6 (Arabic)
  56.  
  57.      8859-7
  58.       Part 7 (Greek)
  59.  
  60.      8859-8
  61.       Part 8 (Hebrew)
  62.  
  63.      8859-9
  64.       Latin-5 (Finnish .. Portuguese)
  65.  
  66.      koi8 KOI-8 (GOST 19769-74)
  67.  
  68.      jis-kanji
  69.       ISO 2022-JP
  70.  
  71.      ujis EUC-JX: JIS 0208
  72.  
  73.      ms-kanji
  74.       Microsoft, or Shift-JIS
  75.  
  76.      jis  (from only) guesses between ISO 2022-JP, EUC or Shift-Jis
  77.  
  78.      gb      Chinese national standard (GB2312-80)
  79.  
  80.      big5 Big 5 (HKU version)
  81.  
  82.      unicode
  83.       Unicode Standard 1.0
  84.  
  85.      tis  Thai character set plus ASCII (TIS 620-1986)
  86.  
  87.      msdos
  88.       IBM PC: CP 437
  89.  
  90.      atari
  91.       Atari-ST character set
  92.  
  93. EXAMPLES
  94.      tcs -f 8859-1
  95.       Convert 8859-1 (Latin-1) characters into UTF format.
  96.  
  97.      tcs -s -f jis
  98.       Convert  characters encoded in one of     several  shift     JIS
  99.       encodings into UTF format. Unknown Kanji will be converted
  100.       into 0xFFFD characters.
  101.  
  102.      tcs -lv
  103.       Print an up to date list of the supported character sets.
  104.  
  105. SOURCE
  106.      /sys/src/cmd/tcs
  107.  
  108. SEE ALSO
  109.      ascii(1), rune(2), utf(6).
  110.  
  111. OS/2                             August 06, 2000
  112.