home *** CD-ROM | disk | FTP | other *** search
/ Dream 52 / Amiga_Dream_52.iso / Linux / Divers / lynx2.8.1dev.10.tar.gz / lynx2.8.1dev.10.tar / lynx2-8 / docs / README.chartrans < prev    next >
Text File  |  1998-02-27  |  7KB  |  170 lines

  1. Lynx CHARTRANS
  2.  
  3.  Features (in addition to those which Lynx 2.7.1 already has):
  4.  
  5.  - Can (attempt to) translate from any document charset to any display
  6.    character set, *IF* the document charset is known by a translation 
  7.    table (compiled in at installation).
  8.  
  9.  - New method to define character sets: used for input charset as well
  10.    as display character set, translation tables compiled in from 
  11.    separate files (one per charset).  One table is designated as default
  12.    and can be used for fallback translation to 7-bit replacements for
  13.    display.
  14.  
  15.  - New method for specifying translations of SGML entities.
  16.  
  17.  - Unicode (UTF8) support: can (attempt to) decode and translate UTF8 to
  18.    display character set, or pass through UTF to display (if terminal
  19.    or console understands UTF8).  [raw display of UTF only tested with Slang 
  20.    so far, does not always position everything correctly on screen]
  21.  
  22.  - Support for CHARSET attribute on A tag (and sometimes LINK), as in HTML
  23.    i18n RFC 2070 and W3C HTML 4.0 drafts.  A link can suggest the target's
  24.    charset in this way.
  25.  
  26.  - Support for ACCEPT-CHARSET attribute of FORM tags.
  27.  
  28.  - EXPERIMENTAL, currently enabled only for Linux console: 
  29.    can (attempt to) automatically switch terminal mode and load new
  30.    code pages on change of display character set.
  31.  
  32.  - some minor changes: sometimes invalid characters are displayed in a hex
  33.    notation Uxxxx (helps debugging, but I also regard it as at least not
  34.    worse than showing the wrong char without warning).
  35.  
  36. Additions/changes to user interface:
  37.  
  38.  - many new Display Character Sets are available on O)ptions screen.
  39.    (One can use arrow keys, HOME, END etc. for cycling through the list
  40.    or use selection from popup box, as for other options.)
  41.  
  42.  - new command line flags:
  43.    -assume_charset=...  assume this as charset for documents that don't
  44.                         specify a charset parameter in HTTP headers
  45.    -assume_local_charset=...  assume this as charset of local file
  46.    -assume_unrec_charset=...  in case a charset parameter is not recognized;
  47.    docs also available as ASSUME_CHARSET etc. in lynx.cfg
  48.    In "Advanced User" mode, ASSUME_CHARSET can be changed during a session
  49.    from the Options Screen.
  50.  
  51.  - The "Raw" toggle (from -raw flag, '@' key, or Options screen)
  52.    o  toggles the assumption "Default remote charset is same as Display
  53.       Character Set" on or off.
  54.       Toggling of the assumed charset is between Display Character Set and
  55.       the specified ASSUME_CHARSET or, if they are the same, between the
  56.       specified ASSUME_CHARSET and ISO-8859-1.
  57.    o  The default for raw mode now depends on the Display Character Set as
  58.       well as on the specified ASSUME_CHARSET value.
  59.    o  should work as before for CJK charsets (turning CJK-mode on or off).
  60.    o  If the effective ASSUME_CHARSET and the Display Character Set are
  61.       unchanged from the ISO-8859-1 default, toggling "Raw" may have some
  62.       additional effect for characters that can't be translated.
  63.    (Try the "Transparent" Display Character Set for more "rawness".)
  64.  
  65.  
  66. Requirements:  same as for Lynx in general :)
  67.  
  68. The chartrans code is now merged with Wayne Buttle's changes for
  69. 32-bit MS Windows and DOS/DJGPP, with Thomas Dickey's and Jim Spath's
  70. emerging auto-configure mechanism, and with BUGFIXES from Foteos
  71. Macrides.  See the accompanying file CHANGES.new for the current
  72. status.
  73.  
  74.  
  75. A warning:
  76. In some cases undisplayable bytes may still get sent to the terminal
  77. which are then interpreted as control chars, there is no protection
  78. against if strange things are defined in the table files.
  79.  
  80.  
  81. HOW TO GET SOURCES:
  82.  
  83. The development code is available at
  84.          <URL: http://sol.slcc.edu/lynx/current/>
  85. in various formats.
  86.  
  87. HOW TO INSTALL:
  88.  
  89. (4) before compiling:
  90.  
  91.     Check top level makefile or Makefile and userdefs.h as usual.
  92.  
  93.     NOTE that there is a new "#define" in userdefs.h for MAX_CHARSETS
  94.     near the end (in "Section 3.").
  95.  
  96. (5) Building Lynx:
  97.  
  98.     Compiling the chartrans code is now integrated into the normal
  99.     installation procedures for UNIX (configure script) and other
  100.     platforms.
  101.  
  102.     What's supposed to happen (in addition to the usual things when
  103.     building Lynx): in the new subdirectory src/chrtrans, make should
  104.     first compile the auxiliary program `makeuctb', then invoke that
  105.     program to create xxxxx_yyy.h files from the provided xxxxx_yyy.tab
  106.     translation table files.  (See README.* files in src/chrtrans for
  107.     more info.)
  108.  
  109.     If all goes well, just invoking make from the top-level Lynx dir
  110.     as usual should do everything automatically.  If not, the makefiles
  111.     may need some tweaking... or:
  112.  
  113. (6) Some things to look at if compilation fails:
  114.  
  115.     In src/chrtrans/UCkd.h there is a typedef for an unsigned 16bit
  116.     numeric type which may need to be changed for your system.  
  117.     See comment near top there.
  118.  
  119.     For recompiling Lynx, `make clean' should not be necessary if only
  120.     files in src/chrtrans have been changed.  On the other hand 
  121.     may not propagate to the src/chrtrans directory (depending how things
  122.     are going with auto-config), you may have to cd to that directory 
  123.     and `make clean' there to really clean up there.
  124.  
  125. (7) To customize (add/change translation tables etc.):
  126.  
  127.      See README.* files in src/chrtrans.
  128.      Make the necessary changes there, then recompile.
  129.      (A general `make clean' should not be necessary, but make sure
  130.      the ...uni.h file in src/chrtrans gets regenerated.)
  131.  
  132.      Note that definition of new character entities (if e.g. you want
  133.      Lynx to recognize Ž) are not covered by these table files,
  134.      they have to be listed in entities.h.  
  135.  
  136.      _If you are on a Linux system_ and using Lynx on the console (i.e.
  137.      not xterm, not a dialup *into* the Linux box), you can compile
  138.      with -DEXP_CHARTRANS_AUTOSWITCH.  This is very useful for testing
  139.      the various Display Character Sets, Lynx will try to automatically
  140.      change the console state.  You need to have the Linux kbd package
  141.      installed, with a working `setfont' command executable by the user,
  142.      and the right font files - check the source in src/UCAuto.c for
  143.      the files used and/or to change them!  
  144.      NOTE that with this enabled,
  145.      - Lynx currently will not clean up the console state at exit,
  146.        it will probably left like the last Display Character Set you used.
  147.      - Loading a font is global across _all_ virtual text consoles, so
  148.        using Lynx (compiled with this flag) may change the appearance of
  149.        text on other consoles (if that text contains characters 
  150.        beyond ASCII).
  151.  
  152. (8) Some suggested Web pages for testing:
  153.  
  154.     <URL:  http://www.tezcat.com/~kweide/lynx-chartrans/test/>
  155.  
  156.     <URL:  http://www.isoc.org:8080/>,
  157.       especially 
  158.     <URL:  http://www.isoc.org:8080/liste_ml.htm>.
  159.  
  160.     <URL:  http://www.accentsoft.com/un/un-all.htm>
  161.  
  162. (9) Please report bugs, unexpected behavior, etc. 
  163.     to <lynx-dev@sig.net>.
  164.  
  165.     Suggestions for improvement would be welcome, as well as 
  166.     contributed translation tables (for stuff that is not available
  167.     at ftp://dkuug.dk or ftp://ftp.unicode.org).
  168.  
  169. KW  1997-11-06
  170.