home *** CD-ROM | disk | FTP | other *** search
/ OS/2 Shareware BBS: 35 Internet / 35-Internet.zip / htm2txt1.zip / README.TXT < prev   
Text File  |  1997-03-11  |  5KB  |  147 lines

  1. HTM2TXT v 1.0, Mar.11,1997 by Otto Räder
  2.  
  3. Description:
  4.  
  5.    HTM2TXT.CMD is a REXX script which extracts HTML-tags from
  6.    .HTML-files used in Internet www-communication and stores
  7.    the remaining text into an ASCII-file.
  8.  
  9. Group:
  10.  
  11.    HTM2TXT belongs to group: ../os2/internet/www/tools/
  12.  
  13. Freeware:
  14.  
  15.    HTM2TXT may be distributed freely under the following conditions.
  16.    Copyright notices must NOT be removed, all files contained in the file
  17.    inventory below must be distributed together (you may not remove any
  18.    files), and you may not charge for the program.
  19.  
  20.    If you find the program useful then send a post-card (picture of
  21.    the location where you live) to:
  22.  
  23.        Otto Räder
  24.        Hauptstrasse 61B/13
  25.        A3001 Mauerbach
  26.        ---------------
  27.        Austria
  28.  
  29. Prerequisites:
  30.  
  31.    HTM2TXT requires OS/2 and REXX.
  32.  
  33.    It has been developed and tested under OS/2 Warp,
  34.    there is no intention to move it to other platforms.
  35.  
  36. Distribution:
  37.  
  38.    The following files are contained in HTM2TXT1.ZIP:
  39.  
  40.     HTM2TXT.CMD       the REXX command-file 1997-03-11
  41.     HTM2TXT.ICO       an icon file contributed by Gerard Pinkas, pinkas@en.com
  42.     MAKEOBJ.CMD       a command to create a desktop program object
  43.     README.TXT        documentation, this file
  44.     FILE_ID.DIZ       Id-file
  45.  
  46. Installation:
  47.  
  48.    To install HTM2TXT just UNZIP the HTM2TXT1.ZIP file and place the
  49.    command into a directory contained in your CONFIG.SYS PATH= statement.
  50.  
  51.    You may use the MAKEOBJ.CMD to create a desktop oject for HTM2TXT.CMD.
  52.    You should run MAKEOBJ.CMD from that directory where HTM2TXT.CMD and
  53.    HTM2TXT.ICO are installed.
  54.  
  55. Usage:
  56.  
  57.      From an OS/2 command line start HTM2TXT:
  58.  
  59.        htm2txt filename.htm
  60.  
  61.      Make sure filename.htm is in the current directory.
  62.  
  63.      filename may contain wildcard character '*'.
  64.  
  65.    or
  66.  
  67.      Drag and drop a .HTML object to the HTM2TXT object if you
  68.      have created one using makeobj.cmd.
  69.  
  70.    HTM2TXT will create an output file 'filename.txt' and it will
  71.    start an editor to view this file.
  72.  
  73.    Note: HTM2TXT will follow <a href="...> tags and tries
  74.          to resolve the given link-address. If it can be
  75.          accessed it will be included in the .txt file.
  76.  
  77.    Following statements may be changed to customize operation:
  78.  
  79.      line 11: linemax=72    maximum line length in output file.
  80.                             Any text longer will be split to
  81.                             output lines not longer than 'linemax'
  82.  
  83.      line 12: pixlbyt=6     when <td width="nnnPIX">
  84.                             then the column width
  85.                             in tables is determined
  86.                             by: chars = nnn/pixlbyt.
  87.  
  88.      line 13: editor='e'    the name of an ASCII editor to display
  89.                             result file. It may be changed to the
  90.                             installations favoured editor.
  91.  
  92.                             editor='' causes no editor to be called
  93.  
  94.  
  95.      line 14: chain='Y'     tells HTM2TXT to follow  href-chains.
  96.                             any other setting inhibits chaining.
  97.  
  98.      line 15: showu='N'     tells HTM2TXT not to show href-chain-addresses
  99.                             in output-text. if set to 'Y' chain-addresses
  100.                             are shown in output-text.
  101.  
  102.      line 16: ofile='.TXT'  tells HTM2TXT the outputfile-name should be
  103.                             derived from the inputfile-name: it should
  104.                             be ifiname.TXT.
  105.                             any other value may specify a valid
  106.                             path\filename or a symbolic device
  107.                             like STDOUT.
  108.  
  109.      line 66: consts=       this is a table of variables to substitute
  110.                             special characters. This table has been
  111.                             contributed by tremro@digicom.qc.ca
  112.  
  113.    You may temporarily overwrite these parameters by adding options
  114.    when starting htm2txt from an os/2 command line:
  115.  
  116.      htm2txt filename.html l 80      to set linemax to 80 characters
  117.      htm2txt filename.html p  8      to set pixlbyt to  8 pixels/char
  118.      htm2txt filename.html e tedit   to set editor  to tinyedit
  119.      htm2txt filename.html o finame  to define an output file name
  120.      htm2txt filename.html f n       to suppress chaining
  121.      htm2txt filename.html u         to include url-references in .txt
  122.  
  123.    These options may appear in any order after the filename:
  124.  
  125.      htm2txt filename.html e te p 8 l 80 u f n o stdout
  126.  
  127. Warranty:
  128.  
  129.    The program is distributed on an as-is basis.
  130.    It tries to extract as much text as possible,
  131.    however, i am sure, there are some special forms
  132.    of tags which i missed.
  133.    Normally such tags are simply ignored.
  134.  
  135.    There is no guarantee to get certain results
  136.    nor is any guarantee to avoid damages of existing files.
  137.  
  138.    Note: In the current directory the program will
  139.          overwrite any file with filename of
  140.          input-file and a file extension of .TXT, eg.: filename.TXT !
  141.  
  142. Comments:
  143.  
  144.    Comments and recommendations pls to:
  145.  
  146.          oraeder@ibm.net
  147.