home *** CD-ROM | disk | FTP | other *** search
/ ARM Club 3 / TheARMClub_PDCD3.iso / programs / comms_networking / html2text / !HTML2Text / !Help next >
Encoding:
Text File  |  1995-12-24  |  1.9 KB  |  72 lines

  1.  
  2.  !HTML2Text
  3.  
  4.  An HTML to text file converter program
  5.  Written by Tim Wiser
  6.  
  7.  Version 1.00 (18-Dec-95)
  8.  
  9.  
  10.  This application was written solely because one
  11.  night I wanted to read the script for the excellent stage show 'Bottom Live' that I had
  12.  downloaded from the Cathouse Archives in HTML
  13.  format.  Because it was in HTML format, the
  14.  file had the HTML formatting statements littered
  15.  around it and was generally very messy.  This
  16.  program takes any file containing comments in <>
  17.  brackets (ie: HTML) and removes any text inside
  18.  those brackets.  Thus you get this effect ...
  19.  
  20.  "The code is written <tt>main(void)</tt>"
  21.  
  22.  .. which converts into:
  23.  
  24.  "The code is written main(void)"
  25.  
  26.  .. giving a more readable file.
  27.  
  28.  Of course, this 'dumb' approach to conversion
  29.  has its disadvantages - someone may put valid
  30.  information in <> brackets.  Converting files that
  31.  contain elements of C code will not give nice
  32.  results, because C uses <> brackets a lot:
  33.  
  34.  #include <stdio.h>
  35.               /\
  36.              /  \
  37.             /_  _\
  38.              |__|
  39.              
  40.       You want this bit
  41.       of text included
  42.       because it is a
  43.       bit of C code, not
  44.       HTML.
  45.       
  46.  
  47.  This program does not get rid of embedded typographic
  48.  commands such as " and &ersand.  These remain
  49.  in the text but can easily be removed via search &
  50.  replace in a text editor.
  51.  
  52.  So, although the program is fast (depending on the
  53.  speed of disc access, that is), you may get
  54.  dodgy results.  It should work fine for scripts
  55.  and stuff like that.
  56.  
  57.  Want to contact me?
  58.  
  59.  Tim Wiser             Room B17
  60.  Cowgate Cottage       Cotuit Hall
  61.  Lea Road              Pullen's Lane
  62.  Lea Bridge            Headington
  63.  Derbyshire            Oxford
  64.  DE4 5JL               OX3 0DA
  65.  
  66.  E-Mail  95149919@brookes.ac.uk
  67.  IRC     Timmy
  68.  Web     http://www.csv.warwick.ac.uk/~csuwg/people
  69.  Phone   01629 534537  (Holidays)
  70.          01865 61804   (Term time)
  71.          
  72.