home *** CD-ROM | disk | FTP | other *** search
/ OS/2 Shareware BBS: 35 Internet / 35-Internet.zip / unh222.zip / README.UNH < prev    next >
Text File  |  1999-05-23  |  1KB  |  41 lines

  1.  
  2. UNH is an OS/2 command line utility to strip HTML codes from
  3. files saved from the WebX or other web browsers. If it is executed
  4. without any aarguments, the following message will be displayed.
  5.  
  6.  
  7.  UNH 2.22 HTML stripper 
  8.  by Don Hawkinson , author of CCA, DH-Grep-PM,
  9.     PMStripper, Pastry Box, and DH_ClipSave/2
  10.     http://www2.southwind.net/~dwhawk
  11.     dwhawk@southwind.net
  12.  
  13.  usage:  unh  file1 file2 <file3>
  14.     file1 == html file
  15.     file2 == stripped text output file
  16.     file3 == URLs from html source file - optional
  17.  
  18.  
  19. UNH does not check for the existance of the output file, and will
  20. overwrite any existing file.  UNH is HPFS aware.
  21.  
  22. UNH does not attempt to recreate the format of the  Web page. UNH does
  23. not attempt to force any format on the output text, nor does it attempt
  24. to remove any existing text format. While the layout of tables and lists
  25. is lost during stripping, data is sorted to separate lines for
  26. legibility.
  27.  
  28. UNH has a filter which translates any embedded NULL characters
  29. to spaces.  I have no idea why anyone would use NULL characters
  30. on a web page, but I have encountered at least one Web site that
  31. has done this.
  32.  
  33. This program is free, but the author retains all rights. See the file
  34. license.txt file for further information.
  35.  
  36. The command line utility UNH.EXE uses the same logic as PMStripper
  37. to strip the HTML codes from files.  
  38.  
  39.  
  40.                                                           
  41.