home *** CD-ROM | disk | FTP | other *** search
/ Netscape Plug-Ins Developer's Kit / Netscape_Plug-Ins_Developers_Kit.iso / SOFTWARE / swish / readme.txt next >
Encoding:
Text File  |  1996-05-21  |  2.7 KB  |  93 lines

  1. SWISH README
  2. ~~~~~~~~~~~~
  3.  
  4. What should be in this directory:
  5.  
  6. swish.11.tar.Z  SWISH 1.1 distribution
  7.  
  8. The documentation's at
  9.  
  10.    http://www.eit.com/software/swish/
  11.  
  12. ...and you can email kevinh@eit.com for suggestions, contributions, etc.
  13.  
  14.    Enjoy!
  15.  
  16.    -- Kevin Hughes
  17.            kevinh@eit.com
  18.            3/13/95
  19.  
  20. --
  21.  
  22. Announcing SWISH 1.1
  23. ~~~~~~~~~~~~~~~~~~~~
  24.  
  25. What's SWISH?
  26. ~~~~~~~~~~~~~
  27.  
  28.    SWISH stands for Simple Web Indexing System for Humans -
  29. it's a program that allows you to index your Web site and search
  30. for files using keywords in a fast and easy manner.
  31.    For instance, to index your Web site, just type:
  32.  
  33.    swish -i /usr/local/www
  34.  
  35.    This creates a single file called "index.swish" that you
  36. can search. Then, to search for files with certain words, such as
  37. "john and doe or jane", just type:
  38.  
  39.    swish -w john and doe or jane
  40.  
  41. What's New
  42. ~~~~~~~~~~
  43.  
  44.    * You can search for words specifically in HTML
  45.      <BODY>, <HEAD>, <TITLE>, header, comment, and
  46.      emphasized (<B>, <I>, <EM>, <STRONG>) tags, or
  47.      use any combination of these criteria.
  48.  
  49.    * You can now use NOT booleans, parentheses, and
  50.           wildcards to match the beginnings of words, so
  51.           you can make searches like:
  52.  
  53.      "((t* and that) or (not apples and oran*))"
  54.  
  55.    * You can index and search words with 8-bit HTML
  56.      entities in them. Entities can be converted to
  57.      their 7-bit ASCII equivalents, if they exist, so
  58.      a word such as "resumé" can be searched
  59.      as "resume".
  60.  
  61.    * Searching is about three times faster on average.
  62.  
  63.    * You can specify multiple directories and files to
  64.           index, and multiple index files to search.
  65.  
  66.    * Stopwords can be automatically found and included in
  67.      index files.
  68.  
  69.    * You can merge index files larger than available
  70.      memory. Merging removes all redundant information.
  71.  
  72.    * Many other features and bug fixes.
  73.  
  74.    SWISH is not as fully-featured as many indexing programs, but
  75. it has been customized for indexing Web sites containing HTML files
  76. and images. Search results are ranked, words in title and header tags
  77. are indexed and weighted accordingly, and simple boolean searches are
  78. supported. Using a SWISH configuration file, you can specify the files
  79. to index using a number of criteria. SWISH indexes are typically
  80. 50% of the size of WAIS indexes and 1 to 5% of the size of the original
  81. HTML data, indexing is faster, and searching is typically as fast as
  82. most WAIS searches.
  83.    With WWWWAIS acting as a gateway, you can use SWISH just like
  84. waisq and similar programs.
  85.  
  86. You can see how it all looks at:
  87.  
  88.    http://www.eit.com/cgi-bin/wwwwais
  89.  
  90.    Enjoy,
  91.  
  92.    -- Kevin
  93.