home *** CD-ROM | disk | FTP | other *** search
/ OS/2 Professional / OS2PRO194.ISO / os2 / network / waisos2 / os2wais.inf (.txt) < prev    next >
OS/2 Help File  |  1993-07-19  |  11KB  |  230 lines

  1.  
  2. ΓòÉΓòÉΓòÉ 1. Introduction ΓòÉΓòÉΓòÉ
  3.  
  4.     The WAIS OS/2 Client is a Public Domain software product developed at
  5. the Library of Congress.  The Client allows OS/2 users to connect to WAIS
  6. Servers on the Internet and to search for and retrieve documents from those
  7. Servers.  Documents returned can be text, pictures, or other types of data,
  8. depending on the type of server being accessed.  The Client and WAIS Servers
  9. communicate using the WAIS Protocol.  This allows a single user to query many
  10. different data servers without having to learn a new query language or
  11. interface.
  12. The Client can also be used to access local WAIS
  13. Servers across a local area network (LAN).
  14.  
  15.  
  16. ΓòÉΓòÉΓòÉ 2. Quick Start ΓòÉΓòÉΓòÉ
  17.  
  18. WAIS is simple to use.
  19. First, choose one or more sources using the 'Sources' pull-down menu.  Next, enter your query in the 'Tell me about' window.  Then, just click on the
  20. 'Search' pushbutton.
  21.  
  22.  
  23. ΓòÉΓòÉΓòÉ 3. Network Requirements ΓòÉΓòÉΓòÉ
  24.  
  25.     The OS/2 Client runs on top of IBM's TCP/IP for OS/2 network software.
  26. The user must be able to open a socket connection to a remote WAIS Server
  27. machine on the network.  The WAIS Client will work with either the 16-bit or
  28. 32-bit flavor of IBM's TCP/IP for OS/2 product.  The Client will not work with
  29. non-IBM TCP/IP products, but conversion should not be difficult.  Since the
  30. Client is Public Domain software, source code is
  31. available for porting, modification, or improvement.
  32.  
  33.  
  34. ΓòÉΓòÉΓòÉ 4. Sources ΓòÉΓòÉΓòÉ
  35.  
  36.     The first step in beginning a search is to select a .source to contact.
  37. The user lists the currently known sources by clicking on the "Sources" button.
  38. A window listing current known sources will appear.  You can select one or more
  39. of these sources with the mouse and then hit the "Use Selected Sources" button
  40. or double click on a source.  The selected sources will then appear in the "Look
  41. in these Sources:" window, ready to be searched.  Most searches are a
  42. single-source, but there are times when it is desirable to search multiple
  43. sources simultaneously.
  44.  
  45.     If you want to stop searching a source, select the source in the "Look
  46. in these Sources:" window and execute the "Stop Using Source" command in
  47. the "Sources" pull-down menu.
  48.  
  49.     Known sources are described in files with ".src" extensions.  The first
  50. time the user lists sources, the Client loads in all the .src files in the
  51. local directory.  To see what these files contain, select a source in the "Known
  52. Sources" window (just one) and then click on the "Edit Source" button.
  53. A window will appear, showing all the information associated with that source.
  54. Typically, the source description provides information on how to search that
  55. source, how to obtain more information on that source, whether or not the server
  56. service costs money, and the e-mail address of the source administrator.  Be
  57. careful, you can click in any of these windows and edit the contents,  if you
  58. change the network information, you may not be able to contact that source in
  59. the future.
  60.  
  61.     You can also select sources and hit the "Delete Selected Sources"
  62. button.  This erases all the information related to that source and erases the
  63. *.src file in the local directory.
  64.  
  65.  
  66. ΓòÉΓòÉΓòÉ 5. Queries ΓòÉΓòÉΓòÉ
  67.  
  68.     Once you have selected a source to use,
  69. the Client should put you back into the Query window.  This is the window which
  70. is labeled, "Tell me about:".  You can now enter a natural language
  71. question in this window, or just type a set of words and phases that are
  72. relevant to the type of information you are seeking from the selected source.
  73.  
  74.     The general algorithm for weighting words and phrases is as follows:  if
  75. a word is rarely used in the database, it get more weight;  if a phase matches
  76. exactly, it gets more weight;  and if a word appears in the document title, it
  77. get more weight.
  78.  
  79.     Once you have entered your query, hit return or click on the
  80. "Search" button to begin a search.
  81.  
  82.     You can also enter more complex queries, depending on the type of server
  83. you are contacting.  For example, WAIS Inc. commercial servers allow you to
  84. enter boolean queries by using logical words in capital letters, like AND, OR,
  85. and NOT.  The source description should tell you what kind of server it is and
  86. what kinds of queries it supports.  Also, the server description often contains
  87. a method for getting a help document about that server.
  88.  
  89.  
  90. ΓòÉΓòÉΓòÉ 6. Results ΓòÉΓòÉΓòÉ
  91.  
  92.     Search results are displayed in the results window, the largest window
  93. in the display with the column headings "Score Size  HEADLINES".  The server
  94. should return a number of document titles or headlines, along with their score
  95. and size.  The score runs from 0 to 1000.  The highest scoring documents are
  96. listed first at the top of the display.  The default file size indicates the
  97. number of bytes or characters it contains.  If the file is large, the size will
  98. be expressed in multiples of 1024.  If the size is followed by a "k", these are
  99. units of 1024.  "M" stands for megabytes, or units of 1024 squared (slightly
  100. more than a million).  "G" stands for gigabytes, or units of 1024 cubed
  101. (slightly more than a billion).
  102.  
  103.  
  104. ΓòÉΓòÉΓòÉ 7. Retrieving Documents ΓòÉΓòÉΓòÉ
  105.  
  106.     You can double click on any displayed headline in the results window to retrieve and display the document.
  107. Before retrieving a document, it is wise to look at how large it is to get an
  108. idea of how long it will take to retrieve the document.  A 150k file will take
  109. anywhere from 10 seconds to a minute to download, depending on network traffic,
  110. network bandwidth, and server workload.
  111.  
  112.     The Client retrieves the document and puts it into a file called
  113. "new_doc.tmp" and launches a viewer to display the document.  The type of viewer
  114. depends on the type of document retrieved.
  115.  
  116.     The user can select which type of viewer to launch with each type of
  117. document by selecting the "Document Viewers" menu item from the "Options" menu
  118. list.  Typically, editors are used for text documents, while an image viewer
  119. is used to display GIF, JPEG, or TIFF documents.
  120.  
  121.     The Client comes with default viewer settings.  The OS/2 epm editor is
  122. called on text documents.  Also included on the Client distribution disk is a
  123. Public Domain image viewer (pmviewjr.exe) which is called by the Client for GIF
  124. and JPEG images. The user can substitute his preferred editors and viewers for
  125. these default values.
  126.  
  127.     The document viewer runs as a separate program.  When you are done
  128. viewing a document, simply quit or close out the editor or viewer.  The WAIS
  129. Client will still be running.
  130.  
  131.  
  132. ΓòÉΓòÉΓòÉ 8. Saving Documents ΓòÉΓòÉΓòÉ
  133.  
  134.     Each document retrieval erases the previous contents of "new_doc.tmp".
  135. If the user wishes to permanently store a document, she should copy the file
  136. "new_doc.tmp" to another file before retrieving another document.  In the case
  137. of text documents, simply use the "Save As" command in the editor to save
  138. the file under another name.  With images, the user may have to go to another
  139. OS/2 command window to copy the file, unless the viewer has a "Save As" command.
  140.  
  141.  
  142. ΓòÉΓòÉΓòÉ 9. Finding New Sources ΓòÉΓòÉΓòÉ
  143.  
  144.     The Client disk comes with a few of .src files, but these are only for
  145. demonstration purposes.  The one source which is essential to have is the
  146. Directory of Servers.  This is a WAIS Server which is a database of databases.
  147. Begin your search with this source in order to locate sources which are relevant
  148. to your query.
  149.  
  150.     The Directory of Servers functions like a normal WAIS Server, except
  151. that the documents it returns are source descriptions, not documents.  To
  152. examine a source description, simply double click on the headline in the Results
  153. window.  The "document" will be retrieved and displayed.  At this point you have
  154. the option to discard the source description "Cancel", or to save it out for
  155. future use "Save".
  156.  
  157.     If you wish to save the source, be sure to edit the
  158. "Filename" field to indicate the filename to use.  The default name is
  159. "new-src" which will be overwritten the next time you save a source description
  160. without changing the file name.  The Client will append a ".src" extension to
  161. the source filename.  The new source should now appear in the known sources
  162. window, listed under the filename you chose, ready to be used.
  163.  
  164.     If you are running WAIS on a FAT formatted disk, you will get an error
  165. if you specify a filename greater than eight characters.
  166.  
  167.  
  168. ΓòÉΓòÉΓòÉ 10. Creating Source Pointers ΓòÉΓòÉΓòÉ
  169.  
  170.     You can also create source descriptions if you know the database name,
  171. the internet address, and the port number of the Server you are trying to
  172. contact.  Call the "Create a New Source" command under the "Sources" pull-down
  173. menu.  Then fill out the necessary information by clicking in each field.  The
  174. IP Number is not required, but if you know it, put it in as it will save lookup
  175. time.  The rest of the information is optional.
  176.  
  177.     You must enter the exact Database Name;  the machine name and port
  178. number are not sufficient.  Servers run under the UNIX Operating System. The
  179. Database Name is actually a UNIX path name which the Server uses to access the
  180. database.  UNIX is case sensitive.  This means that the database name must have
  181. the correct capitalization.
  182.  
  183. CAUTION:
  184. Also note that UNIX pathnames use "/" not "\" as in DOS, or OS/2.
  185.  
  186.  
  187. ΓòÉΓòÉΓòÉ 11. Relevance Feedback ΓòÉΓòÉΓòÉ
  188.  
  189.     One of the most powerful aspects of WAIS is the ability to say to a
  190. server, "find me more documents like this one."  This is called relevance
  191. feedback. This is a quick, intuitive way of searching large databases to obtain
  192. the documents you are looking for.  If you find a document that you want to use
  193. for relevance feedback, select the document headline and execute the "Use
  194. Document for Relevance Feedback" command under the "Documents" menu list.  The
  195. document headline, along with the source it comes from, will appear in the
  196. relevance feedback window which is titled "Similar to:".
  197.  
  198.     You can now run the search again(by
  199. clicking on the "Search" button), but this time, in addition to your query,
  200. the
  201. document pointers in the relevance feedback window will be passed to the server
  202. to refine your search.  Relevance feedback can be used iteratively, adding and
  203. deleting documents until you find the what you are looking for.
  204.  
  205.  
  206. ΓòÉΓòÉΓòÉ 12. Relevance Feedback and Multiple Source Searches ΓòÉΓòÉΓòÉ
  207.  
  208.     Relevance feedback works best with single-source searches with documents
  209. which come from that source.  If you are doing a multiple-source query,
  210. relevance feedback becomes more complicated.  For those of you who want to
  211. know how it really works, read on.
  212.  
  213.     Although all relevance feedback document ID's are send to all the
  214. servers being searched, only those servers that can access relevance feedback
  215. documents on their own file systems will use them, otherwise they will ignore
  216. them.  That is, relevance feedback documents from Server X cannot be used by
  217. Server Y, unless Server X and Y are on the same file system.
  218.  
  219.     Thus, if you are simultaneously searching on two servers (X and Y) with
  220. relevance feedback documents from both servers, and if they are not on the
  221. same file system, then each server will perform its search only with the relevance
  222. feedback documents from their respective databases.
  223.  
  224.     Also, when a user removes a source from the "Look in these
  225. Sources:" window(via the "Stop Using Source" command), all the relevance
  226. feedback documents from that source are placed at the bottom of the list, with
  227. the label "These documents may be ignored:" to indicate that their source
  228. is no longer being used.  If they exist on a file system that is still in use,
  229. they may still be used, but otherwise they will be ignored.
  230.