home *** CD-ROM | disk | FTP | other *** search
/ ftp.umcs.maine.edu / 2015-02-07.ftp.umcs.maine.edu.tar / ftp.umcs.maine.edu / pub / WISR / wisr6 / proceedings / ascii / stockwell2.ascii < prev    next >
Text File  |  1993-10-19  |  20KB  |  433 lines

  1.  
  2.  
  3.  
  4.  
  5.        Internet  Information  Discovery and  Retrieval  Tools  -
  6.  
  7.  
  8.           Cost  Effective  Building  Blocks  for  Asset  Libraries
  9.  
  10.  
  11.  
  12.                                            Timothy Stockwell
  13.  
  14.  
  15.  
  16.                                        TheMITRE Corporation
  17.  
  18.                                                   MS-Z381
  19.  
  20.                                           7525 Colshire Drive
  21.  
  22.                                        McLean, VA 22102-3481
  23.  
  24.                                            Tel:  (703) 883-6695
  25.  
  26.                                          Email: tim@mitre.org
  27.  
  28.  
  29.  
  30.                                                Mark Krause
  31.  
  32.  
  33.  
  34.                                        TheMITRE Corporation
  35.  
  36.                                                  MS-W273
  37.  
  38.                                           7525 Colshire Drive
  39.  
  40.                                        McLean, VA 22102-3481
  41.  
  42.                                            Tel:  (703) 883-7642
  43.  
  44.                                       Email: mkrause@mitre.org
  45.  
  46.  
  47.  
  48.                                                   Abstract
  49.  
  50.  
  51.     The MITRE Corporation's Center for Advanced Aviation System Development (CAASD)
  52. is addressing the issue of institutionalizing reuse within the corporation. Implementation of a
  53. distributed, heterogeneous asset library has been recognized as a critical step in achieving the
  54. vision of institutionalized information reuse. Recent advances in the field of network information
  55. discovery and retrieval technology have led to the CAASD development of a reuse library mech-
  56. anism, at minimal cost, using widely available Internet resources. This position paper supports
  57. the use of Internet resource discovery tools as cost-effective building blocks for implementing
  58. distributed, heterogeneous asset libraries.
  59.  
  60.  
  61. Keywords: library, architecture, interoperability, standards, full-text indexing, network infor-
  62. mation discovery and retrieval, Internet Gopher, WAIS
  63.  
  64.  
  65. Workshop Goals: learning; sharing CAASDreuse initiative results; advocating the importance
  66. of standards for implementing interoperable libraries.
  67.  
  68.  
  69. Working Groups:  tools and environments, education, reuse management, organization and
  70. economics.
  71.  
  72.  
  73.  
  74.                                                 Stockwell- 1
  75.  
  76.  
  77. 1      Background
  78.  
  79.  
  80.  
  81. In  November  1992  CAASD started  an  initiative  to  support  and  promote  software  and  informa-
  82. tion reuse within the center.  The CAASD Resource Discovery Systemis a network information
  83. discovery and retrieval system built from Internet resource discovery tools and implemented as a
  84. client-server computing model. The system supports an asset library that is implemented across
  85. distributed, heterogeneous computer platforms.  Client software is available on a wide variety of
  86. computer platforms, including VT220s, IBM PCs, Macintoshes, NeXT workstations, UNIX work-
  87. stations, and X Window terminals. Server software is available for UNIX platforms.  Client-server
  88. communication occurs over a network using TCP/IP. The major Internet resource discovery tools
  89. used in implementing the CAASD Resource Discovery System are the Internet Gopher and Wide
  90. Area Information Servers (WAIS). Descriptions of these tools and how they are used within the
  91. CAASD Resource Discovery System are presented below. The CAASD Resource Discovery System
  92. has been available for on-line access since January 1993, and has since received wide support at all
  93. levels in the corporation.
  94.  
  95.  
  96.  
  97. 2      Position
  98.  
  99.  
  100.  
  101. Implementation of an on-line asset library was viewed as a crucial step in institutionalizing reuse
  102. within CAASD. The library mechanism had to be low cost,easy to set up and maintain, accessible
  103. from the wide variety of computer platforms used by CAASD staff, and it had to meet the require-
  104. ments for an asset library mechanism. Specifically,the asset library had to allow for the automated
  105. search and retrieval of on-line information in the form of text documents, images, software, and
  106. pointers to sources of more information (meta-assets) with minimal barriers b etween CAASD staff
  107. and the desired information.
  108.  
  109.  
  110. The CAASD Reuse Team informally reviewed a number of asset library mechanisms. None fit the
  111. set of candidate requirements. The search was expanded. The two main tools that were evaluated
  112. and eventually used to build the CAASD asset library were the Internet Gopher and Wide Area
  113. Information  Servers  (WAIS).  Given  the  recent  advances  in  network  information  discovery  and
  114. retrieval technology, this class of tools seemed to lend themselves to the solution of the problem.
  115.  
  116.  
  117. The Internet Gopher client/server provides a distributed information delivery system around which
  118. a campus-wide information system (CWIS) can be readily constructed. While providing a delivery
  119. vehicle for local information, Gopher also facilitates access to other Gopher and information servers
  120. throughout the world. [1 ]
  121.  
  122.  
  123. WAIS is a networked information retrieval system that uses TCP/IP to connect client applications
  124. to information servers.  Client applications request do cuments using user-supplied keywords and
  125. are able to retrieve text or multimedia documentsstored on the servers.  Servers search the full
  126. text index for the documents and return a list of documents containing the keywords.  The client
  127. may then request the server to send a copy of any of the documents found. [2 ]
  128.  
  129.  
  130. Gopher allows a user to browse for assets using amenu structure.  If a user wants to access an item,
  131. Gopher will "go fer" it and, if possible, "show" it to the user. Different Gopher clients have varying
  132. levels  of  capability  with  respect  to  "showing"  assets  to  the  user.  All  clients  can  display  ASCII
  133. text documents. Other document types which the Gopher protocol defines, and which may or may
  134. not be supported by the specific client software for a computer platform, are sounds, bit-mapped
  135. images, and multimedia documents. If desired, the user may save the document on the local disk
  136.  
  137.  
  138.                                                        Stockwell- 2
  139.  
  140.  
  141. drive, print the document on a local printer, or mail the document to an email address. Gopher
  142. can connect to other asset library systems via the Gopher protocol, TELNET protocol (VT100or
  143. TN3270 emulation), or anonymous ftp. Gopher also has interfaces to several information servers,
  144. including Archie servers, CSOname servers (a class of electronic phone books), and WAIS servers.
  145. Archie is a system which allows searching indexes of files available on anonymous ftp servers on
  146. the  Internet  [3].   CSO name  servers  allow  users  to  access certain  electronic  phone  books.   The
  147. Gopher-WAIS interface allows the user to sp ecify keywords to be used for a WAIS search.  The
  148. results of the WAIS search arepresented to the Gopher user as a custom directory. Items in the
  149. directory are assets which match the search criteria.  In addition,  WAIS uses a complex scoring
  150. algorithm for the assets and presents the assets in sorted order, based upon the score of each asset.
  151. This feature saves the user effort by automating the process of determining which assets are most
  152. relevant, based on the user's search criteria.
  153.  
  154.  
  155. The  implementation  of  the  CAASD Resource  Discovery  System  consists  of  an Internet  Gopher
  156. server and a WAIS server running on a UNIX workstation. Gopher client software is available for
  157. UNIX workstations (X Window and character based), Macintoshes, IBM PCs (DOS, Windows,and
  158. OS/2), and NeXT workstations. Dumb terminals (for example, VT220s) may access the system by
  159. logging into a special account and running a "secure mode", character-based Gopher client.  The
  160. CAASD Resource Discovery System has links to otherInternet Gopher servers maintained within
  161. MITRE, telnet links to the MITRE on-line library catalogs, and links to anonymous ftp sites within
  162. MITRE.
  163.  
  164.  
  165. The CAASD Resource Discovery System acts as a library mechanism for many different types of
  166. assets available for reuse by CAASD  staff. Asset types include technical reports, letters, memos,
  167. briefings, meeting minutes,numerous databases, and software. All of these asset types are searched,
  168. browsed, and retrieved using the common mechanisms provided by the CAASD Resource Discovery
  169. System.
  170.  
  171.  
  172. A number of tasks have been accomplished to assistCAASD staff to utilize the CAASD Resource
  173. Discovery  System  for  the  purpose  of  software  reuse.   Software  description  templates  have  been
  174. designed and distributed to CAASD staff. These templates are used to capture information about
  175. software developed within MITRE as well as information about software that was developed ex-
  176. ternally from MITRE, but used within MITRE. When the templates are filled in,  these software
  177. descriptions are collected, indexed, and made available through the CAASD Resource Discovery
  178. System. In addition, catalogs and information about external software repositories, such as ASSET,
  179. AdaNET, and the NETLIB server at research.att.com, have been reformatted, indexed, and made
  180. available through the CAASD Resource Discovery System.  Both of these efforts provide a means
  181. for searching through collections of descriptions of software assets available for reuse to CAASD
  182. staff.  The software descriptions also provide information on how to retrieve the software assets.
  183. Finally, using the anonymous ftp facility available within the CAASD Resource Discovery System,
  184. a large number of software assets have been made available for direct retrieval by CAASD staff.
  185.  
  186.  
  187. The  CAASD Reuse  Team  is  currently  evaluating  the  use  of  enhancements  to  both  Gopher  and
  188. WAIS as well as the use ofWorld-Wide Web (WWW) technology. Gopher enhancements include
  189. serving documents in multiple types (for example, Microsoft Word, PostScript, and ASCII text).
  190. WAIS enhancements include the use of boolean op erators, partial keywords, and literal phrases in
  191. WAIS indexsearches.  WWW technology merges hypertext and network information discovery and
  192. retrieval technologies in a very p owerful paradigm.
  193.  
  194.  
  195. All of the technology and software usedto build the CAASD Resource Discovery System is freely
  196. available from the Internetcommunity.  Many information resources related to these technologies
  197.  
  198.  
  199.  
  200.                                                        Stockwell- 3
  201.  
  202.  
  203. are  also  available  in  the  form  of network  news  groups  and  mailing  lists.  For  more  information,
  204. please consult the following sources.
  205.  
  206.  
  207.  
  208. The Internet Gopher.              Software  is  available  via  anonymous  ftp  to  boombox.micro.umn.edu in
  209.        directory /pub/gopher.
  210.  
  211.        Network news is discussed in comp.infosystems.gopher.
  212.  
  213.  
  214. WAIS.      Software is available via anonymous ftp to ftp.cnidr.org in directory /pub/NIDR.tools.
  215.  
  216.        Network news is discussed in comp.infosystems.wais.
  217.  
  218.  
  219. WWW.         Software is available via anonymous ftp to ftp.ncsa.uiuc.edu in directory /Mosaic.
  220.  
  221.        Network news is discussed in comp.infosystems.www.
  222.  
  223.  
  224.  
  225. 3      Comparison
  226.  
  227.  
  228.  
  229. An asset library mechanism must make available a set of services for both the library staff and the
  230. users of the library. Both the North Atlantic Treaty Organization (NATO) and the United States
  231. (U.S.) Department of Defense (DoD) have put together documents specifying the recommended
  232. services  to  be  provided  by  asset  library  mechanisms.   This  section  presents  the  recommended
  233. services and discusses how the CAASD Resource Discovery System performs these services.
  234.  
  235.  
  236.  
  237. 3.1     NATO
  238.  
  239.  
  240.  
  241. NATO has issued a three volume set of standards to address the issue of software reuse.
  242.  
  243.  
  244. Volume  1  -  The  Standard  for  the  Development  of  Reusable  Software  Components  is  designed  to
  245. provide guidance in the creation of software pro ducts with maximum potential for software reuse.
  246.  
  247.  
  248. Volume 2 - The Standard for Management of a Reusable Software Component (RSC) Library pro-
  249. vides guidance in the establishment and operation of a NATO-controlled resource to support the
  250. reuse of software life-cycle products in NATO  contracts.  This volume also includes a section on
  251. library tool management that discusses tool requirements of both the library staffand the library
  252. user. [4 ]
  253.  
  254.  
  255. Volume 3 - The Standard for Software Reuse Procedures is designed to provide guidance for software
  256. project teams who wish to practice reuse by making significant use of reusable software components
  257. available in the NATO Reuse Library.
  258.  
  259.  
  260.  
  261. 3.1.1     Library Staff Tool Requirements
  262.  
  263.  
  264. Support the cataloguing of RSCs.                   WAIS provides a mechanism to perform full-text indexing
  265.        on asset descriptions and keyword searching on these asset descriptions. Each asset description
  266.        exists as an individual file, and these files may be bulk-loaded into the library system.  Gopher
  267.        provides a mechanism to allow a hierarchy of libraries to be created so that domain-specific
  268.        assets may be classified as such.
  269.  
  270.  
  271.  
  272.                                                        Stockwell- 4
  273.  
  274.  
  275. Support the maintenance of the classification mechanism.                               A classification  system  is  not
  276.        formally used.  Instead, the full-text searching mechanism of WAIS is utilized.
  277.  
  278.  
  279. Generate transaction and status reports.                      Both Gopher and WAIS maintain logs of accesses
  280.        and queries.  These logs may be pro cessed to determine asset and user statistics.
  281.  
  282.  
  283. Support configuration management of the RSCs and of the classification vocabulary.
  284.        Gopher and WAIS do not directly address the issue of configuration management.  The Go-
  285.        pher server administrator is responsible for configuration management of the RSCs.
  286.  
  287.  
  288. Support problem-report tracking.                   Gopher  and  WAIS do  not  directly  address  the  issue  of
  289.        problem-report tracking.  Problem reports are tracked by library staff.
  290.  
  291.  
  292. Support user and project tracking.                   Gopher  and  WAIS do  not  directly  address  the  issue  of
  293.        user and project tracking, except by the logging mechanism. Tracking of users and projects
  294.        is performed by library staff.
  295.  
  296.  
  297. Include adequate tool documentation.                      Gopher allows for the inclusion of help files that a user
  298.        may browse in the same directory as the search items and other tools.
  299.  
  300.  
  301.  
  302. 3.1.2     Library User Tool Requirements
  303.  
  304.  
  305. Provide reusers an effective RSC search and retrieval system.                                Gopher and WAIS provide
  306.        an excellent search and retrieval system accessible from a wide variety of computer platforms.
  307.        The response to a keyword search will be a custom directory showing asset titles which match
  308.        the search parameters. If a title is selected, the full text of the asset description will be made
  309.        available to the user.
  310.  
  311.  
  312. Furnish documentation explaining the features and use of the tools.                                   As mentioned above,
  313.        Gopher allows documentation to be provided on-line in help files, where desired. The library
  314.        staff also provide paper copies of documentation to users.
  315.  
  316.  
  317.  
  318. 3.2     U.S. DoD
  319.  
  320.  
  321.  
  322. Another document which identifies and categorizesa set of asset library services is the Asset Library
  323. Open Architecture Framework (ALOAF) - Version 1.2, developed under the Software Technology
  324. for Adaptable, Reliable Systems (STARS) program [5]. Sp onsored by the U.S. Defense Advanced
  325. Research Projects Agency (DARPA), the STARS program is supported by the military services,
  326. SEI, and MITRE, with the U.S. Air Forceas the executive contracting agent.  TheSTARS Asset
  327. Library Framework (ALF) Service Model defines the categories of services that individual library
  328. frameworks make available.
  329.  
  330.  
  331. The ALF service categories and how each is addressed by the tools used in the CAASD Resource
  332. Discovery System are discussed below.
  333.  
  334.  
  335.  
  336. Session Services.         The Gopher protocol manages connections to the asset library, provides other
  337.        connection  services  through  FTP  and  TELNET  protocols,  and  logs  accesses  to  the  asset
  338.        library.
  339.  
  340.  
  341.  
  342.                                                        Stockwell- 5
  343.  
  344.  
  345. Library Management Services.                   Gopher  provides services  for  managing  and  manipulating  an
  346.        asset library. The asset library maps into a UNIX file hierarchy, with provisions for providing
  347.        symbolic names to the files.
  348.  
  349.  
  350. Data Model Services.             Gopher  and  WAIS do  not  directly  address  data  model  services.  Data
  351.        models are managed and maintained by library staff.
  352.  
  353.  
  354. Asset description services.             Asset  descriptions  are  managed  and  manipulated  outside  of  the
  355.        Gopher and WAIS tools.
  356.  
  357.  
  358. Query Services.          Gopher  and  WAIS provide  a  keyword  query  service  on  the  full  text  of  asset
  359.        descriptions.  Results are returned and are sorted by asset relevance as determined by the
  360.        WAIS scoring algorithms.
  361.  
  362.  
  363. Asset Processing Services.              Asset processing varies on a case-by-case basis.  Some assets may
  364.        be available through the anonymous ftp mechanism available through Gopher.  Other assets
  365.        may require contacting the internal point of contact mentionedin the asset description.
  366.  
  367.  
  368. Metrics Services.          Gopher and WAIS provide logging mechanisms to allow asset library admin-
  369.        istrators to collect statistics on library usage and asset usage, as well as unsuccessful library
  370.        queries.
  371.  
  372.  
  373. Access Control Services.              Gopher and WAIS provide access control on a machine-by-machine
  374.        basis.  User level authentication has been prototyped but is not a part of the standard Gopher
  375.        software  distribution.   Currently,  sensitive information  is  not  made  available  through  the
  376.        CAASD Resource Discovery System.
  377.  
  378.  
  379.  
  380. References
  381.  
  382.  
  383.  
  384. [1]  UGT - UofMN Gopher Team, Gopher (comp.infosystems.gopher) Frequently Asked Questions
  385.      (FAQ). University of Minnesota, May 1993.
  386.  
  387.  
  388. [2]  A. Edguer,  comp.infosystems.wais  Frequently  asked  Questions  [FAQ] (with  answers).   Case
  389.      Western Reserve University, May 1993.
  390.  
  391.  
  392. [3]  E. Krol, The Whole Internet - User's Guide and Catalog. O'Reilly and Associates, Inc., 1992.
  393.  
  394.  
  395. [4]  NATO, NATO Standard for Management of a Reusable SoftwareComponent Library.  NATO
  396.      Communications and Information Systems Agency.
  397.  
  398.  
  399. [5]  ALOAF,  Asset  Library  Open  Architecture  Framework  -  Version  1.2.    No.  STARS-TC-
  400.      04041/001/02,Software Technology for Adaptable, Reliable Systems (STARS), August 1992.
  401.  
  402.  
  403.  
  404. 4      Biographies
  405.  
  406.  
  407.  
  408. Timothy Stockwell is a Member of the Technical Staff at The MITRE  Corporation, McLean,
  409. Virginia. He is a lead researcher on information asset reuse within the Centerfor Advanced Aviation
  410. System Development (CAASD) and is also working with MITRE Corporate Informations Systems
  411. in exploring the use of network information discovery and retrieval tools for searching and accessing
  412. corporate databases.  Mr.  Stockwell was previously involved with the design and implementation
  413.  
  414.  
  415.  
  416.                                                        Stockwell- 6
  417.  
  418.  
  419. of oceanic air traffic control prototypes and simulation models. He received a B.S. in Computer
  420. and Systems Engineering from Rensselaer Polytechnic Institute in 1988.
  421.  
  422.  
  423. Mark  Krause  is  a  Member  of  the  Technical  Staff  at  The  MITRE Corporation,  McLean,  Vir-
  424. ginia.  Mr.  Krause is a lead researcher specializing in network information discovery and retrieval
  425. technologies and software and information reuse in support of the CAASD Reuse Initiative and is
  426. also providing input at the corporate level on information infrastructure re-engineering.  He was
  427. previously involved in the design and implementation of en-route air traffic control systems.  Mr.
  428. Krause received a B.S. in Computer Science from George MasonUniversity in 1990.
  429.  
  430.  
  431.  
  432.                                                        Stockwell- 7
  433.