home *** CD-ROM | disk | FTP | other *** search
/ Nebula 1994 June / NEBULA_SE.ISO / Documents / FAQ / Free-databases-faq < prev    next >
Encoding:
Internet Message Format  |  1993-08-26  |  26.7 KB

  1. Path: senator-bedfellow.mit.edu!bloom-beacon.mit.edu!spool.mu.edu!olivea!sgigate!sgiblab!idiom.berkeley.ca.us!idiom.berkeley.ca.us!not-for-mail
  2. From: muir@idiom.berkeley.ca.us (David Muir Sharnoff)
  3. Newsgroups: comp.databases,comp.sources.d,comp.archives.admin,comp.answers,news.answers
  4. Subject: Catalog of free databases
  5. Followup-To: comp.archives.admin
  6. Date: 26 Aug 1993 01:53:39 -0700
  7. Organization: Idiom Consulting / Berkeley, CA  USA
  8. Lines: 638
  9. Approved: news-answers-request@mit.edu
  10. Expires: Sat, 1 Jan 1994 23:59:00 GMT
  11. Message-ID: <freedb-1.0@idiom.berkeley.ca.us>
  12. NNTP-Posting-Host: idiom.berkeley.ca.us
  13. Xref: senator-bedfellow.mit.edu comp.databases:28292 comp.sources.d:9459 comp.archives.admin:1135 comp.answers:1744 news.answers:11807
  14.  
  15. Archive-name: free-databases
  16. Last-modified: 1993/08/26
  17. Version: 1.0
  18.  
  19.  
  20.  
  21.     Catalog of Free Databases
  22.  
  23.  
  24. This document attemts to catalog databases that are 
  25. available without payment and with source.
  26.  
  27. This document is still a draft.  
  28.  
  29. The latest version of the document can be ftp'ed from
  30. pub/free-databases on idiom.berkeley.ca.us.
  31.  
  32. Please send additions and corrections to 
  33. David Muir Sharnoff <muir@idiom.berkeley.ca.us>
  34.  
  35. Thanks,
  36.  
  37. -Dave
  38.  
  39. ---------------------------------------------------------------------------
  40. Prototype entry:
  41.  
  42. name:        The name of the package
  43. version:    The current version number of the package
  44.         direct inquiries to "contact."
  45. interfaces:    The external interfaces that are supported by
  46.         the package.  Common interfaces are: SQL, ESQL,
  47.         dbm, etc.
  48. access methods:    A list of the access methods that are supported
  49. multiuser:    Can more than one person access the package at
  50.         the same time.  
  51. transactions:    Does the package support transactions?
  52. distributed:    Does the package support distributed databases?
  53. query language:    What query languages does the package support
  54.         if any?  SQL, QUEL, etc.
  55. index size:    (full text only) the size of the index as a percentage
  56.         of the size of the text to be indexed.
  57. limits:        Any known, annoying limits
  58. robustness:    Can this package be used on mission-critical data?
  59. description:    A description of the package.
  60. references:    Pointers to other documentation
  61. announcments:    Where to get announcments
  62. discussion:    Where to send, or how to join discussions about
  63.         the package
  64. bugs:        Where to send bug reports
  65. requires:    Special requirements for installing or running
  66. ports:        What does the package run on?
  67. restrictions:    Specail copyright or other restrictions on the software
  68. author:        The primary author, if known.  If not known, 
  69. contact:    The current contact point.  If not specified, 
  70.         use "author."
  71. how to get:    Instructions for obtaining the package
  72. updated:    When the package was last updated (yyyy/mm/dd)  [often
  73.         incorrect]
  74.  
  75.  
  76. ---------------------------------------------------------------------------
  77. --------------------------- relational databases --------------------------
  78. ---------------------------------------------------------------------------
  79.  
  80. name:        University INGRES
  81. version:    8.9
  82. interfaces:    QUEL, EQUEL
  83. access methods:    heap, hash, isam, ordered
  84. multiuser:    yes
  85. transactions:    yes, but no multistatement transactions.  Each statement
  86.         is ACID
  87. distributed:    no
  88. query language:    QUEL
  89. limits:        ?
  90. robustness:    Very mature technology
  91. description:    This is the database program that was the basis for INGRES
  92.         Corporation.  Obviously, it does not have all the bells 
  93.         and whistles of the current commercial product.  However,
  94.         it is small and fast and it works.
  95.         So called ordered relations are slow and not locked.
  96. references:    "The INGRES Papers" Stonebraker ed. Addison Wesley
  97. ports:        SunOS, ?
  98. author:        The Ingres project at UC Berkeley.  
  99. contact:    <ingres@postgres.berekely.edu>
  100. how to get:    ftp pub/ingres89.tar.Z from toe.cs.berkeley.edu 
  101.         _and_ ftp pub/source/ingres.patch from idiom.berkeley.ca.us
  102. updated:    1993/05/20
  103.  
  104. name:        MetalBase
  105. version:    5.0
  106. interfaces:    custome C library
  107. access methods:    AVL-trees
  108. multiuser:    yes, but in theory race conditions still exist
  109. transactions:    yes
  110. distributed:    no
  111. query language:    "Report", and "View Relation" a curses based viewer
  112. limits:        ?
  113. robustness:    data corruption is possible when MetalBase is not shut 
  114.         down correctly
  115. description:    MetalBase is a small relational database.  It has all the
  116.         pieces that a relational database should C interface, curses
  117.         interface, report writer, etc.  It does not have design which
  118.         takes advantage of shared memory or the better access methods.
  119.         None of the interfaces are standard, but all of them are easy
  120.         to use.
  121. discussion:    mbase-request@internode.com.au
  122. requires:    curses
  123. ports:        Linux, MS-DOS, Amiga, NeXT, Coherent, Macintosh MPW, SGI, Xenix
  124. restrictions:    donations are suggested
  125. author:        Richid Jernigan / PO Box 827 / Norris TN 37828
  126. how to get:    ftp systems/unix/linux/sources/usr.bin/mbase.tar.z 
  127.         from ftp.uu.net
  128. updated:    1992/10/01
  129.  
  130. name:        Postgres
  131. version:    4.1
  132. interfaces:    libpq (C interface)
  133. access methods:    Heap plus secondary indexes: B-tree, R-tree, Hash.
  134. multiuser:    yes
  135. transactions:    yes
  136. distributed:    no
  137. query language:    Postquel (incompatable superset of Quel)
  138. limits:        ?
  139. robustness:    "It is not up to commercial levels of reliability.  I would 
  140.         not want _my_ payroll records in it :-)"
  141. description:    Postgres is a database research project under Prof. Michael
  142.         Stonebraker at U. C. Berkeley.  To facilitate research
  143.         efforts, a software test-bed was created; this is the
  144.         "Postgres" DBMS software.  The Postgres DBMS is extended
  145.         relational or object oriented, depending on the buzzword du
  146.         jour.  Postgres is relational.  It is highly extensible.  It
  147.         has object oriented features like inheritance.  it has query
  148.         language procedures, rules, updatable views, and more.
  149. references:    There are may papers available, both through ftp and as
  150.         hard-copy technical reports.  Cruse the ftp site for papers
  151.         or mail Michelle Mattera <michelle@postgres.berkeley.edu>
  152. discussion:    send "Subject: ADD" to postgres-request@postgres.berkeley.edu
  153. bugs:        <bug-postgres@postgres.berkeley.edu>
  154. ports:        MIPS Ultrix 4.2+, SunOS 4.1.1+, NextStep 3.0, Linux 0.99.7
  155.         in progress: Alpha OSF/1, HP-PA HP-UX 8.07, HP-PA HP-UX 9.01,
  156.             i386 SCO ODT 2.0, Sparc Solaris 2.1
  157.         previous versions: i386 SVR4, i386 386BSD, RS/6000 AIX 3.2
  158. contact:    developers: <postgres-questions@postgres>
  159.         chief programmer: Marc Teitelbaum <marc@postgres.berkeley.edu>
  160.         admin: Michelle Mattera <michelle@postgres.berkeley.edu>
  161. how to get:    ftp pub/postgres/postgres-v4r1/* from toe.cs.berkeley.edu
  162. updated:    1993/03/19
  163.  
  164. name:        REQUIEM
  165. version:    ?
  166. interfaces:    RQL, ERQL (extension)
  167. access methods:    B-tree indexes can be created on attributes of base relations.
  168. multiuser:    yes (multiuser extension)
  169. transactions:    yes (multiuser extension)
  170. distributed:    no
  171. query language:    RQL
  172. robustness:    [seems to maintained by zero to few people --muir]
  173. description:    REQUIEM (RElational Query and Update Interactive systEM) is an 
  174.         extensible, relational DBMS developed in C with a query language
  175.         based on the relational algebra called RQL (Relational Query 
  176.         Language).
  177.         There appears to be three versions of REQUIEM: the base
  178.         version and two extensions.  One extension adds multiuser
  179.         capability.  The other adds an embeddable version of the
  180.         query langauge.
  181. references:    "An Extensible DBMS for Small-Medium Scale Systems",
  182.         Papazoglou, M.P., IEEE Micro, April 1989.
  183.         Relational Database Management - A Systems Programming 
  184.         Approach, Papazoglou, M.P. and Valder, W., Prentice Hall 
  185.         International, UK, 1989.
  186.                 "The Development of a Program Interface for the RDBMS Requiem"
  187.                 Power, R.A., 1991 Honours Thesis (dvi file available with 
  188.                 source code for the embedded version).
  189. ports:        Sparc/SunOS; base version only: MS-DOS, Macintosh
  190. contact:    (embedded version only) 
  191.         Robert Power <robert.power@csis.dit.csiro.au>
  192. how to get:    ftp pub/requiem/REQUIEM.tar.Z (multiuser version) or
  193.         pub/requiem/Requiem.tar.Z (embeddable version) 
  194.         from dcssoft.anu.edu.au 
  195.         The base version can be constructed from the multiuser version.
  196. updated:    1992/10/06
  197.  
  198. name:        shql
  199. version:    1.1
  200. interfaces:    SQL, shell
  201. multiuser:    no
  202. transactions:    no ?
  203. distributed:    no
  204. limits:        no NULLs in the data, spaces and backslashes may be added when 
  205.         the data contains punctuation, GROUP BY is not implemented.
  206. robustness:    it is a shell script.
  207. description:    Shql is a program that reads SQL commands interactively and
  208.         executes those commands by creating and manipulating Unix
  209.         files.  The program is patterned after Ingres' interactive sql
  210.         terminal monitor program.
  211. requires:    bourne shell with functions, awk, grep, cut, sort, uniq, join,
  212.         wc, and sed
  213. author:        Bruce Momjian <root%candle.uucp@bts.com>
  214. how to get:    ask archie
  215. updated:    1993/01/25
  216.  
  217. ---------------------------------------------------------------------------
  218. --------------------------- object oriented -------------------------------
  219. ---------------------------------------------------------------------------
  220.  
  221. name:        Arjuna Distributed Programming System
  222. version:    2.0
  223. interfaces:    C++
  224. access methods:    ?
  225. multiuser:    yes
  226. transactions:    yes, nested
  227. distributed:    yes, includes replicated objects
  228. query language:    ?
  229. limits:        ?
  230. robustness:    "all reported bugs fixed"
  231. description:    Arjuna is a programming system for reliable distributed
  232.         computing. Arjuna supports nested atomic actions for
  233.         controlling operations on objects (instances of C++ classes),
  234.         which can potentially be persistent. The software available
  235.         includes a C++ stub generator which hides much of the details
  236.         of client-server based programming, plus a system programmer's
  237.         manual containing details of how to install Arjuna and use it
  238.         to build fault-tolerant distributed applications.
  239. discussion:    send "join arjuna YOUR-NAME-HERE" to mailbase@mailbase.ac.uk
  240. ports:        UNIX: Suns, HPs, etc.
  241. restrictions:    A commercial extension exists.
  242. contact:    arjuna@newcastle.ac.uk
  243. how to get:    ftp ? from arjuna.ncl.ac.uk
  244. updated:    1993/05/15
  245.  
  246. name:        EXODUS Project software
  247. version:    GNU E 2.3.3, Storage Manager (SM) 3.0
  248. interfaces:    GNU E, (C++ for direct access to the Storage Manager)
  249. access methods:    B+tree and linear-hashing based indexes
  250. multiuser:    yes, client-server
  251. transactions:    yes
  252. distributed:    yes, applications can access multiple servers in a single
  253.         transaction.  Distributed commits are performed across servers
  254.         and clients have access to an interface allowing participation
  255.         in distributed commits managed by an external agent.
  256. query language:    GNU E -- a persistent programming language based on C++
  257. robustness:    High (at least for academic software).
  258.                 The SM release includes a facility for regression
  259.         testing most features, including crash recovery.
  260. description:    The EXODUS Storage Manager (SM) is a client-server object
  261.         storage system which provides "storage objects" for storing
  262.         data, versions of objects, "files" for grouping related storage
  263.         objects, and indexes for supporting efficient object access.  A
  264.         storage object is an uninterpreted container of bytes which can
  265.         range in size from a few bytes to hundreds of megabytes.  The
  266.         Storage Manager provides routines to read, overwrite, and
  267.         efficiently grow and shrink objects.  In addition, the Storage
  268.         Manager provides transactions, lock-based concurrency control,
  269.         and log-based recovery.
  270.         GNU E is a persistent, object oriented programming language
  271.         developed as part of the Exodus project.  GNU E extends C++
  272.         with the notion of persistent data, program level data objects
  273.         that can be transparently used across multiple executions of a
  274.         program, or multiple programs, without explicit input and
  275.         output operations.
  276. references:    A bibliography of EXODUS related papers can be obtained from
  277.         the ftp site described below.  Some of the papers are available
  278.         from the ftp server as technical reports, and are marked as
  279.         such in the bibliography.
  280. discussion:    We maintain a list of users for notification of updates.
  281.                 Mail exodus@cs.wisc.edu to be placed on the list.
  282. bugs:           exodusbugs@cs.wisc.edu
  283. ports:        MIPS/Ultrix, SPARC/SunOS, (HP 7xx/HP-UX for SM only) 
  284. restrictions:    none, but see copyright notice located in all source files 
  285. author:        The EXODUS Database Toolkit project at the 
  286.         University of Wisconsin
  287. contact:    exodus@cs.wisc.edu
  288. how to get:    ftp exodus/* from ftp.cs.wisc.edu
  289. updated:    1993/07/22
  290.  
  291. name:           William's Object Oriented Database (Wood)
  292. version:        0.6 
  293. interfaces:     MCL 2.0
  294. access methods: custom
  295. multiuser:      no
  296. transactions:   no
  297. distributed:    no
  298. query language: none. Has BTrees for indexing.
  299. limits:         Will slow down when the database size exceeds
  300.                 256 megabytes. Otherwise, database size limited
  301.                 by disk size (up to Macintosh limit, which is,
  302.                 I believe, 4 gigabytes). Object size limited
  303.                 to 24 megabytes. If you think of a Wood database
  304.                 as a random access FASL file, you'll have the
  305.                 right idea.
  306. robustness:     Until it has a real logging/recovery mechanism,
  307.                 I wouldn't advise using it for mission critical
  308.                 data. Caches pages in memory, so if you crash,
  309.                 you will lose. Has a function to flush the
  310.                 cache to disk, so you can do explicit checkpoints
  311.                 to make it more robust.
  312. description:    Wood is a simple persistent store for MCL 2.0.
  313.                 This is still alpha software. It is incomplete: though you can
  314.                 save/restore all Lisp objects to/from a file, there is no
  315.                 transaction/recovery manager and no garbage collector for the
  316.                 persistent heap. I will not be able to provide much support,
  317.                 but you get source code.
  318. discussion:     info-wood-request@cambridge.apple.com
  319. bugs:           bug-wood@cambridge.apple.com
  320. ports:          Macintosh CommonLisp 2.0
  321. author:         Bill St. Clair <bill@cambridge.apple.com>
  322. how to get:     ftp pub/mcl2/contrib/wood* from cambridge.apple.com
  323. updated:        1993/03/07
  324.  
  325. ---------------------------------------------------------------------------
  326. --------------------------- deductive databases ---------------------------
  327. ---------------------------------------------------------------------------
  328.  
  329. name:        Aditi Deductive Database System
  330. version:    beta release
  331. interfaces:    motif, command line, NU-Prolog
  332. access methods:    Base relations contain variable sized records.  Base relations
  333.         can be indexed with B-trees or multi-level signature files
  334.         (superimposed code words) allowing multi-attribute indexing and
  335.         querying, or they can be stored as unindexed flat files.
  336. multiuser:    yes
  337. transactions:    next release
  338. distributed:    ?
  339. query language:    prolog, graphical (Motif)
  340. limits:        ?
  341. robustness:    ?
  342. description:    Aditi is a multi-user deductive database system.  It supports
  343.         base relations defined by facts (relations in the sense of
  344.         relational databases) and derived relations defined by rules
  345.         that specify how to compute new information from old
  346.         information.  The old information can be from derived relations
  347.         as well as base relations; the rules of derived relations may
  348.         be recursive.  Both base relations and the rules defining
  349.         derived relations are stored on disk and are accessed as
  350.         required during query evaluation.
  351. ports:        SPARC/SunOS, MIPS/IRIX
  352. author:        The development of the Aditi system started in 1988 by
  353.         Professor Kotagiri Ramamohanarao, and many people have been
  354.         involved in its development, in particular Jayen Vaghani, Tim
  355.         Leask, Peter Stuckey, John Shepherd, Zoltan Somogyi, James
  356.         Harland and David Kemp. The support of Kim Marriott, David
  357.         Keegel, and Warwick Harvey is also acknowledged.
  358. contact:    aditi@cs.mu.oz.au
  359. how to get:    send email to aditi@cs.mu.oz.au
  360. updated:    1992/12/17
  361.  
  362. name:        CORAL
  363. version:    0.1  (Version 1.0 expected shortly)
  364. interfaces:    Exodus storage mangager, C++
  365. access methods:    Hash-based and B+ tree indices
  366. multiuser:    When used with Exodus
  367. transactions:    When used with Exodus
  368. distributed:    no
  369. query language:    Prolog-like with SQL-style extensions; C++ interface
  370. limits:        No type checking; only atomic values in persistent relations
  371. robustness:    Research software; used for teaching and in research projects,
  372.         but some bugs remain
  373. description:    The CORAL deductive database/logic programming system was
  374.         developed at the University of Wisconsin-Madison.  The CORAL
  375.         declarative language is based on Horn-clause rules with
  376.         extensions like SQL's group-by and aggregation operators, and
  377.         uses a Prolog-like syntax.  Many evaluation techniques are
  378.         supported, including bottom-up fixpoint evaluation and top-down
  379.         backtracking.  Disk-resident data is supported via an interface
  380.         to the Exodus storage manager; however, CORAL can run without
  381.         Exodus if disk-resident relations are not required.  
  382.         A good interface to C++ is provided.  Relations defined using 
  383.         the declarative language can be manipulated from C++ code, 
  384.         and relations defined using C++ code can be used in declarative 
  385.         rules.  C++ code defining relations can be incrementally loaded.
  386. requires:    AT&T C++ 2.0 or later
  387. ports:        Decstations, Sun 4, Sparc, HP Snakes 
  388. author:        The CORAL group consists of R. Ramakrishnan, P. Seshadri,
  389.         D. Srivastava and S. Sudarshan.  The following people made
  390.         important contributions: T. Arora, P. Bothner, V. Karra 
  391.         and W.G. Roth.  Several other people were also involved:  
  392.         J. Albert, T. Ball, L. Chan, M. Das, S. Goyal, R. Netzer 
  393.         and S. Sterner.
  394. contact:    Raghu Ramakrishnan <raghu@ricotta.cs.wisc.edu>
  395. how to get:    ftp from ftp.cs.wisc.edu
  396. updated:    1993/02/12
  397.  
  398. ---------------------------------------------------------------------------
  399. --------------------------- flat files ------------------------------------
  400. ---------------------------------------------------------------------------
  401.  
  402. name:        Jinx
  403. version:    2.1
  404. interfaces:    perl, shell
  405. multiuser:    no
  406. transactions:    no
  407. distributed:    no
  408. query language: none
  409. limits:        no limits
  410. robustness:    No bugs have ever been reported
  411. description:    Very easy to use, curses based flat file handler.
  412.         In Perl, so no limits. Allows Join, Project, Sort etc.
  413.         Representation in 2 readable unix files.  A documented
  414.         Perl library makes it easy to add applications.
  415. references:    Online help and a 17 page tutorial.
  416. requires:    Perl, cterm (distributed with jinx)
  417. ports:        any unix system with ordinary perl and curses
  418. restrictions:    Copyleft
  419. author:        Henk Penning, Utrecht University
  420. contact:    Henk Penning <henkp@cs.ruu.nl>
  421. how to get:    ftp pub/PERL/jinx.shar.Z and pub/PERL/cterm.shar.Z 
  422.         from ftp.cs.ruu.nl
  423. updated:    1991/11/01
  424.  
  425. name:        rdb
  426. version:    2.5j
  427. interfaces:    ?
  428. access methods:    ?
  429. multiuser:    ?
  430. transactions:    ?
  431. distributed:    ?
  432. query language:    ?
  433. limits:        ?
  434. robustness:    ?
  435. description:    RDB is mostly a set of Perl scripts working as filters, like
  436.         "row" & "column"; a very nifty table formatting script is in
  437.         "ptbl", which can do long field folding into multiple lines per
  438.         row.
  439. references:    ?
  440. discussion:    ?
  441. bugs:        ?
  442. requires:    perl
  443. ports:        ?
  444. author:        Walt Hobbs
  445. how to get:    ftp pub/RDB-hobbs/RDB-2.5j.tar.Z from rand.org
  446. updated:    ?
  447.  
  448. ---------------------------------------------------------------------------
  449. --------------------------- dbm variants  ---------------------------------
  450. ---------------------------------------------------------------------------
  451.  
  452. name:        The Berkeley DB code
  453. version:    1.6
  454. interfaces:    ndbm, hsearch
  455. access methods:    hash, b+tree, recno
  456. multiuser:    no 
  457. transactions:    no 
  458. distributed:    no
  459. query language:    none
  460. limits:        can handle large items
  461. robustness:    The db routines are used in some production code so they
  462.         are likely to work reasonably well.
  463. description:    The Berkeley DB Code is a unification of several previous
  464.         interfaces.  It also forms the basis of a unified interface
  465.         to new access methods (b+tree, recno).
  466. references:    "A New Hashing Package for UNIX", Margo Seltzer, Ozan Yigit,
  467.         Proceedings of the Winter USENIX Conference, Dallas, TX, 1991.
  468.         Also available by ftp'ing pub/oz/hash.ps.Z from nexus.yorku.ca.
  469.         "Document Processing in a Relational Database System, Michael
  470.         Stonebraker," Heidi Stettner, Joseph Kalash, Antonin Guttman,
  471.         Nadene Lynn, Memorandum No. UCB/ERL M82/32, May 1982.
  472.         "LIBTP: Portable, Modular Transactions for UNIX," Margo
  473.         Seltzer, Michael Olson, Proceedings 1992 Winter Usenix
  474.         Conference, San Francisco, CA, January 1992.
  475. reported bugs:    does not align data in memory [fixed? --ed]
  476. ports:        SunOS 4.1.2, Ultrix 4.2A, BSD 4.4, and most other Unix
  477. author:        Margo Seltzer, Keith Bostic, Ozan Yigit
  478. contact:    Keith Bostic <bostic@cs.berkeley.edu>
  479. how to get:    ftp ucb/4bsd/db.tar.Z from ftp.cs.berkeley.edu
  480. updated:    1993/06/06
  481.  
  482. name:        dbz
  483. version:    "20 Feb 1993 Performance Release of C News"
  484. interfaces:    dbm-like, command-line access
  485. access methods:    hash
  486. multiuser:    no
  487. transactions:    no
  488. distributed:    no
  489. query language:    none
  490. limits:        lines are limited to 1024 bytes unless the -l option is used
  491. robustness:    very robust within its domain
  492. description:    A dbm-like library maintained for use with C-news.
  493. ports:        everything that runs C-news (lots)
  494. author:        Jon Zeeff <zeeff@b-tech.ann-arbor.mi.us>, David Butler, Mark
  495.         Moraes, Henry Spencer.  Hashing function by Peter Honeyman.
  496. contact:    Henry Spencer <henry@zoo.toronto.edu>
  497. how to get:    included in the C-news distribution as ./dbz
  498. updated:    1992/02/11
  499.  
  500. name:        gdbm
  501. version:    1.6
  502. interfaces:    dbm, ndbm, gdbm
  503. access methods:    hash
  504. multiuser:    no, but does lock the entire file
  505. transactions:    no
  506. distributed:    no
  507. query language:    none
  508. limits:        can handle large items
  509. robustness:    [should be good --ed]
  510. description:    An ndbm work-alike from the Free Software Foundation
  511. bugs:        gnu.utils.bug
  512. author:        Philip A. Nelson <phil@wwu.edu>
  513. how to get:    ftp gdbm-*.tar.gz from any gnu archive
  514. updated:    1993/07/20
  515.  
  516. name:        sdbm
  517. version:    ?
  518. interfaces:    ndbm
  519. access methods:    hash
  520. multiuser:    no
  521. transactions:    no
  522. distributed:    no
  523. query language:    none
  524. limits:        ?
  525. robustness:    [I know of no problems --ed]
  526. description:    ndbm work-alike hashed database library based
  527.         on Per-Aake Larson's Dynamic Hashing algorithms.
  528. author:        Ozan S. Yigit <oz@nexus.yorku.ca>
  529. how to get:    included in the X11R5 distribution as contrib/util/sdbm
  530. updated:    1990/03/01
  531.  
  532. name:        tdbm
  533. version:    1.1
  534. interfaces:    dbm-like
  535. access methods:    hashing
  536. multiuser:    In theory, but the required threads package is not currently
  537.                 distributed.
  538. transactions:    yes
  539. distributed:    yes
  540. query language:    none
  541. limits:         Some minor ones.
  542. robustness:    Probably pretty reliable, but no hard data available.
  543. description:    Tdbm is a transaction processing database with a dbm-like
  544.         interface.  It provides nested atomic transactions, volatile
  545.         and persistent databases, and support for very large objects
  546.         and distributed operation.
  547. references:    A paper appearing in the Summer '92 USENIX proceedings
  548.         describes the design and implementation of tdbm and examines
  549.         its performance.
  550. discussion:    Contact the author.
  551. bugs:        Contact the author.
  552. author:        Barry Brachman <brachman@cs.ubc.ca>
  553. requires:       Nothing special.
  554. ports:        Sparc, MIPS, AIX.  Thought to be quite portable.
  555. restrictions:   Copyrighted with liberal use policy.
  556. how to get:    ftp pub/local/src/tdbm.tar.Z from cs.ubc.ca [137.82.8.5]
  557. updated:    1992/05/13
  558.  
  559.  
  560. ---------------------------------------------------------------------------
  561. --------------------------- full text -------------------------------------
  562. ---------------------------------------------------------------------------
  563.  
  564. name:        Liam Quin's text retrieval package (lq-text)
  565. version:    1.12-gamma
  566. interfaces:    command line, curses
  567. access methods:    hash (dbm) plus clustered linked list
  568. multiuser:    read only
  569. distributed:    no, can be used over nfs if the systems are similar
  570. query language:    very limited command line
  571. limits:        30-bit max document size, 31-bit distinct words in vocabulary,
  572.         up to 2^24 documents (possibly more but I don't have enough
  573.         disk to test anything like that!)
  574. index size:    >30%, <100% of input text
  575. robustness:    The README says that there are bugs.
  576. description:    lq-text is a text retrieval package.
  577.         That means you can tell it about lots of files, and later you
  578.         can ask it questions about them.  The questions have to be:
  579.         "which files contain this word?" or "which files contain this
  580.         phrase?", but this information turns out to be rather useful.
  581.         Lqtext has been designed to be reasonably fast.  It uses an
  582.         inverted index, which is simply a kind of database.  This tends
  583.         to be smaller than the size of the data, but more than half as
  584.         large.  You still need to keep the original data.
  585.         Lqtext uses dbm (berkeley db or sdbm) to store its indexes.
  586. discussion:    lq-text-beta-request@sq.com
  587. bugs:        lq-text-beta@sq.com
  588. ports:        most version of unix (except SCO)
  589. restrictions:    permission required for commercial use.
  590. author:        Liam R. E. Quin <lee@sq.com>
  591. how to get:    ftp pub/lq-text*.tar.Z from relay.cs.toronto.edu
  592. updated:    1992/08/24
  593.  
  594. name:        SMART
  595. version:    11.0
  596. interfaces:    terminal, X (slightly oder version), and several 
  597.         under development including X39.50
  598. access methods:    inverted file search or sequential search
  599. multiuser:    yes, but last writer wins when there are update conflicts
  600. distributed:    In-house version, to be made public in fall
  601. query language:    Natural language
  602. index size:    approx 40% of original text.
  603. limits:        Can only handle roughly 4 Gbytes of text in 
  604.         non-distributed version.
  605. robustness:    Research tool; parts have been well-tested but others not.
  606. description:    SMART is an implementation of the vector-space model of
  607.         information retrieval proposed by Salton back in the 60's.  The
  608.         primary purpose of SMART is to provide a framework in which to
  609.         conduct information retrieval research.  Standard versions of
  610.         indexing, retrieval, and evaluation are provided.
  611.         The system is designed to be used for small to medium scale
  612.         collections, and offers reasonable speed and support for these
  613.         actual applications.
  614.         SMART analyses the collection of information and builds
  615.         indexes.  It can then be used to build natural-language based
  616.         information retrieval software.  It uses feedback from the
  617.         user to tighten its search.
  618. restrictions:    Research use only.
  619. discussion:    smart-people-request@cs.cornell.edu
  620. ports:        Unix
  621. contact:    <chrisb@cs.cornell.edu>
  622. how to get:    ftp pub/smart/* from ftp.cs.cornell.edu
  623. updated:    1992/07/21
  624.  
  625.  
  626. name:        WAIS (Wide Area Information Server)
  627. version:    8 b5.1
  628. interfaces:    the wais protocol (Z39.50)
  629. access methods:    inverted string index
  630. multiuser:    read only
  631. distributed:    client/server
  632. query language:    natural language, boolean, Relevance Feedback
  633. index size:    roughtly = data size
  634. limits:        "none"
  635. robustness:    fairly high
  636. description:    There are three main components: WAISINDEX, WAISSERVER, and
  637.         WAISSEARCH.
  638.         WAISINDEX creates an inverted file index.  WAISINDEX includes
  639.         filters for a number of common file formats.
  640.         WAISSERVER listens for Z39.50 packets and tries to answer
  641.         them.
  642.         WAISSEARCH is the user agent that talks to WAISSERVERs.  There
  643.         are several front ends: shell, X, and emacs.
  644. announcements:    wais-interest-request@think.com
  645. discussion:    wais-discussion-request@think.com
  646. ports:        vax, sun-3, sun-4, NeXT, sysV
  647. restriction:    commercial version exists, contact info@wais.com
  648. author:        Harry Morris <Morris@wais.com>, Brewster Kahle 
  649.         <Brewster@wais.com>, Jonny Goldman <Jonathan@Think.COM>
  650. how to get:    ftp wais/* from wais.com
  651. updated:    1992/11/16
  652.  
  653.