home *** CD-ROM | disk | FTP | other *** search
/ ftp.pasteur.org/FAQ/ / ftp-pasteur-org-FAQ.zip / FAQ / ai-faq / general / part5 < prev    next >
Encoding:
Internet Message Format  |  2004-05-09  |  45.6 KB

  1. Path: senator-bedfellow.mit.edu!bloom-beacon.mit.edu!newsfeed.stanford.edu!headwall.stanford.edu!newshub.sdsu.edu!newshosting.com!nx01.iad01.newshosting.com!novia!newsfeed.nyu.edu!arlnews!oanews!info.usuhs.mil!cadig2.usna.navy.mil!crab.cs.usna.edu!not-for-mail
  2. From: crabbe@usna.edu (Ric Crabbe and Amit Dubey)
  3. Newsgroups: comp.ai,news.answers,comp.answers
  4. Subject: Artificial Intelligence FAQ:5/6 AI Web Directories & Online Papers [Monthly posting]
  5. Followup-To: comp.ai
  6. Date: Wed, 5 May 2004 19:14:09 +0000 (UTC)
  7. Organization: United States Naval Academy
  8. Lines: 1153
  9. Sender: crabbe@crab.cs.usna.edu
  10. Approved: news-answers-request@MIT.EDU
  11. Expires: 10 JUN 2004 21:54:49 GMT
  12. Message-ID: <c7bee1$d8s$1@crab.cs.usna.edu>
  13. Reply-To: crabbe@usna.edu
  14. NNTP-Posting-Host: crab.cs.usna.edu
  15. X-Trace: cadig2.usna.navy.mil 1083784458 27833 131.122.89.100 (5 May 2004 19:14:18 GMT)
  16. X-Complaints-To: news@usna.navy.mil
  17. NNTP-Posting-Date: Wed, 5 May 2004 19:14:18 +0000 (UTC)
  18. Summary: FTP Resources for AI
  19. Xref: senator-bedfellow.mit.edu comp.ai:69168 news.answers:271033 comp.answers:57107
  20.  
  21. Archive-name: ai-faq/general/part5
  22. Posting-Frequency: monthly
  23. Version: 2.1
  24. Maintainer: Ric Crabbe <crabbe@usna.edu> and Amit Dubey <adubey@coli.uni-sb.de>
  25. URL: http://www.faqs.org/faqs/ai-faq/general/part5/preamble.html
  26. Size: 46277 bytes, 1114 lines
  27.  
  28. ;;; ****************************************************************
  29. ;;; Answers to Questions about Artificial Intelligence *************
  30. ;;; ****************************************************************
  31. ;;; Written by Amit Dubey, Ric Crabbe, and Mark Kantrowitz
  32. ;;; ai_5.faq 
  33.  
  34. If you think of questions that are appropriate for this FAQ, or would
  35. like to improve an answer, please send email to the maintainers.
  36.  
  37. Parts 5 and 6 of the FAQ are now under heavy construction.  The FTP & WWW
  38. resources have been combined, since both are browser accessible these
  39. days.  We're also pruning the entries to sites that include
  40. information other than whatever project is being done at that
  41. University, etc.
  42.  
  43. Part 5 (WWW & FTP Resources):
  44.   [5-0] Research Index (nee Citeseer)
  45.   [5-1] Weblogs, repositories, web directories and communities not
  46.         aimed primarily at researchers
  47.   [5-2] Repositories and web directories aimed primarily at researchers
  48.   [5-3] Web books (textbooks and otherwise)
  49.   [5-4] AI Bibliographies available by FTP and WWW
  50.   [5-5] Technical Reports available by FTP and WWW
  51.   [5-6] Technical Reports for/by undergraduate students
  52.   [5-7] Where can I get a machine readable dictionary, thesaurus, and
  53.         other text corpora?
  54.   [5-8] Where can I get training sets for machine learning algorithms?
  55.   [5-9] What on-line journals are there?
  56.  
  57. Search for [#] to get to question number # quickly.
  58.  
  59. ----------------------------------------------------------------
  60. Subject: [5-0] Research Index (nee Citeceer)
  61.  
  62. http://citeseer.nj.nec.com/cs
  63.  
  64. "ResearchIndex is a scientific literature digital library that aims to
  65. improve the dissemination and feedback of scientific literature, and
  66. to provide improvements in functionality, usability, availability,
  67. cost, comprehensiveness, efficiency, and timeliness.
  68.  
  69. Rather than creating just another digital library, ResearchIndex
  70. provides algorithms, techniques, and software that can be used in
  71. other digital libraries. ResearchIndex indexes Postscript and PDF
  72. research articles on the Web..."
  73.  
  74. http://citeseer.nj.nec.com/cs
  75.  
  76. Research index (though most people still call it citeseer) is the
  77. currently best way to find published papers AND TRACK CITATIONS.  It
  78. is so cool, it's in the FAQ twice.
  79.  
  80. UPDATE 4/1/04:  ResearchIndex has been sick, and updates stopped.  It
  81. has been moved to: http://citeseer.ist.psu.edu/cis where hopefully it
  82. will continue.
  83.  
  84. ----------------------------------------------------------------
  85. Subject: [5-1] Repositories and directories not aimed primarily at researchers
  86.  
  87.  
  88. AI Toolkit:
  89.  
  90.    The AI Toolkit is an educational software package developed to
  91.    train future and current scientists and engineers on Artificial
  92.    Intelligence methods, with a specific focus on soft computing
  93.    techniques for robotic applications. The software is designed to be
  94.    completely user-friendly, and provide hands-on interactive lessons
  95.    to enhance understanding and knowledge of these powerful
  96.    methods. In addition, the multicultural interfaces promote a
  97.    universal atmosphere to enhance learning.
  98.  
  99.    The AI Toolkit is now freely available for download at:
  100.    http://www.openchannelsoftware.com/projects/AI_Toolkit
  101.  
  102.    For more information, visit:  http://aitoolkit.jpl.nasa.gov
  103.  
  104.  
  105. AI Topics: 
  106.    http://www.aaai.org/Pathfinder/html/welcome.html
  107.    Presented by AAAI, AI Topics is a "...web site provided ... for
  108.    students, teachers, journalists, and everyone who would like to
  109.    learn more about what artificial intelligence is, and what AI
  110.    scientists do.
  111.  
  112.    [Their] goal is to offer a limited number of authoritative,
  113.    non-technical resources that [they] have organized and annotated
  114.    to provide you with meaningful access to basic information about
  115.    the AI universe. Each of the AI Topics (see the navigation buttons
  116.    to the left) will lead you to online and in-print sources of
  117.    information.
  118.  
  119.    There has been an explosion in the number of Websites that catalog
  120.    locations of AI information in a Yahoo-style directory.  Although they
  121.    often duplicate functionality, in the interest of fairness, I will list all
  122.    the ones I know about here.
  123.  
  124. AboutAI.com:
  125.    http://www.aboutai.net/
  126.    It is a second generation portal and a successor to the former
  127.    ai.about.com.  aboutAI.Net contains dozens of AI-related essays and
  128.    thousands of Web links. It will be focused on the technical side,
  129.    describing the implementation of a wide range of AI
  130.    techniques. Site actively uses data mining techniques for
  131.    collaboration filtering, information retrieval, automatic
  132.    classification of retrieved information, etc.
  133.  
  134. Kurzweilai.Net:
  135.    http://www.kurzweilai.net
  136.    An entertaining mix of flashy demos and interesting essays on AI,
  137.    many by important poeple in the field.  Much philosophical
  138.    discussion, less hard-core technical discussion.
  139.  
  140. MAKHFI
  141.  
  142.    A site dedicated to Neural Networks, including some open source
  143.    tools that they developed.
  144.  
  145.     http://www.makhfi.com
  146.  
  147.    The site is still not complete, but we are fully committed to make
  148.    it "the" resource site for ANN.
  149.  
  150. Neuron AI Directory
  151.    http://www.neuron.co.uk 
  152.  
  153. Neural Network Information in Polish:
  154.    http://www.neuron.of.pl
  155.  
  156. Generation 5:
  157.    http://www.generation5.org
  158.  
  159.    "Generation5 is aimed at presenting a website that will educate the
  160.    viewer on Artificial Intelligence -- whatever the level of
  161.    expertise. We have essays on the applications and history of AI for
  162.    those unfamiliar, to essays on programming and philosophy, all the way
  163.    to full blown mathematically-orientated essays on genetic algorithms
  164.    and neural networks.  Generation5 prides itself also in its interviews
  165.    sections with exclusive interviews from top AI scientists like Marvin
  166.    Minsky, Craig Reynolds, Roger Schank, Andre LaMothe and many
  167.    others. Generation5 also has a comprehensive collection of original
  168.    programs, all with source included. Demonstration programs like image
  169.    recognizors, number recognizors, cellular automata creators, NLP
  170.    demonstrator and more. All programs have an accompanying essay
  171.    describing the workings of the programs.
  172.  
  173.    The aim of Generation5 is not only to educate the viewer, but to allow
  174.    the viewer to contribute to further other people's knowledge. They can
  175.    do this through the discussion boards, voting systems, and soon
  176.    through AI Solutions (a scheme to submit code - with a accompanying
  177.    monthly competition)."
  178.  
  179.  
  180. Yahoo Clubs:
  181.    Yahoo maintains a number of AI clubs.  There is the general
  182.    AI Group, an online community that discusses AI (a resource
  183.    for beginners).  Their website is:
  184.  
  185.       http://clubs.yahoo.com/clubs/artificialintelligencegroup
  186.  
  187.    There is also a resource for amateur robot enthusiasts at:
  188.  
  189.       http://clubs.yahoo.com/clubs/theroboticsclub
  190.  
  191. Pentomino Site:
  192.    http://home.planetinternet.be/~odettedm
  193.    Student run site at T.I.D. Ronse Belgium on searching Pentomino
  194.    spaces. 
  195.  
  196. ----------------------------------------------------------------
  197. Subject: [5-2] Repositories aimed primarily for researchers
  198.  
  199.  
  200. CMU AI Repository:
  201.  
  202.    The CMU Artificial Intelligence Repository was established by
  203.    Carnegie Mellon University to contain public domain and freely
  204.    distributable software, publications, and other materials of
  205.    interest to AI researchers, educators, students, and practitioners. 
  206.    The AI Repository currently contains more than a gigabyte of
  207.    material and is growing steadily. 
  208.  
  209.    The AI Repository is accessible from:
  210.  
  211.       http://www.cs.cmu.edu/Web/Groups/AI/html/repository.html
  212.  
  213. ACT-R Faq:
  214.    
  215.    http://acs.ist.psu.edu/act-r-faq/
  216.    "ACT-R is a proposed unified theory of cognition realised as a
  217.    production system. It is a unified theory of cognition, in the
  218.    spirit proposed by Newell (1990, Unified theories of cognition,
  219.    Harvard, Cambridge, MA), in that it is designed to predict human
  220.    behavior by processing information and generating intelligent
  221.    behavior itself."
  222.  
  223.  
  224.  
  225. Soar Faq:
  226.  
  227.    http://acs.ist.psu.edu/soar-faq/soar-faq.html
  228.    "Soar is used by AI researchers to construct integrated intelligent
  229.    agents and by cognitive scientist for cognitive modeling. It can
  230.    basically be considered in three different ways:
  231.    1. A theory of cognition. As such it provides the principles behind
  232.    the implemented Soar system. 
  233.    2. A set of principles and constraints on (cognitive)
  234.    processing. Thus, it provides a (cognitive) architectural
  235.    framework, within which you can construct cognitive models. In this
  236.    view it can be considered as an integrated architecture for
  237.    knowledge-based problem solving, learning and interacting with
  238.    external environments. 
  239.    3. An AI programming language."
  240.  
  241.  
  242.  
  243. Fast Replanning Methods:
  244.    Techniques for replaning under plan failure without starting from
  245.    scratch:
  246.    http://www.cc.gatech.edu/fac/Sven.Koenig/fastreplanning.html
  247.  
  248. Artificial Life Online:
  249.  
  250.    Sponsored by MIT Press and the Santa Fe Institute, Artificial Life
  251.    Online is intended to be a central information collection and
  252.    distribution site on the Internet for any and all aspects of the
  253.    Artificial Life endeavor.
  254.  
  255.    A special feature of the BBS is a collection of 40 or so local
  256.    newsgroups dedicated to a wide variety of topics in Artificial Life.
  257.  
  258.    Artificial Life Online is accessible by World-Wide Web from
  259.  
  260.       http://alife.santafe.edu/
  261.  
  262. Case based reasoning:
  263.    http://www.ai-cbr.org/
  264.    ai-cbr aims to provide a comprehensive information base to
  265.    Case-Based Reasoning academics and commercial developers. Through
  266.    the dissemination of information it is hoped a stronger world-wide
  267.    community of people interested in Case-Based Reasoning will be
  268.    fostered and the commercial use of Case-Based Reasoning will
  269.    increase. (added to the FAQ 2/2/00)
  270.  
  271.    http://www.aic.nrl.navy.mil/~aha/research/case-based-reasoning.html
  272.    A very complete list of resources including tutorials 
  273.  
  274. Consortium for Lexical Research:
  275.  
  276.    clr.nmsu.edu:/CLR/ [128.123.1.12]
  277.  
  278.    Archive containing a variety of programs and data files related to
  279.    natural language processing research, with a particular focus on
  280.    lexical research. The file 00README.clr.site is a good place to start.
  281.    See the file catalog or catalog.ps for a listing of the contents of
  282.    the archive. Long descriptions are in the info/ subdirectory.
  283.    Materials for paid-up members of the Consortium are in the
  284.    members-only/ subdirectory. Public materials include the Alvey Natural
  285.    Language Tools, Sowa's Conceptual Graph parser implemented in YACC by
  286.    Maurice Pagnucco, a morphological parsing lexicon of English, a
  287.    phonological rule compiler for PC-KIMMO, C source code for the NIST
  288.    SGML parser, PC-KIMMO sources, the 1911 Roget Thesaurus, and a variety
  289.    of word lists (including English, Dutch, and male/female/last names).
  290.    Comments and questions may be directed to lexical@nmsu.edu.
  291.  
  292.    There are also some materials in clr.nmsu.edu:/pub/ unrelated to
  293.    the archive.   
  294.  
  295. Fuzzy Logic Repositories:
  296.  
  297.    ntia.its.bldrdoc.gov:/pub/fuzzy/ [132.163.64.201] contains information
  298.    concerning fuzzy logic, including bibliographies (bib/), product 
  299.    descriptions and demo versions (com/), machine readable published
  300.    papers (lit/), miscellaneous information, documents and reports (txt/), 
  301.    and programs, code and compilers (prog/). You may download new items 
  302.    into the new/ subdirectory. If you deposit anything in new/, please 
  303.    inform fuzzy@its.bldrdoc.gov. The repository is maintained by 
  304.    Timothy Butler, tim@its.bldrdoc.gov. 
  305.  
  306. Genetic Algorithms:
  307.  
  308.    The Genetic Algorithms Repository is accessible is also a WWW version at
  309.  
  310.       http://www.aic.nrl.navy.mil/galist/
  311.  
  312.    The information files includes Nici Schraudolph's survey of free and
  313.    commercial GA software (send email to <schraudo@cs.ucsd.edu> to add to
  314.    the list).
  315.  
  316.    The software includes GAC (a simple GA written in C), GAL (a simple GA
  317.    written in Common Lisp), GAucsd, GECO (a Common Lisp toolbox for
  318.    constructing genetic algorithms), GENESIS, GENOCOP, Paragenesis (a
  319.    parallel version of GENESIS that runs on the CM-200), SGA-C (a C
  320.    implementation/extension of Goldberg's SGA system).
  321.  
  322. Intelliwise:
  323.  
  324.    Sergio Navega maintains a large collection of AI links:
  325.  
  326.       http://www.intelliwise.com/links.htm
  327.  
  328. Funic Neural Nets Archive Site:
  329.  
  330.    The Finnish University maintains an archive site containing a large
  331.    collection of neural network papers and public domain software.
  332.    The files are available through the web interface at
  333.    http://www.nic.funet.fi/pub/sci/neural or through FTP from
  334.    ftp://funic.funet.fi:/pub/sci/neural.  FTP users: see the file 01README
  335.    for details.   There's also a directory for non-neural net AI stuff
  336.    in the directory /pub/sci/ai.  (Web service is still experimental as
  337.    of 05/29/99).
  338.  
  339.    There is a list of mirrored ftp sites is in 04Neural_FTP_Sites.  For
  340.    further information, contact neural-adm@funic.funet.fi or Marko
  341.    Gronroos <magi@funic.funet.fi> (or <magi@utu.fi>).
  342.  
  343. OSU Neuroprose:
  344.  
  345.      archive.cis.ohio-state.edu:/pub/neuroprose/   [128.146.8.52]
  346.  
  347.    This directory contains technical reports, mostly from the early 90's, as a
  348.    public service to the connectionist and neural network scientific community
  349.    which has an organized mailing list (for info:
  350.    connectionists-request@cs.cmu.edu)
  351.  
  352. NL Software Registry:
  353. [maintainer's note: links upto this point haven't been checked]
  354.  
  355.    The Natural Language Software Registry is a catalogue of software
  356.    implementing core natural language processing techniques, whether
  357.    available on a commercial or noncommercial basis. Some of the topics
  358.    listed include speech signal processing, morphological analysis,
  359.    parsers, natural language generation systems, and knowledge
  360.    representation systems. The second edition of the catalog contains
  361.    more than 100 descriptions of natural language processing software.
  362.    The catalogue is available from the German Research Institute for
  363.    Artificial Intelligence (DFKI) in Saarbruecken (Germany) at the URL
  364.  
  365.       http://www.dfki.de/lt/registry
  366.  
  367.    The email contact for the site is lt-www@dfki.de
  368.  
  369. Essex ROBOTS Archive:
  370.    Contains robotics related information, hasn't been updated since 1995 or so:
  371.    ftp.essex.ac.uk:/pub/robots/
  372.  
  373. AI IN DESIGN WEBLIOGRAPHY 
  374.    http://www.cs.wpi.edu/Research/aidg/AIinD-hotlist.html
  375.    These web pages contain links to pretty much everything 
  376.    concerned with the application of AI to Design.
  377.  
  378. Miscellaneous AI:
  379.  
  380.    Some miscellaneous AI programs may be found on ftp.uu.net:/pub/ai/
  381.    Most are mirrors of programs available at other sites.
  382.  
  383.    AI_ATTIC is an anonymous ftp collection of classic AI programs and
  384.    other information maintained by the University of Texas at Austin.  It
  385.    includes Parry, Adventure, Shrdlu, Doctor, Eliza, Animals, Trek, Zork,
  386.    Babbler, Jive, and some AI-related programming languages.     This
  387.    archive is available by anonymous ftp from ftp.cc.utexas.edu
  388.    in the directory /pub/AI_ATTIC.  For more information, contact
  389.    atticmaster@bongo.cc.utexas.edu.
  390.  
  391.    The QWERTZ toolbox, a library of Standard ML modules with an emphasis
  392.    on symbolic Artificial Intelligence programming, (including
  393.    implementations of heuristic search and an ATMS reason maintenance
  394.    system) may be obtained by anonymous ftp from
  395.  
  396.       ftp.gmd.de:/gmd/ai-research/Software/qwertz.tar.gz
  397.  
  398.    For more information, write to Tom Gordon <thomas.gordon@gmd.de>.
  399.  
  400. ----------------------------------------------------------------
  401. Subject: [5-3] Web books (textbooks and otherwise)
  402. [This is a new topic, and we're just building the list.  Please submit
  403. any web-based books you know about.]
  404.  
  405. Practical Artificial Intelligence Programming in Java, by Mark Watson.
  406. "...covers AI programming techniques using Java."
  407. http://www.markwatson.com/
  408.  
  409. Sutton, R.S. and Barto, A.G. (1998) Reinforcement Learning: An
  410. introduction. MIT Press, Cambridge Mass, is online at:
  411. http://www-anw.cs.umass.edu/~rich/book/the-book.html
  412.  
  413.    
  414. ----------------------------------------------------------------
  415. Subject: [5-4] AI Bibliographies available by FTP
  416.  
  417. General:
  418.  
  419.    There are many recent papers at:
  420.  
  421.       http://www.cora.whizbang.com
  422.  
  423.    You can both browse and search; the searching ranks papers based on
  424.    how often they have been referenced.
  425.    
  426.    [I think whizbang.com went away in the .com bust.  -ric]
  427.  
  428. Fuzzy Logic:
  429.          
  430.    A BibTeX database of references addressing neuro-fuzzy issues can be
  431.    obtained by anonymous ftp from 
  432.  
  433.       ftp.tu-bs.de:/local/papers/ [134.169.34.15]
  434.  
  435.    as the (ascii) file fuzzy-nn.bib.
  436.  
  437. Genetic Algorithms:
  438.  
  439.       http://www.cogs.susx.ac.uk/users/ezequiel/alife-page/alife.html
  440.  
  441. Logic Programming, Constraints:
  442.  
  443.    A BibTeX bibliography for Constraint Logic Programming is available
  444.    by anonymous ftp from 
  445.  
  446.       archive.cis.ohio-state.edu:/pub/clp/
  447.  
  448.    in the bib/ and papers/ subdirectories.
  449.  
  450. NLP/CL:
  451.  
  452.    For information on a fairly complete bibliography of computational
  453.    linguistics and natural language processing work from the 1980s, send
  454.    mail to clbib@csli.stanford.edu with the subject HELP. 
  455.  
  456.    The CSLI linguistics bibliography contains 3,300 entries in
  457.    bib/tib/refer format. The bibliography is heavily slanted towards
  458.    phonetics and phonology but also includes a fair amount of
  459.    computational morphology, syntax, semantics, and psycholinguistics.
  460.    The bibliography can be used with James Alexander's tib
  461.    bibliography system, which is available from minos.inria.fr
  462.    [128.93.39.5] among other places. The bibliography itself is available
  463.    by anonymous ftp from 
  464.  
  465.       csli.stanford.edu:/pub/bibliography/
  466.  
  467.    Contributions are welcome, but should be in tib format.
  468.    For more information, contact Andras Kornai <kornai@csli.stanford.edu>
  469.  
  470. NLG:
  471.  
  472.    Robert Dale's Natural Language Generation (NLG) bibliography is
  473.    available by anonymous ftp from 
  474.  
  475.       scott.cogsci.ed.ac.uk:/pub/nlg/ [129.215.144.3] 
  476.  
  477.    Note that it is formatted for A4 paper. Stick in a line 
  478.       .94 .94 scale
  479.    after the %! line to print on 8.5 x 11 paper. For further information,
  480.    write to Robert Dale, University of Edinburgh, Centre for Cognitive
  481.    Science, 2 Buccleuch Place, Edinburgh EH8 9LW Scotland, or
  482.    <R.Dale@edinburgh.ac.uk> or <rdale@microsoft.com>.
  483.  
  484.    Mark Kantrowitz's Natural Language Generation (NLG) bibliography is
  485.    available by anonymous ftp from 
  486.  
  487.       ftp.cs.cmu.edu:/user/ai/areas/nlp/nlg/bib/mk/ [128.2.206.173] 
  488.  
  489.    In addition to the tech report, the BibTeX file containing the
  490.    bibliography is also available.  The bibliography contains more than
  491.    1,200 entries. A searchable index to the bibliography is
  492.    available via the URL
  493.  
  494.       http://liinwww.ira.uka.de/bibliography/Ai/nlg.html
  495.  
  496.    Additions and corrections should be sent to mkant@cs.cmu.edu. 
  497.  
  498. Neural Nets, Learning:
  499.  
  500.    A bibliography of over 1000 entries about Self-Organizing Map
  501.    (SOM) and Learning vector Quantization (LVQ) studies is
  502.    available by anonymous ftp from
  503.  
  504.       cochlea.hut.fi:/pub/ref/
  505.  
  506.    as the files references.bib.Z (BibTeX file) and references.ps.Z
  507.    (PostScript file). Please send additions and corrections to 
  508.    biblio@cochlea.hut.fi.
  509.  
  510.    An extensive collection of references on Principal Component Analysis
  511.    (PCA) neural networks and learning algorithms is available by
  512.    anonymous ftp from dendrite.hut.fi:/pub/ref/ in LaTeX and PostScript
  513.    formats. The list was compiled by Liu-Yue Wang, a graduate student of
  514.    Erkki Oja, and updated by Juha Karhunen, all from Helsinki University
  515.    of Technology, Finland.  For more information, contact Erkki Oja
  516.    <oja@dendrite.hut.fi>.
  517.  
  518.    A bibliography of PCA algorithms is available by anonymous ftp from
  519.    ftp.ai.mit.edu:/pub/sanger-papers/ as pca.bib. For more information,
  520.    contact Terry Sanger <tds@ai.mit.edu>.
  521.  
  522.    A 36-page bibliography of connectionist models with symbolic
  523.    processing is available by anonymous ftp from Neuroprose
  524.  
  525.       archive.cis.ohio-state.edu:/pub/neuroprose/ [128.146.8.52]
  526.  
  527.    as the file sun.nn-sp-bib.ps.Z. For more information, contact
  528.    Ron Sun <rsun@athos.cs.ua.edu>.
  529.  
  530. Nonmonotonic Logic, Belief Revision:
  531.  
  532.    A bibliography on belief revision and nonmonotonic logics with
  533.    about 2,000 items is available by anonymous ftp from
  534.  
  535.       tarski.phil.indiana.edu:/pub/morado/  [129.79.134.34]
  536.  
  537.    as nonmono.bib or nonmono.bib.Z. The file is also available by WAIS as
  538.  
  539.       wais://tarski.phil.indiana.edu/nonmono.bib?
  540.  
  541.    and by gopher/WWW. Please send additions and corrections to Raymundo
  542.    Morado <morado@phil.indiana.edu>. 
  543.  
  544. Speech: 
  545.  
  546.    A bibliography of papers on Silicon Auditory Models (VLSI
  547.    implementations of auditory representations) is available by anonymous
  548.    ftp from
  549.  
  550.       hobiecat.pcmp.caltech.edu:/pub/anaprose/lazzaro/sa-biblio.ps.Z
  551.  
  552.    For more information, write to John Lazzaro <lazzaro@boom.cs.berkeley.edu>
  553.  
  554. Multi-agent Systems
  555.  
  556.    http://dis.cs.umass.edu/research/agents-learn.html
  557.  
  558. ----------------------------------------------------------------
  559. Subject: [5-5] Technical Reports available by WWW/FTP
  560.  
  561. This section lists the anonymous ftp sites for technical reports from
  562. several universities and other organizations. Some of the sites
  563. provide only an online catalog of technical reports, while the rest
  564. make the actual reports available online. The email address listed is
  565. that of the appropriate person to contact with questions about
  566. ordering technical reports. 
  567.  
  568. The main source of tech reports is now from Networked Computer Science
  569. Technical Reference Library  or NCSTRL (pronounced "ancestral").
  570. It's home page is: http://www.ncstrl.org/  
  571. If that is a problem, you can go directly to:
  572. http://cs-tr.cs.cornell.edu/
  573.  
  574.  
  575. Other general locations for technical reports from several
  576. universities include:
  577.  
  578.    wuarchive.wustl.edu:/doc/techreports/ [128.252.135.4]
  579.    cs-archive.uwaterloo.ca:/cs-archive/  (see Index for an index)
  580.       AKA watdragon.uwaterloo.ca [129.97.140.24]
  581.  
  582. The uwaterloo archive includes tech reports from the Logic Programming
  583. and Artificial Intelligence Group (LPAIG) of the University of Waterloo.
  584.  
  585. There is also a WAIS server containing tech report abstracts that can be
  586. searched. To use, create the file ~/wais-sources/cs-techreport-abstracts.src 
  587. containing
  588.    (:source
  589.       :version  3
  590.       :ip-address "130.194.74.201"
  591.       :ip-name "daneel.rdt.monash.edu.au"
  592.       :tcp-port 210
  593.       :database-name "cs-techreport-abstracts"
  594.       :cost 0.00
  595.       :cost-unit :free
  596.       :maintainer "wais@daneel.rdt.monash.edu.au")
  597. and invoke your local wais client. To add to it, email abstracts of
  598. your papers to wais@rdt.monash.edu.au in the following format:
  599.    %TI Title
  600.    %AU Author (use multiple %AU lines for multiple authors)
  601.    %PU Published In (citation information)
  602.    %AV Availability (e.g., ftp reports.adm.cs.cmu.edu:/1992/CMU-CS-92-101.ps)
  603.    %OR Organization (see cs-techreport-archives.src for institution codes)
  604.    %LT Local title (e.g., tech report number)
  605.    %DA Date (and, if you want, %MN Month, %YR Year)
  606.    %AB Abstract
  607. If your papers are not available by FTP, you can use a %AV line such as:
  608.    %AV mail harry.bovik@cs.cmu.edu
  609. Further instructions are available from
  610.    daneel.rdt.monash.edu.au:/pub/techreports/reports/README  
  611. [Based on a post by Ashwin Ram.]
  612.  
  613. Also see the Unified Computer Science Technical Report Index
  614.     http://cs.indiana.edu/cstr/search
  615. [this archive appears to be out of date -ed]
  616.  
  617. A list of FTP sites for technical reports and papers can be found in
  618.     http://www.rdt.monash.edu.au/tr/siteslist.html
  619.  
  620. A list of more than 230 sites publishing CS tech reports may be
  621. obtained by anonymous ftp from
  622.  
  623.     ftp.rdt.monash.edu.au:/pub/techreports/sites/sites-list-data
  624.  
  625. To receive notification of new tech report sites, send mail to
  626. compdoc-techreports-request@ftp.cse.ucsc.edu to join the mailing list.
  627.  
  628. An archive of linguistics papers and preprints is available from
  629. linguistics.archive.umich.edu:/linguistics/papers/. Contact John Lawler
  630. (jlawler@umich.edu) or linguistics-archivist@umich.edu for more
  631. information.
  632.  
  633. The Concurrent Engineering Research Center (CERC) at West Virginia
  634. University has placed ASCII versions of the concurrent
  635. engineering-related abstracts (over 500) that were on CERCnet, ASCII
  636. back issues of the Concurrent Engineering Research in Review journal
  637. (now discontinued), and Postscript copies of CERC technical reports in
  638. the gopher server gopher.cerc.wvu.edu.  In addition, many of the CERC
  639. technical reports, including journal articles, symposium papers,
  640. theses, dissertations, and issues of the Concurrent Engineering
  641. Research in Review journal, are available as Postscript versions via
  642. anonymous ftp from 
  643.  
  644.    babcock.cerc.wvu.edu:/pub/techReports/ [157.182.44.36]
  645.  
  646. An index to all the reports, including some that are
  647. available only in hardcopy, is contained in the file "CERC-TR-INDEX".
  648. If you need additional information, contact Mary Carriger, CERC Office
  649. of Information Services, at carriger@cerc.wvu.edu.
  650.  
  651. The newsgroup comp.doc.techreports is devoted to distributing lists of
  652. tech reports and their abstracts.
  653.  
  654.    MIT Artificial Intelligence Laboratory:
  655.       ftp    -- publications.ai.mit.edu:/ai-publications/
  656.       email  -- publications@ai.mit.edu
  657.       www    -- http://www.ai.mit.edu/research/publications/publications.shtml
  658.  
  659.       A full catalog of MIT AI Lab technical reports (and a listing of recent
  660.       updates) may be obtained from the above location, by writing to
  661.       Publications, Room NE43-818, M.I.T. Artificial Intelligence Laboratory,
  662.       545 Technology Square, Cambridge, MA 02139, USA, or by calling
  663.       1-617-253-6773. The catalog lists the technical reports ("AI Memos") 
  664.       with a short abstract and their current prices. There is also a charge
  665.       for shipping. Some recent tech reports (since 1991) are available in the
  666.       ai-publications/ subdirectory; older technical reports are NOT
  667.       available by ftp. A bibliography is in the bibliography/ directory.
  668.  
  669.    CMU School of Computer Science:
  670.       ftp   -- reports.adm.cs.cmu.edu
  671.       email -- Technical.Reports@cs.cmu.edu
  672.       www   -- reports-archive.adm.cs.cmu.edu/cs.html
  673.  
  674.    CMU Software Engineering Institute:
  675.       ftp   --  ftp.sei.cmu.edu:/pub/documents
  676.       email --  bjz@sei.cmu.edu
  677.       www   --  www.sei.cmu.edu/publications/publication.html
  678.  
  679.    Yale: 
  680.       ftp   --  dept.cs.yale.edu:/pub/TR/
  681.  
  682.    University of Washington CSE Tech Reports:
  683.       ftp   --  june.cs.washington.edu:/tr  
  684.       email --  tr-request@cs.washington.edu
  685.  
  686.    ================
  687.  
  688.    AT&T Bell Laboratories:
  689.       ftp   -- netlib.att.com:/netlib/research/cstr/
  690.       bib.Z contains short bibliography, including all the technical
  691.       reports contained in this directory.
  692.  
  693.       ftp   -- research.att.com:/dist/ai
  694.  
  695.       [Maintainer's note: I assume these have been moved over to Lucent's
  696.        domain?]
  697.  
  698.    Argonne National Laboratory:
  699.       ftp   -- anagram.mcs.anl.gov:/pub/tech_reports
  700.       email -- wright@mcs.anl.gov
  701.  
  702.       Contains MCS Division preprints and technical memoranda,
  703.       available as either .dvi or .ps files. For descriptions of the
  704.       contents, see the subdirectory pub/tech_reports/abstracts; for
  705.       the files themselves see the subdirectory pub/tech_reports/reports.
  706.  
  707.    Boston University:
  708.       ftp   --  cs.bu.edu:/techreports/
  709.       email --  techreports@cs.bu.edu
  710.  
  711.    Brown University:
  712.       ftp   --  wilma.cs.brown.edu:/techreports/
  713.       email --  techreports@cs.brown.edu
  714.  
  715.    Cambridge University: Speech, Vision & Robotics Group
  716.       ftp   --  svr-ftp.eng.cam.ac.uk:/reports/
  717.  
  718.    Columbia University:
  719.       ftp   --  cs.columbia.edu:/pub/reports
  720.       email --  tech-reports@cs.columbia.edu
  721.  
  722.    DEC Cambridge Research Lab:
  723.       ftp   --  crl.dec.com:/pub/DEC/CRL/abstracts/
  724.         crl.dec.com:/pub/DEC/CRL/tech-reports/
  725.  
  726.    DEC Paris Research Lab:
  727.       email --  doc-server@prl.dec.com
  728.                 Put commands in Subject: line of the message.
  729.                 To get a list of articles, use
  730.                         send index articles
  731.                 To get a list of tech reports, use
  732.                         send index reports
  733.  
  734.    DEC WRL:
  735.       email -- wrl-techreports@decwrl.dec.com
  736.                To get a helpfile, send a message with 
  737.                   help
  738.            in the subject line.
  739.  
  740.    DFKI:
  741.       ftp   -- duck.dfki.uni-sb.de:/pub/papers
  742.       email -- Martin Henz (henz@dfki.uni-sb.de)
  743.  
  744.    Duke University:
  745.       ftp   --  cs.duke.edu:/dist/papers/
  746.         cs.duke.edu:/dist/theses/
  747.       email --  techreport@cs.duke.edu  [unknown user, 7/7/93]
  748.  
  749.    Edinburgh:
  750.       A list of available reports can be sent via email. Send requests
  751.       for information about reports from the Center for Cognitive Science 
  752.       to cogsci%ed.ac.uk@nsfnet-relay.ac.uk, and from the Human Communication 
  753.       Research Center to HCRC%ed.ac.uk@nsfnet-relay.ac.uk. 
  754.  
  755.    Electrotechnical Laboratory, Japan:
  756.       Reports from the Cooperative Architecture project (half AI, half
  757.       software engineering).
  758.       ftp   -- etlport.etl.go.jp:/pub/kyocho/Papers [192.31.197.99]
  759.                See file Index.English.
  760.       email -- Hideyuki Nakashima <nakashim@etl.go.jp>.
  761.  
  762.    Georgia Tech College of Computing, AI Group:
  763.       ftp   -- ftp.cc.gatech.edu:/pub/ai (130.207.3.245) 
  764.       email -- Professor Ashwin Ram <ashwin@cc.gatech.edu>
  765.  
  766.    HCRC (Human Communication Research Centre):
  767.       ftp   -- scott.cogsci.ed.ac.uk:/pub/HCRC-papers/
  768.       mail  -- Fiona-Anne Malcolm
  769.                Human Communication Research Centre
  770.                2 Buccleuch Place, Edinburgh, UK
  771.  
  772.    Illinois:
  773.       email -- Erna Amerman <erna@uiuc.edu>
  774.  
  775.    Illinois Genetic Algorithms Laboratory (IlliGAL):
  776.       email -- Eric Thompson <library@gal1.ge.uiuc.edu>
  777.       phone -- 217-333-2346 (9AM to 5PM CT, M-F)
  778.       mail  -- Illinois Genetic Algorithms Laboratory
  779.                Department of General Engineering
  780.                117 Transportation Building
  781.                104 South Mathews Avenue
  782.                Urbana, IL 61801-2996
  783.       ftp   -- gal4.ge.uiuc.edu:/pub/papers/IlliGALs/
  784.                Includes the GA bibliography and the Messy GA code in C
  785.                (in /pub/src/) and preprints (in /pub/papers/Publications)
  786.       www   -- http://gal4.ge.uiuc.edu/illigal.home.html
  787.  
  788.    Indiana:
  789.       ftp   -- cogsci.indiana.edu:/pub         [129.79.238.12]
  790.       ftp   -- ftp.cs.indiana.edu:/pub/techreports [129.79.254.191]
  791.  
  792.    INRIA, France:
  793.       ftp   -- ftp.inria.fr:/INRIA/publication/
  794.  
  795.    Institute for Learning Sciences at Northwestern University:
  796.       ftp   --  aristotle.ils.nwu.edu:/pub/papers/
  797.       phone --  708-491-3500
  798.  
  799.    Mechanized Reasoning Group (MRG):
  800.       ftp   --  ftp.mrg.dist.unige.it:/pub/mrg-ftp
  801.       email --  Fausto Giunchiglia <fausto@irst.it>
  802.                 Mechanized Reasoning Group, IRST
  803.                 38050 Povo Trento, Italy
  804.                 Tel: +39 461-314444 (secr.)
  805.                      +39 461-314436 (office)
  806.                 Fax: +39 461-302040 / 314591
  807.  
  808.    National University of Singapore:
  809.       ftp   -- ftp.nus.sg:/pub/NUS/ISCS/techreports
  810.  
  811.    New York University (NYU):
  812.       ftp   --  cs.nyu.edu:/pub/tech-reports
  813.  
  814.    OGI:
  815.       ftp   --  cse.ogi.edu:/pub/tech-reports
  816.       email --  csedept@cse.ogi.edu
  817.  
  818.    Ohio State University, Laboratory for AI Research
  819.       ftp   -- nervous.cis.ohio-state.edu:/pub/papers
  820.       email -- lair-librarian@cis.ohio-state.edu
  821.  
  822.    OSU Neuroprose:
  823.       ftp   -- archive.cis.ohio-state.edu:/pub/neuroprose  (128.146.8.52)
  824.  
  825.       This directory contains technical reports as a public service to the
  826.       connectionist and neural network scientific community which has an
  827.       organized mailing list (for info: connectionists-request@cs.cmu.edu)
  828.       Includes several bibliographies.
  829.  
  830.    Stanford:
  831.       ftp   -- elib.stanford.edu:/cs
  832.    
  833.       Very spotty collection.
  834.  
  835.    SRI:
  836.       email -- Donna O'Neal, donna@ai.sri.com
  837.  
  838.    SUNY Buffalo:
  839.       ftp   -- ftp.cs.buffalo.edu:/pub/tech-reports/
  840.  
  841.    SUNY at Stony Brook:
  842.       ftp   -- sbcs.sunysb.edu:/pub/TechReports
  843.       email -- rick@cs.sunysb.edu or stark@cs.sunysb.edu
  844.  
  845.       The /pub/sunysb directory contains the SB-Prolog implementation
  846.       of the Prolog language. Contact warren@sbcs.sunysb.edu for more
  847.       information.
  848.  
  849.    TCGA (The Clearinghouse for Genetic Algorithms):
  850.       email -- Robert Elliott Smith <rob@comec4.mh.ua.edu>
  851.                Department of Engineering of Mechanics
  852.                Room 210 Hardaway Hall
  853.                The University of Alabama
  854.                PO Box 870278
  855.                Tuscaloosa, AL 35487
  856.                205-348-1618, fax 205-348-6419
  857.  
  858.    Thinking Machines:
  859.       ftp   -- ftp.think.com:/think/techreport.list
  860.  
  861.       This file contains a list of Thinking Machines technical reports.
  862.       Orders may be placed by email (limit 5) to t-rex@think.com, or by US
  863.       Mail to Thinking Machines Corporation, Attn: Technical reports, 245
  864.       First Street, Cambridge, MA 01241. In addition, the directories
  865.       cm/starlisp and cm/starlogo contain code for the *Lisp and *Logo
  866.       simulators. 
  867.  
  868.    Tulane University:
  869.       ftp   -- rex.cs.tulane.edu:/pub/tech/  [129.81.132.1]
  870.  
  871.    University of Alabama:
  872.       ftp   -- aramis.cs.ua.edu:/pub/tech-reports/
  873.  
  874.    University of Arizona:
  875.       ftp   -- cs.arizona.edu:/reports/
  876.       email -- tr_libr@cs.arizona.edu
  877.  
  878.       The directory /japan/kahaner.reports contains reports on AI in
  879.       Japan, among other things, written by Dr. David Kahaner, a
  880.       numerical analyst on sabbatical to the Office of Naval
  881.       Research-Asia (ONR Asia) in Tokyo from NIST. The reports are not
  882.       written in any sort of official capacity, but are quite interesting. 
  883.  
  884.    University of California/Los Angeles:
  885.       ftp   -- ftp.cs.ucla.edu:/tech-report/
  886.  
  887.    University of California/Santa Cruz:
  888.       ftp   -- ftp.cse.ucsc.edu:/pub/bib/
  889.            ftp.cse.ucsc.edu:/pub/tr/
  890.       email -- jean@cs.ucsc.edu
  891.  
  892.    University of Cambridge Computer Lab:
  893.       email -- tech-reports@cl.cam.ac.uk
  894.  
  895.    University of Colorado:
  896.       ftp   --  ftp.cs.colorado.edu:/pub/cs/techreports
  897.  
  898.    University of Florida:
  899.       ftp   -- bikini.cis.ufl.edu:/cis/tech-reports
  900.  
  901.    University of Genoa, Mechanized Reasoning Group:
  902.       ftp   -- ftp.mrg.dist.unige.it:/pub/mrg-ftp/
  903.       email -- Fausto Giunchiglia <fausto@irst.it>
  904.  
  905.    University of Georgia:
  906.       ftp   -- ai.uga.edu:/pub/ai.reports/
  907.  
  908.    University of Illinois at Urbana:
  909.       ftp   -- a.cs.uiuc.edu:/pub/dcs
  910.       email -- e-amerman@a.cs.uiuc.edu 
  911.  
  912.    University of Indiana, Center for Research on Concepts and Cognition:
  913.       ftp   --  cogsci.indiana.edu:/pub/
  914.       email --  helga@cogsci.indiana.edu
  915.  
  916.    University of Kaiserslautern, Germany:
  917.       ftp   --  ftp.uni-kl.de:/reports_uni-kl/computer_science/
  918.  
  919.    University of Kentucky:
  920.       ftp   --  ftp.ms.uky.edu:/pub/tech-reports/UK/cs/
  921.  
  922.    University of Massachusetts at Amherst:
  923.       email --  techrept@cs.umass.edu
  924.  
  925.    University of Melbourne, Australia,
  926.    Computer Vision and Pattern Recognition Laboratory (CVPRL):
  927.       ftp   -- krang.vis.mu.oz.au:/pub/articles
  928.  
  929.    University of Michigan:
  930.       ftp   -- ftp.eecs.umich.edu:/techreports
  931.         
  932.    University of North Carolina:
  933.       ftp   -- ftp.cs.unc.edu:/pub/technical-reports/
  934.  
  935.    University of Pennsylvania:
  936.       ftp   -- ftp.cis.upenn.edu:/pub/papers/
  937.       email -- publications@upenn.edu [email bounced 7/7/93]
  938.  
  939.    USC/Information Sciences Institute:
  940.       email -- Sheila Coyazo <scoyazo@isi.edu> is the contact. [email
  941.            bounced 7/7/93]
  942.  
  943.    University of Toronto:
  944.       ftp   -- ftp.cs.toronto.edu:/pub/cogrob/   (Cognitive Robotics)
  945.            ftp.cs.toronto.edu:/pub/reports/
  946.       email -- tech-reports@cs.toronto.edu
  947.  
  948.    University of Virginia:
  949.       ftp   -- uvacs.cs.virginia.edu:/pub/techreports/cs
  950.  
  951.    University of Western Australia:
  952.       ftp   -- ciips.ee.uwa.edu.au
  953.       Centre for Intelligent Information Processing Systems (CIIPS)
  954.       EE Engineering Department
  955.  
  956.    University of Wisconsin:
  957.       ftp   -- ftp.cs.wisc.edu:/tech-reports
  958.            ftp.cs.wisc.edu:/machine-learning
  959.            ftp.cs.wisc.edu:/computer-vision
  960.       email -- tech-reports-archive@cs.wisc.edu
  961.  
  962.  
  963. Some AI authors have set up repositories of their own papers:
  964.  
  965.    Matthew Ginsberg: t.stanford.edu:/u/ftp/papers
  966.  
  967. ----------------------------------------------------------------
  968. Subject: [5-6] Technical resources for/by undergraduate students
  969.  
  970. Brainsciences http://www.brainsciences.com
  971.  
  972.    A group of students at Brown University have created a web site to
  973.    "provide a forum for undergraduates to publish their work. We feature
  974.    reports of original research, book reviews, term papers, and other work
  975.    in a similar vein."
  976.  
  977.  
  978. ----------------------------------------------------------------
  979. Subject: [5-7] Where can I get a machine readable dictionary, thesaurus, and
  980.                other text corpora?
  981.  
  982. Linguistic Data Consortium:
  983.  
  984.    The Linguistic Data Consortium was established to broaden the
  985.    collection and distribution of speech and natural language data
  986.    bases for the purposes of research and technology development in
  987.    automatic speech recognition, natural language processing, and
  988.    other areas where large amounts of linguistic data are needed.  LDC
  989.    corpora are the most commonly used in published research.
  990.    Information about the LDC is at http://www.ldc.upenn.edu/
  991.  
  992. Free:
  993.  
  994.    On unix systems, /usr/dict/words is a fine word list.
  995.  
  996.    ===========
  997.    The Moby Thesaurus (25,000 roots/1.2 million synonyms), Moby Words
  998.    (560,000 entries), Moby Hyphenator (155,000 entries), and the Moby
  999.    Part-of-Speech (214,000 entries), Moby Pronunciator (167,000
  1000.    entries with IPA encoding, syllabification, and primary, secondary,
  1001.    and tertiary stress marks) and Moby Language (100,000 word word
  1002.    lists in five major world languages) lexical databases are
  1003.    available at:
  1004.    
  1005.    http://www.dcs.shef.ac.uk/research/ilash/Moby/
  1006.  
  1007.    This was once commercial but is now in the public domain.
  1008.    [thanks to Robert Bechtel]
  1009.    ===========
  1010.  
  1011.    Roget's 1911 Thesaurus is available by anonymous FTP from the
  1012.    Consortium for Lexical Research 
  1013.  
  1014.       clr.nmsu.edu:/CLR/lexica/roget-1911 [128.123.1.12]
  1015.  
  1016.    It is also available from
  1017.  
  1018.       src.doc.ic.ac.uk:/literary/collections/project_gutenberg/roget11.txt.Z
  1019.  
  1020.    An old Webster's dictionary is in /text/dict/{DICT.Z,DICT.INDEX.Z}.
  1021.    Project Gutenberg also has Roget's 1911 Thesaurus. The Project
  1022.    Gutenberg archive is at mrcnext.cso.uiuc.edu:/pub/etext/. The
  1023.    Project Gutenberg archive collects public domain electronic books. For more
  1024.    information, write to Michael S. Hart, Professor of Electronic Text,
  1025.    Executive Director of Project Gutenberg Etext, Illinois Benedictine
  1026.    College, 5700 College Road, Lisle, IL 60532 or send email to
  1027.    hart@vmd.cso.uiuc.edu. 
  1028.  
  1029.    The Online Book Initiative maintains a text repository at
  1030.    http://obi.std.com:/obi/ 
  1031.  
  1032.    The CHILDES project at Carnegie Mellon University has a lot of data of
  1033.    children speaking to adults, as well as the adult written and adult
  1034.    spoken corpora from the CORNELL project.  Contact Brian MacWhinney
  1035.    <brian@andrew.cmu.edu> for more information.
  1036.  
  1037.    The Association for Computational Linguistics (ACL) has a Data
  1038.    Collection Initiative. For more information, contact Donald Walker at
  1039.    Bellcore, walker@flash.bellcore.com.
  1040.  
  1041.    Two lists of common female first names (4967 names) and male first
  1042.    names (2924 names) are available for anonymous ftp from 
  1043.  
  1044.       ftp.cs.cmu.edu:/user/ai/areas/nlp/corpora/names/
  1045.  
  1046.    Read the file README first. Send mail to mkant@cs.cmu.edu for more
  1047.    information. 
  1048.  
  1049.    A list of 110,000 English words (one per line, in ASCII) is
  1050.    available in the PD1:<MSDOS.LINGUISTICS> directory on SIMTEL20 as the
  1051.    files WORDS1.ZIP, WORDS2.ZIP, WORDS3.ZIP, and WORDS4.ZIP. Although the
  1052.    list is in MS-DOS files, it can easily be used on other machines (but
  1053.    first you'll have to unzip the files on a DOS machine). The list
  1054.    includes inflected forms of the words, such as plural nouns and the
  1055.    -s, -ed, and -ing forms of verbs; thus the number of lexical stems in
  1056.    the list is considerably smaller than the total number of word forms.
  1057.    These files are available via FTP from WSMR-SIMTEL20.ARMY.MIL
  1058.    [192.88.110.20].  SIMTEL20 files are mirrored on wuarchive.wustl.edu.
  1059.  
  1060.    The Collins English Dictionary encoded as a Prolog fact base is
  1061.    available from the Oxford Text Archive by anonymous ftp from
  1062.  
  1063.       ota.ox.ac.uk:/pub/ota/dicts/1192/  [129.67.1.165]
  1064.  
  1065.    The Oxford Text Archive includes many other texts, dictionaries,
  1066.    thesauri, word lists, and so on, most of which are available for
  1067.    scholarly use and research only. See the files
  1068.  
  1069.       ota.ox.ac.uk:/pub/ota/textarchive.form
  1070.       ota.ox.ac.uk:/pub/ota/textarchive.info
  1071.       ota.ox.ac.uk:/pub/ota/textarchive.list
  1072.       ota.ox.ac.uk:/pub/ota/textarchive.sgml
  1073.  
  1074.    for more information, or write to archive@ox.ac.uk, Oxford Text Archive,
  1075.    Oxford University Computing Services, 13 Banbury Road, Oxford OX2
  1076.    6NN, UK, call 44-865-273238 or fax 44-865-273275.
  1077.  
  1078.    Chuck Wooters <wooters@icsi.berkeley.edu> has extracted the most
  1079.    likely pronunciation for each of about 6100 words in the hand-labeled
  1080.    TIMIT database, and made them available by anonymous ftp from
  1081.    ftp.icsi.berkeley.edu:/pub/speech/TIMIT.mostlikely.Z.
  1082.  
  1083.    A list of homophones from general American English is available by
  1084.    anonymous ftp from svr-ftp.eng.cam.ac.uk:/comp.speech/data/ as the file
  1085.    homophones-1.01.txt. To receive the list by email, send mail to
  1086.    Evan.Antworth@sil.org. The list was compiled by Tony Robinson.
  1087.  
  1088.    Sigurd P. Crossland <sig@seuss.vantage.gte.com> has been compiling 
  1089.    a dictionary of English words, including most common American words,
  1090.    abbreviations, hyphenations, and even incorrect spellings. The most
  1091.    recent version is available by anonymous ftp from
  1092.  
  1093.       wocket.vantage.gte.com:/pub/standard_dictionary/dic-0394.tar.gz
  1094.  
  1095.    The tar file includes 31 text files, one for each word-length from 2
  1096.    to 32. The compressed tar file takes up just over 4mb of space, and
  1097.    includes approximately 870,000 words.
  1098.  
  1099.    WordNet is an English lexical reference system based on current
  1100.    psycholinguistic theories of human lexical memory. It organizes nouns,
  1101.    verbs and adjectives into synonym sets corresponding to lexical
  1102.    concepts. The sets are linked by a variety of relations. Besides being
  1103.    of scientific interest, 
  1104.    it makes a handy thesaurus. WordNet is available by anonymous ftp from
  1105.  
  1106.       clarity.princeton.edu:/pub/
  1107.  
  1108.    If you retrieve a copy of wordnet by ftp, please send mail to
  1109.    wordnet@princeton.edu. 
  1110.  
  1111. Commercial:
  1112.  
  1113.    The Oxford Text Archive has hundreds of online texts in a wide variety
  1114.    of languages, including a few dictionaries (the OED, Collins, etc.).
  1115.    The Lancaster-Oslo-Bergen (LOB), Brown, and London-Lund corpii are also
  1116.    available from them.  For more information, write to Oxford Electronic
  1117.    Publishing, Oxford University Press, 200 Madison Avenue, New York, NY
  1118.    10016, call 212-889-0206, or send mail to archive@vax.oxford.ac.uk.
  1119.    (Their contact information in England is Oxford Text Archive, Oxford
  1120.    University Computing Service, 13 Banbury Road, Oxford OX2 6NN, UK, +44
  1121.    (865) 273238.)
  1122.  
  1123. Mailing Lists:
  1124.  
  1125.    CORPORA is a mailing list for Text Corpora. It welcomes information
  1126.    and questions about text corpora such as availability, aspects of
  1127.    compiling and using corpora, software, tagging, parsing, and
  1128.    bibliography. To be added to the list, send a message to
  1129.    corpora-request@x400.hd.uib.no. Contributions should be sent to 
  1130.    corpora@x400.hd.uib.no.
  1131.  
  1132.  
  1133. ----------------------------------------------------------------
  1134. Subject: [5-8] Where can I get training sets for machine learning algorithms?
  1135.  
  1136. UC/Irvine (UCI) AI/Machine Learning Repository:
  1137.  
  1138.    ftp.ics.uci.edu has a variety of AI-related materials, with a special
  1139.    focus on machine learning. For example,
  1140.  
  1141.       ftp.ics.uci.edu:/pub/machine-learning-databases/
  1142.  
  1143.    contains over 80 benchmark data sets for classifier systems (30mb).
  1144.  
  1145. MLnet Machine Learning Archive
  1146. MLnet Online Information Service
  1147.  
  1148.    In 1988 the Special Interest Group on Machine Learning of the German
  1149.    Society for Computer Science (GI e.V.) decided to establish a library
  1150.    of PROLOG implementations of Machine Learning algorithms.  By 1994 the
  1151.    library had a sizable collection of GLPed PROLOG software.  The site
  1152.    has grown, and now, according to the webpage it "offers a growing
  1153.    collection of ML information, datasets, software and pointers to other
  1154.    ML resources."  The homepage is at:
  1155.  
  1156.     http://www.mlnet.org
  1157.  
  1158.    Send your contributions to Mathias Kirsten (info@mlnet.org) at the GMD -
  1159.    German National Research Center, or use the contribution facilities within
  1160.    the MLnet OiS.
  1161.  
  1162. ----------------------------------------------------------------
  1163. Subject: [5-9] What on-line Journals are there?
  1164.  
  1165. [this question is still in progress]
  1166.  
  1167. Journal of Artificial Intelligence Research.  See [3-2a].
  1168. Journal of Machine learning Reasearch. See [3-2n].
  1169.  
  1170. ---
  1171. [ comp.ai is moderated.  To submit, just post and be patient, or if ]
  1172. [ that fails mail your article to <comp-ai@moderators.isc.org>, and ]
  1173. [ ask youa news administrator to fix the problems with your system. ]
  1174.