home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #16 / NN_1992_16.iso / spool / alt / gopher / 1095 < prev    next >
Encoding:
Text File  |  1992-07-27  |  5.4 KB  |  127 lines

  1. Newsgroups: alt.gopher
  2. Path: sparky!uunet!snorkelwacker.mit.edu!thunder.mcrcim.mcgill.edu!sifon!news
  3. From: peterd@bunyip.com (Peter Deutsch)
  4. Subject: Re: index for all of gopherspace - try the new archie...
  5. Message-ID: <1992Jul28.001000.8292@sifon.cc.mcgill.ca>
  6. Sender: news@sifon.cc.mcgill.ca
  7. Nntp-Posting-Host: expresso.cc.mcgill.ca
  8. Organization: Bunyip Information Services (the archie people)
  9. References: <a-steiner-270792125230@steiner.acns.nwu.edu>
  10. Distribution: na
  11. Date: Tue, 28 Jul 1992 00:10:00 GMT
  12. Lines: 113
  13.  
  14. In article <a-steiner-270792125230@steiner.acns.nwu.edu>  
  15. a-steiner@nwu.edu (Albert Steiner) writes:
  16. > In article <1992Jul27.163746.974@nstn.ns.ca>, daniel@nstn.ns.ca  
  17. (Daniel
  18. > MacKay) wrote:
  19. > > 
  20. > > Then- we just run an index on the abstracts, and gopher managers  
  21. can put a
  22. > > search item onto their menus- something like "Gopherspace Resource  
  23. Search"
  24. > > that points to the central registry.
  25. > > 
  26. > > Our hapless user picks it, and asks for "recipies" or "food" or  
  27. "cooking"
  28. > > and gets a pointer back to the resource- whereever it is. (who  
  29. cares where
  30. > > it is?)
  31.  
  32. Actually, as we discovered with archie, they will care once they find 
  33. they get the same thing from multiple sites, and once is on the same 
  34. regional network and one is behind three slow pipes to Europe or 
  35. Australia.
  36.  
  37. > , Canada
  38. > This is an idea I think is very important.  I would like to see a way  
  39. to
  40. > encode an address in "about" entries for "important" directory  
  41. levels. 
  42. > When the server selected an about entry with pointer, it would  
  43. separate the
  44. > entry and the pointer into two items returned to the client.  The  
  45. first
  46. > item is the about, the second item is a directory entry to the actual
  47. > location else where.
  48. > This still leaves the problem of verifying that the index's are up to  
  49. date.
  50. > Perhaps they should be checked every week.  The original directory  
  51. checked
  52. > again for its "about" file, the directory address added, and reposted  
  53. in
  54. > the directory of directories.  In addition, new entries could be  
  55. added by
  56. > mailing the address of a new "interesting" directory to the "index  
  57. master"
  58.  
  59. While talking about indexing Gopherspace, the next release of archie 
  60. will allow gathering of arbitrary collections of information and as our 
  61. first demo of its new capabilities we plan to convert the existing 
  62. archie.mcgill.ca into a pilot Internet Yellow Pages service (we figure
  63. there are enough primary archies out there now, and we want to
  64. demo the new software on an unsolved problem). This will track all 
  65. sorts of services, not just anonymous FTP, and we plan to put
  66. in pointers to the various Gopher servers as a proof of concept.
  67.  
  68. The idea is that archie will revisit your server periodically to a) 
  69. verify you're still alive, and b) pick up a description of your site in 
  70. some format (provided you can give this to us). We were planning to 
  71. look into asking the Gopher gang to standardize on such site 
  72. descriptions as we set things up. Sound reaonable? Have such standards 
  73. been worked out and I missed it?
  74.  
  75. A simple twist on this would be to build a "Gopher archie", which 
  76. in effect indexes every Goperh entry (as we do now for the 2,100,000 
  77. entries in anonymous FTP). Users would then be able to search for 
  78. specific items in the "Gopher archie" databases. Carrying this further,
  79. you could allow a hierarchy of textual "descriptions", which could
  80. be picked up and indexed for rapid searching.
  81.  
  82. Now, the missing link here seems to be a simple way to get the index
  83. info out of Gopher. One alternative (kinda kludgy, but it would work)
  84. is to build such info "off-line" and offer it through anonymous FTP
  85. (our work through IAFA is aimed at standardizing ways of encoding
  86. this kind of stuff for tools such as our to pick up and this could
  87. be a candidate for a "Services" template).
  88.  
  89. Another approach is a simple extension to the Gopher protocol to allow 
  90. us to say "dump the equivalent of ls -lR" to the sender and have
  91. the server give back the entire listing in a format we can parse, or
  92. even "dump your hierarchy of descriptions files".
  93.  
  94. There are people more qualified in Gopherspeak than I am in this group 
  95. who might want to comment on the feasibility (and desirability) of 
  96. doing this, but we basically are testing the code to do the general 
  97. gathering and database building now.
  98.  
  99. If you guys gave us the data gathering capability, we are just about
  100. ready to periodically pick the stuff up and drop it into the 
  101. appropriate archie database and  index if for you. At that point it 
  102. would look pretty much like the anonFTP archie as far as the user was 
  103. concerned, with the word anonFTP crossed out and the word "Gopher" 
  104. written in in red crayon. Of course, Gopher already has a gateway
  105. to archie, so accessing this service from Gopher is a done deal.
  106.  
  107. FYI, the next release will have support for WAIS databases out
  108. of the box, so indexing large text files will be easy. The new
  109. architecture is designed to allow arbitrary data gathering, parsing
  110. and database maintenance, so you should be able to build almost any
  111. database you want out of distributed information. Anything up to a 
  112. couple of Gigabytes of information seems feasible with a combination
  113. of WAIS, cheap disk space and enough workstations to handle the
  114. anticipated load (I think a Yellow Pages service could easily generate
  115. as much traffic as the anonFTP archie does now, maybe more).
  116.  
  117. Comments on this approach most welcome, as we are working now to get 
  118. things ready for the first live test in the next week or so.
  119.  
  120.  
  121.  
  122.                  peterd
  123.  
  124.  
  125.