home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #16 / NN_1992_16.iso / spool / alt / gopher / 1115 < prev    next >
Encoding:
Internet Message Format  |  1992-07-29  |  5.4 KB

  1. Path: sparky!uunet!cis.ohio-state.edu!magnus.acs.ohio-state.edu!usenet.ins.cwru.edu!agate!ames!bionet!snorkelwacker.mit.edu!thunder.mcrcim.mcgill.edu!sifon!peterd
  2. From: peterd@cc.mcgill.ca (Peter Deutsch)
  3. Newsgroups: alt.gopher
  4. Subject: Re: index for all of gopherspace
  5. Message-ID: <1992Jul29.153142.2281@sifon.cc.mcgill.ca>
  6. Date: 29 Jul 92 15:31:42 GMT
  7. References: <1992Jul27.180509.27470@mercury.unt.edu> <1992Jul27.201122.17017@msuinfo.cl.msu.edu> <1992Jul28.194722.19492@nstn.ns.ca>
  8. Sender: news@sifon.cc.mcgill.ca
  9. Organization: Bunyip Information Systems (the archie people)
  10. Lines: 103
  11. Nntp-Posting-Host: expresso.cc.mcgill.ca
  12.  
  13. In article <1992Jul28.194722.19492@nstn.ns.ca> daniel@nstn.ns.ca (Daniel MacKay) writes:
  14. >Hello!
  15. .  .  .
  16. >Peter Deutsche writes:
  17.  
  18. First, a little administriva note - that's "Deutsch", not
  19. "Deutsche". Think of me as a noun, not an adjective... :-)
  20.  
  21.  
  22. >> While talking about indexing Gopherspace, the next release of archie 
  23. >> will allow gathering of arbitrary collections of information and ...
  24. >> [...]
  25. >> and we plan to put
  26. >> in pointers to the various Gopher servers as a proof of concept.
  27. >
  28. >I was describing my idea to a visitor to my office, and he suggested
  29. >exactly the same thing- there be a file with a well-known-name available on
  30. >every gopher that is authoritative for some resource.  This file would have
  31. >a wordy and search-rich description of the resources, i.e. an abstract for
  32. >the resource written in a way that it will be full of keywords that people
  33. >are likely to use when they're looking for it.  The one for the recipies
  34. >database would have words like "recipies" "food" "cooking" (but would it
  35. >contain an entry for "dessert" "entree"?  Hmm.)
  36.  
  37. Yup, this sounds like an IAFA-like template for each site
  38. admin to fill in, with liberal use of the "Keywords" and
  39. "Comments" fields.  I like this approach because it is
  40. easy for admins (so they'll do it) and has enough
  41. structure to make searching a lot easier.
  42.  
  43. >Peter's, or someone's, robot could sweep through the gopher servers
  44. >periodically, collect the files, and build the Index Into Gopherspace.
  45. >
  46. >My point: there are not *that* many things in gopherspace once you take
  47. >out all the redundancy.  If we only collect descriptions from people who
  48. >are authoritative for their resource, the problem dwindles into something
  49. >quite doable- think of how much smaller Peter's archie database would be if
  50. >there was only one entry in it for every ftp'able resource!
  51.  
  52. This is exactly what we are saying about anonFTP, too. I
  53. believe we have already reduced duplication to some extent
  54. with archie, since people now have some expectation that
  55. they can again find something, they no longer feel quite so
  56. inclined to store old copies. Of course, there is still a
  57. lot of "pack-ratting" going on. To address this completely
  58. we really need unique document identifers and resource
  59. serial numbers deployed to allow the tools to detect and
  60. eliminate the duplicates. Work is going on through the
  61. IETF to get these defined and deployed ASAP.
  62.  
  63. >Anyway, it results in an entity that's like a couple of things:
  64. > a) Peter's "whatis" project.
  65. > b) My gopherizing of the SRI NISC List-of-Lists, available on the
  66. >    nstn.ns.ca gopher; check it out as 
  67. >    Internet Resources
  68. >       Mail Lists
  69. >          Mail List Subject Search
  70. >
  71. >The important thing is that the *name* of something usually doesn't tell
  72. >you much about it.  So a robot indexing all the words of the menu items it
  73. >finds in gopherspace is relatively useless.  Someone carefully writing a
  74. >description of their resource, keeping in mind the kind of keywords a user
  75. >might use when looking for it, is *much* better.  Yeah, writing it is work.
  76. >But- garbage in, garbage out.  If you're authoritative for a resource,
  77. >presumably you should be able to take the time to describe the resource
  78. >once.
  79.  
  80. Again, this is exactly the same problem we found with our
  81. anonFTP experience and was a driving force behind our work
  82. with IAFA. Once we have a standardized way of encoding
  83. information, the tools can be deployed to index and search
  84. them (given that we now have archie, WAIS, etc they're
  85. already written, at this point).
  86.  
  87. >Peter continues:
  88. >> Now, the missing link here seems to be a simple way to get the index
  89. >> info out of Gopher.
  90. >I don't think that's much of a problem.  *The* thing that gopher's best at
  91. >is delivering documents.  And I think it's quite reasonable to have a
  92. >Well-Known-Directory containing descriptions of the data for which that
  93. >gopher is authoritative, (e.g. me and CA*Net news, Canadian Weather).
  94. >
  95. >On a related topic- Peter, does that mean that the archie data and the
  96. >whatis data will be integrated?  I had a complaint from a user the other
  97. >day that my gopher/archie gateway didn't deliver whatis data, and I
  98. >thought- right!  Why doesn't it?
  99.  
  100. Well, the info templates we gather will automate the
  101. maintenance of the "whatis" database, but I believe that
  102. the reason you can't get to the current archie whatis data
  103. is simply that the current Gopher gateway doesn't support
  104. the "whatis" command. This is a minor loss right now,
  105. since the database is not automatically maintained, but
  106. hopefully someone will improve the gateway once the new
  107. release is deployed to allow Gophereens to access all the
  108. new databases. If someone wants to join the 3.0
  109. client development team, drop us a line (actually, send
  110. the note to Alan Emtage "bajan@bunyip.com", since he's
  111. coordinating this work). We're just about to release stuff
  112. to the client writers for 3.0.
  113.  
  114.  
  115.                     - peterd
  116.