home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #3 / NN_1993_3.iso / spool / comp / infosyst / gopher / 2067 < prev    next >
Encoding:
Internet Message Format  |  1993-01-25  |  2.6 KB

  1. Path: sparky!uunet!mcsun!uknet!yorkohm!nigelm
  2. From: nigelm@ohm.york.ac.uk (Nigel Metheringham)
  3. Newsgroups: comp.infosystems.gopher
  4. Subject: Re: Gopherising FAQ files
  5. Message-ID: <1993Jan25.183335.28005@ohm.york.ac.uk>
  6. Date: 25 Jan 93 18:33:35 GMT
  7. References: <1993Jan21.174815.17047@ohm.york.ac.uk>
  8. Organization: Electronics Department, University of York, UK
  9. Lines: 50
  10.  
  11. [Following up to my own posts - maybe I should just talk to myself]
  12.  
  13. In my previous article I wrote about the "gopher-ising" of Usenet
  14. FAQ files.  This would mean that on a gopher server you would see a
  15. list of FAQ directories, and in each directory you would see a set
  16. of entries each being one section (question/answer?) of an FAQ file.
  17.  
  18. Additionally there would be an index for each FAQ set, and ideally
  19. an index for all the FAQs from the top level.
  20.  
  21. Basically since FAQ files are free format we have to "persuade"
  22. gopher and WAIS to recognise their subsectioning.  Actually all you
  23. *need* to do is get them into a format that WAIS understands - you
  24. can then put together a set of gopher links (using range addressing)
  25. from the WAIS index.cat file with a simple piece of Perl.
  26.  
  27. FAQ files are mostly different from one another.  They also do not
  28. fit neatly into any of the known WAIS document types.  It would be
  29. quite easy to co-erce them into a pseudo mail-digest form, but this
  30. doesn't really present the right information (the From: field would
  31. tend to be redundant).
  32.  
  33. So of the types already handled by WAIS, it would seem best to munge
  34. FAQs into a dash separated format, where each section is separated
  35. by a line of dashes.   The first line following the dashes is the
  36. section identifier.  This leaves the FAQ still readable, but able to
  37. be directly indexed by WAIS.  A script can be written to modify most
  38. FAQ sets into this format quite easily.
  39.  
  40. the disadvantage is that the FAQs need to be rewritten (ie sepearate
  41. file store).
  42.  
  43. I have also, despite misplaced confidence, been unable to do
  44. anything similar with NeXT indexing (ie I had to go and build WAIS
  45. instead).  The NeXT indexer seems unable to cope with ranges within
  46. a file even if you replace the commands it uses to analyse a file
  47. (because the rotton thing stats the file before starting anything
  48. else, and it objects if you give it a gopher range type filename).
  49.  
  50.  
  51. I would appreciate it if anyone with strong feelings as to the
  52. "right" way to split FAQs would contact me about it before I do too
  53. much work on this technique!
  54.  
  55.     Nigel.
  56.  
  57. -- 
  58. #   Nigel Metheringham  -- (NeXT) EMail: nigelm@ohm.york.ac.uk    #
  59. #   System Administrator, Electronics Dept, University of York    #
  60. #   York YO1 5DD. Phone: +44 904 432374, Fax: +44 904 432335      #
  61.