home *** CD-ROM | disk | FTP | other *** search
/ Usenet 1994 October / usenetsourcesnewsgroupsinfomagicoctober1994disk1.iso / answers / faqs / minimal-digest-format next >
Encoding:
Text File  |  1994-10-08  |  9.6 KB  |  248 lines

  1. Newsgroups: news.admin.misc,news.software.readers,news.answers
  2. Path: bloom-beacon.mit.edu!hookup!hookup!nic.ott.hookup.net!ecicrl!clewis
  3. From: clewis@ferret.ocunix.on.ca (Chris Lewis)
  4. Subject: FAQs: A Suggested Minimal Digest Format
  5. Summary: A suggested digest format for USENET FAQs.
  6. Message-ID: <digestfaq_781536005@ferret.ocunix.on.ca>
  7. Supersedes: <digestfaq_780326405@ferret.ocunix.on.ca>
  8. Approved: news-answers-request@mit.edu
  9. Date: Fri, 7 Oct 1994 13:20:09 GMT
  10. Expires: Fri, 4 Nov 1994 13:20:05 GMT
  11. Reply-To: digfaq@ferret.ocunix.on.ca (Digest FAQ commentary reception)
  12. Organization: Elegant Communications Inc., Ottawa, Canada
  13. Keywords: faqs digest format
  14. Followup-To: poster
  15. Lines: 230
  16. Xref: bloom-beacon.mit.edu news.admin.misc:23223 news.software.readers:10289 news.answers:26943
  17.  
  18. Archive-name: faqs/minimal-digest-format
  19. Posting-frequency: every 20 days
  20. Last-modified: Tue Aug 16 20:45:15 EDT 1994
  21.  
  22.         FAQs: A Suggested Minimal Digest Format
  23.                Chris Lewis
  24.         clewis@ferret.ocunix.on.ca
  25.  
  26. Changes: surround URLs with angle brackets.
  27.    
  28. ------------------------------
  29.  
  30. Subject: 1. Introduction and Intent
  31.  
  32. The intent of this FAQ is to provide current and future FAQ maintainers
  33. with a simple description of a minimal format for FAQs.  This minimal
  34. format is a simplification of RFC1153 digest format that is sufficient
  35. to be compatible with common newsreader digest handling functionality,
  36. current practise, and Thomas Fine's "FAQ digest format to HTML"
  37. converter which allows more sophisticated viewing on HTML-aware systems
  38. such as Mosaic or WWW.  There are other more sophisticated formats that
  39. you can use, but this is the simplest one that is compatible with a wide
  40. range of software that understands digest format.
  41.  
  42. This format is entirely optional.  But it is designed to give you the
  43. biggest "bang per buck" in terms of existing software compatibility and
  44. minimum effort.  If you believe that your FAQ can benefit from more
  45. sophisticated formats, by all means use them.  As such, this FAQ can be
  46. simply considered a guide on how to take advantage of some basic digest
  47. capabilities in end-user viewing software.
  48.  
  49. Rather than confuse the issue by documenting all of the variation
  50. allowed by existing practise and software, this documents a single
  51. variant.  However, it can be extended by reviewing the documentation
  52. for Thomas Fine's FAQ to HTML converter.
  53.  
  54. This FAQ is written entirely in the minimal digest format, and can be
  55. used as an example.  You can skip from one section to the next
  56. by pressing ^G in many newsreaders, such as rn, trn and strn.
  57.  
  58. This FAQ describes only how FAQ sections should be delimited, and
  59. a couple of suggestions for meta-references to such things as FTP
  60. or WWW repositories in formats that other tools support.
  61.  
  62. Note to reader software implementors: you should not take this format
  63. as gospel, instead, use it as a guide to one minimal format of many
  64. more sophisticated ones.  You should really be reading RFC1153,
  65. Thomas Fine's material, and consulting news.answers for how FAQS
  66. are formatted in real life.  See "Newsreader/Converter Specifics"
  67. for descriptions of how some newsreaders work with digest-like documents.
  68.  
  69. ------------------------------
  70.  
  71. Subject: 2. Table of Contents
  72.  
  73.     1. Introduction and Intent
  74.     2. Table of Contents
  75.     3. What Should the Overall FAQ Look Like?
  76.     4. What's a Section, and How is it Formatted?
  77.     5. What is the Table of Contents Format?
  78.     6. What are External Meta References,
  79.         and What is Their Format?
  80.     7. Where Do I need to Look for Other Information?
  81.     8. Newsreader/Converter Specifics
  82.  
  83. ------------------------------
  84.  
  85. Subject: 3. What Should the Overall FAQ Look Like?
  86.  
  87. Most FAQs lend themselves to a format like:
  88.  
  89.     <news headers>
  90.     <news.answers required headers if the FAQ is registered>
  91.     <title and author>
  92.     <section>
  93.     <section>
  94.     <section>
  95.     <section>
  96.  
  97. While FAQs aren't always lists of questions and answers, they usually
  98. have "sections" of text -- whether they be sets of lists, individual
  99. Q&A's, groups of Q&A, textual sections, whatever.  The digest format
  100. is all about how these sections should be delimited for automatic parsing.
  101.  
  102. ------------------------------
  103.  
  104. Subject: 4. What's a Section, and How is it Formatted?
  105.  
  106. A "section" is merely a block of text.  In many FAQs they are simply
  107. the introduction paragraph, the table of contents, and each question
  108. and answer.  Through the use of digest format, most newsreaders can
  109. skip from section to section using the convention presented here, and
  110. more sophisticated packages can hypertext them.
  111.  
  112. A "section" consists of:
  113.  
  114.     <blank line>
  115.     <string of 30 hyphens>
  116.     <blank line>
  117.     Subject: <subject line>
  118.     <additional optional RFC822-like headers>
  119.     <blank line>
  120.     <text>
  121.  
  122. Note that the string of hyphens and "Subject:" must start in column one.
  123. "Subject:" has one space or tab between it and the subject line.  If you have
  124. to put "Subject:" in and don't want it interpreted as a section header, just
  125. make sure that it isn't in column one (just like above).  If your subject
  126. line is too wide to fit in 80 columns, you can continue it onto the next
  127. lines, with whitespace at the beginning of the following lines.  Example:
  128.  
  129.     Subject: this is a long........
  130.         subject line
  131.  
  132. The subject can be any arbitrary string of text.  You may wish to use
  133. a numbering scheme, for it makes it easier for your readers to "grep"
  134. down to the precise section they want.
  135.  
  136. You can place additional RFC-like headers after the Subject, such as
  137. "From:", "Date:" etc.  Again, these headers should start in column
  138. one.  There should be no blank lines in the entire set of headers
  139. in a section.
  140.  
  141. The text is free format ASCII and may be formatted any way you wish.
  142.  
  143. Current FAQ maintainers take note: if you're already using a consistent
  144. format for your FAQ, converting to this format will often require only
  145. one or two global edit commands.
  146.  
  147. ------------------------------
  148.  
  149. Subject: 5. What is the Table of Contents Format?
  150.  
  151. The Table of Contents simply consists of the subject lines from the rest
  152. of the FAQ, excluding "Subject:", and preferably indented.  The subject lines
  153. should be exact copies of the section headers.
  154.  
  155. This is only a suggestion.  There is no existing software that parses this
  156. data.  The intent of using exactly the same strings as the subjects is
  157. so that users can use search mechanisms to find specific sections.  If the
  158. subject line is too long to fit in a table of contents line, it is suggested
  159. that you truncate it at a convenient point - the search will still work.
  160.  
  161. ------------------------------
  162.  
  163. Subject: 6. What are External Meta References,
  164.     and What is Their Format?
  165.  
  166. Many of the more sophisticated viewers can "jump" from one FAQ to the
  167. next, retrieve data via FTP, or send email simply by "pointing at"
  168. properly formatted "tags" in your FAQ.  This FAQ recommends "URL"
  169. format tags.  See Section 7 for a reference.
  170.  
  171. If your FAQ refers to a FTP-able file, use this format:
  172.  
  173.     ftp://<inet>/<str>/<str>
  174.  
  175. Where "<inet>" is the Internet domain name of the server, and the rest
  176. of the "<str>/<str>" is the file name.  If you want to refer to a directory,
  177. leave a trailing "/".
  178.  
  179. This string can be anywhere in the document, inline with text or whatever.
  180.  
  181. Similarly, for html (hypertext markup language)-compatible documents,
  182. use http://<inet>/<str>/<str>
  183.  
  184. | For clarity, it's best to surround the URL with angle brackets to make
  185. | it easier to parse.  This FAQ uses this convention, ie:
  186.  
  187. |    <ftp://ftp.uunet.ca/distrib/chris_lewis/hp2pbm/>
  188.  
  189. | One difficulty with URLs is that they're often quite long.  Do not
  190. | break them in the middle, or they won't work.  It is suggested that
  191. | if the URL is too long to fit, start a new line with the URL.  Even
  192. | if it does look rather ugly, it's better than not working, or wrapping
  193. | beyond the 80th column.
  194.  
  195. ------------------------------
  196.  
  197. Subject: 7. Where Do I need to Look for Other Information?
  198.  
  199. [These seemed relevant, but I need descriptions!]
  200. <http://www.cis.ohio-state.edu/hypertext/usenet/faq-format/www/faq.html>,
  201. <http://www.cis.ohio-state.edu/hypertext/faq/usenet/faq-format/top.html>
  202. <http://www.cis.ohio-state.edu/hypertext/faq/usenet/technical-notes/faq.html>
  203.  
  204. John E. Goodwin's <JEGOODWIN@delphi.com> "Elements of E-Text Style,
  205.  
  206. URL format: <ftp://info.cern.ch/pub/www/doc/url-spec.txt>
  207.  
  208. ------------------------------
  209.  
  210. Subject: 8. Newsreader/Converter Specifics
  211.  
  212. Rn, trn, and strn "^G" functionality skips to the next occurance of
  213. "Subject:" in column one.
  214.  
  215. GNUs has two "digest" parsers.  One insists on full RFC1153 compliance
  216. (main Subject: line "digest" tokens etc.), and the other skips to lines
  217. with (at least 8?) hyphens starting in column 1.
  218.  
  219. Tin has no digest functionality at present, though, tin's author indicates
  220. willingness to add it in a way compatible with this format.  This author
  221. suggests either the "^Subject:" or "^-*" approach.
  222.  
  223. Nn triggers on Subject: plus From:.  Which is often not applicable
  224. to FAQs.  Nn "explodes" FAQs with both Subject: and From: subheaders
  225. into individual articles.  Most nn users this author has discussed this
  226. with do not want FAQs to behave this way, which is why this format doesn't
  227. require "From:" lines.
  228.  
  229. Thomas Fine's FAQ to HTML conversion system uses a scoring system to
  230. measure compliance with the:
  231.  
  232.     <blank line>
  233.     <line of hyphens>
  234.     <blankline>
  235.     Subject: <subject>
  236.  
  237. format.  See the following for more detail:
  238.  
  239. <http://www.cis.ohio-state.edu/hypertext/faq/usenet/faq-format/top.html>
  240.  
  241. I would appreciate detail on digest/FAQ parsing in other newsreaders and
  242. conversion systems.
  243. -- 
  244. Chris Lewis: _Una confibula non sat est_
  245. Phone: Canada 613 832-0541  Ferret list: ferret-request@ferret.ocunix.on.ca
  246. Latest psroff: FTP://ftp.uunet.ca/distrib/chris_lewis/psroff3.0pl17/*
  247. Latest hp2pbm: FTP://ftp.uunet.ca/distrib/chris_lewis/hp2pbm/*
  248.