home *** CD-ROM | disk | FTP | other *** search
/ Handbook of Infosec Terms 2.0 / Handbook_of_Infosec_Terms_Version_2.0_ISSO.iso / text / rfcs / rfc0744.txt < prev    next >
Text File  |  1996-05-07  |  11KB  |  238 lines

  1.  NWG/RFC  744                                   JS5 8-Jan-78 21:59  42857 Network Working Group                                     Joanne Sattley Request for Comments: 744                                        JZS@CCA NIC: 42857                                                8 January 1978 
  2.  
  3.               MARS - A Message Archiving & Retrieval Service 
  4.  
  5.  I.    Introduction       ------------ 
  6.  
  7. This document describes a Message Archiving  and  Retrieval  Service (MARS) which has been developed at Computer Corporation of America; it utilizes the Datacomputer, a network database utility developed by CCA for  ARPA.   [Research  and development of a prototype MARS system was supported by the Defense Advanced  Research  Projects  Agency  of  the Department  of  Defense,  under the ARPA Very Large Databases program, and was monitored by the Office of Naval Research under  Contract  No. N00014-76-C-0991.] 
  8.  
  9. The  Service  is  available,  primarily,  to  groups  for  storage  of teleconferencing transcripts.  Is is also available, upon request,  to individual ARPANET correspondents. 
  10.  
  11. There  are  both  'public'  and  'private'  messages  in the database. Public messages may be retrieved by  anyone.   The  public  collection includes  the  messages of the Header-People [@ MIT-MC] group, and the MsgGroup [@ USC-ISI] proceedings. 
  12.  
  13. Private messages may be retrieved only by the users who have  archived them,  or anyone whose name appears on the list of message recipients. 
  14.  
  15. Messages archived using MARS are heavily indexed and can be  retrieved in  a  variety  of  ways,  including  Boolean  combinations of message recipients, message composition date, any text words  in  the  message subject,  and text words in the message body.  The MARS facilities are integrated  very   naturally   into   the   existing   collection   of message-handling tools: 
  16.  
  17.    . A message is designated for archiving by sending it to      MARS-Filer @ CCA using one of the usual message-mailing tools such      as SNDMSG. 
  18.  
  19.    . A message is designated for retrieval by sending a request as      ordinary mail to MARS-Retriever @ CCA. 
  20.  
  21. The  Filer  program  checks for mail every hour; the Retriever program checks every quarter-hour.  The periodicity can  be  altered  to  meet demand  but  the intent is for MARS to operate as a background job and only during extremely low-activity periods. 
  22.  
  23. The next section (II) describes  the  indexing  operation  in  greater detail,  and  how  to archive and retrieve messages.  The last section (III) is an extractable user card. 
  24.  
  25.                                                                  [Page 1]
  26.  
  27.  
  28. NWG/RFC  744                                   JS5 8-Jan-78 21:59  42857 MARS - A Message Archiving & Retrieval Service 
  29.  
  30.  
  31.  
  32. II.       Using MARS           ---------- 
  33.  
  34. A.  Message Indexing     ---------------- 
  35.  
  36. For each message, a vector of parsed tokens is  created.   The  parsed tokens are collected by the message-field in which they occurred -- to be  used  as  "indexes",  i.e.,  values  of  inverted  fields,  by the Datacomputer. 
  37.  
  38. The Filer "indexes", essentially  without  analysis,  except  for  the following: 
  39.  
  40.    --  Each distinguishable section of the message is indexed        separately; each header line is a separate inversion domain, as        is the body of the message. 
  41.  
  42.    --  The header lines which contain ARPANET addresses are analyzed in        order to index separately on mailbox and host. 
  43.  
  44.    --  The date-field is parsed and converted to the standard Tenex        internal date/time format, which is better adapted for        less-than/greater-than comparisons, as in retrievals which        specify a date range. 
  45.  
  46.    --  One-character words in both the subject-field and the        message-text field arbitrarily discarded. 
  47.  
  48.    --  Two-character words in the message-text field are arbitrarily        discarded. 
  49.  
  50.    --  Hyphenated phrases, i.e., words bound together by hyphens, are        retained intact. 
  51.  
  52.    --  All message formats which conform to RFC  733 standards are        accommodated.  The minimum requirements are:  a date-field, a        from-field, and a blank line between the message-header and        message-body. 
  53.  
  54.  
  55.  
  56.  
  57.  
  58.  
  59.  
  60.  
  61.  
  62.  
  63.  
  64.  
  65.  
  66.                                                                 [Page 2]
  67.  
  68.  
  69. NWG/RFC  744                                   JS5 8-Jan-78 21:59  42857 MARS - A Message Archiving & Retrieval Service 
  70.  
  71.  
  72.  
  73. B.  To Archive Messages     ------------------- 
  74.  
  75. There  are  three modes of filing currently supported by MARS, to wit: 
  76.  
  77.    --  single-message mode, wherein the MARS-Filer mailbox appears in        the message as an addressee; 
  78.  
  79.    --  forwarded-message mode, wherein the MARS-Filer mailbox appears as        the only primary recipient; 
  80.  
  81.    and 
  82.  
  83.    --  batch mode, wherein the mailing envelope is addressed to        MARS-Filer and the subject-field contains the keyword "batch". 
  84.  
  85. Until the ARPANET standard for the format of messages  is  implemented universally, the variability amongst formats is still greater than the Filer can handle as it stands.  Nonetheless, a user  can  successfully file  any  message in a "foreign" format by forwarding it to the Filer under the aegis of a mail-handling program  which  does  produce  good formats.   Admittedly, the correct header-field indexing, as described above, will not be done on the enclosed message;  but  at  least,  the words  in  its unreadable header fields will appear as "text" words in the indexing. 
  86.  
  87. In the case of forwarded-message-mode filing, all interesting indexing information is extracted from the  message-header  of  the  forwarding envelope  prior  to discarding it.  The name of the archiver, the date and time the message was forwarded, and the  subject-line  information are   recorded.   The  remainder  is  handled  as  though  it  were  a non-forwarded message which had been CC'd to the Filer. 
  88.  
  89. A forwarded message may be 'annotated' by adding  text  (e.g.,  notes, comments, keywords) in the forwarding envelope.  Annotations are filed and retrieved as part of the archived message. 
  90.  
  91. In  the  case  of  batch-mode filing, only the archiver's name and the date and time s/he sent the package are  extracted  from  the  mailing envelope.   The  message-body  portion  is then treated as a series of individual messages. 
  92.  
  93.  
  94.  
  95.  
  96.  
  97.  
  98.  
  99.  
  100.  
  101.  
  102.  
  103.                                                                 [Page 3]
  104.  
  105.  
  106. NWG/RFC  744                                   JS5 8-Jan-78 21:59  42857 MARS - A Message Archiving & Retrieval Service 
  107.  
  108.  
  109.  
  110. C.  To Retrieve Messages     -------------------- 
  111.  
  112. Retrievals are initiated by sending a Retrieval Request  (which  is  a specially   formatted  message)  to  "MARS-Retriever@CCA".   Retrieved messages are mailed back, one at a time, and will appear as  new  mail in the requester's mailbox. 
  113.  
  114. Retrieval  Request  messages  can be composed using any SNDMSG-type of program, as follows: 
  115.  
  116.    . The recipient of the RR message must be MARS-Retriever @ CCA 
  117.  
  118.    . Other message header fields are ignored for now 
  119.  
  120.    . The message body portion of the RR is used to compose Datalanguage      for performing the retrieval.  Its format resembles a message      header, or selected portions thereof. 
  121.  
  122. The following list defines which field names are recognized, and  some notes  on  their  interpretation.   The  scanning  of  each  field  is terminated by a carriage-return. 
  123.  
  124.    DATE:     The format of the date field is day-month-year.  Use of              hyphens is optional.  This field will cause  only those              messages composed on the specified date to be retrieved. 
  125.  
  126.    AFTER:    Use of this field will  retrieve  messages  composed after              the specified date. 
  127.  
  128.    SINCE:    This field is interpreted like the AFTER: field. 
  129.  
  130.    BEFORE:   Use of this field will  retrieve  messages  composed before              the specified date. 
  131.  
  132.    UNTIL:    This field is interpreted like the BEFORE: field. 
  133.  
  134.    FROM:     This field is expected to contain  a  valid  mailbox name.              The host specification is optional.  If more than one name              is specified, ORing of  the  names  is implicit.              Retrieval  based upon host specification alone has not been              implemented. 
  135.  
  136.    TO:       This field is expected to contain one or more  valid              mailbox  names.  The host specification is optional. Spaces              and commas between the names imply AND. 
  137.  
  138.  
  139.  
  140.  
  141.  
  142.                                                                  [Page 4]
  143.  
  144.  
  145. NWG/RFC  744                                   JS5 8-Jan-78 21:59  42857 MARS - A Message Archiving & Retrieval Service 
  146.  
  147.  
  148.  
  149.    SUBJECT:  Use of this field will retrieve all  messages  whose              indexed  subject-field  contents match the specified              word(s).  Spaces and commas imply AND.  The  use  of OR              must be explicit. 
  150.  
  151.    TEXT:     Use of this field will retrieve all  messages  whose              indexed  message-body  contents  match the specified              word(s).  Spaces and commas imply AND.  The  use  of OR              must be explicit. 
  152.  
  153. An  interactive  TENEX-based  program  for composing RRs is available; the filename is "RR.SAV".  A copy of this program  is  stored  on  the Datacomputer, available via DFTP under node COMMON>MARS. 
  154.  
  155. There  is  also  a  copy  of the program in CCA's directory at SRI-KA; another in the CCA-ACCAT directory at ISIA. 
  156.  
  157.  
  158.  
  159.  
  160.  
  161.  
  162.  
  163.  
  164.  
  165.  
  166.  
  167.  
  168.  
  169.  
  170.  
  171.  
  172.  
  173.  
  174.  
  175.  
  176.  
  177.  
  178.  
  179.  
  180.  
  181.  
  182.  
  183.  
  184.  
  185.  
  186.  
  187.  
  188.  
  189.  
  190.  
  191.                                                                  [Page 5]
  192.  
  193.  
  194. NWG/RFC  744                                   JS5 8-Jan-78 21:59  42857 MARS - A Message Archiving & Retrieval Service 
  195.  
  196.  
  197.  
  198. III.      MARS User Card           -------------- 
  199.  
  200. ::  Archiving     --------- 
  201.  
  202. Individual Messages 
  203.  
  204.    . Include MARS-Filer@CCA on message distribution list 
  205.  
  206.    . Forward message to MARS-Filer@CCA [Annotation is optional.] 
  207.  
  208. Batches of Messages 
  209.  
  210.    . Incorporate the mail file as the message-body of a single      message sent to MARS-Filer@CCA with the clue "BATCH" in its      subject-field. 
  211.  
  212. ::  Retrieving     ---------- 
  213.  
  214. Using RR Program 
  215.  
  216.    . RR is a TENEX-based interactive program designed to prepare      Retrieval Request messages and to mail them to MARS-Retriever@CCA. 
  217.  
  218. Using SNDMSG-Type Program 
  219.  
  220.    . Send a message to MARS-Retriever@CCA, specifying the retrieval      criteria in the body of the message. 
  221.  
  222. Sample Retrieval Criteria 
  223.  
  224. SUBJECT:RFC 733 or RFC733     ; OR must be explicit 
  225.  
  226. TEXT:MARS Project,goals       ; spaces & commas imply AND 
  227.  
  228. DATE: 14 November 1977 SINCE: 1 Nov 77               ; same as AFTER: 1 Nov 77 AFTER: 1  Dec 1977 UNTIL: 15 January 1978        ; same as BEFORE: 15 January 1978 BEFORE: Aug 7 76 
  229.  
  230. FROM:  JZS@CCA         ; host specification is optional FROM:  Hacker,JZS      ; comma implies OR (in FROM: field only) 
  231.  
  232. TO:  CCA@SRI-KA     ; host specification is optional TO:  SDD-0:,SDD-1:  ; spaces and commas imply AND 
  233.  
  234.  
  235.  
  236.                                                                  [Page 6]
  237.  
  238.