home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #16 / NN_1992_16.iso / spool / comp / std / unix / 350 < prev    next >
Encoding:
Internet Message Format  |  1992-07-28  |  3.8 KB

  1. Path: sparky!uunet!uunet!not-for-mail
  2. From: les@chinet.chi.il.us (Leslie Mikesell)
  3. Newsgroups: comp.std.unix
  4. Subject: Re: Your chance to contribute to new POSIX archive format
  5. Date: 29 Jul 1992 00:28:09 -0700
  6. Organization: Chinet - Public Access UNIX
  7. Lines: 79
  8. Sender: sef@ftp.UU.NET
  9. Approved: sef@ftp.uucp (Moderator, Sean Eric Fagan)
  10. Message-ID: <155ha9INNlrq@ftp.UU.NET>
  11. References: <14q4alINNate@ftp.UU.NET> <152l4tINNist@ftp.UU.NET>
  12. NNTP-Posting-Host: ftp.uu.net
  13. X-Submissions: std-unix@uunet.uu.net
  14.  
  15. Submitted-by: les@chinet.chi.il.us (Leslie Mikesell)
  16.  
  17. In article <152l4tINNist@ftp.UU.NET> peter@ferranti.com (Peter da Silva) writes:
  18. >Submitted-by: peter@ferranti.com (Peter da Silva)
  19.  
  20. >I'm not familiar with the ISO1001 format, but I would like to suggest a textual
  21. >self-documenting format, like RFC822. You don't need to put the actual field
  22. >names in every file header if you establish a property file at the beginning of
  23. >the archive. For example:
  24. >    FieldCodeset: ASCII
  25. >    FieldSeparator: <0A>
  26. >[ these two would be required for the initial header, and need to be in an
  27. >  agreed on language. ]
  28.  
  29. What's a field?  And why so verbose in something that will only be
  30. parsed by programs or people who better know what they are doing?
  31. How about short abbreviations for the common header items?
  32.  
  33. >    HeaderLength: 96
  34. >    BodyLength: 0
  35. >    Common: HeaderLength,BodyLength,FileName,ModificationTime,Owner
  36. >[ This establishes the common fields until the next Common field ]
  37. >    2746
  38. >    13995
  39. >    usr/local/src/pax/Makefile
  40. >    19920723.194516.0001
  41. >    peter
  42. >[ These are the header length, body length, filename, etcetera for the first
  43. >  file ]
  44.  
  45. What's the advantage of this over explicit token/value pairs for each header
  46. item?  If you don't repeat the token for each item, how will you recover
  47. from errors where the initial description is lost?  
  48.  
  49. I agree with the concept though.  We should only need one format for
  50. encapsulating any attributes that any OS might need to carry around
  51. if it is done with header records that can be added as necessary.
  52. Textual components can be noted as such for conversion as necessary
  53. to extract on any other system.  Other data types can be identified
  54. to the extent possible and the type of encoding/encryption/compression
  55. can be noted per-item.  Using a mailable encoding should produce a
  56. mailable archive (i.e. the header fields should be textual). 
  57.  
  58. >This should require a minimal amount of additional space, and would be
  59. >indefinitely extensible. Older versions of the archive program could
  60. >discard unknown headers, or stick them in a file somewhere for later
  61. >messing around with.
  62.  
  63. Not only older versions will have to deal with this but versions under
  64. different OS's that don't have the same storage concepts. 
  65.  
  66. >>     - The archive must be able to be stored on as many media types
  67. >>       as possible, including but not limited to 9-track and streaming 
  68. >>       tape, diskette, CDROM, ftp files, etc.
  69.  
  70. One thing that is needed here is to be able to generate multi-part
  71. archives, possibly spliting files across media, with the ability
  72. to extract files from any single part directly.   
  73.  
  74. >>         - Compression of individual files in the archive
  75.  
  76. Yes, and the compression should restart as you go to new media to allow
  77. the above splitting to work, or the header should note that the file
  78. can only be extracted as a continuation.
  79.  
  80. >>         - Direct mailability of the archive file (without translation,
  81. >>           such as through uuencode)
  82.  
  83. This should be a possibility by using an appropriate encoding but not
  84. enforced for backup media.   For backup purposes the archiver should
  85. be able to note the current contents of directories and which of those
  86. items are included in the archive (like GNU tar with the -G option).
  87. This allows restoring incremental backups without accumulating the
  88. files that were deleted between the runs.
  89.  
  90. Les Mikesell
  91.   les@chinet.chi.il.us
  92.  
  93. Volume-Number: Volume 28, Number 65
  94.