home *** CD-ROM | disk | FTP | other *** search
/ The Best Internet Programs / BESTINTERNET.bin / latest / roadmap / map16.txt < prev    next >
Encoding:
Internet Message Format  |  1995-02-08  |  12.6 KB

  1. Date:         Tue, 7 Feb 1995 10:11:59 -0600
  2. From: BITNET list server at UA1VM (1.8a) <LISTSERV@UA1VM.UA.EDU>
  3. Subject:      File: "MAP16 LESSON"
  4.  
  5. MAP16: FTP FILE COMPRESSION
  6.  
  7.  
  8.      "Travel is glamorous only in retrospect." -- Paul Theroux,
  9.       quoted in The Observer
  10.  
  11.  
  12. Own a personal computer for any amount of time, and you will quickly
  13. realize that the amount of storage space on your computer is limited.
  14. One way to deal with this problem is to use a compression software
  15. package that "squishes" unused programs into small "boxes", thus
  16. freeing up a little more of your disk space for other programs.
  17.  
  18. It turns out that storage space problems are not limited solely to
  19. personal computers. As the numbers of files that are available
  20. through ftp increases daily, ftp sites are actively looking
  21. for ways to squeeze more files into a limited amount of space.
  22.  
  23. The ftp sites accomplish this by using file compression.
  24.  
  25. The good news is that a compressed file takes up a lot less space
  26. on the ftp site's computer. The bad news is that a compressed file
  27. is absolutely useless until you uncompress it.
  28.  
  29. Wait ... it gets worse. Before you can uncompress a file, you have
  30. to know what compression method was used to compress the file in
  31. the first place. Unfortunately, there is no one standard ftp file
  32. compression method -- there are HUNDREDS of different file compression
  33. methods in use today :(
  34.  
  35. If you have to know what compression method was used before you
  36. can uncompress a file, how are you ever going to figure out which
  37. method was used? Well, it is actually pretty easy:
  38.  
  39.      1. Most ftp directories have a READ.ME file that shows an
  40.         index of all the files that are in that directory. Some
  41.         really nice ftp sites have expanded READ.ME files that
  42.         include a mention about what compression method was used
  43.         and where you can get a free copy of the software needed
  44.         to uncompress the files.
  45.  
  46.      2. Look at the files' extensions. By looking at the extensions
  47.         and comparing them to the chart below, you will be able to
  48.         determine what compression method was used and what particular
  49.         software is needed to uncompress the file.
  50.  
  51. Fortunately, most uncompression software is either public domain (meaning
  52. that it is completely free) or shareware (meaning that you can get a copy
  53. of it for free, but the author expects you to send him some money for the
  54. program if you decide to keep it and use it). Best of all, most
  55. uncompression software is available through ftp! :)
  56.  
  57. The list below shows some of the most popular extensions that you
  58. are bound to encounter during your visits to ftp sites around the
  59. world. It also shows transfer modes needed to retrieve files with
  60. these extensions, what uncompress software package you need to
  61. to uncompress the files after you retrieve them, and it even gives
  62. some additional comments about each of the extensions.
  63.  
  64. Paraphrasing something I said in MAP01, I want you to be aware
  65. that the one compression method that isn't listed below is going
  66. to be the one compression package that you ADORE. Please do not
  67. take this personally. There are literally HUNDREDS of compression
  68. methods in use today, and there is no way that I can list all
  69. of them.
  70.  
  71. SUGGESTION: Save the following list, and use it as a reference tool
  72. for when you encounter an extension that you have never seen before :)
  73. Also, please notice that the following list talks about "archie".
  74. Archie is an FTP search tool that we will discuss tomorrow.
  75.  
  76. -----
  77.  
  78. (the following list was adapted from "The EFF's Guide to the Internet"
  79. by Patrick Crispen)
  80.  
  81. FILE           TRANSFER UNCOMPRESS
  82. EXTENSION      MODE     PACKAGE      ADDITIONAL COMMENTS
  83. ------------   ------   ----------   -----------------------------------
  84.  
  85. .txt or .TXT   ASCII                 By itself, this means the file is
  86.                                      a document rather than a program,
  87.                                      and does not need to be uncompressed
  88.  
  89. .ps or .PS     ASCII                 A PostScript document (in Adobe's
  90.                                      page description language). You can
  91.                                      print this file on any PostScript
  92.                                      capable printer or use a previewer,
  93.                                      like GNU project's GhostScript.
  94.  
  95. .doc or .DOC   ASCII                 Another common extension for text
  96.                                      documents. (Be careful, though: .doc
  97.                                      and .DOC extensions are also used for
  98.                                      Microsoft Word documents (which are
  99.                                      Binary files). The duck theory will
  100.                                      help you determine the difference)
  101.                                      No decompression is needed, unless it
  102.                                      is followed by: .Z
  103.  
  104. Binary                  uncompress   This indicates a Unix compression
  105.                                      method. To uncompress type
  106.  
  107.                                           uncompress filename.Z
  108.  
  109.                                      and hit enter at your host system's
  110.                                      command line.
  111.  
  112.                                      u16.zip is an MS-DOS program that
  113.                                      will let you download .Z files and
  114.                                      uncompress them on your own computer.
  115.                                      The Macintosh equivalent program is
  116.                                      called MacCompress (use archie to
  117.                                      find these).
  118.  
  119. .zip or .ZIP   Binary   PKZip or     This indicates the file has been
  120.                         Zip/Unzip    compressed with a common MS-DOS
  121.                                      compression program, known as PKZIP
  122.                                      (use archie to find PKZIP204.EXE).
  123.                                      Many Unix systems will let you un-ZIP
  124.                                      a file with a program called unzip.
  125.  
  126. .gz            Binary   gunzip       A Unix version of ZIP. To uncompress,
  127.                                      type
  128.  
  129.                                           gunzip filename.gz
  130.  
  131.                                      at your host system's command line.
  132.  
  133. .zoo or .ZOO   Binary   zoo          A Unix and MS-DOS compression
  134.                                      format. Use a program called zoo
  135.                                      to uncompress.
  136.  
  137. .shar or .Shar Binary   unshar       Another Unix format. Use unshar
  138.                                      to uncompress.
  139.  
  140. .tar           Binary   tar          Another Unix format, often used
  141.                                      to compress several related files
  142.                                      into one large file. All Unix
  143.                                      systems will have a program called
  144.                                      tar for "un-tarring" such files.
  145.                                      Often, a "tarred" file will also be
  146.                                      be compressed with the gz method,
  147.                                      so you first have to use uncompress
  148.                                      and then tar.
  149.  
  150. .sit or .Sit   Binary   StuffIt      A Macintosh format that requires
  151.                                      the StuffIt program.
  152.  
  153. .ARC           Binary   ARC or       Another MS-DOS format, which
  154.                         ARCE         requires the use of the ARC
  155.                                      or ARCE programs.
  156.  
  157. .LHZ           Binary   LHARC        Another MS-DOS format; requires
  158.                                      the use of LHARC.
  159.  
  160. "A few last words of caution: Check the size of a file before you get
  161. it. The Net moves data at phenomenal rates of speed.  But that 500,000-
  162. byte file that gets transferred to your host system in a few seconds
  163. could take more than an hour or two to download to your computer if
  164. you're using a 2400-baud modem.  Your host system may also have limits on
  165. the amount of bytes you can store online at any one time.  Also, although
  166. it is really extremely unlikely you will ever get a file infected with a
  167. virus, if you plan to do much downloading over the Net, you'd be wise to
  168. invest in a good anti-viral program, just in case." (1)
  169.  
  170.  
  171. FTPMAIL AND BINARY FILES
  172.  
  173. Yesterday, I showed you that it is possible to get ftp files
  174. using e-mail by sending an e-mail letter to one of the following
  175. addresses
  176.  
  177.           Australia      ftpmail@cs.uow.edu.au
  178.           France         ftpmail@grasp.insa-lyon.fr
  179.           Germany        ftpmail@ftp.uni-stuttgart.de
  180.           Great Britain  ftpmail@doc.ic.ac.uk
  181.           Ireland        ftpmail@ieunet.ie
  182.           Sweden         ftpmail@lth.se
  183.           USA            ftpmail@sunsite.unc.edu
  184.           USA            ftpmail@ftp.uu.net
  185.           USA            ftpmail@decwrl.dec.com
  186.  
  187. with the following commands in the body of your e-mail letter
  188.  
  189.           reply <your Internet address>
  190.           connect <ftp site address>
  191.           <transfer mode>
  192.           chdir <directory>
  193.           get <filename>
  194.           quit
  195.  
  196. Before I introduce you to the new stuff, there are a couple of
  197. things that I want to review with you.
  198.  
  199. First, the
  200.  
  201.           reply <your Internet address>
  202.  
  203. command tells the FTPmail address where you want the file sent.
  204. If you use the example that I gave you yesterday
  205.  
  206.           reply pcrispe1@ua1vm.ua.edu
  207.           connect ftp.sura.net
  208.           ascii
  209.           chdir /pub/articles
  210.           get fall91.issue
  211.           quit
  212.  
  213. without changing the reply address, FTPmail is going to send the
  214. file to *ME*, not to you :)
  215.  
  216. Please remember to change the reply line to include *YOUR*
  217. Internet e-mail address.
  218.  
  219. Also, I did not mention this yesterday, but FTPmail limits
  220. you to only one CHDIR command per letter.
  221.  
  222. Finally, yesterday I asked you to contact you local Internet
  223. service provider to see if they placed any size limits on
  224. file transfers. If they do, there is an additional command
  225. that you need to add to your list of commands
  226.  
  227.           chunksize <size>
  228.  
  229. This command will break the files into chunks that your
  230. system can handle. If your system has a 50,000 character
  231. limit on messages from the Internet, your chunksize
  232. command should be
  233.  
  234.           chunksize 49000
  235.  
  236. (you want to make sure that you set your chunksize below what
  237. your system's limits are). This command will break your file
  238. into 49,000 character chunks, and will then send the chunks
  239. to you :)
  240.  
  241. You already now how to retrieve ASCII text files using FTPmail.
  242. Today, I am going to show you how to retrieve Binary files using
  243. FTPmail.
  244.  
  245. Binary file transfers using FTPmail aren't difficult ... they
  246. just require a few additional steps. Because all e-mail has to
  247. be in ASCII form, FTPmail has to encode your Binary file in
  248. ASCII before it can e-mail the file to you. Once you get the
  249. file, you can then decode the file back into Binary :)
  250.  
  251. Fortunately, there are two ways that FTPmail can encode Binary
  252. files into ASCII. The first way it can do this is through something
  253. called "uuencode." As long as you have a uudecode program -- and
  254. uudecode programs are all over the place (chances are your site
  255. has uudecode stored on its system) -- the whole process is simple.
  256.  
  257. The second encoding type that you can use is called "btoa" (binary
  258. to ascii). Your local Internet service provider will be able to
  259. tell you a little more about btoa.
  260.  
  261. So, to get ASCII files using FTPmail, you would use the following
  262. commands in the body of your letter to the FTPmail address:
  263.  
  264.           reply <your Internet address>
  265.           connect <ftp site address>
  266.           ascii
  267.           chdir <directory>
  268.           chunksize <size>
  269.           get <filename>
  270.  
  271. and to get Binary files using FTPmail, you would use the following
  272. commands in the body of your letter to the FTPmail address:
  273.  
  274.           reply <your Internet address>
  275.           connect <ftp site address>
  276.           <uuencode or btoa>
  277.           chdir <directory>
  278.           <encoding type>
  279.           chunksize <size>
  280.           get <filename>
  281.  
  282. TOMORROW: - ARCHIE
  283.           - A *HUGE* LIST OF FTP SITES THAT YOU CAN VISIT
  284.  
  285. HOMEWORK
  286.  
  287.      Take a break. You've earned it :)
  288.  
  289.  
  290. SOURCES
  291.  
  292. (1) "The EFF's Guide to the Internet", reprinted by permission.
  293.  
  294.  
  295.    PATRICK DOUGLAS CRISPEN    THE VIEWS EXPRESSED IN THIS LETTER DO NOT
  296.     PCRISPE1@UA1VM.UA.EDU      NECESSARILY REPRESENT THE VIEWS OF THE
  297.   THE UNIVERSITY OF ALABAMA      UNIVERSITY OF ALABAMA - TUSCALOOSA
  298.  
  299.       ROADMAP: COPYRIGHT PATRICK CRISPEN 1994. ALL RIGHTS RESERVED.
  300.  
  301.