home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #26 / NN_1992_26.iso / spool / comp / archives / 3684 < prev    next >
Encoding:
Internet Message Format  |  1992-11-04  |  22.1 KB

  1. Path: sparky!uunet!usc!rpi!think.com!ames!agate!agate!usenet
  2. From: BEEKMAN@econ.umd.edu
  3. Newsgroups: comp.archives
  4. Subject: [sci.econ] EconData (FTP site)
  5. Followup-To: sci.econ
  6. Date: 5 Nov 1992 12:39:46 GMT
  7. Organization: University of Maryland
  8. Lines: 507
  9. Sender: adam@soda.berkeley.edu
  10. Approved: adam@soda.berkeley.edu
  11. Distribution: world
  12. Message-ID: <1db4miINN7ta@agate.berkeley.edu>
  13. References: <BEEKMAN.29@econ.umd.edu>
  14. NNTP-Posting-Host: soda.berkeley.edu
  15. X-Original-Newsgroups: sci.econ
  16. X-Original-Date: 28 Oct 92 21:49:05 GMT
  17.  
  18. Archive-name: auto/sci.econ/EconData-FTP-site
  19.  
  20.  
  21.                                 Guide to
  22.  
  23.                                 EconData
  24.  
  25.                   A Source of Economic Time Series Data
  26.                      from the University of Maryland
  27.                               1992 July 22
  28.  
  29.  
  30. This Guide tells how to use the EconData service of the University of
  31. Maryland.  Several hundred thousand economic time series, produced by
  32. the U.S. Government and distributed by the government in a variety of
  33. formats and media, have been put into a standard, highly efficient,
  34. easy-to-use form for personal computers and made publicly available
  35. through this service.  These series include various national accounts,
  36. labor information, price indices, current business indicators and
  37. industrial production, information on states and regions, and
  38. international data.  A more complete list of the series covered can be
  39. found in the file CONTENTS.DOC.  These series are all in the form of
  40. banks for the G regression and model building program and its public
  41. domain version, PDG.  The DOS version of PDG and the banks can be
  42. downloaded from the University's computer systems by anyone connected to
  43. Internet or, more slowly, by telephone.  The data have been put in this
  44. form by the INFORUM research group in the Economics Department.  The
  45. dissemination by computer network is made possible by the Computer
  46. Science Center.
  47.  
  48.  
  49. HOW TO GET THE DATA
  50.  
  51. EconData may accessed in three ways:
  52.  
  53.   1.   Through Internet using an ftp (file transfer protocol) for
  54.        "anonymous" login
  55.   2.   Through Internet using a Telnet package to use the "info"
  56.        interface (intended to make the downloading process easier).
  57.   3.   By modem and telephone at 1200 or 2400 baud.
  58.  
  59. The first two are far faster than the third, so we begin by describing
  60. them.
  61.  
  62.  
  63. Internet with the anonymous login.
  64.  
  65. Internet, is a computer network linking most of the major research
  66. universities in the United States and many other countries.  If you have
  67. obtained this document by way of Internet, you must know what is in this
  68. section.  If, however, you obtained it by mail or by dial-up modem or
  69. through the University of Maryland's interactive INFO system, you will
  70. find the method described here vastly faster.
  71.  
  72. Exactly how one connects with Internet is different at each site and
  73. must be learned from the local network administrator.  All the rest of
  74. how to use EconData is the same everywhere.  Generally, a user at a PC
  75. connected to a local network that connects to Internet has a command to
  76. make the connection with "ftp" -- a File Transfer Protocol.  Let us say
  77. that this command has the name "ftpcall", though it will almost
  78. certainly be something else.  You would then type:
  79.  
  80.   ftpcall info.umd.edu
  81. That command connects you to the "info" machine at the University of
  82. Maryland.  You will see on your screen:
  83.  
  84.   user name:
  85.   ftp>
  86.  
  87. You then type:
  88.  
  89.   user anonymous
  90.  
  91. You are then asked for a password.  It will be your identification while
  92. connected, so your name would be a good choice.  After giving the
  93. password, you again get the "ftp>" prompt.  Reply with 
  94.  
  95.   binary
  96.   cd /info/EconData/Instructions
  97.  
  98. Do not forget the capital letters in "EconData" and "Instructions". 
  99. Then, the first time you are connected, do:
  100.  
  101.   get readme.doc
  102.   get gbanks.doc
  103.   get guide.doc
  104.   get contents.doc
  105.   cd ../Tools
  106.   get pkz110.exe  (if you do not already have PKZip version 1.1 or
  107.   higher)
  108.   get unzip.exe
  109.   get unzip.doc
  110.   get dezip20.com
  111.   get pdgarc.exe
  112.   get pdgsup.exe
  113.   bye
  114.  
  115. Those instructions will obtain the essential tools you need and a
  116. demonstration bank.  After studying the "contents.doc" file, you can
  117. come back for particular banks.  Let us suppose you decide that you want
  118. nipaq.zip, the quarterly national accounts.  It is in the
  119. Data/USNational/Accounts
  120. directory, so you again repeat the above procedure as through the line
  121. "binary" and then do:
  122.  
  123.   cd /info/EconData/Data
  124.   get nipaq.zip
  125.   bye
  126.  
  127. You can then follow the example below for using nipaq.zip
  128.  
  129.  
  130. Internet via Telnet with the INFO interface.
  131.  
  132. A telnet program is one which provides terminal emulation over the
  133. Internet to a user, who can either be connected directly with a PC or
  134. via a mini or mainframe computer.  As with FTP there are many versions
  135. of Telnet software and specific questions about its use should be
  136. directed to your system administrator.  While the speed of transfer may
  137. of may not be affected by using Telnet rather than FTP, a connection
  138. made with Telnet has an advantage in that it offers the users full
  139. screen menus.  These menus significantly improve the user friendliness
  140. of the INFO bulletin board and EconData, especially for first time
  141. users.  
  142.  
  143. For the purposes of this explanation, we will assume that your Telnet
  144. program is simply called telnet (as it often is).  The command to issue
  145. Telnet should be something like this:
  146.  
  147.   telnet info.umd.edu
  148.  
  149. When connected you should be given a login prompt, such as:
  150.   
  151.   login:
  152.  
  153. you should reply:
  154.  
  155.   info
  156.  
  157. This login connects you to a more user-friendly interface which allows
  158. you to view the documentation files before the downloading.  Learn what
  159. the various commands available to you do by using the arrow keys to
  160. select the command and then tapping the '?' key.  You first want to
  161. "View" EconData.  Then you want to "X-fer" the files listed above.  When
  162. you choose "X-fer", you will be asked to choose the type of transfer
  163. protocol.  You will probably want to choose either the FTP or TFTP
  164. protocols, the choice of which will depend upon on your particular
  165. Telnet program.
  166.  
  167.  
  168. Telephone and modem connection.
  169.  
  170. If not connected to internet, you can use your modem for a dial-up call
  171. to download some of the files.  (Some data files are so large that this
  172. method of downloading may require more than the maximum 90 minute
  173. connection allowed by the system.)  Follow these steps:
  174.  
  175.   1.   Start your communications program.  Set the terminal emulation as
  176.        vt100 if possible, otherwise note how it is set.  Dial
  177.        301-403-4333 with the following communications parameters:  baud
  178.        2400 if possible, otherwise 1200 or 300; 8 data bits, no parity,
  179.        1 stop bit.   If you have a 9600 baud modem the number is 301-
  180.        403-4444 with the same settings as above.
  181.  
  182.   2.   After the terminal is connected, tap the 'Enter' or 'Return' key
  183.        every second until the annex prompt appears.
  184.  
  185.   3.   At the "annex" prompt, type
  186.        telnet info.umd.edu
  187.  
  188.   4.   At the "login" prompt, type 
  189.        info
  190.  
  191.   5.   To the question about terminal type, answer "vt100" or the other
  192.        type which you set your communication program to emulate.  
  193.  
  194.   6.   Learn what the various commands available to you do by using the
  195.        arrow keys to select the command and then tapping the '?' key. 
  196.        You first want to "View" EconData.  Then you want to "X-fer" the
  197.        files listed above. You will want to use the Kermit protocol.
  198.  
  199.   7.   To leave the system, select Quit on the menu.  That will take you
  200.        back to the "annex" prompt.  Reply "ha" to this prompt to
  201.        "hangup".
  202.  
  203. THE FIRST FILES YOU NEED
  204.  
  205. The very first time you connect, you should transfer the following
  206. files:
  207.  
  208.  
  209. In the Instructions subdirectory:
  210.  
  211.   README.DOC     Brief notes on recent changes in EconData
  212.   CONTENTS.DOC   A description of the subdirectories of EconData and the
  213.                  files contained in those subdirectories
  214.   GUIDE.DOC    The current version of this document.  If the date at the
  215.                top is the same as the date of the file, you presumably
  216.                do not need the file, since you are looking at it.  This
  217.                document, explaining how to use these economic time
  218.                series.  The same material is available as a file for
  219.                WordPerfect 5.1 as GUIDE.WP.
  220.  
  221. In the Tools subdirectory:
  222.  
  223.   PDGARC.EXE   The public domain version of the G regression package,
  224.                necessary for using the data files.
  225.   PDGSUP.EXE   The supplementary programs for the G regression package,
  226.                used for making tables and manipulating data.
  227.   PKZ110.EXE   The PKZip archival package.  If the files you want end in
  228.                ".zip", you need this program or some other compatible
  229.                program to de-archive them.  PKZip is shareware, and a
  230.                modest registration is required for legal use beyond an
  231.                initial trial period.  We started off with DWC because it
  232.                was public domain and out-performed the well-known PKArc. 
  233.                However, PKZip gives significantly greater compression,
  234.                so we have gradually switching to it.)  
  235.  
  236. PKZip and PKUNZip are the packages that we used and tested to create the
  237. archive you see here.  However, we have also made available two public
  238. domain programs that were designed to strictly de-archive Zipped files. 
  239. We have made these available to you if you want to save on license fee,
  240. but to you, but we have not fully tested them.  If you are interested,
  241. you might be able to use the following programs instead of PKZip:
  242.  
  243.   DEZIP20.COM
  244.   UNZIP.EXE
  245.   UNZIP.DOC
  246.  
  247. DE-ARCHIVING
  248.  
  249. Except for a few ASCII files ending in the ".doc" extension, all files
  250. on EconData have been archived with PKZIP and have the ".zip" extension. 
  251. They must be de-archived before they can be used. 
  252.  
  253. For PKZIP, the process is slightly different.  At the DOS prompt, just
  254. type 
  255.  
  256.   PKZ110
  257.  
  258. and the one file will explode into a number of files, one of which is
  259. PKUNZIP.EXE and others are documentation and registration information. 
  260. To de-archive the file xxxx.zip, just type
  261.  
  262.   pkunzip xxxx
  263.  
  264. The commands for the public domain alternatives to pkunzip are very
  265. similar.  You should refer to the accompanying documentation.
  266.  
  267. PUBLIC DOMAIN G
  268.  
  269. All of the time-series are in the form of banks for G and PDG.  PDG is
  270. contained in the file PDGARC.EXE, and important supplementary programs
  271. are in PDGSUP.EXE.  These are "must" files for the initial download.
  272.  
  273. Once you have downloaded these files and you are back on your own
  274. computer, create a pdg subdirectory by typing: 
  275.  
  276.   c:
  277.   cd \
  278.   md pdg
  279.   cd pdg
  280.  
  281. Now move or copy to this directory the PDGARC.EXE, and PDGSUP.EXE files. 
  282. De-archive PDG by typing:
  283.  
  284.   pdgarc 
  285.   pdgsup 
  286.  
  287. You should now backup the PDGARC.EXE, PDGSUP.EXE files to diskette.  You
  288. may then delete PDGARC.EXE and PDGSUP.EXE from your hard disk to save
  289. space.  
  290.  
  291. Now, edit your autoexec.bat file to include c:\pdg in the path.  Also,
  292. your config.sys file should have the lines
  293.  
  294.   FILES = 20
  295.   BUFFERS = 20
  296.  
  297. The "20's" may be replaced with larger numbers.  Probably your
  298. config.sys file is already fine; if not, modify it and reboot. Now it is
  299. time to try out PDG. Do:
  300.  
  301.   cd \pdg
  302.   pdg demo
  303.  
  304. You will get a demonstration of PDG's functions.
  305.  
  306.  
  307. USING PDG WITH THE ECONOMIC TIME-SERIES DATA
  308.  
  309. Once PDG is in the path, you can access it from any subdirectory.  Now
  310. you simply need to download a time-series of interest from the Data
  311. subdirectory in Econdata.
  312.  
  313. For illustration purposes, we will assume that you have downloaded the
  314. quarterly National Income and Product Accounts time-series, NIPAQ.ZIP. 
  315. On you own computer, you need to set up a subdirectory for this data. 
  316. This is done by typing:
  317.  
  318.   cd \
  319.   md nipaq
  320.   cd nipaq
  321.  
  322. Now copy or move the NIPAQ.ZIP file to this directory, and type:
  323.  
  324.   pkunzip nipaq
  325. You may then delete NIPAQ.ZIP.  Note that if you are using one of the
  326. public domain alternatives to PKUNZIP, then you would replace that
  327. programs name for "pkunzip" in the above example.
  328.  
  329. Each time-series has its own G configuration file, G.CFG, specific to
  330. that series.  Provided that each series is kept in a different
  331. subdirectory, then when you start PDG, the G.CFG file will automatically
  332. assign this bank.  You start PDG by typing:
  333.  
  334.   pdg
  335.  
  336. Answer the opening question with a 'Enter', and then, at the  :  prompt,
  337. do:
  338.  
  339.   look
  340.  
  341. and you may now explore the quarterly NIPA accounts.
  342.  
  343. Of course, it is possible to have all of the time-series data in one
  344. subdirectory; but then you must specify which bank you would like to
  345. look at once you are in PDG.  You do this at any : prompt by typing:
  346.  
  347.   hbk nipaq
  348.  
  349. If you are using PDG in another directory, you can assign this bank by
  350. the G or PDG command:
  351.  
  352.   hbk \nipaq\nipaq
  353.  
  354. These steps should get you started.  The "demo" will introduce you to
  355. the basic functions of PDG; the "help" files are extensive and may be
  356. printed out.  There are also interactive lessons in the material you
  357. have downloaded. The book "The Craft of Economic Modeling" by Clopper
  358. Almon (Ginn Press) gives many examples of the use of G.
  359.  
  360.  
  361. AVAILABLE DATA
  362.  
  363. Read the file CONTENTS.DOC for a list of currently available data.
  364.  
  365.  
  366. COMMON QUESTIONS
  367.  
  368.   Q.   Do I have to download a whole huge file every time it is updated?
  369.   A.   No, just download a small file with the updates and run a simple
  370.        program to update the old large file from the small new one. 
  371.        Suppose you have downloaded nipaq, the quarterly  national
  372.        accounts, and a new quarter rolls around.  You will then soon
  373.        find a file in the Data directory named newnipaq.zip.  Download
  374.        it to the same directory with your nipaq bank.  Then do
  375.  
  376.           splice nipaq newnipaq revnipaq
  377.  
  378.        SPLICE is a program in the pdgsup.exe file which you have
  379.        installed into the pdg  directory.  This command will create a
  380.        new compressed bank named revnipaq.  Start PDG and assign it with
  381.        the command
  382.  
  383.           hbk revnipaq
  384.  
  385.        Then examine a few series to insure that everything has worked
  386.        properly.  Then exit PDG, delete nipaq.cin and nipaq.cbk and do
  387.  
  388.           ren revnipaq.* nipaq.*
  389.  
  390.        Your nipaq bank is now updated.
  391.  
  392.   Q.   Can I download an individual series?
  393.   A.   No.  Only whole banks can be moved.  But whole banks now move
  394.        faster than individual series did a few years ago.  
  395.  
  396.   Q.   How large are the banks and how long does it take to download
  397.        one?
  398.   A.   A typical bank is 200 - 400K bytes, though some reach 2 or 3
  399.        megabytes.  We experience  a file transfer rate of about 5 or 6 K
  400.        bytes per second in downloading via Internet from  systems at
  401.        other universities.  (The local rate is some 45 K per second). 
  402.        Thus, the  complete annual national accounts, 5,600 series, each
  403.        back to 1929 or whenever it begins,  occupies 425 K bytes and
  404.        would require about 75 to 90 seconds. Since downloading a 1.44
  405.        Megabyte diskette of data requires only about 3 minutes, there is
  406.        little reason to mail diskettes among sites connected to
  407.        Internet.  Download by dial-up telephone is much slower.  The
  408.        theoretical maximum rate is .24 K per second, so a file will take
  409.        20 to 25  times as long by dial-up as it does via Internet.
  410.  
  411.   Q.   How current are the data?  
  412.   A.   Banks which we can update from the Commerce Department's Economic
  413.        Bulletin Board  (EBB) are updated within a few days of release of
  414.        new data.  These include the quarterly  National Income and
  415.        Product Accounts, the Business Conditions Indicators, the Blue 
  416.        Pages of the Survey of Current Business, and the Indexes of
  417.        Industrial Production.  The  Federal Reserve cooperates by
  418.        lending us a Flow of Funds tape when it appears, so this bank is
  419.        also very up-to-date.  Other data we have to purchase.  In
  420.        particular, the Bureau of Labor Statistics has explicitly refused
  421.        any cooperation other than selling us the tapes.  Consequently,
  422.        these files are updated only when we have a particular need to do
  423.        so.  That is at least once a year but seldom monthly.
  424.  
  425.   Q.   What is the advantage of EconData over EBB?
  426.   A.   The Commerce EBB is primarily composed of "documents," often
  427.        press releases, not banks.  Almost every file is in a different
  428.        format.  There is no standard way to get the data into an
  429.        analytical program.  Nor is there any standard way to update a
  430.        previous file with new information.  On EconData, every bank is
  431.        in the format of a G data bank.  Updating is easy.  To update our
  432.        banks from the EBB, we have had to write C-programs  -- a
  433.        different one for every EBB file -- to put the EBB material into
  434.        a standard form.  Writing these programs was a tiresome bother.  
  435.        We have put them in the "Tools" directory of EconData, in case we
  436.        should not be quick enough for you in getting the file  ready
  437.        some month.  We have urged the EBB staff to at least offer our
  438.        banks to their users.  They have declined to do so because they
  439.        accept only files from U.S. Government agencies.  We then urged
  440.        agencies to use these banks to submit data to the EBB.  The 
  441.        Federal Reserve submits the industrial production indexes in the
  442.        form of an ASCII file  for input into PDG.  The staff of other
  443.        agencies, though expressing personal admiration  of the programs,
  444.        have been apprehensive that making the data so easy to use might
  445.        constitute competition with private industry. 
  446.   Q.   How hard are the data to use, once I get them?
  447.   A.   If you are using PDG or G as your main analysis program, you have
  448.        only to type a three-letter command plus the bank name to assign
  449.        the bank.  Then the "look"  command allows you to search for the
  450.        series you want, graph it or display it numerically.  A brief
  451.        command, followed by the names of the variables you want, will
  452.        write the series  to ascii files or 1-2-3 worksheet files. 
  453.        Nearly any program can read them in this form.  
  454.  
  455.   Q.   What else do PDG and G do?
  456.   A.   PDG will do algebraic and functional (such as logarithmic)
  457.        transformations of series and  convert a series from monthly to
  458.        quarterly or from quarterly to annual periodicity -- and vice
  459.        versa, approximately.  You can bring in your own data and make
  460.        banks that have series selected from your own data and one or
  461.        more of the EconData banks.  PDG will graph data in a variety of
  462.        ways -- lines (up to seven) with user-controlled line size,
  463.        style, and marking, multiple-scale graphs, bar graphs, stacked
  464.        bars, parallel bars, scatter graphs,  scatter graphs with
  465.        connected points, semi-logarithmic graphs, and so on.  It allows
  466.        on-screen annotation of graphs and can "remember" the annotations
  467.        that were made on screen so that when the same graph is repeated
  468.        with updated data, the annotation will automatically appear.  It
  469.        will do screen dump prints to most printers.  (Full G also
  470.        supports PostScript printers, TIFF files, and HP- compatible
  471.        printers with downloaded fonts.)  A companion program makes
  472.        tables that can include growth rates and annual averages of
  473.        monthly or quarterly data.  PDG does ordinary least squares
  474.        regression, regression with "soft" or "stochastic" constraints,
  475.        and distributed lags via soft constraints.  Full G, for $95, adds
  476.        Hildreth-Lu correction for autocorrelation, ARIMA methods,
  477.        seemingly unrelated regression and stacked regression with
  478.        constraints across equations, non-linear regression, automatic
  479.        Chow tests, and pooled time-series and cross-section regression. 
  480.        With its sister program Build, it can build simultaneous equation
  481.        models with hundreds of equations.  Both G and PDG have extensive
  482.        on-line documentation.  There are versions of both programs in
  483.        French, Italian, Spanish, Russian, and Chinese.  The Italian
  484.        version is being officially used in data dissemination.
  485.  
  486.   Q.   What is the form of the data banks?  How do they pack so much
  487.        data into so little  space? Can they be used without PDG or G?
  488.   A.   The precise form is described, byte-by-byte, in the gbanks.doc
  489.        file in the Instructions directory of EconData.  While one cannot
  490.        simply look at the banks with the DOS "type"  command or a text
  491.        editor, there would be no problem for authors of other data
  492.        handling  programs to read the G banks.  Basically, for each
  493.        series, the frequency, starting date, and number of decimal
  494.        places are recorded.  The decimal point is then shifted to the
  495.        right to give a sequence of integers, and the first differences
  496.        of these integers are taken. If the differences are all between
  497.        -32K and +32K, then the series can be stored with perfect
  498.        accuracy as an initial value and then these differences, stored
  499.        as 2-byte integers.  Otherwise, the storage defaults to 4-byte
  500.        floating point.  G and PDG can use the series in this form; they
  501.        reconstitute each series as needed.  For transmission, the
  502.        resulting banks have been further compressed by putting them
  503.        through PKZIP, data compression and archiving programs.  PKZIP
  504.        are available in the Tools directory of EconData, along with some
  505.        public domain programs which seem to be very good at unzipping
  506.        ZIP files.
  507.   Q.   How is EconData supported?
  508.   A.   The INFORUM research group has developed many of these data banks
  509.        for its own use in  building the most comprehensive interindustry
  510.        models of the U.S. economy.  It has a PC  with a 9-track tape
  511.        drive, the essential piece of hardware to bridge the gap between
  512.        the  PC world and the 9-track tape world which most government
  513.        data suppliers still live in.  Since INFORUM is not in the
  514.        business of selling data, it has been willing to make these banks
  515.        available to other academic researchers through Internet. 
  516.        Several other groups have asked INFORUM to put particular bodies
  517.        of data into this form and have agreed to let the result be
  518.        placed on EconData.  Other groups at the University of Maryland
  519.        have  also contributed interest and support.  Further
  520.        contributions -- particularly if already in  G-bank form -- would
  521.        be most welcome.  
  522.  
  523.  
  524.  
  525.