home *** CD-ROM | disk | FTP | other *** search
/ The World of Computer Software / World_Of_Computer_Software-02-385-Vol-1of3.iso / t / ts2st20.zip / STATREGR.INF < prev    next >
Text File  |  1992-09-22  |  13KB  |  287 lines

  1.                            - 1 -
  2. Tue 22-September-1992                          (All rights reserved)
  3.  
  4. About TS2ST in General  (Multiple regression analysis)
  5. ======================
  6.  
  7. Apply question mark ? with the program call for a brief description
  8. of a program.
  9.  
  10. This package may be used and distributed freely for NON-COMMERCIAL,
  11. NON-INSTITUTIONAL, PRIVATE purposes, provided it is not changed in
  12. any way.
  13. ┌────────────────────────────────────────────────────────────────┐
  14. │ For ANY other usage (such as use in a business enterprise or a │
  15. │ university) or the full scale version contact the author for a │
  16. │ personal or a site license.                                    │
  17. └────────────────────────────────────────────────────────────────┘
  18. Please do not distribute any part of this package separately.
  19. Uploading to BBSes is encouraged.
  20.  
  21. The registered version is strictly for the registrant only.
  22. Identical programs must NOT be running on more than one computer at
  23. a time. Site licensed programs must not be run outside the licensed
  24. site.
  25.  
  26. The programs are under development. Comments and contacts are
  27. solicited. If you have any questions, please do not hesitate to use
  28. electronic mail for communication.
  29. InterNet address: ts@uwasa.fi         (preferred)
  30. Bitnet address:   SALMI@FINFUN
  31.  
  32. The author shall not be liable to the user for any direct, indirect
  33. or consequential loss arising from the use of, or inability to use,
  34. any program or file howsoever caused. No warranty is given that the
  35. programs will work under all circumstances.
  36.  
  37. Timo Salmi
  38. Professor of Accounting and Business Finance
  39. Faculty of Accounting and Industrial Management
  40. University of Vaasa
  41. P.O. BOX 297, SF-65101 Vaasa, Finland
  42.  
  43.  
  44. CONTENTS:
  45.  
  46.   1. Acknowledgements
  47.   2. General Description
  48.   3. Release Notes
  49.   4. The Statistics Set for Other Computers
  50.   5. List of the files in the package
  51.  
  52.                            - 2 -
  53.  
  54.  
  55. 1. ACKNOWLEDGEMENTS
  56.  
  57.    In developing and testing multiple regression programs for the
  58. VAX 11/750 during 1983-86 I have had many useful discussions with my
  59. colleague Martti Luoma (Associate Professor of Statistics). This has
  60. directly benefited programming the current STATREGR program for PC
  61. compatibles. I have also had useful suggestions from Antti Kanto
  62. (Acting Associate Professor of Statistics) in developing STATREGR.
  63.  
  64.  
  65. 2. GENERAL DESCRIPTION
  66.  
  67. STATREGR (Ver 2.0)
  68.  
  69.    STATistics: multiple REGRession analysis is part of the
  70. interactive statistical system by Timo Salmi. It is the second
  71. program in the set. The first program in the set is STATistical
  72. MEASures (STATMEAS in TS1STxx.ZIP), which is intended for univariate
  73. analysis. The third program in the set is STATistics:
  74. TRANsformations (STATTRAN in TS3STxx.ZIP), which can be used for
  75. transforming the observations, and, if necessary, also as an editor.
  76. The fourth program in the set is STATistics: Ranks and CORrelations
  77. (STATRCOR in TS4STxx.ZIP). The fifth program in the set is
  78. STATistics: Least Absolute Deviation multiple Regression (STATLADR
  79. in TS5STxx.ZIP).
  80.  
  81.    STATREGR includes a handy built-in help system, which can be
  82. invoked by typing ? at any interactive question. Because of this
  83. built-in help, and the interactive nature of the program's user
  84. interface, no long-winding instructions have been included. (Who
  85. reads instructions anyhow?)
  86.  
  87.    The program performs and ordinary least squares (OLS) multiple
  88. regression analysis, that is, estimates the coefficients of
  89.         Y = a + b(1)X(1) + ... + b(M)X(M)
  90. from a set of observations. Furthermore, it draws (or rather writes)
  91. low-resolution scatter diagrams of the data, and the regression
  92. analysis.
  93.  
  94.   The data can either be given from the keyboard or taken from a
  95. file. If the input is to be taken from a file it must first be
  96. prepared with some editor, or some word processor which includes an
  97. option for preparing ordinary ascii text. (Also STATTRAN can be used
  98. for this purpose.)
  99.  
  100.    The data is given to the program in the following format:
  101.  
  102.        X1 X2 X3                !variable names (! denotes a comment)
  103.        3.56 6.32 -1.73
  104.        5.12 -4.21 9.18
  105.        14.2 5.11 0.31
  106.        END                     !END is optional in a file
  107.  
  108. A missing item in an observation is marked by a hash (#). E.g. if
  109. the first item of the second observation were missing, the
  110. observation should be written as  # -4.21 9.18
  111.    The items in an observation can be separated with blanks, as in
  112. the above, or with commas (,) e.g. 5.12,-4.21,9.18. The number of
  113. the intervening blanks is irrelevant, and can be customized for
  114. increased readability. Thus e.g. 5.12 -4.21 9.18 and
  115. 5.12     -4.21     9.18    are equivalent.
  116.    A row can be continued using an ampersand (&). E.g. the variables
  117. could be given as
  118.        X1 X2 &
  119.        X3
  120. Alternatively, * or \ can be used instead of & as the continuation
  121. marker.
  122.  
  123.    Comments can be added to the input data. If ! appears on a line
  124. all text after ! will be considered as a comment.
  125.  
  126.    A header can be entered on each page if output is directed to a
  127. file. To accomplish this start the very first line on the input file
  128. with a double exclamation mark (!!) and the rest of the line will be
  129. used as the header. Thus !! indicates a header, a single ! an
  130. ordinary comment.
  131.  
  132.    The maximum number of variables is 25. The maximum number of
  133. observations is 400 (for each variable). The public domain version,
  134. however, sets the limits at 4 and 100 respectively.
  135.  
  136.  
  137. 3. RELEASE NOTES
  138.  
  139.    Version 1.1 of STATREGR includes some minor changes and
  140. corrections in the user interface.
  141.  
  142.    Version 1.2 of STATREGR introduces CGA high-resolution diagrams
  143. for the analysis. Unlike the low-resolution text-mode diagrams, the
  144. high-resolution diagrams will always be drawn on the screen. (In the
  145. former case, directing the output to a file is also possible).
  146.  Further overflow checks have been added to prevent the program
  147. crashing because of bad data.
  148.  Multiple regression estimates are based inverting a cross-product
  149. matrix of the observations. If the explaining variables are very
  150. similar (multicollinearity), the matrix will be nearly singular, and
  151. the estimates are very unstable. Further problems of significance
  152. can arise if the values of the explaining variables are of a very
  153. different scale. To test the reliability of the estimation results
  154. the cross-product matrix is multiplied by its computed inverse, and
  155. the result compared with a unit matrix, and the sum of absolute
  156. deviations is reported as ABS DEVIATION FROM UNIT MATRIX. The
  157. smaller this figure, the less probability of computationally weak
  158. estimates. Although seldom reported, this problem is inherent to
  159. most (even the top commercial) statistics packages.
  160.  If the input file is not found, you have the choice of listing
  161. directories from within STATREGR. The directory routine has been
  162. rewritten for a more relaxed syntax. (For details see the
  163. information on DIRW in TSUTIL.INF in TSUTILxx.ZIP version 1.8 or
  164. later.)
  165.  
  166.    In version 1.3 the program no longer crashes from an attempt to
  167. rewrite a write-protected file. Second, the user now has more
  168. control over the choice of the graphics driver in the
  169. high-resolution scatter diagrams. Apply ? at the question "USE CGA
  170. GRAPHICS DRIVER" for more information. Third, the t-values of the
  171. residuals have been included in the tableau giving the regressed
  172. values.
  173.  
  174.    In version 1.4 the program has been recompiled with some minor
  175. changes.
  176.  
  177.    Version 1.5:  This version introduces input recall and line
  178. editing. The special keys Del, CrLf, CrRg, CrUp, Home, End, and Esc
  179. are functional for this purpose. PgUp is the recall key. Line
  180. editing uses insert mode.
  181.  Disk access has been made faster (the program has its own cache).
  182.  The directory routine has been updated.
  183.  Read-only files can be read properly.
  184.  The program size has been reduced by limiting the graphics to CGA,
  185. EGA, and VGA.
  186.  
  187.    Version 1.6: In compiling version 1.5 I made in error in setting
  188. the default heap size. This caused an out of memory condition, which
  189. now has been remedied. In line editing the Insert key has been made
  190. functional.
  191.  
  192.    Version 1.7: The regression line in the high resolution scatter
  193. diagram was incorrectly drawn for negative regression coefficients.
  194. My thanks are due to acting associate professor Roy Dahlstedt for
  195. pointing it out.
  196.  
  197.    Version 1.8: The line editing potential of the program has been
  198. improved. When the task is given from the keyboard, and continuation
  199. lines are used, the repeated input recall (CursorUp) gets each line
  200. in turn. Ctlr-C and break-key abort have been enhanced.
  201.  A line can be continued using an &, or a * at the end. Now also the
  202. backslash \ is accepted.  This was suggested by Tuomas Eerola.
  203.  Some help texts within the program have been extended.
  204.  Multiple regression estimates are based inverting a cross-product
  205. matrix of the observations. If the explaining variables are very
  206. similar (multi- collinearity), the matrix will be nearly singular,
  207. and the estimates are very unstable. Further problems of
  208. significance can arise if the values of the explaining variables are
  209. of a very different scale. To test the reliability of the estimation
  210. results the cross-product matrix is multiplied by its computed
  211. inverse, and the result compared with a unit matrix, and the square
  212. root of the sum of the squared deviations is reported as DEVIATION
  213. FROM UNIT MATRIX. (Earlier I used the sum of absolute deviations,
  214. but the norm, that is the square root of squared deviations, is
  215. theoretically better, since it can be considered the length of the
  216. deviation vector.) The smaller this figure, the less probability of
  217. computationally weak estimates. Although seldom reported, this
  218. problem is inherent to most (even the top commercial) statistics
  219. packages.
  220.  Found and corrected an annoyingly elusive bug, that caused problems
  221. if the last observation in the data had items with more digits than
  222. 10.
  223.  
  224.    Version 1.9: Several improvements to the nuts and bolts of the
  225. user interface.
  226.    The new usage of the call is
  227. PROGNAME [/h(elp)] [/iInputFileName] [/oOutputFileName] [/cColumnsPerRow]
  228. (the /c option, which regulates the width of the output, is for
  229. registered versions, only). If you use the /i switch, it stuffs the
  230. InputFileName into the appropriate recall buffer. This means that
  231. when the program asks you for the input file name, you can invoke
  232. the input file name just by pressing the CursorUp key. (The same
  233. goes for the /o switch, respectively.) This is very convenient, if
  234. you use the program many times successively making small changes in
  235. your data in between. (This assumes, of course, that you have a
  236. command line editor like DOSEDIT or CED to recall previous MsDos
  237. commands. These common shareware programs can be obtained from any
  238. well-stocked BBS or FTP site.)
  239.    The printer readiness test has been rewritten to be more general.
  240. The earlier test failed for some printers, because the codes the
  241. printers send when they are offline are not standardized.
  242.    The "file exists, overwrite?" question is no more asked when the
  243. output file is prn, in other words when the output is directed to
  244. the printer.
  245.    The user has now a choice of a left margin from 0 to 20 blanks
  246. when output is directed to the printer.
  247.    The user has now a choice between formfeed and four blank lines
  248. to start each new page of output.
  249.    When an input file is not found, the user is given the choice of
  250. listing a directory. The directory routine has been rewritten.
  251.    The file ready message now also includes the file side besides
  252. the name.
  253.  
  254.    Version 2.0: The input and output file names can be optionally
  255. given as parameters in the program calls, e.g.
  256.       STATREGR /ic:\stat\test.dat /or:\tmp
  257. This option has  been improved.  The "prefilled"  name (e.g.
  258. c:\stat\test.dat) will now automatically appear on the input line
  259. without the need of pressing the cursor up key. All you need to do
  260. is to press enter.
  261.    Also made some minor internal changes not worth recording.
  262.    Rewrote the document files using a 68 column wrap instead of the
  263. former 80 to make the text easier to read and handle. Added the list
  264. of files in the package to the documentation.
  265.  
  266. 4. THE STATISTICS SET FOR OTHER COMPUTERS
  267.  
  268.    The Statistical programs by Timo Salmi are also available for the
  269. Sinclair QL computer. Named STATPREP the system is part of a Public
  270. Domain library for QUANTA members. The descriptions of the files in
  271. the Quanta Library are given in STATMEAS.INF contained in
  272. TS1STxx.ZIP, i.e. the first part of the set statistical programs.
  273.  
  274.  
  275. 5. LIST OF THE FILES IN THE PACKAGE
  276.  
  277. TS2ST Statistics by T.Salmi, Part II
  278. Filename        Comment
  279. --------        --------------------------------
  280. FILE_ID.DIZ     Brief characterization of TS2ST
  281. STATREGR.EXE    Multiple regression analysis
  282. STATREGR.INF    Document
  283. STATREGR.NWS    News announcements about ts2st
  284. TSPROG.INF      List of PD programs from T.Salmi
  285. ----            ------             ------  -----
  286. 0005
  287.