home *** CD-ROM | disk | FTP | other *** search
/ Explore the World of Soft…e: Engineering & Science / Explore_the_World_of_Software_Engineering_and_Science_HRS_Software_1998.iso / programs / statistc / kstat41.exe / XXKS2.LZH / KS41.DOC < prev    next >
Text File  |  1995-08-16  |  11KB  |  296 lines

  1.  
  2.      
  3.      
  4.      
  5.      
  6.      
  7.      
  8.      
  9.      
  10.      
  11.      
  12.      
  13.      
  14.                                   KWIKSTAT 4.1
  15.                                Supplemental Manual
  16.      
  17.                            Statistical Data Analysis
  18.      
  19.      
  20.                                    June, 1995
  21.      
  22.                         (C)Copyright TexaSoft, 1983-1995
  23.                                  P.O. Box 1169
  24.                           Cedar Hill, Texas 75106-1169
  25.                          214-291-2115 Fax:214-291-3400
  26.      
  27.      
  28.      INSTALLATION
  29.      
  30.      Note: If you install KWIKSTAT 4.1 in the same directory as version 4.0, the
  31.      installation of 4.1 will overwrite your old KWIKSTAT program files, but
  32.      will not overwrite any new .DBF (database) files you may have created. By
  33.      default, KWIKSTAT 4.1 is set up to install in a new directory called KS41.
  34.      Once you  have installed and tested the new version, and copied all of your
  35.      data files, you can delete version 4.0.
  36.      
  37.      Install KWIKSTAT 4.1 using the same procedure described on page 1-3 of the
  38.      main manual. Briefly, make A: (or B:) the default drive. Then, enter
  39.      INSTALL, and follow the instructions on the screen.
  40.      
  41.      PROGRAM DIFFERENCES
  42.      
  43.      This manual supplement describes the differences and enhancements from
  44.      KWIKSTAT version 4.0 to version 4.1. Although there have been a number of
  45.      small cosmetic changes throughout the program, only those that have changed
  46.      the program usage in a significant way are described here. Other program
  47.      differences or enhancements are described in the file LATENEWS.DOC. Please
  48.      print this file and read it.
  49.      
  50.      GENERAL PROGRAM ENHANCEMENTS
  51.      
  52.      If you are performing a standard type of analysis, it is often easiest to
  53.      use a pre-defined database structure to create a database. New pre-defined
  54.      database structures have been added to the list in version 4.1. These
  55.      include a number of new structures for graphs as well as for analyses. To
  56.      display this list, choose the New Database option from the DATA menu. A
  57.      list of the available pre-defined databases will be listed. Scroll through
  58.  
  59.                                         1
  60.  
  61.      
  62.      KWIKSTAT 4.1 Supplement
  63.      ___________________________________________________________________
  64.      
  65.      
  66.      this list to see what database structures you can select. Of course, you
  67.      can always choose the Custom Database option to create a database unique to
  68.      your analysis.
  69.      
  70.      
  71.      SUMMARY STATISTICS
  72.      
  73.      The limit for number of groups in the "Summary Statistics" option in the
  74.      Descriptive Statistics option from the ANALYZE menu has been increased to
  75.      1000 groups. Of course, if you have that many groups, the calculation will
  76.      take a considerable amount of time.
  77.      
  78.      BY-GROUP PLOT
  79.      
  80.      A new plot type has been added to the "By Group" option in the Graphs
  81.      option from the ANALYZE menu. The new plot type displays means with error
  82.      bars. Mean values are displayed as bars. This type of plot is often seen in
  83.      medical and psychological journals. You can optionally display these plots
  84.      with means connected with a line.
  85.      
  86.      FREQUENCY ANALYSIS
  87.      
  88.      The Frequency Analysis program is located in the Crosstabulations,
  89.      Frequencies and Chi Square option on the ANALYZE menu. In version 4.0, you
  90.      had to select one field at a time to perform a frequency analysis. In
  91.      version 4.1, you can select up to 30 fields at a time. When you request a
  92.      Frequency Analysis, a pick list is displayed. Select as many as thirty
  93.      field names from this list. As you select a name, it is displayed on the
  94.      screen in the list. Once you finish your selection, an analysis for all
  95.      fields will be performed, and displayed.
  96.      
  97.      NEW 2 X 2 TABLE STATISTICS
  98.      
  99.      Two new statistics have been added to the 2 x 2 crosstabulation
  100.      option in the Crosstabulation, Frequencies and Chi Square option on
  101.      the ANALYZE menu. These are Relative Risk and Odds Ratio.  In a 2x2
  102.      table, the relative risk is given by the formula
  103.      
  104.            a/(a + b)
  105.      RR =  ----------
  106.            c/(c + d)
  107.      
  108.      where the two by two table is
  109.      
  110.  
  111.  
  112.  
  113.  
  114.  
  115.  
  116.  
  117.  
  118.                                         2
  119.  
  120.      
  121.      KWIKSTAT 4.1 Supplement
  122.      ___________________________________________________________________
  123.      
  124.      
  125.                   Factor 1
  126.                    +   -
  127.                  ---------
  128.             +    |a  |  b|
  129.      Factor 2    ---------
  130.             -    |c  |  d|
  131.                  ---------
  132.      
  133.      
  134.      the odds ratio is calculated by
  135.      
  136.              a / b
  137.      OR =    -----
  138.              c / d
  139.      
  140.      For more information on these two statistics, reference any
  141.      biostatistics/epidemiology text. One example is Basic Biostatistics in
  142.      Medicine and Epidemiology, A. A. Rimm, Appleton-Century-Crofts, 1980.
  143.      
  144.      NEW SAS CODE OUTPUT OPTIONS
  145.      
  146.      A new SAS export feature has been added to the File Utilities option from
  147.      the DATA menu. When you choose to create an SDF (Standard Data File) output
  148.      file, and choose to output the data definition to a file, you are given a
  149.      choice to output the SAS code to create a standard SAS data file or output
  150.      the SAS code to do a sample analysis using the exported data. The SAS code
  151.      files created may be used unchanged with most versions of SAS. For example,
  152.      if you export the data from the EXAMPLE database to SAS code to create a
  153.      standard SAS data file, you would create a file called EXAMPLE.TXT that
  154.      contained the data and a file called EXAMPLE.SAS that contained SAS code.
  155.      If you are using PC SAS, you could then enter the command
  156.      
  157.      SAS EXAMPLE.SAS
  158.      
  159.      from DOS, (i.e., at C:\SAS>) to run SAS and create a SAS data file called
  160.      EXAMPLE.SSD. If you are running SAS on a mainframe, you would need to
  161.      upload the files EXAMPLE.TXT and EXAMPLE.SAS to your mainframe, then run
  162.      SAS on EXAMPLE.SAS. If you are not using PC SAS or SAS for WINDOWS,  you
  163.      may need to change the LIBNAME and INFILE statements in the code to run on
  164.      your platform.
  165.      
  166.      CONVERSION OF A SAS DATA SET TO .DBF (PROFESSIONAL EDITION)
  167.      
  168.      SAS code to convert a SAS data set into a .DBF file that can be used in
  169.      KWIKSTAT is contained in a file called SAS2DBF.SAS. This file is the source
  170.      code for a SAS program. You must have the SAS program to run this code.
  171.      
  172.      To use the conversion program, you must edit the file called SAS2DBF.SAS to
  173.      change the filename for the SAS ".SSD" data set file, and the references to
  174.      the directory containing the file. Documentation in the SAS2DBF.SAS file
  175.      points out what changes need to be made. It is important to set formats for
  176.  
  177.                                         3
  178.  
  179.      
  180.      KWIKSTAT 4.1 Supplement
  181.      ___________________________________________________________________
  182.      
  183.      
  184.      any numeric fields with decimal values. Otherwise, these numbers may be
  185.      truncated to integers during the conversion.
  186.      
  187.      ANALYSIS OF COVARIANCE (PROFESSIONAL EDITION)
  188.      
  189.      The "Analysis of Covariance" option, located in the Advanced Analysis of
  190.      Variance module, is an analysis technique that combines regression and
  191.      analysis of variance. Sometimes, when designing a One Way Analysis of
  192.      Variance, you may be able to reduce the error term if you have information
  193.      from an independent variable that is related to your dependent variable.
  194.      
  195.      For example, see the Custom Regression Example on page 5-32 in the main
  196.      manual. In this case there are 3 treatments (the grouping variable) and you
  197.      are interested in seeing if sales (Y)  during a promotional period is
  198.      greater for a particular treatment (color of package). You also have
  199.      another variable -- sales during a previous period, using the same
  200.      packaging. (This is called the X or concomitant variable). Data for this
  201.      analysis is in a file named ANCOVA.DBF which has the following fields:
  202.      
  203.      COLOR - The grouping variable, which is color of package, 1=Red,
  204.      2=Green, 3=Blue.
  205.      
  206.      Y - Sales during a promotional period
  207.      
  208.      X - Sales during a previous period
  209.      
  210.      Open the ANCOVA database, choose the "Analysis of Covariance" option, and
  211.      select the fields as described above. Part of the results reported are:
  212.      
  213.      ESTIMATED TREATMENT MEAN RESPONSES AT XBAR
  214.      
  215.      Treatment          Mean Response    N
  216.      ---------          -------------  ------
  217.       1                  37.55068        6
  218.       2                  35.55799        6
  219.       3                  26.72466        6
  220.      
  221.      Test for group effects
  222.      ----------------------
  223.      F( 2 ,  14 ) =  22.47097          p =  0.043
  224.      
  225.      Test for parallel slopes
  226.      ------------------------
  227.      F( 2 ,  12 ) =  1.815916          p =  0.410
  228.      
  229.      Because the test for parallel slopes is not significant and
  230.      the test for groups is significant, you may conclude that
  231.      there is a significant difference in the group elevations.
  232.      
  233.      Multiple comparison tests are appropriate to decide where
  234.      the significant differences lie.
  235.  
  236.                                         4
  237.  
  238.      
  239.      KWIKSTAT 4.1 Supplement
  240.      ___________________________________________________________________
  241.      
  242.      
  243.      
  244.      Multiple comparisons (Scheffe')
  245.                                                              Critical S
  246.      Comparison              Difference               S         (0.05)
  247.      ---------------------------------------------------------------------
  248.      Elev 1 - Elev 2          1.992683              1.140        2.735
  249.      Elev 1 - Elev 3          10.82602              6.196        2.735 *
  250.      Elev 2 - Elev 3          8.833334              5.234        2.735 *
  251.      
  252.      Differences marked with an * are significant at the 0.05 level.
  253.      
  254.      From this output, you can see that elevation 3 (BLUE color) ranks
  255.      significantly lower than the other two treatment types. There was no
  256.      significant difference found in sales between colors Red (1) and Green (2).
  257.      Another way to see this relationship is by displaying the plot. From the
  258.      options menu on the plot, you can also choose to display the trend lines
  259.      for the regressions by group.
  260.      
  261.      Comparison of the elevations can be considered appropriate since the test
  262.      for parallel slopes is not significant (although in the plot the slope of
  263.      treatment 3 seems a bit different that the other two.) This graph visually
  264.      confirms that group 3 has an overall mean less than the other two groups,
  265.      which would mean that Blue was the worst color in terms of sales for this
  266.      packaging.
  267.      
  268.      The Scheffé procedure is recommended for the multiple comparison test (see
  269.      Neter, et. al.,1990,  p. 877), and is automatically performed for this
  270.      analysis.
  271.      
  272.      
  273.      
  274.      
  275.      
  276.      
  277.      
  278.  
  279.  
  280.  
  281.  
  282.  
  283.  
  284.  
  285.  
  286.  
  287.  
  288.  
  289.  
  290.  
  291.  
  292.  
  293.  
  294.  
  295.                                         5
  296.