home *** CD-ROM | disk | FTP | other *** search
/ CD Shareware Masterblend / cdsharewaremasterblend.iso / finance / kwikstat / ks.doc < prev    next >
Text File  |  1991-11-15  |  103KB  |  2,599 lines

  1.  
  2.  
  3.  
  4.  
  5.  
  6.  
  7.  
  8.                                   TexaSoft's
  9.                                 USING KWIKSTAT
  10.  
  11.                       Reference Guide, Condensed Version
  12.                        (C)Copyright 1991 Alan C. Elliott
  13.  
  14.     All rights reserved. No part of this manual may be reproduced without
  15.     prior permission. For information, address TexaSoft, P.O. Box 1169,
  16.     Cedar Hill, Texas 75104. CIS:70721,3145
  17.  
  18.     No patent liability is assumed with respect to the use of the
  19.     information  contained herein. While every precaution has been taken
  20.     in the preparation of  this publication, the publisher assumes no
  21.     responsibility for errors or omissions. Neither is any liability
  22.     assumed for damages resulting from the use of the information herein.
  23.  
  24.     This shareware copy of the program is made available so you can "try it
  25.     before you but it." When you register, you will receive the latest
  26.     version of the program, license to use the program on a regular basis,
  27.     a 288 page printed manual, 3 months of support, a newsletter and more.
  28.     -----------------------------------------------
  29.     For more information, print these files
  30.     Registration form - KSORDER.TXT
  31.     Site license - SITELICE.DOC
  32.     Updated information - LATENEWS.DOC Detailed
  33.     Installation instructions - KSINSTAL.DOC
  34.     -------------------------------------------------
  35.  
  36.     CONDENSED TABLE OF CONTENTS
  37.     ---------------------------
  38.     Part I: An OverView of KWIKSTAT
  39.     Part II: Using the KWIKSTAT Database
  40.     Part III: A Review of Statistical Concepts
  41.     Part IV: Performing A Statistical Analysis
  42.           o Descriptive statistics
  43.           o t-tests and analysis of variance
  44.           o Non-parametric comparative procedures
  45.           o Regression analysis
  46.           o Crosstabulations and Chi-Square
  47.           o Life tables and survival analysis
  48.     Part V:  Using KWIKSTAT Utilities
  49.           o Export data from a database to an ASCII file
  50.           o Produce a printed report
  51.           o Import 1-2-3 type files
  52.           o Create and edit images for pictograph procedure
  53.     Appendices: Error Codes/ Problem Form/ Ballot
  54.  
  55.  
  56.                                 ---------------
  57.                                 Please Register
  58.  
  59.                                        1
  60.  
  61.  
  62.     KWIKSTAT 3
  63.  
  64.  
  65.     PART I - AN OVERVIEW OF KWIKSTAT
  66.     -------------------------------------------------
  67.  
  68.     KWIKSTAT is for people who need to summarize, analyze or interpret
  69.     numerical information. It will help you decide what kind of analysis
  70.     is appropriate, read the data you already have on your computer (from
  71.     a variety of file types) or from the keyboard, perform the analysis
  72.     and offer interpretation of the results. Unlike older programs such
  73.     as SPSS or SAS, you do not have to be a professional statistician or
  74.     programmer to beneficially use KWIKSTAT.
  75.  
  76.     REQUIREMENTS:100% compatible computer, including the IBM PS/2
  77.     computers, 384K RAM, CGA, EGA, VGA or Hercules compatible monitor.
  78.     Many printers are supported.
  79.  
  80.     INSTALLATION
  81.  
  82.     Detailed installation procedures for KWIKSTAT are in the file
  83.     KINSTALL.DOC. For quick installation on a hard disk, place the
  84.     KWIKSTAT disk (1) in the A: drive and enter:
  85.  
  86.     A:INSTALL
  87.  
  88.     Follow the instructions on the screen.
  89.  
  90.     USING THE KWIKSTAT MENU
  91.  
  92.     The main KWIKSTAT menu uses a pull-down menu interface. When you begin
  93.     the KWIKSTAT program with the KS command from the DOS prompt (after it
  94.     has been installed), and after the Copyright screen, you will see the
  95.     main KWIKSTAT "DATA" menu. (If the ANALYZE menu appears instead of the
  96.     DATA menu, press the left arrow key once, and the DATA menu will
  97.     appear.) The top line of the menu is a menu bar. This bar contains the
  98.     options "Data", "Analyze" and "Helps". These are the three main
  99.     options for KWIKSTAT. Using the right and left arrow keys, you can
  100.     move bewteen the options.
  101.  
  102.     To select options from an extended menu (pulled-down), use the up and
  103.     down arrow keys on the cursor pad to highlight the option you desire,
  104.     then press the Enter key. Or, to select on option from a pull-down
  105.     menu, press the first letter of the option name.
  106.  
  107.     To exit KWIKSTAT choose the Quit - Exit from the DATA menu or press
  108.     the Esc key.
  109.  
  110.  
  111.  
  112.  
  113.  
  114.  
  115.                                 ---------------
  116.                                 Please Register
  117.  
  118.                                        2
  119.  
  120.  
  121.     KWIKSTAT 3
  122.  
  123.  
  124.     USING THE ANALYZE MENU
  125.  
  126.     The KWIKSTAT Analyze menu allows you to choose which analysis module
  127.     to run. See the section titled "TUTORIAL: Try this Example".
  128.  
  129.     USING THE KWIKSTAT HELP SYSTEM
  130.  
  131.     The "HELPS" pull-down menu contains the following choices:
  132.  
  133.     o HELP ON USING THE PROGRAM OPTION - general help
  134.     o DECIDE WHAT ANALYSIS TO USE OPTION - what analysis to use
  135.     o ABOUT KWIKSTAT - copyright and order information
  136.     o GO TO DOS, RETURN WITH EXIT (SHELL) - temporarily go to DOS prompt
  137.     o CHANGE SETUP - select default directory, printer, monitor
  138.     o SET MONITOR COLOR - select monitor colors
  139.  
  140.     --------------------------------------------------------------------
  141.     DO THIS TUTORIAL EVEN IF YOU DON'T READ ANY MORE OF THE MANUAL.
  142.     --------------------------------------------------------------------
  143.  
  144.     This tutorial will give you a feeling for how to use KWIKSTAT. It
  145.     assumes you are using KWIKSTAT on a hard disk. To begin KWIKSTAT, you
  146.     must first be in the \KWIKSTAT directory on your hard disk. Use the CD
  147.     (Change Directory) command from the DOS prompt to change to the
  148.     \KWIKSTAT directory by using the command:
  149.  
  150.     CD\KWIKSTAT
  151.  
  152.     From the \KWIKSTAT directory, begin KWIKSTAT with the command:
  153.  
  154.     KS
  155.  
  156.     After the copyright information, the Data pull-down menu will appear.
  157.     (If the Analyze menu appears, press the left arrow key once to open
  158.     the Data menu.)
  159.  
  160.     ACCESSING THE KWIKSTAT HELP SCREEN
  161.  
  162.     To examine the KWIKSTAT HELP menu, press the F1 function key. (This
  163.     help screen is available from any menu.) The HELP menu lists major
  164.     topics, and the screen number. You can think about the HELP procedure
  165.     as a book, with screens instead of pages. To look at a particular
  166.     topic, enter the screen number you desire. For example, to look at
  167.     screen 7, type 7 and press Enter.
  168.  
  169.     KWIKSTAT displays screen 7. Once you have displayed screen 7, to move
  170.     to screen number 8, press Enter. To go back to the menu, type the "M"
  171.     key. To exit the HELP module, press the Enter key from the main Help
  172.     menu or the Esc key from a help screen. Press Enter now. This takes you
  173.     back to the KWIKSTAT Data pull-down menu. Every module has the help
  174.                                 ---------------
  175.                                 Please Register
  176.  
  177.                                        3
  178.  
  179.  
  180.     KWIKSTAT 3
  181.  
  182.  
  183.     screens available.
  184.  
  185.     The KWIKSTAT "Decision" help screen is available from the Helps
  186.     pull-down menu. To look at this help menu, use the right arrow key to
  187.     move to the Helps pull-down menu. Then use the down arrow key to
  188.     highlight "Decide what analysis to use" and press Enter.
  189.  
  190.     EXAMPLE OF DESCRIPTIVE STATISTICS
  191.  
  192.     Entering data from the keyboard is explained later in Part II, "Using
  193.     the KWIKSTAT database". This example will use the database named
  194.     EXAMPLE on disk. To open this database, use your arrow keys to move to
  195.     the Data pull-down menu. Select "Open a Database". A "Pick" menu will
  196.     appear of available database names. Use the up and down arrow keys to
  197.     highlight EXAMPLE and press Enter. (If the EXAMPLE database does not
  198.     appear on the list of databases, you may not have installed the
  199.     program correctly. Review the installation instructions.)
  200.  
  201.     Once the database is opened, a notice at the bottom of the screen tells
  202.     you that the database is open. Press the "L" key to choose the List the
  203.     Contents option. This will list the contents of EXAMPLE database to the
  204.     screen. Press Enter several times to list the entire database to the
  205.     screen. When the list is finished, you will return to the Data
  206.     pull-down menu. Use the right arrow key to move to the Analyze
  207.     pull-down menu. Choose the Descriptive Statistics and Graphs option
  208.     from the Analyze menu by highlighting it and press Enter. KWIKSTAT now
  209.     switches to the Descriptive module (which may take a few seconds).
  210.  
  211.     From the Descriptive Statistics menu, press the letter B (or highlight
  212.     the "B" option and press Enter) to choose "Detailed statistics on a
  213.     single variable." The program now displays the variables available for
  214.     analysis from the database.
  215.  
  216.     Choose variable number 2 (AGE) by typing a 2, then press Enter. Before
  217.     the statistics for this variable are displayed, two options are
  218.     presented. First, you are prompted you with the question:
  219.  
  220.     Specify Confidence Interval level (.5 to .99) (Default is .95)
  221.  
  222.     For this example, PRESS ENTER TO ACCEPT THE DEFAULT.
  223.  
  224.     Default for percentiles is Tukey 5 Number Summary
  225.     Specify your own percentiles to calculate (y/N)?
  226.  
  227.     When a Yes/No question appears on the screen, notice that the Y or the
  228.     N will be uppercase (in this case it is (y/N). This means that if you
  229.     press Enter without entering a Y or an N, the uppercase option is the
  230.     default (No). For this example, to choose No to the question, JUST
  231.     PRESS ENTER.
  232.  
  233.                                 ---------------
  234.                                 Please Register
  235.  
  236.                                        4
  237.  
  238.  
  239.     KWIKSTAT 3
  240.  
  241.  
  242.     The program will display a screen of descriptive statistics, and a box
  243.     plot of the data. Notice that this screen is different from previous
  244.     screens. The information on this screen is displayed in graphics mode
  245.     (if you have a graphics monitor). Normally, information on the screen
  246.     is in "text" mode. When graphs are displayed on the screen, the
  247.     program must use a graphics screen mode. This graph appears in black
  248.     and white, although some graphs will appear in color.
  249.  
  250.     On graphic screens, a menu will appear at the bottom of the screen for
  251.     a few seconds, then disappear. This allows you to capture or print the
  252.     screen without the menu appearing on your printout. To bring the menu
  253.     back, press the spacebar once. The menu options are still available
  254.     even when the menu is not visible. The menus differ according to your
  255.     setup and particular options available for the graphic display, but
  256.     most graphic menus will include the following options:
  257.  
  258.     Esc:Exit R:Replot P:Print
  259.  
  260.     Press Esc to end the display, press R to replot (choose other display
  261.     options) and P to print the graphic screen to the printer. For example,
  262.     if you want a printed copy of this graphics screen, MAKE SURE YOUR
  263.     PRINTER IS TURNED ON, and is ON LINE, and HAS PAPER. Then, press "P"
  264.     (for Print).
  265.  
  266.     IF THE SCREEN DOES NOT PRINT PROPERLY: You may not have your printer
  267.     graphics command properly implemented - review the installation
  268.     procedures and technical considerations in the appendix and the file
  269.     PRINTERS.DOC.
  270.  
  271.     To return to the main Descriptives menu, press Esc. To end this module
  272.     and return to the main KWIKSTAT menu, press Esc. To end KWIKSTAT from
  273.     the main menu, press Esc again and answer Y to the prompt "End
  274.     KWIKSTAT."
  275.  
  276.     Procedures are explained more fully later in the manual. However, you
  277.     may find that you will be able to use most of the KWIKSTAT features
  278.     without any further aid from the manual. Remember, you have three
  279.     sources of information if you need help. (1) the regular help menu
  280.     (F1), (2) the help procedure that will assist you in choosing the right
  281.     statistical analysis to use (main menu, Helps) and (3) the manual.
  282.  
  283.     IF SOMETHING GOES WRONG
  284.  
  285.     If an error code appears and cannot resolve the problem, please fill
  286.     out the Problem Report Form and send it in right away, so that errors
  287.     in the program can be eliminated. (For fastest response, fax it to
  288.     214-291-3400 or send a Compuserve E-Mail message to 70721,3145.) If
  289.     you have a suggestion for how to improve KWIKSTAT, fill out the USER'S
  290.     BALLOT. Thanks.
  291.  
  292.                                 ---------------
  293.                                 Please Register
  294.  
  295.                                        5
  296.  
  297.  
  298.     KWIKSTAT 3
  299.  
  300.  
  301.  
  302.     PART II - USING THE KWIKSTAT DATABASE
  303.     ---------------------------------------------------------
  304.  
  305.     The DATA pull-down menu is used to manage your data. From this menu
  306.     you enter data, change data, create new data fields from existing
  307.     ones, and perform other data maintenance tasks. Once your data is in
  308.     the KWIKSTAT (dBASE-type) database, you can access the data from any
  309.     of the other KWIKSTAT modules.
  310.  
  311.     HOW DATA IS STORED IN KWIKSTAT
  312.  
  313.     A KWIKSTAT database uses the same file format as the dBASE III and
  314.     dBASE IV programs. Therefore, data already stored in a dBASE III or
  315.     dBASE IV file may be read directly into all the KWIKSTAT programs. The
  316.     only exception to this is that KWIKSTAT does not read dBASE MEMO
  317.     fields. Therefore, if your data in dBASE contains memo fields, you may
  318.     have to create a subset of your database before using it in KWIKSTAT.
  319.     Data from other programs can also be used in KWIKSTAT. Refer to the
  320.     section called "Entering Data into a Database." The following
  321.     information describes how to use the DATA pull-down menu.
  322.  
  323.     OPENING AN EXISTING DATABASE
  324.  
  325.     The OPEN A DATABASE TO USE option on the DATA menu allows you to
  326.     access information in a dBASE file. Use this option to choose the
  327.     database that you will be analyzing.
  328.  
  329.     When you choose the OPEN option on the DATA menu, a pick list of
  330.     databases currently in the default directory will be displayed. To
  331.     select a database, use the up and down arrow keys to highlight a
  332.     database name, then press Enter. If the database you want to use is not
  333.     in the current (default) directory, you can temporarily change the
  334.     default directory by pressing the F2 function key.
  335.  
  336.     DESIGNING AND CREATING A DATABASE
  337.  
  338.     The CREATE A NEW DATABASE OPTION on the DATA menu is used to create a
  339.     new database. The structure, or layout, of a database must be
  340.     described before you enter your data.
  341.  
  342.  
  343.  
  344.  
  345.  
  346.  
  347.  
  348.  
  349.  
  350.  
  351.                                 ---------------
  352.                                 Please Register
  353.  
  354.                                        6
  355.  
  356.  
  357.     KWIKSTAT 3
  358.  
  359.  
  360.     NAME YOUR DATABASE
  361.  
  362.     The database name must be standard DOS file name. DO NOT include an
  363.     extension to the name. Once you have named the database, you will
  364.     define the fields -- names of the places where the data will be
  365.     stored. Each variable (or field) description requires the following
  366.     information
  367.  
  368.     o A field name
  369.     o A field type (character or numeric)
  370.     o A width
  371.     o Number of decimals (if field is numeric)
  372.  
  373.     DEFINE THE FIELDS IN YOUR DATABASE
  374.  
  375.     When you first enter the definition mode, the cursor will be in the
  376.     FIELD NAME area. Enter a name (such as AGE), and press Enter.
  377.  
  378.     In the TYPE area, you only need to enter the first character of the
  379.     type (N, or C), then press Enter. If your choice is NUMERIC, press
  380.     ENTER when your cursor moves to this area (the default).
  381.  
  382.     WIDTH is the number of characters reserved for the entry. Decimal is the
  383.     number of decimal places (only relevant for numbers). Note that the number
  384.     of decimal places must be at least one less than the width. For example,
  385.     if a number has the format ###.##, the width is 6 (count the decimal
  386.     point), and the number of decimal places is 2.
  387.  
  388.     Once a complete field description is entered, a next blank field
  389.     description will appear, ready for entry. To end the creation process,
  390.     type Control-END (^END). The End key is on the numeric pad. As long as
  391.     you have not ended the procedure, you may use the cursor keys to back
  392.     up, and make any corrections. If you mess up, end the procedure with
  393.     Esc and begin again.
  394.  
  395.     If you want to enter data now, answer "Y" to the question Enter
  396.     Records Now (y/N)  Otherwise answer "N". You can always enter the
  397.     data later, or add to data already in a database.
  398.  
  399.     SPECIFICATION FOR DATABASE FIELDS
  400.  
  401.     1. The FIELDNAME: 1 to 10 characters, MUST begin with a character (A
  402.     to Z).
  403.  
  404.     2. The TYPE may be: CHARACTER - May contain any character. NUMERIC -
  405.     Must contain numbers only. Examples:1.00, -4.32, 6, 10000.
  406.  
  407.     3. The WIDTH of the field: Choose a width so that the maximum number of
  408.     characters will fit into the field.
  409.  
  410.                                 ---------------
  411.                                 Please Register
  412.  
  413.                                        7
  414.  
  415.  
  416.     KWIKSTAT 3
  417.  
  418.  
  419.     4. DECIMALS:Decimals are only valid for numeric fields. This specifies
  420.     to KWIKSTAT how many decimals to retain in the field.
  421.  
  422.     LIMITATIONS
  423.  
  424.     Maximum 250 fields.
  425.     Maximum width of a cell is 60 characters (15 for numbers).
  426.     Memo fields are not supported.
  427.     Date and Logical fields are recognized, but they cannot be used
  428.     in transformations or subsetting.
  429.  
  430.     ENTERING DATA INTO THE DATABASE
  431.  
  432.     When you choose the Data entry option, you will be asked to specify
  433.     entry from the keyboard or from a file (ASCII file). For most small
  434.     data sets, you will probably enter data from the keyboard. If another
  435.     program supports ASCII or dBASE files, you will be able to enter data
  436.     from that program in to KWIKSTAT. Also, KWIKSTAT contains a translation
  437.     facility to import data from 1-2-3 type files and comma delimited
  438.     files. (See Part V, Using KWIKSTAT Utilities.) The following
  439.     information describes how to enter data from the keyboard, from an
  440.     ASCII file.
  441.  
  442.     ENTERING DATA FROM THE KEYBOARD
  443.  
  444.     If you choose KEYBOARD data entry, an entry screen will appear
  445.     containing the fields you created in the CREATE option. Entering data
  446.     from the keyboard is similar to the way you enter field descriptions
  447.     when creating a new database. The entry screen displays the name of
  448.     each field followed by a highlighted entry area where you will type in
  449.     the contents of the field.
  450.  
  451.     Note: The word FIELD refers to the variable that contains information,
  452.     such as GROUP or AGE. The word RECORD refers to the entire collection
  453.     of FIELDS for one entry -- for example, the GROUP, AGE, TIME1, etc.
  454.     are for one person.
  455.  
  456.     While you are entering information into a record, you can use the up
  457.     and down arrow to move among fields to make corrections. Once you
  458.     enter information in the last field of a record, KWIKSTAT assumes you
  459.     have finished entering data for that record, and goes to the next
  460.     record. If a record contains too many fields to fit on one screen,
  461.     KWIKSTAT will display the first 21 fields on the screen. When you have
  462.     entered information into those fields, the next 21 fields will appear
  463.     on the screen. This will continue until information has been entered
  464.     into all fields for the record.
  465.  
  466.     If you need to go back to a previously entered record to edit,
  467.     pressing the PgUp key will automatically place you into edit mode.
  468.  
  469.                                 ---------------
  470.                                 Please Register
  471.  
  472.                                        8
  473.  
  474.  
  475.     KWIKSTAT 3
  476.  
  477.  
  478.     IMPORTANT: Once you have finished entering information, you can use
  479.     either Esc or ^END (Ctrl-End) to end the entry process. (Just as in
  480.     the dBASE program.) Be careful, since THESE TWO COMMANDS MEAN
  481.     DIFFERENT THINGS. When you press Esc to end, it means, "DO NOT SAVE
  482.     the current record." When you use ^END to end it means "SAVE the
  483.     current record." Therefore, if you are entering data, and come to the
  484.     last record, and KWIKSTAT is displaying a blank record beyond the
  485.     actual data, use the ESC to end. If you are on your last record, and
  486.     it contains information you want to keep, use the ^END to end entry.
  487.     If you accidentally end up with a blank record in your database, use
  488.     the Delete and Pack procedure to get rid of it. (See Deleting and
  489.     Packing.)
  490.  
  491.     ENTERING DATA FROM AN ASCII FILE
  492.  
  493.     KWIKSTAT can read data from ASCII text files. (See also LATENEWS.DOC
  494.     for information on entering data from a comma delimited file.) These
  495.     kinds of files are usually supported by most word processing programs
  496.     (such as WordPerfect DOS Text Mode). Data must be in the form of
  497.     column data, like this...
  498.  
  499.     A 22 3.3 WF
  500.     A 33 4.2 BF
  501.     B 27 3.3 WM
  502.     :
  503.     Etc.
  504.  
  505.     Notice that each column of data is in fixed fields. It does not matter
  506.     that there is no space between the last two fields (Race and Sex)
  507.     since the program will pick off the information from the column and
  508.     does not require that there be spaces between the columns. Use the
  509.     instructions below to prepare the KWIKSTAT (dBASE) database structure
  510.     to be used to read in ASCII data.
  511.  
  512.     The steps to enter ASCII data into KWIKSTAT are:
  513.  
  514.     STEP 1. Use the CREATE option to create a database structure to match
  515.     the columns in the ASCII file. The field widths MUST match the width
  516.     of the columns of data on file. If there are spaces between columns of
  517.     data, make widths wide enough to account for those spaces. The
  518.     following data is from the file EX.DAT on disk:
  519.  
  520.  
  521.  
  522.  
  523.  
  524.  
  525.  
  526.  
  527.  
  528.                                 ---------------
  529.                                 Please Register
  530.  
  531.                                        9
  532.  
  533.  
  534.     KWIKSTAT 3
  535.  
  536.  
  537.     A  12 22.3 25.3 28.2 30.6 5
  538.     A  11 22.8 27.5 33.3 35.8 5
  539.     B  12 22.8 30.0 32.8 31.0 4
  540.     A  12 18.5 26.0 29.0 27.9 5
  541.     :
  542.     etc
  543.     :
  544.     B  12 22.4 27.2 31.8 35.6 4
  545.  
  546.     Try your hand at doing this example by creating a database named EX
  547.     with the following structure:
  548.  
  549.     FIELD NAME     TYPE         WIDTH         DECIMALS
  550.     GROUP          C            2
  551.     AGE            N            4             0
  552.     TIME1          N            5             1
  553.     TIME2          N            5             1
  554.     TIME3          N            5             1
  555.     TIME4          N            5             1
  556.     STATUS         N            2
  557.  
  558.     Notice that even though the first column has data 1 column wide, this
  559.     structure uses a width of 2 for GROUP. Even though the age only uses 2
  560.     columns, the structure calls for AGE to have a width of 4. These
  561.     widths are enter this way to take care of the blank spaces between the
  562.     columns. Create the database called EX with the specifications listed
  563.     above, then go to the next step.
  564.  
  565.     STEP 2: Once you have defined the database to match the ASCII input
  566.     file, choose the Data entry option from the DATA menu, and choose to
  567.     read data from a file. You will be prompted to enter the name of the
  568.     file containing the ASCII data, then the data will be read into the
  569.     database file.
  570.  
  571.     STEP 3: To verify that the data was read properly, use List option to
  572.     examine the database.
  573.  
  574.     USING DBASE TYPE FILES
  575.  
  576.     If the program you are using supports dBASE files, all you have to do
  577.     to copy the file to the KWIKSTAT data directory.
  578.  
  579.  
  580.  
  581.  
  582.  
  583.  
  584.  
  585.  
  586.  
  587.                                 ---------------
  588.                                 Please Register
  589.  
  590.                                        10
  591.  
  592.  
  593.     KWIKSTAT 3
  594.  
  595.  
  596.     EDITING RECORDS
  597.  
  598.     When you choose the Edit a record option, you will be asked to specify
  599.     the record number to edit. Editing is similar to entering data. Use
  600.     the up and down arrow keys to move from field to field within a
  601.     record. Use the PgUp and PgDn keys to move forward or backwards in the
  602.     database one record at a time. When you are finished editing record,
  603.     use the ^END command to exit from the edit mode.
  604.  
  605.     DELETING RECORDS
  606.  
  607.     If you want to delete an entire record within a database, use the edit
  608.     procedure to display the record to delete. While a record is displayed,
  609.     pressing ^U marks the record for deletion. A **DEL** will appear on the
  610.     screen (upper right corner) of a "deleted" record. You can use PgUp and
  611.     PgDn to move within the database and mark as many records as you choose.
  612.     If you accidentally mark a record for delete, pressing ^U a second time
  613.     will cancel the mark, and the **DEL** will disappear from the screen.
  614.  
  615.     PACKING THE DATABASE
  616.  
  617.     The records marked for delete are not actually deleted at this point.
  618.     However, they will be ignored in most analyses. Once you have marked
  619.     one or more record for delete, you may want to permanently get rid of
  620.     them. To erase all records marked for delete, choose the Pack
  621.     procedure from the FILES menu. This procedure erases all "deleted"
  622.     records from the database.
  623.  
  624.     MODIFYING AND DISPLAYING THE STRUCTURE
  625.  
  626.     The Modify or Display database structure option on the DATA menu
  627.     allows you to display the structure of your database, and allows you
  628.     to change characteristics about the database structure. When you
  629.     choose to display the structure, a list of all field names, their
  630.     types, widths and decimals (if any) are listed.
  631.  
  632.     SETTING MISSING VALUES CODES
  633.  
  634.     Sometimes in the collection of data there are values that are lost or
  635.     cannot be gathered. These are called "missing values". When such
  636.     values occur, it is important for the program to know that the values
  637.     are missing so that statistical calculations may take this into
  638.     account. Missing values are usually designated as an impossible value.
  639.     For example, the missing values designated for the variable AGE may be
  640.     -9, since it is impossible for the variable AGE to have the value -9.
  641.     When the program is asked to calculate the mean of age, for example,
  642.     it will ignore those records where AGE is -9 in that calculation if -9
  643.     has been specified as the missing value code. In most KWIKSTAT
  644.     procedures, there is a casewise deletion of the record from
  645.     calculation whenever a missing value is encountered. Once you
  646.                                 ---------------
  647.                                 Please Register
  648.  
  649.                                        11
  650.  
  651.  
  652.     KWIKSTAT 3
  653.  
  654.  
  655.     designate a missing value code for a variable, it is up to you to make
  656.     sure that this code gets placed into your database in the proper
  657.     records and fields. For example, if you have designated -9 as the
  658.     missing value code for AGE, you must make sure that in your database a
  659.     -9 appears in the field AGE if that data is missing or unknown.
  660.  
  661.     A standard dBASE file does not have a way to designate missing values,
  662.     but KWIKSTAT allows a way for you to designate these values in this
  663.     program. The Indicate missing value codes option on the DATA menu is
  664.     used to set up these values. When this option is selected, the program
  665.     will display an entry screen that is similar to a data entry screen.
  666.     You may enter one missing value for each field name. The missing value
  667.     must obey the definition of the field in terms of length and type.
  668.  
  669.     Once missing values are entered, they are stored on disk in a file
  670.     named filename.MV, where "filename" is the name of the designated
  671.     database. If a new variable is created using the transformation
  672.     procedure, its missing value is appended to the missing value file.
  673.  
  674.     You may change or correct the missing values for a database at any
  675.     time by calling up this option. If missing values are already
  676.     designated for the database, they will be displayed on the entry
  677.     screen, and you may edit them or accept them as they are.
  678.  
  679.     IMPORTANT NOTE: If missing values are NOT used, and there is a blank
  680.     numeric variable in a calculation, it will be treated like the value 0
  681.     (zero), so it is important to use missing values if your data contains
  682.     such entries. Otherwise, the statistical calculations will be in
  683.     error!!
  684.  
  685.     MAKING A VARIABLE BY TRANSFORMATION
  686.  
  687.     You may create a new numeric variable in a database by choosing the
  688.     Transformation option. For example, if you wanted a new variable to be
  689.     the ratio of WEIGHT to HEIGHT, you could name a new variable RATIO,
  690.     and use the transformation WEIGHT/HEIGHT as the expression to create
  691.     the new variable.
  692.  
  693.     When you request the TRANSFORMATION procedure, you will
  694.        o Define a name for the new field
  695.        o Define a width for the new variable.
  696.        o Define the number of decimals, if any.
  697.        o Define a missing value code. If none is selected, it is
  698.          assumed to be 0 (zero).
  699.  
  700.     CAREFUL ATTENTION must be paid to the definition to assure that the
  701.     calculated numbers will fit into the field width specifications. If
  702.     the calculated number is too large to fit into the field, it will be
  703.     given the missing value code. If an illegal calculation is attempted,
  704.     such as a division by 0, the result will be missing. If a calculation
  705.                                 ---------------
  706.                                 Please Register
  707.  
  708.                                        12
  709.  
  710.  
  711.     KWIKSTAT 3
  712.  
  713.  
  714.     includes a missing value, the result will be a missing values.
  715.  
  716.     TRANSFORMATIONS SUPPORTED
  717.  
  718.     KWIKSTAT supports standard mathematical operation and functions, as
  719.     described below:
  720.  
  721.     Mathematical operators: Add (+), Subtract (-), Multiply (*), divide
  722.     (/) and exponenation(^).
  723.  
  724.     Following are a few examples of correct expressions:
  725.  
  726.      NEW = AGE/HEIGHT
  727.      NEW = SUM(AGE,WEIGHT,HEIGHT,SCORE)
  728.      NEW = PI * (SCORE ^ 2)
  729.  
  730.     Notice that SUM is a function. KWIKSTAT supports over 20 functions,
  731.     including ABS, ACOS, ASIN, ATAN, ATAN2, CSC, COS, COT, EXP, INT, LN,
  732.     LOG, MAX, MIN, MOD, PI, RAND, RECNO, RECODE, ROUND, SEC, SIN, SQRT,
  733.     SUM and TAN.
  734.  
  735.     The RECODE function is defined as follows:
  736.  
  737.     NEW = RECODE(SCORE,1,0,10,15) means NEW = 1 if SCORE is between 10 and
  738.     15, else NEW=0)
  739.  
  740.     SUBSETTING THE DATABASE
  741.  
  742.     The Subset database option on the DATA menu allows you to create a new
  743.     database from an old database. The new database can be a subset of the
  744.     old one, using a conditional criteria for outputting information from
  745.     the old database to the new one.
  746.  
  747.     For example, suppose you have a database with a field GROUP with
  748.     values 1, 2, 3, 4 and 5. You want to create a database that does NOT
  749.     include Group 5. After choosing Subset database from the DATA menu,
  750.     you are asked for the name of the new database. For example, your new
  751.  
  752.     database might be named NO5.DBF. You are asked for the field name to
  753.     be used in the selection criteria. In this case, you would choose the
  754.     field named GROUP. Next you must enter the selection relationship. It
  755.  
  756.     will be described as a numerical expression. The conditional
  757.     operators you may use are: = > < >= <= <> = and the logical operator
  758.     ".NOT.".
  759.  
  760.     The program will prompt you with
  761.  
  762.     SELECT IF GROUP
  763.  
  764.                                 ---------------
  765.                                 Please Register
  766.  
  767.                                        13
  768.  
  769.  
  770.     KWIKSTAT 3
  771.  
  772.  
  773.     and you must finish the selection criteria. For example:
  774.  
  775.     SELECT IF GROUP .NOT. = 5
  776.  
  777.     (Select records for which the variable GROUP is not equal to 5.) You
  778.     may use all of the variables in the database in the of the expression,
  779.     and you may use the functions described in the Transformation option.
  780.  
  781.     For example, other selections might be
  782.  
  783.     SELECT IF GROUP = 4
  784.     SELECT IF GROUP > STATUS
  785.     SELECT IF GROUP < WEIGHT*HEIGHT
  786.     SELECT IF TIME1 = TIME2*1.96
  787.  
  788.     LISTING THE DATABASE TO THE SCREEN
  789.  
  790.     The LIST option on the DATA menu allows you to look at the information
  791.     in your database.
  792.  
  793.     -------------------------------------------------------------------
  794.     DO THIS TUTORIAL TO LEARN ABOUT CREATING A DATABASE
  795.     -------------------------------------------------------------------
  796.  
  797.     TUTORIAL:YOUR TURN - GIVE IT A TRY
  798.  
  799.     Suppose you are given data from an experiment. The data are from a
  800.     sample of 15 hogs (randomized to four groups) that have been given
  801.     one of four feeds. The measured response for this experiment is weight
  802.     gain. The data are summarized below:
  803.  
  804.         FEED1       FEED2       FEED3       FEED4
  805.         60.8        78.7        92.6        86.9
  806.         67.0        77.7        84.1        82.2
  807.         54.6        76.3        90.5        83.7
  808.         61.7        79.8        90.3
  809.  
  810.     This will be analyzed as a One-Way Analysis of Variance. For that
  811.     procedure, you must have a grouping variable (FEED) and a response
  812.     variable (WEIGHT GAIN). Therefore, the database to be created for this
  813.     data will have two variables. You can call them FEED and WEIGHT.
  814.     Before entering the database, you must first create a new database:
  815.  
  816.     STEP 1. Begin the KWIKSTAT program from the DOS prompt with the KS
  817.     command. From the DATA menu, choose the option Create a new database.
  818.  
  819.     STEP 2. The database creation screen will appear. On this screen,
  820.     define the two fields. Field one will be named FEED, it will be of
  821.     NUMERIC type with a width of 2, with no decimals. Field two will be
  822.     named WEIGHT, it will be of NUMERIC type with a with of 5 and 1
  823.                                 ---------------
  824.                                 Please Register
  825.  
  826.                                        14
  827.  
  828.  
  829.     KWIKSTAT 3
  830.  
  831.  
  832.     decimal place. (NOTE:Widths could actually be 1 and 4 instead of 2 and
  833.     5, but the one extra space gives you some space for unexpected large
  834.     values and makes data entry easier.) Enter the two field
  835.     specifications on the creation screen:
  836.  
  837.     FIELD 1: FEED, NUMERIC, WIDTH 2, NO DECIMALS
  838.     FIELD 2: WEIGHT, NUMERIC, WIDTH 5, 1 DECIMAL PLACE
  839.  
  840.     End the database creation process by entering a ^END (Hold the CTRL
  841.     key down with one finger, and press the End key with another finger.)
  842.  
  843.     STEP 3. You will be asked if you want to enter the data now. Answer Y for
  844.     yes. The data entry screen will appear. On the first screen (the first
  845.     record, you will enter the following values:
  846.  
  847.     FEED       N: 1    <--- You enter the 1
  848.     WEIGHT     N:60.8  <--- You enter the 60.8
  849.  
  850.     The next record will be FEED=1, WEIGHT=67.0, and so on. The following
  851.     table lists the values you will enter into the database:
  852.  
  853.        FEED          WEIGHT
  854.         1            60.8
  855.         1            67.0
  856.         1            54.6
  857.         1            61.7
  858.         2            78.7
  859.         2            77.7
  860.         2            76.3
  861.         2            79.8
  862.         3            92.6
  863.         3            84.1
  864.         3            90.5
  865.         4            86.9
  866.         4            82.2
  867.         4            83.7
  868.         4            90.3
  869.  
  870.     It is important to understand how KWIKSTAT reads this data from the
  871.     database. The FEED variable places the WEIGHT values in one of four
  872.     groups. Thus, KWIKSTAT "knows" that the number 77.7 belongs to group
  873.     (FEED) 2, and so on.
  874.  
  875.     STEP 4. Once you have entered the data for the 15 hogs into the
  876.     database, the screen should be displaying the data entry screen for
  877.     record 16, which does NOT contain any data. To end the entry procedure
  878.     and NOT save the empty record 16, press the Esc key. Your data is now
  879.     saved in the database.
  880.  
  881.     STEP 5. Always verify that your data is correctly entered by choosing
  882.                                 ---------------
  883.                                 Please Register
  884.  
  885.                                        15
  886.  
  887.  
  888.     KWIKSTAT 3
  889.  
  890.  
  891.     the List option from the DATA menu. This lists the values to the
  892.     screen. If everything looks okay, you are ready to analyze your
  893.     information. The various procedures in KWIKSTAT expect the data to be
  894.     stored in a particular way to perform a statistical test. Refer to the
  895.     sections on each procedure for examples of how to design your database
  896.     to match the expectations of that procedure.
  897.  
  898.     PART III
  899.     -----------------------------------------------------------
  900.  
  901.     The Data Generations and Simulations module contains several
  902.     simulations that can be used to demonstrate statistical concepts.
  903.  
  904.     PART IV - PERFORMING A STATISTICAL ANALYSIS
  905.     ------------------------------------------------------------
  906.  
  907.     This section of the KWIKSTAT manual describes the statistical analysis
  908.     procedures available in the basic KWIKSTAT program.
  909.  
  910.     USING DESCRIPTIVE STATISTICS AND GRAPHS
  911.  
  912.     The Descriptive Statistics and Graphs module allows you to examine
  913.     summary statistics of the data in a database. Procedures and graphics
  914.     in this module include:
  915.  
  916.     DETAILED STATISTICS ON A SINGLE VARIABLE
  917.  
  918.     This option calculates the mean, standard deviation, median, standard
  919.     error of the mean, minimum, maximum, sum, and variance of a set of
  920.     data. KWIKSTAT also calculates five percentiles and computes a
  921.     two-sided confidence interval about the mean. You have the opportunity
  922.     to specify the five percentiles to be calculated, as well as the level
  923.     of confidence of the confidence interval.
  924.  
  925.     EXAMPLE 4.1: DESCRIPTIVE STATISTICS ON A SINGLE VARIABLE
  926.  
  927.     Suppose you have the following data on seven persons, and you want to
  928.     know the average age of persons in the group being weighed.
  929.  
  930.     Data for Age/Weight Example
  931.  
  932.     Person   Age   Weight
  933.     1        23   140.0
  934.     2        21   133.5
  935.     3        34   200.0
  936.     4        33   150.0
  937.     5        40   296.5
  938.     6        28   167.0
  939.     7        25   175.5
  940.  
  941.                                 ---------------
  942.                                 Please Register
  943.  
  944.                                        16
  945.  
  946.  
  947.     KWIKSTAT 3
  948.  
  949.  
  950.     CREATING THE DATABASE
  951.  
  952.     The database will include seven records (one for each of the seven
  953.     persons) and two fields ( for the two variables, age and weight). That
  954.     is, in each record two pieces of information about that person (age
  955.     and weight) will be entered.
  956.  
  957.     FIELD NAME    TYPE    WIDTH  DECIMALS
  958.     1     AGE     Numeric 3      0
  959.     2     WEIGHT  Numeric 6      1
  960.  
  961.     You will be asked if you want to enter records now. Answer Yes by
  962.     typing Y and pressing Enter. A data entry screen will appear where you
  963.     will enter the data. The data you will enter in the first record is 23
  964.     (press Enter) and 140.0 (press Enter).
  965.  
  966.     Enter the data for the seven records. Refer to the example in the
  967.     database tutorial for entering the data. After entering the data,
  968.     examine the AGELBS database by choosing the List (display) the
  969.     contents of a database option from the Data menu. The data in the
  970.     database should look like this:
  971.  
  972.     RECNO   AGE   WEIGHT
  973.     1       23   140.0
  974.     2       21   133.5
  975.     3       34   200.0
  976.     4       33   150.0
  977.     5       40   296.5
  978.     6       28   167.0
  979.     7       25   175.5
  980.  
  981.     If your data do not look like this, use the Edit a record option to
  982.     correct errors.
  983.  
  984.     PERFORMING THE ANALYSIS
  985.  
  986.     Once you have entered the data into a database, choose the DESCRIPTIVE
  987.     STATISTICS AND GRAPHS module from the Analyze pull-down menu. The
  988.     Descriptive Statistics and Graphs menu will appear. Select DETAILED
  989.     STATISTICS ON A SINGLE VARIABLE.
  990.  
  991.     You will be prompted to choose the field name of the variable on which
  992.     you wish to calculate summary statistics. In this case Enter 1, which
  993.     chooses AGE.
  994.  
  995.     You will then be asked to specify the level of confidence for the
  996.     confidence interval. If you want a 95% C.I., simply press Enter for
  997.     the default setting. If you want, say, a 99% interval, type .99. Next,
  998.     you will be asked if you want to specify percentiles other than the
  999.     Tukey 5 number summary (0, 25th, 50th, 75th, 100th). If you answer
  1000.                                 ---------------
  1001.                                 Please Register
  1002.  
  1003.                                        17
  1004.  
  1005.  
  1006.     KWIKSTAT 3
  1007.  
  1008.  
  1009.     yes, you will be prompted for the five percentiles you want. KWIKSTAT
  1010.     will perform the calculations and display the results. Figure 4.1
  1011.     shows the results of the summary statistics procedure on the AGE
  1012.     variable using default settings for percentiles and a 95% C.I.
  1013.  
  1014.     SUMMARY STATISTICS ON A NUMBER OF VARIABLES
  1015.  
  1016.     This option is similar to the above Descriptive statistics on a single
  1017.     variable, but in this option several variables can be summarized using
  1018.     descriptive statistics (sample size, mean, standard deviation,
  1019.     minimum, maximum, and standard error of the mean). If you have a
  1020.     grouping variable in your database, you may request output of summary
  1021.     statistics by group. You are also given the opportunity to print
  1022.     results to the printer, or to output results to a file.
  1023.  
  1024.     APPROXIMATE P-VALUE DETERMINATION
  1025.  
  1026.     This option calculates p-values for entered values of four test
  1027.     statistics: normal (z), student's t, F, chi-square. If you designate
  1028.     the statistic being used, degrees of freedom and the calculated value
  1029.     of the test statistic, KWIKSTAT will tell you the p-value associated
  1030.     with that test statistic.
  1031.  
  1032.     PRODUCING A HISTOGRAM
  1033.  
  1034.     This procedure produces a histogram from values read from a database.
  1035.     A histogram can be helpful in determining if the distribution of a
  1036.     continuous variable is approximated by a normal distribution. If the
  1037.     histogram has a peak toward the center, with both tails diminishing,
  1038.     the data could be considered to be approximated by a normal
  1039.     distribution.
  1040.  
  1041.     PRODUCING AN XY-PLOT (SCATTERPLOT)
  1042.  
  1043.     This option enables you to produce a scatterplot of two variables. A
  1044.     scatterplot is simply a plot of all the data values plotted one
  1045.     variable against the other. Such a plot is helpful in determining if
  1046.     two variables are related, and if the relationship is linear (a
  1047.     straight line), curvilinear, or something else.
  1048.  
  1049.     TIME SERIES PLOT
  1050.  
  1051.     This option enables you to produce a time-series plot for one
  1052.     variable. This plot is useful in examining data that is time related,
  1053.     such as profit by month, etc. The X axis is assumed to be "time". The
  1054.     data values must be entered into records in chronological order the
  1055.     observations occurred, i.e., the first record must contain the results
  1056.     of the first observation (first time period), etc. Use UNEMP variable
  1057.     in the LONGLEY database to see an example of graphing an observation
  1058.     over time.
  1059.                                 ---------------
  1060.                                 Please Register
  1061.  
  1062.                                        18
  1063.  
  1064.  
  1065.     KWIKSTAT 3
  1066.  
  1067.  
  1068.  
  1069.     USING T-TESTS AND ANOVA PROCEDURES
  1070.  
  1071.     T-tests and Analysis of Variance (ANOVA) procedures are used to test
  1072.     hypotheses about population means using data obtained through random
  1073.     sampling of those populations.
  1074.  
  1075.     PARAMETRIC INDEPENDENT GROUP ANALYSIS
  1076.  
  1077.     Independent group analysis is appropriate when observations are
  1078.     taken from groups in which subjects in one group do not appear in
  1079.     another group. In this module, a t-test is performed when there are
  1080.     two groups, and an ANOVA is performed when there are three to ten
  1081.     groups being compared. When performing a t-test or ANOVA on two or
  1082.     more independent groups, you are testing the hypotheses:
  1083.  
  1084.     Ho:  The difference in the means of the groups is zero.
  1085.     Ha:  The difference in the means of the groups is not zero.
  1086.  
  1087.     For a two-sample t-test, two t-statistics are calculated, one for
  1088.     the case in which the variances of the two samples are equal and
  1089.     the other for use in the case of unequal variances. KWIKSTAT
  1090.     performs a test of the hypothesis that the variances are equal,
  1091.     that is, a test to determine if the variances are equal, and
  1092.     reports a p-value. If this p-value is small (e.g., less than 0.05),
  1093.     the hypothesis of equal variances is rejected and you use the
  1094.     t-statistic for unequal variances. If the p-value is large, use the
  1095.     t-statistic for equal variances.
  1096.  
  1097.     EXAMPLE 4.7: TWO SAMPLE T-TEST (INDEPENDENT GROUPS)
  1098.  
  1099.     The data used here are heights of 13 plants grown using two
  1100.     different fertilizers. Suppose you want to know if there is a
  1101.     difference in the average heights of plants in the two treatment
  1102.     groups.
  1103.  
  1104.     Data for independent group t-test (fertilizer study)
  1105.  
  1106.     Present Fertilizer   Newer Fertilizer
  1107.     46.2 cm               51.3 cm
  1108.     55.6                  52.4
  1109.     53.3                  54.6
  1110.     44.8                  52.2
  1111.     55.4                  64.3
  1112.     56.0                  55.0
  1113.     48.9
  1114.  
  1115.     In order to enter this data into a database, you must assign group
  1116.     numbers (or letters) such as Present = 1 and Newer = 2, or you
  1117.     could use P and N (if the variable is of the character type).
  1118.                                 ---------------
  1119.                                 Please Register
  1120.  
  1121.                                        19
  1122.  
  1123.  
  1124.     KWIKSTAT 3
  1125.  
  1126.  
  1127.  
  1128.     Since the observations are independent, the database will include
  1129.     thirteen records (one for each plant) and two fields (one for the
  1130.     response and one for the group indicator.
  1131.  
  1132.     FIELD    NAME       TYPE      WIDTH  DECIMALS
  1133.     1        GROUP      Numeric   5      0
  1134.     2        HEIGHT     Numeric   5      1
  1135.  
  1136.     You can choose any field names up to ten characters. You may want to
  1137.     use FERTILIZER instead of GROUP, for example. You will be asked if you
  1138.     want to enter records now. Answer Yes by typing Y and pressing Enter.
  1139.  
  1140.     A data entry screen will appear where you will enter the data. The
  1141.     data you will enter in the first record is 1 (press Enter) and 46.2
  1142.     (press Enter). Enter the data for the thirteen records. For each
  1143.     record of a "Present Fertilizer" observation, enter "1" for the GROUP
  1144.     variable. For the "Newer" observations enter a "2" for the GROUP
  1145.     variable. The second record is a 1 and 55.6. They eighth record is 2
  1146.     and 51.3.
  1147.  
  1148.     From the List option the data in the database should look like this:
  1149.  
  1150.     RECNO  GROUP   HEIGHT
  1151.     1       1       46.2
  1152.     2       1       55.6
  1153.     3       1       53.3
  1154.     4       1       44.8
  1155.     5       1       55.4
  1156.     6       1       56.0
  1157.     7       1       48.9
  1158.     8       2       51.3
  1159.     9       2       52.4
  1160.     10      2       54.6
  1161.     11      2       52.2
  1162.     12      2       64.3
  1163.     13      2       55.0
  1164.  
  1165.     Notice that the GROUP field is 1 if the data are from the Present
  1166.     Fertilizer group and 2 if the data are from the Newer Fertilizer
  1167.     group.
  1168.  
  1169.  
  1170.  
  1171.  
  1172.  
  1173.  
  1174.  
  1175.  
  1176.  
  1177.                                 ---------------
  1178.                                 Please Register
  1179.  
  1180.                                        20
  1181.  
  1182.  
  1183.     KWIKSTAT 3
  1184.  
  1185.  
  1186.     PERFORMING THE ANALYSIS
  1187.  
  1188.     Once you have entered the data into a database, select the T-TESTS AND
  1189.     ANALYSIS OF VARIANCE option from the Analyze menu. Then select the
  1190.     COMPARE INDEPENDENT GROUPS option.
  1191.  
  1192.     You will be prompted to choose the field name of the grouping
  1193.     variable, which in this case is simply GROUP. Enter 1, which chooses
  1194.     GROUP. Next, you will be asked for the data field. Enter 2, which
  1195.     chooses HEIGHT, the response variable. KWIKSTAT will now perform the
  1196.     calculations and display the results on the screen, as illustrated in
  1197.     Figure 4.6.
  1198.  
  1199.     The means for each group (1=Present, 2=Newer) are displayed. A test
  1200.     for equality of variance is also performed to see if the variances
  1201.     of the two groups can be considered equal. This is necessary for
  1202.     deciding which t-statistic and p-value to use for the text on
  1203.     means. A p-value for the equal variances test is displayed. A large
  1204.     p-value (e.g., greater than 0.05) indicates that you can consider
  1205.     the variances to be equal. In this case, p=0.4807, large enough to
  1206.     consider the variances to be equal.
  1207.  
  1208.     If the variances are equal, according to this test, you use the "Equal
  1209.     variances" t-statistic. Otherwise, use the "Unequal variances" result.
  1210.     In this case, the two t-statistics are identical at -1.32. The t-test
  1211.     is performed with 11 degrees of freedom, and the p=value associated
  1212.     with the test is 0.213. A large p-value (greater than the significance
  1213.     level, e.g., 0.05) is usually interpreted to mean that there is no
  1214.     significant difference in the means -- the null hypothesis of equal
  1215.     means is not rejected. That is, there is not enough evidence to
  1216.     conclude that the average height of plants grown with the newer
  1217.     fertilizer is significantly different from the average height of
  1218.     plants grown with the present fertilizer.
  1219.  
  1220.     Type G for a graphical comparison of the two samples. Tukey's five
  1221.     number summaries and box plots will appear. Press Esc to continue and
  1222.     you will be given the option to print a report for this analysis.
  1223.  
  1224.     EXAMPLE 4.8. SINGLE FACTOR ANOVA
  1225.  
  1226.     When more than two independent groups are compared with respect to one
  1227.     variable, one-way or single factor analysis of variance techniques are
  1228.     appropriate. This example uses data for hogs which have been randomly
  1229.     assigned to four groups, with each group being given a different feed.
  1230.     The response is weight gain.
  1231.  
  1232.  
  1233.  
  1234.  
  1235.  
  1236.                                 ---------------
  1237.                                 Please Register
  1238.  
  1239.                                        21
  1240.  
  1241.  
  1242.     KWIKSTAT 3
  1243.  
  1244.  
  1245.     Data for Independent Group ANOVA
  1246.  
  1247.        GP1    GP2    GP3    GP4
  1248.        60.8   78.7   92.6   86.9
  1249.        67.0   77.7   84.1   82.2
  1250.        54.6   76.3   90.5   83.7
  1251.        61.7   79.8   90.3
  1252.  
  1253.     The database to analyze this data is similar to the one used for
  1254.     Example 4.7 above, differing only with respect to the number of
  1255.     groups. In fact, this one-way ANOVA is an extension of the t-test when
  1256.     there are three or more groups.
  1257.  
  1258.     See the tutorial in the database section for information on how to
  1259.     create and enter this database.
  1260.  
  1261.     The results of this test are summarized in the p-value. In this case,
  1262.     the small p-value (0.000) means that there is a significant difference
  1263.     between groups.
  1264.  
  1265.     The ANOVA tells you only that there is a difference among the feeds.In
  1266.     order to find out which groups are significantly different from which
  1267.     others, press M to choose (M)ultiple comparison. The Newman-Keuls
  1268.     multiple comparison test will describe which of the means are
  1269.     significantly different from which others (at the 0.05 significance
  1270.     level). Figure 4.8 displays a graphical representation of the
  1271.     Newman-Keuls multiple comparisons test. See the example of Friedman's
  1272.     test for how to interpret the Newman-Keuls chart.
  1273.  
  1274.     Box plots are also available to graphically illustrate the differences
  1275.     between the groups. Type G (for graphical comparison) and press Enter
  1276.     to produce the plots.
  1277.  
  1278.     PARAMETRIC REPEATED MEASURES (PAIRED) ANALYSIS
  1279.  
  1280.     Repeated measures are observations taken on the same or related
  1281.     subjects over time or in differing circumstances. Examples would be
  1282.     weight loss, or reaction to a drug across time. Repeated measures may
  1283.     also be matched subjects.
  1284.  
  1285.     A t-test is performed when there are two groups (two repeated
  1286.     measures), and an analysis of variance is performed if there are three
  1287.     to ten groups.
  1288.  
  1289.     In a database for paired or repeated measures data, each record
  1290.     represents one subject (e.g., person, animal). There must be one field
  1291.     for each repeated measure (each treatment group). For paired data,
  1292.     there are two groups, hence two fields. Thus, in each record, there is
  1293.     a field in which to enter data from each observation (treatment) on
  1294.     that subject. The hypotheses being tested with a paired t-test or a
  1295.                                 ---------------
  1296.                                 Please Register
  1297.  
  1298.                                        22
  1299.  
  1300.  
  1301.     KWIKSTAT 3
  1302.  
  1303.  
  1304.     repeated measures ANOVA is:
  1305.  
  1306.     Ho: There is no difference among means of the groups (repeated
  1307.     measures).
  1308.     Ha: There is a difference among means of the groups.
  1309.  
  1310.     EXAMPLE 4.9: PAIRED T-TEST
  1311.  
  1312.     The data in this example are before and after weights for eight
  1313.     persons on a diet. Notice that in this case, both data values are
  1314.     taken from the SAME entity (person).
  1315.  
  1316.     Data for paired t-test
  1317.  
  1318.     Person  Before  After
  1319.      1      162     168
  1320.      2      170     136
  1321.      3      184     147
  1322.      4      164     159
  1323.      5      172     143
  1324.      6      176     161
  1325.      7      159     143
  1326.      8      170     145
  1327.  
  1328.     The database will include two fields (BEFORE and AFTER) and eight
  1329.     records, one for each person. Since the observations are paired, not
  1330.     independent, the database reflects this by having each record contain
  1331.     a pair of observations. Each record, that is, each person, is
  1332.     independent of the over seven persons, but within a record, the before
  1333.     and after observations are not independent of each other.
  1334.  
  1335.     FIELD   NAME    TYPE     WIDTH  DECIMALS
  1336.      1      BEFORE  Numeric   5      0
  1337.      2      AFTER   Numeric   5      0
  1338.  
  1339.     As a result of the analysis, the means and standard deviations for
  1340.     each group are displayed, but more importantly, the mean difference
  1341.     between BEFORE and AFTER measurements is given. The statistical
  1342.     procedures are performed on this average difference. A 95% confidence
  1343.     interval for the mean difference is given, as well as a calculated
  1344.     t-statistic and a p-value. These results are interpreted like those of
  1345.     a single sample t-test with null hypothesis: mean=0, and alternative
  1346.     hypothesis: mean <> 0.
  1347.  
  1348.     The calculated t-statistic is 2.37. The p-value associated with the
  1349.     test is 0.008. A small p-value such as this is usually interpreted to
  1350.     indicate rejection of the null hypothesis and leads to the conclusion
  1351.     that the average difference in BEFORE and AFTER weights is not zero,
  1352.     i.e., there is evidence of a significant (at the 0.05 level) change of
  1353.     weight in these eight subjects on average.
  1354.                                 ---------------
  1355.                                 Please Register
  1356.  
  1357.                                        23
  1358.  
  1359.  
  1360.     KWIKSTAT 3
  1361.  
  1362.  
  1363.  
  1364.     EXAMPLE 4.10: ONE-WAY REPEATED MEASURES ANOVA
  1365.  
  1366.     For more than a pair of repeated measures on the same subject, a
  1367.     one-way repeated measures analysis of variance is appropriate. The
  1368.     data in this example are repeated measures of reaction times of five
  1369.     persons after being treated with four drugs in randomized order.
  1370.  
  1371.     One-way repeated measures ANOVA data
  1372.  
  1373.     Person   Drug 1   Drug 2   Drug 3   Drug 4
  1374.     1         31       29       17       35
  1375.     2         15       17       11       23
  1376.     3         25       21       19       31
  1377.     4         35       35       21       45
  1378.     5         27       27       15       31
  1379.  
  1380.     Create a database (named e.g., MEDICINE) with the field names, e.g.,
  1381.     DRUG1, DRUG2, DRUG3, DRUG4. For the first record, enter the data for
  1382.     the first person 31,29,17,35. The second record will contain
  1383.     15,17,11,23 and so forth.
  1384.  
  1385.     You will be prompted to choose the fields which you wish to
  1386.     compare. Enter 1,2,3,4. KWIKSTAT will now perform the calculations
  1387.     and display the results on the screen.
  1388.  
  1389.     The results of this ANOVA are summarized in the p-value. In this case,
  1390.     the small p-value (p=0.000) means that there is a statistically
  1391.     significant difference in the mean response times for the four drugs.
  1392.  
  1393.     If you want to determine which of the four drugs are significantly
  1394.     different from which others, press M for Multiple comparison. The
  1395.     Newman-Keuls multiple comparison test will describe which of the means
  1396.     are significantly different from which others (at the 0.05
  1397.     significance level).
  1398.  
  1399.     INDEPENDENT GROUP TESTS FROM SUMMARY DATA
  1400.  
  1401.     This option allows you to perform a one-way ANOVA or a t-test if you
  1402.     have only the means, standard deviations and group sizes of two to ten
  1403.     groups. Since data are summary, no box plots can be given.
  1404.  
  1405.  
  1406.  
  1407.  
  1408.  
  1409.  
  1410.  
  1411.  
  1412.  
  1413.                                 ---------------
  1414.                                 Please Register
  1415.  
  1416.                                        24
  1417.  
  1418.  
  1419.     KWIKSTAT 3
  1420.  
  1421.  
  1422.     SINGLE SAMPLE ANALYSIS
  1423.  
  1424.     This option allows you to choose a single variable, and test a
  1425.     hypothesis that the mean differs from a hypothesized mean. You must
  1426.     enter the hypothesized population mean. The hypotheses you are testing
  1427.     in this case are: Ho: The mean equals the hypothesized value. Ha: The
  1428.     mean does not equal the hypothesized value.
  1429.  
  1430.     USING NON-PARAMETRIC COMPARATIVE PROCEDURES
  1431.  
  1432.     Non-parametric procedures are appropriate when the assumption of
  1433.     normality cannot be made for a small data set or when a large data set
  1434.     is known to be from a non-normal population. Non-parametric procedures
  1435.     are generally based on ranks rather than actual data values, so these
  1436.     procedures can be useful also when actual data values are not known,
  1437.     but the order or ranks of the data values are known.
  1438.  
  1439.     NON-PARAMETRIC INDEPENDENT GROUP ANALYSIS - MANN-WHITNEY AND KRUSKAL
  1440.     WALLIS TESTS
  1441.  
  1442.     In the Non-Parametric Comparison Tests Module, KWIKSTAT uses the
  1443.     Mann-Whitney procedure if two independent groups are being compared,
  1444.     and the Kruskal Wallis procedure if three or more groups are being
  1445.     compared. The hypotheses being tested are:
  1446.  
  1447.     Ho: There is no difference in the medians of the groups.
  1448.     Ha: There is a difference in the medians of the groups.
  1449.  
  1450.     EXAMPLE 4.15: MANN-WHITNEY NON-PARAMETRIC TEST OF TWO INDEPENDENT
  1451.     GROUPS
  1452.  
  1453.     The data from Example 4.7, are used in this example, the database
  1454.     named FERTILIZ.
  1455.  
  1456.     KWIKSTAT will perform the calculations and display the results,
  1457.     including the Mann-Whitney U statistic, the rank sums, sample sizes
  1458.     and mean ranks of the groups, a z statistic and an approximate
  1459.     p-value. In this case, U=24.00, z=0.421 and p=0.673. The p-value is
  1460.     large so the null hypothesis of no difference in medians between
  1461.     groups is not rejected. There is not sufficient evidence based on this
  1462.     procedure to say that there is a difference between the median heights
  1463.     of plants in the two groups grown using different fertilizers.
  1464.  
  1465.  
  1466.  
  1467.  
  1468.  
  1469.  
  1470.  
  1471.  
  1472.                                 ---------------
  1473.                                 Please Register
  1474.  
  1475.                                        25
  1476.  
  1477.  
  1478.     KWIKSTAT 3
  1479.  
  1480.  
  1481.     KRUSKAL-WALLIS PROCEDURE
  1482.  
  1483.     If more than two independent groups are being compared using
  1484.     non-parametric methods, KWIKSTAT uses the Kruskal Wallis test.
  1485.  
  1486.     NON-PARAMETRIC REPEATED MEASURES ANALYSIS  - FRIEDMAN'S TEST
  1487.  
  1488.     When repeated observations are taken on the same subject, and there is
  1489.     interest in comparing the observations for each repeated measure
  1490.     (e.g., each type of treatment), then a repeated measures analysis may
  1491.     be appropriate. If you cannot make the assumption that the data that
  1492.     being observed are normally distributed with equal variances between
  1493.     repeated measures, then a non-parametric analysis is appropriate. One
  1494.     method of performing a non-parametric one-way analysis of variance
  1495.     (ANOVA) with repeated measures (randomized complete block experimental
  1496.     design) is with the Friedman test. (When there are only two groups,
  1497.     this test is equivalent to the sign test.) The hypotheses for the
  1498.     Friedman test are:
  1499.  
  1500.     Ho:There is no difference in mean ranks between repeated measures.
  1501.     Ha:There is a difference in mean ranks between repeated measures.
  1502.  
  1503.     The following data are the same data used in a previous example for a
  1504.     standard repeated measures ANOVA:
  1505.  
  1506.     One Way Repeated Measures ANOVA Data
  1507.  
  1508.     Person   Drug 1  Drug 2   Drug 3   Drug 4
  1509.     1        31      29       17       35
  1510.     2        15      17       11       23
  1511.     3        25      21       19       31
  1512.     4        35      35       21       45
  1513.     5        27      27       15       31
  1514.  
  1515.     The data presented here are repeated measures of reaction times of 5
  1516.     persons after being given 4 drugs in randomized order. For a Friedman
  1517.     test, the analysis is performed by ranking the data within each of the
  1518.     5 subjects.
  1519.  
  1520.     KWIKSTAT calculates the Friedman's Chi-Square and reports the p-value
  1521.     associated with the test. If the resulting p-value is low (usually
  1522.     less than 0.05), it is appropriate to examine multiple comparisons of
  1523.     the groups (repeated measures).
  1524.  
  1525.     To perform the FRIEDMAN test, choose the REPEATED MEASURES ANALYSIS
  1526.     option from the Non-Parametric Tests menu. You will be prompted to
  1527.     choose the field names that represent the repeated measures you want
  1528.     to compare. In this case, enter
  1529.  
  1530.     1,2,3,4
  1531.                                 ---------------
  1532.                                 Please Register
  1533.  
  1534.                                        26
  1535.  
  1536.  
  1537.     KWIKSTAT 3
  1538.  
  1539.  
  1540.  
  1541.     which chooses fields DRUG1, DRUG2, DRUG3 and DRUG4. KWIKSTAT will now
  1542.     perform the calculations and display the results on the screen.
  1543.  
  1544.     For this data set, a Chi-Square value of 14.13 and a small p-value
  1545.     (p=0.00, which means p < 0.005) is reported. The small p-value means
  1546.     that there is a statistically significant difference in the mean ranks
  1547.     of times for the four drugs. Press Enter to see the results of the
  1548.     Newman-Keuls multiple comparison test. This test describes which of
  1549.     the mean ranks are significantly different from the others (at the
  1550.     0.05 significance level).
  1551.  
  1552.     In this case, the following results are reported from the multiple
  1553.     comparison procedure:
  1554.  
  1555.                     Gp     Gp     Gp     Gp
  1556.                     3      2      1      4
  1557.     Population 1           ----------------
  1558.     Population 2   -----------------
  1559.  
  1560.     This table is interpreted in the following way: Any two groups
  1561.     underlined by the same line are considered not different at the 0.05
  1562.     level of significance. Therefore, the result of this analysis is that
  1563.     the mean rank for DRUG 3 is less than the mean rank for DRUG 4. There
  1564.     are no other statistically significant pairwise differences among the
  1565.     four groups.
  1566.  
  1567.     NON-PARAMETRIC DICHOTOMOUS DATA ANALYSIS - COCHRAN'S Q
  1568.  
  1569.     Cochran's Q procedure is a non-parametric procedure appropriate for
  1570.     use with dichotomous data when the experiment involves repeated
  1571.     measures on blocks. Often the blocks are subjects (people or
  1572.     animals). The response of the subjects to the treatments is
  1573.     dichotomous if it is taken as one of only two possible outcomes, often
  1574.     labeled "success" and "failure", rather than as a measurement.
  1575.     Cochrans's Q is used to test three or more treatments, or groups, and
  1576.     is in fact an extension of McNemar's test for two groups.
  1577.  
  1578.     The hypotheses being tested are:
  1579.  
  1580.     Ho: The proportion of successes is the same for all treatments.
  1581.     Ha: The proportion of successes is not the same for all treatments.
  1582.  
  1583.  
  1584.  
  1585.  
  1586.  
  1587.  
  1588.  
  1589.  
  1590.                                 ---------------
  1591.                                 Please Register
  1592.  
  1593.                                        27
  1594.  
  1595.  
  1596.     KWIKSTAT 3
  1597.  
  1598.  
  1599.     USING REGRESSION & CORRELATION PROCEDURES
  1600.  
  1601.     To examine the linear relationship between variables, correlation and
  1602.     linear regression are used.
  1603.  
  1604.     SIMPLE LINEAR REGRESSION ANALYSIS
  1605.  
  1606.     Simple linear regression is used for predicting a value of a dependent
  1607.     variable using an independent variable. To begin the regression module,
  1608.     choose the Regression and Correlation option from the Analyze menu in
  1609.     the main KWIKSTAT module. When you choose the Simple Linear Regression
  1610.     option, KWIKSTAT will prompt you to give the "independent" and
  1611.     "dependent" variables to be used in the analysis. The "independent"
  1612.     variable is generally that variable that you can choose, regulate or
  1613.     specify (e.g., amount of money spent on advertising) and the
  1614.     "dependent" variable is the one you observe and would possibly like to
  1615.     predict. After the two variables are chosen, KWIKSTAT will present the
  1616.     results of its calculations. The regression equation will be displayed
  1617.     along with other results. If the fit is appropriate, the equation may
  1618.     be used to predict a new value of the dependent variable given the
  1619.     value of the independent variable, within the range of the original
  1620.     data.
  1621.  
  1622.     The Pearson correlation coefficient is a number between -1.0 and 1.0,
  1623.     and tells the strength of the linear relationship between the two
  1624.     variables. A correlation coefficient close to -1 or 1 means that the
  1625.     relationship is strong, and a correlation close to 0 means that a
  1626.     relationship is non-existent or very weak. KWIKSTAT also performs a
  1627.     t-test for significance of the slope of the regression line (Ho: Slope
  1628.     = 0, Ha: Slope <> 0). This test is equivalent to testing whether the
  1629.     population correlation coefficient rho = 0. If the p-value is small
  1630.     (less than the chosen significance level) you can conclude that the
  1631.     slope of the regression line is not zero. That is, the linear
  1632.     relationship is statistically significant.
  1633.  
  1634.     Scatterplots of raw data and plots of residuals from linear fit are
  1635.     optionally available. Plots are helpful in visually examining the
  1636.     relationship between the variables. It is important to verify that
  1637.     the relationship is indeed a straight line.
  1638.  
  1639.     Since regression and correlation are used to relate variables to
  1640.     each other, the database must be structured so that each record
  1641.     contains values for each variable. The records often represent time
  1642.     periods or locations from which an observed value for each variable
  1643.     is available. The fields, then, are the variables and you are asked
  1644.     for a value for each field in each record.
  1645.  
  1646.  
  1647.  
  1648.  
  1649.                                 ---------------
  1650.                                 Please Register
  1651.  
  1652.                                        28
  1653.  
  1654.  
  1655.     KWIKSTAT 3
  1656.  
  1657.  
  1658.     EXAMPLE 4.19:  SIMPLE LINEAR REGRESSION ANALYSIS
  1659.  
  1660.     Data for this example of simple linear regression are Homicide Rate
  1661.     and Handgun Licenses Issued per 100,000 population for the years
  1662.     1961 to 1973 in Detroit (Fisher, 1976, reprinted from Gunst and
  1663.     Mason, 1980).
  1664.  
  1665.     Data for simple linear regression (handgun study)
  1666.  
  1667.     Year   Homicide   Handguns
  1668.            Rate       Registered
  1669.     1961    8.60       178.15
  1670.     1962    8.90       156.41
  1671.     1963    8.52       198.02
  1672.     1964    8.89       222.10
  1673.     1965   13.07       301.92
  1674.     1966   14.57       391.22
  1675.     1967   21.36       665.56
  1676.     1968   28.03      1131.21
  1677.     1969   31.49       837.60
  1678.     1970   37.39       794.90
  1679.     1971   46.26       817.74
  1680.     1972   47.24       583.17
  1681.     1973   52.33       709.59
  1682.  
  1683.     Since you want to compare homicide rate with handguns registered,
  1684.     you need a database with only these two sets of numbers, and can
  1685.     exclude year. The data in the database will be from the table
  1686.     above, excluding the year column.
  1687.  
  1688.     The database will include two fields (Homicide Rate and Guns
  1689.     Registered) and thirteen records (one for each year).
  1690.  
  1691.     FIELD    NAME        TYPE      WIDTH     DECIMALS
  1692.     1        HOMICIDES   Numeric   6         2
  1693.     2        HANDGUNS    Numeric   8         2
  1694.  
  1695.     The data you will enter in the first record is 8.60 (press Enter)
  1696.     and 178.15 (press Enter), and so on.
  1697.  
  1698.     PERFORMING THE ANALYSIS
  1699.  
  1700.     Enter the Regression module from the Analyze menu, and choose the
  1701.     Simple Linear Regression option. You will be prompted to enter the
  1702.     INDEPENDENT (X) variable, which in this case is HANDGUNS. Enter 2,
  1703.     which chooses HANDGUNS. Next, you will be asked for the DEPENDENT (Y)
  1704.     variable. Enter 1, which chooses HOMICIDES. KWIKSTAT will now perform
  1705.     the calculations and display the results on the screen.
  1706.  
  1707.     Pearson's correlation coefficient (r) is reported (0.7263) as well
  1708.                                 ---------------
  1709.                                 Please Register
  1710.  
  1711.                                        29
  1712.  
  1713.  
  1714.     KWIKSTAT 3
  1715.  
  1716.  
  1717.     as R2 (R-Square, 0.5275). The linear regression equation given is a
  1718.     mathematical representation of a straight line that passes through a
  1719.     plot of the data, and can be used to predict the dependent variable
  1720.     (HOMICIDES) given a value for the independent variable (HANDGUNS). In
  1721.     this case the linear regression equation is:
  1722.  
  1723.     HOMICIDES = 4.910512 + 3.761144E-02 * HANDGUNS
  1724.  
  1725.     If you want to predict the homicide rate for 300 handguns registered,
  1726.     you would use the equation:
  1727.  
  1728.     HOMICIDES = 4.910512 + 3.761144E-02 * 300
  1729.  
  1730.     A t-test is performed to test the statistical significance of the
  1731.     linear relationship between the two variables. A low p-value means
  1732.     that the two variables are significantly related. In this case
  1733.     p=0.005, quite small, so the null hypothesis (Slope = 0) is rejected
  1734.     and you conclude that the regression line has a slope significantly
  1735.     different from zero.
  1736.  
  1737.     The program also allows you to view a scatterplot of the data with
  1738.     the fitted line and a plot of the residuals.
  1739.  
  1740.     MULTIPLE REGRESSION
  1741.  
  1742.     Multiple regression is an extension of simple linear regression into
  1743.     several dimensions (several independent variables). In the multiple
  1744.     regression procedure, you must enter a list of the independent
  1745.     variables and a single dependent variable on which you wish to perform
  1746.     the regression analysis. In KWIKSTAT you may use up to 10 independent
  1747.     variables in this option.
  1748.  
  1749.     An analysis of variance is performed to determine the overall
  1750.     significance of the model. If the ANOVA reveals a significant
  1751.     relationship, (that is, if the p-value is small) the model may be a
  1752.     good representation of the sample data.
  1753.  
  1754.     A plot of residuals from the fit is available. You may plot the fit
  1755.     against any of the variables. Look for patterns in the residuals.
  1756.     Patterns other than a horizontal band about zero suggest that the
  1757.     assumptions necessary for regression analysis may be violated. If you
  1758.     are unfamiliar with multiple regression, the Neter and Wasserman book
  1759.     contains an excellent treatment.
  1760.  
  1761.  
  1762.  
  1763.  
  1764.  
  1765.  
  1766.  
  1767.                                 ---------------
  1768.                                 Please Register
  1769.  
  1770.                                        30
  1771.  
  1772.  
  1773.     KWIKSTAT 3
  1774.  
  1775.  
  1776.     EXAMPLE 4.20: MULTIPLE REGRESSION ANALYSIS (LONGLEY DATA)
  1777.  
  1778.     Longley introduced a data set which has often been used in comparing
  1779.     multiple linear regression procedures in the literature. The variables
  1780.     refer to economic factors. This example uses the LONGLEY database on
  1781.     the KWIKSTAT disk.
  1782.  
  1783.     The LONGLEY database consists of 7 fields: DEFLATOR, GNP, UNEMP,
  1784.     ARMED, POP, TIME, and TOTAL. The first six of these will be used as
  1785.     independent variables and the seventh, TOTAL, is the dependent
  1786.     variable (the one to be predicted). Figure 4.15 displays the LONGLEY
  1787.     database. You can get this display by using the List (display) the
  1788.     contents of a database option on the Data main menu.
  1789.  
  1790.     PERFORMING THE ANALYSIS
  1791.  
  1792.     In the Multiple Regression procedure, you will be prompted to enter
  1793.     the INDEPENDENT  VARIABLE(S), which in this case are DEFLATOR, GNP,
  1794.     UNEMP, ARMED, POP, TIME. Enter any combination of 1,2,3,4,5,6 to
  1795.     choose the variable(s) you wish to analyze against TOTAL. One way to
  1796.     approach a multiple regression problem is to first include all of the
  1797.     independent variables. After initial analysis (see below) you may
  1798.     decide to eliminate those independent variables found to not be
  1799.     significant.
  1800.  
  1801.     After entering the independent variables, you will be asked for the
  1802.     DEPENDENT VARIABLE. Enter 7, which chooses TOTAL. KWIKSTAT will now
  1803.     perform the calculations and display the results on the screen, as
  1804.     illustrated in Figure 4.16.
  1805.  
  1806.     The table at the top of the screen (in Figure 4.16) tells you the
  1807.     intercept value and the coefficient values for each of the
  1808.     independent variables. These can be used to create an equation for
  1809.     prediction of the dependent variable. In this case, the equation
  1810.     is:
  1811.  
  1812.     TOTAL = -3481930.1065 + DEFLATOR*(15.0161517122) +
  1813.     GNP*(-0.03579443400) + UNEMP*(-2.0199053296) +
  1814.     ARMED*(-1.0332049046) + POP*(-0.05130725587) + TIME*(1828.99249535)
  1815.  
  1816.     The t-value associated with each coefficient tests its significance
  1817.     in the equation. You can use the p-value associated with each
  1818.     coefficient to make a decision about the validity of having that
  1819.     variable in the equation. A low p-value suggests that the dependent
  1820.     variable, TOTAL, is related to the independent variable whose
  1821.     p-value you are examining. In this case, you might question the
  1822.     validity of having DEFLATOR (p=0.8636), GNP (p=0.3132) and POP
  1823.     (p=0.8257) in the equation.
  1824.  
  1825.     In choosing the variables to have in such an equation, you also need
  1826.                                 ---------------
  1827.                                 Please Register
  1828.  
  1829.                                        31
  1830.  
  1831.  
  1832.     KWIKSTAT 3
  1833.  
  1834.  
  1835.     to consider such questions as multicollinearity, heteroscedasticity
  1836.     and parsimony.
  1837.  
  1838.     If you wish to delete some variables from the equation, you can do so
  1839.     by re-running the analysis an leaving out some variables. The Multiple
  1840.     Regression procedure also allows you to plot residuals and to calcuate
  1841.     predicted values using the prediction equation.
  1842.  
  1843.     CORRELATION ANALYSIS
  1844.  
  1845.     The correlation coefficient is a measure of the strength of the
  1846.     linear relationship between two variables. KWIKSTAT allows you to
  1847.     find both Pearson's and Spearman's (rank) correlation coefficients
  1848.     of two variables. It also displays the matrix of correlation
  1849.     coefficients of pairs of variables when there are more than two
  1850.     variables being considered.
  1851.  
  1852.     EXAMPLE 4.22: CORRELATION MATRIX (LONGLEY DATA)
  1853.  
  1854.     This example uses the LONGLEY database on disk. You will be prompted
  1855.     to choose variables from the list of fields that appears. In this
  1856.     case, there are seven fields, and you can choose any combination of
  1857.     them. If you want correlation coefficients of all pairs of the seven
  1858.     variables, type 1,2,3,4,5,6,7 and press Enter. KWIKSTAT will perform
  1859.     the calculations and display the 7 by 7 array shown in Figure 4.17.
  1860.     Only half of the array is displayed since the other half is a mirror
  1861.     image. The diagonal entries are also omitted since they are all one; a
  1862.     variable is always perfectly correlated with itself.
  1863.  
  1864.     Each entry in the array consists of two numbers (three numbers if the
  1865.     information is printed to a printer). The first (upper) is the
  1866.     Pearson's correlation coefficient for the two (row and column)
  1867.     variables of that entry. The second (middle) number, in parentheses,
  1868.     is the p-value of the t-test for Ho: rho = 0 vs. Ha: rho <> 0. In the
  1869.     hard copy printout (if requested), the third (bottom) number, in
  1870.     brackets, is the sample size, or number of paired observations used in
  1871.     the calculations.
  1872.  
  1873.     EXAMPLE 4.23: GRAPHICAL CORRELATION MATRIX (LONGLEY DATA)
  1874.  
  1875.     This example also uses the Longley data. You will be prompted to
  1876.     choose variables from the list of fields that appears. In this case,
  1877.     there are seven fields, and you can choose any combination of them. If
  1878.     you want correlation coefficients of all pairs of the seven variables,
  1879.     type 1,2,3,4,5,6,7 and press Enter. KWIKSTAT will perform the
  1880.     calculations and display the 7 by 7 array of scatterplots. These
  1881.     scatterplots are a visual way of examining the relationships between
  1882.     pairs of variables.
  1883.  
  1884.  
  1885.                                 ---------------
  1886.                                 Please Register
  1887.  
  1888.                                        32
  1889.  
  1890.  
  1891.     KWIKSTAT 3
  1892.  
  1893.  
  1894.     USING FREQUENCY AND CROSSTABULATION PROCEDURES
  1895.  
  1896.     The Crosstabulations, Frequencies, Chi Square module performs analyses
  1897.     on categorical data, that is, data observed in categories, rather than
  1898.     measurement data. Previous examples using measurement data include
  1899.     weights of hogs, weights of people, heights of plants, numbers of
  1900.     handguns and homicides, and dollar amounts. If, rather than taking a
  1901.     measurement, a data observation involves identifying which of a set of
  1902.     categories the observation falls into, you are working with
  1903.     categorical data.
  1904.  
  1905.     Generally, categorical data are entered into a database by using
  1906.     one record for each person or entity on which the observation is
  1907.     made and one field for each characteristic which is divided into
  1908.     categories. For example, to categorize ten people by sex, hair
  1909.     color and eye color, you would need ten records (one per person)
  1910.     and three fields (e.g., SEX, HAIR, EYE).
  1911.  
  1912.     Some of the procedures in this module give you the choice of simply
  1913.     entering totals for each category rather than creating a database
  1914.     and entering the results of each observation. This can save time if
  1915.     totals are known and only totals are needed to perform a test or
  1916.     calculation or to produce a graph.
  1917.  
  1918.     PERFORMING A FREQUENCIES ANALYSIS
  1919.  
  1920.     In the Frequencies, Pictograph, Pie Chart option, KWIKSTAT "counts"
  1921.     the occurrence of each data value for a single variable or field
  1922.     and displays that information in a table. You can also create a bar
  1923.     chart, pictograph and/or pie chart of this information using this
  1924.     option.
  1925.  
  1926.     EXAMPLE 4.24: FREQUENCY TABLE, PICTOGRAPH, BAR AND PIE CHARTS
  1927.  
  1928.     This example uses the EXAMPLE database file on the KWIKSTAT disk.
  1929.     One of the fields (variables) in this database is STATUS referring
  1930.     to socioeconomic status. Suppose you want to know how the total
  1931.     data set is divided up into the five levels of STATUS.
  1932.  
  1933.     You will be prompted to enter one field (variable) to use. Since
  1934.     you want to do a frequency table on STATUS, enter 7. KWIKSTAT will
  1935.     count the data in each of the five categories of STATUS and display
  1936.     the results as a frequency table, shown in Figure 4.19.
  1937.  
  1938.     You are then prompted to press Enter, which takes you to the
  1939.     Frequencies Analysis menu. From this menu you may choose to print
  1940.     your table, go back and do another analysis, or create charts
  1941.     (Select an option by using the up and down arrow keys to highlight
  1942.     the desired option and pressing Enter).
  1943.  
  1944.                                 ---------------
  1945.                                 Please Register
  1946.  
  1947.                                        33
  1948.  
  1949.  
  1950.     KWIKSTAT 3
  1951.  
  1952.  
  1953.     You may choose to display a pie chart or pictograph. Selecting Bar
  1954.     Chart/Pictograph takes you to another menu from which you can select
  1955.     the type of chart you want to produce. BAR1 gives regular size bars
  1956.     and BAR2 gives wide bars on a bar chart. Each of the four options
  1957.     BEETLE, CAT, PC, PERSON gives a pictograph whose symbol is the item
  1958.     listed. (BEETLE is the car, not the insect.)
  1959.  
  1960.     A disappearing menu at the bottom of the screen offers the options
  1961.     to replot (press R), print (press P), or exit the pictograph or bar
  1962.     chart (press Esc). Press Enter to retrieve the bottom menu.
  1963.  
  1964.     PERFORMING A GOODNESS OF FIT ANALYSIS
  1965.  
  1966.     A goodness-of-fit test of a single population is a test to determine
  1967.     if the distribution of observed frequencies in the sample data closely
  1968.     matches the expected number of occurrences under a hypothetical
  1969.     distribution of the population. The hypotheses being tested are
  1970.  
  1971.     Ho: The population distribution follows the hypothesised distribution.
  1972.     Ha: The population does not follow the hypothesised distribution.
  1973.  
  1974.     EXAMPLE 4.25: GOODNESS-OF-FIT ANALYSIS
  1975.  
  1976.     The data for this example come from the text by Zar, 1974, page 46.
  1977.     According to a genetic theory, crossbred pea plants show a 9:3:3:1
  1978.     ratio of yellow smooth, yellow wrinkled, green smooth, green wrinkled
  1979.     offspring. Out of 250 plants, under the theoretical ratio
  1980.     (distribution) of 9:3:3:1, you would expect
  1981.  
  1982.     about  (9/16)x250=140.625 to produce yellow smooth peas,
  1983.            (3/16)x250=46.875             yellow wrinkled,
  1984.            (3/16)x250=46.875             green smooth,
  1985.            (1/16)x250=15.625             green wrinkled.
  1986.  
  1987.     After growing 250 of these pea plants, you observe that
  1988.  
  1989.                   152 have yellow smooth peas,
  1990.                    39 have yellow wrinkled,
  1991.                    53 have green smooth,
  1992.                     6 have green wrinkled.
  1993.  
  1994.  
  1995.  
  1996.  
  1997.  
  1998.  
  1999.  
  2000.  
  2001.  
  2002.  
  2003.                                 ---------------
  2004.                                 Please Register
  2005.  
  2006.                                        34
  2007.  
  2008.  
  2009.     KWIKSTAT 3
  2010.  
  2011.  
  2012.     PERFORMING THE ANALYSIS
  2013.  
  2014.     You will be prompted to enter the number of categories. In this
  2015.     case, type 4 for the four categories of peas (yellow smooth, yellow
  2016.     wrinkled, green smooth, green wrinkled) and press Enter. You will
  2017.     also be asked if you want to enter the expected ratios, or if you
  2018.     will be entering the actual expected values into the table. If you
  2019.     choose to enter ratios, you will enter
  2020.  
  2021.     9,3,3,1
  2022.  
  2023.     An empty table will appear with the instructions to enter the
  2024.     observed values for each category. Enter the observed values given
  2025.     above, pressing Enter after each entry. For example, for the first
  2026.     row, enter 152 for observed (Press Enter) enter 39 (Press Enter)
  2027.     and so on. KWIKSTAT will perform the calculations (including
  2028.     filling in the expected values column) and display the results.
  2029.  
  2030.     The calculated chi-square statistic in this case is 8.97 and the
  2031.     p-value is 0.031.
  2032.  
  2033.     PERFORMING A CROSSTABULATION ANALYSIS (CHI-SQUARE)
  2034.  
  2035.     Crosstabulations can be used to perform a chi-square test for
  2036.     independence or a chi-square test for homogeneity. A two-way table is
  2037.     constructed that displays the number of counts for each category. It
  2038.     must be possible to assume that the data observations are independent
  2039.     and that each data value can be counted in one and only one category.
  2040.     It is also assumed that the number of observations is fixed. KWIKSTAT
  2041.     allows you to enter data for a two-way table from the keyboard or from
  2042.     a database.
  2043.  
  2044.     When you choose to enter the two-way table from the keyboard, KWIKSTAT
  2045.     will ask you the size of the table (number of rows and columns). A
  2046.     blank table will be presented on the screen, and you will then be
  2047.     prompted to enter a number in each cell of the table. If you choose to
  2048.     enter the information from a database, KWIKSTAT will prompt you to
  2049.     choose the two variables (fields) from the currently active database
  2050.     that you wish to tabulate. KWIKSTAT will read the information from the
  2051.     database, and construct the table. For instance, in the EXAMPLE
  2052.     database, if you choose to tabulate the variables GROUP and STATUS,
  2053.     KWIKSTAT will form the table on the screen as illustrated in Figure
  2054.     4.23. (Note that the first variable entered is the row variable.)
  2055.  
  2056.     For a test for independence, a contingency table looks at two
  2057.     categorical variables from a single sample of one population and tests
  2058.     whether the two variables are related in some way, (e.g., are sex and
  2059.     hair color related?)
  2060.  
  2061.  
  2062.                                 ---------------
  2063.                                 Please Register
  2064.  
  2065.                                        35
  2066.  
  2067.  
  2068.     KWIKSTAT 3
  2069.  
  2070.  
  2071.     The hypotheses being tested are
  2072.  
  2073.     Ho: The variables are independent of each other. (There is no
  2074.     association between them).
  2075.     Ha: The variables are not independent of each other.
  2076.  
  2077.     KWIKSTAT reports both the chi-square statistic and the p-value. If the
  2078.     expected value in one or more cells is less than 5, the chi-square
  2079.     test may not be valid. A warning to this effect appears on the screen
  2080.     if appropriate. In the case of a 2 by 2 table, Fisher's Exact Test and
  2081.     the chi-square with Yates' correction are also performed and results
  2082.     displayed.
  2083.  
  2084.     SCREEN LIMITATIONS: The limits to tables being displayed on the screen
  2085.     are 10 columns by 7 rows. If the table is too big for the screen, only
  2086.     the test results are displayed. Tables as large as 15 columns by 100
  2087.     rows may be printed on a line printer if data are entered from a
  2088.     database.
  2089.  
  2090.     EXAMPLE 4.26: CROSSTABULATION ANALYSIS (2 BY 2) TEST FOR INDEPENDENCE
  2091.  
  2092.     Data for this example are observations of the number of beetles and
  2093.     bugs on the upper and lower sides of leaves (Zar,1974, page 292).
  2094.  
  2095.     2 BY 2 CONTINGENCY TABLE DATA
  2096.  
  2097.               Beetles   Bugs
  2098.               ---------------
  2099.     Upper Leaf  12     7
  2100.     Lower Leaf   2     8
  2101.  
  2102.     Since you are given only the totals for each of the four categories,
  2103.     and not the individual data for each leaf, there is no need to create
  2104.     a database. Rather, you can just enter these totals from the keyboard.
  2105.  
  2106.     PERFORMING THE ANALYSIS
  2107.  
  2108.     When you choose the crosstabulations option, you will be asked if you
  2109.     want to enter data from a (D)atabase or (K)eyboard. Type K and press
  2110.     Enter.
  2111.  
  2112.     You will then be prompted to give the size of the table. Enter 2 for
  2113.     rows and 2 for columns. An empty table will appear with the
  2114.     instructions to enter the counts for each category into the
  2115.     appropriate cell. Enter the values given above, pressing Enter after
  2116.     each entry.
  2117.  
  2118.     The calculated chi-square statistic in this case is 4.89 with a
  2119.     p-value of 0.028. The chi-square with Yates correction is 3.31 with a
  2120.     p-value of 0.069 and the Fisher Exact Test (two tail) has a p-value of
  2121.                                 ---------------
  2122.                                 Please Register
  2123.  
  2124.                                        36
  2125.  
  2126.  
  2127.     KWIKSTAT 3
  2128.  
  2129.  
  2130.     0.050. Because one of the cells produces an expected value less than
  2131.     5, KWIKSTAT gives a warning that the chi-square analysis for this data
  2132.     may not be valid. Given this warning, it is best to rely on the
  2133.     Fisher's Exact Test for making a decision.
  2134.  
  2135.     If you choose Output to Printer or File, each cell in the output will
  2136.     contain five numbers. The top number is the count that you entered.
  2137.     The second number is the calculated expected value used to calculate
  2138.     the chi-square statistic. The third number is the percentage of the
  2139.     TOTAL number of observations that the observed number in that cell
  2140.     represents. the fourth and fifth numbers are percentages of the ROW
  2141.     and COLUMN totals that the observed number in that cell represents.
  2142.  
  2143.     EXAMPLE 4.27: CONTINGENCY TABLE LARGER THAN 2 BY 2 (SEX BY HAIR COLOR)
  2144.  
  2145.     A generalization of the 2 by 2 table is the R by C (Rows by Columns)
  2146.     table. This is an example (Zar, 1984, page 62) of a two by four
  2147.     contingency table involving the variables hair color and sex. The null
  2148.     hypothesis is that there is no relationship between hair color and
  2149.     sex.
  2150.  
  2151.     2 BY 4 CONTINGENCY TABLE DATA (SEX BY HAIR COLOR)
  2152.  
  2153.                    HAIR COLOR
  2154.           Black   Brown   Blonde   Red
  2155.     -----------------------------------------
  2156.     Male   32      43      16       9
  2157.     Female 55      65      64       16
  2158.  
  2159.     KWIKSTAT will perform the calculations and display the results as
  2160.     shown in Figure 4.25. The calculated chi-square statistic in this case
  2161.     is 8.99 with a p-value of 0.03.
  2162.  
  2163.     DRAWING A 3-D BAR CHART
  2164.  
  2165.     KWIKSTAT allows you to draw a 3-dimensional bar chart of data for
  2166.     a contingency table (crosstabulation), and then to focus in on a
  2167.     part of it if desired.
  2168.  
  2169.     Data for the 3-dimensional bar chart must be entered first, either
  2170.     from the keyboard or a database, by using the Crosstabulations,
  2171.     Chi-Square option of the Frequencies and Crosstabulations Choose
  2172.     Analysis Option menu. To get to this menu from the Data main menu,
  2173.     select Analyze at the top of the screen, and then select
  2174.     Crosstabulations, Frequencies, Chi Square.
  2175.  
  2176.  
  2177.  
  2178.  
  2179.  
  2180.                                 ---------------
  2181.                                 Please Register
  2182.  
  2183.                                        37
  2184.  
  2185.  
  2186.     KWIKSTAT 3
  2187.  
  2188.  
  2189.     EXAMPLE 4.28: DRAWING A 3-D BAR CHART (EXAMPLE DATABASE)
  2190.  
  2191.     Check the lower left corner of the screen to see which database is
  2192.     currently in use. If it is the one you want, EXAMPLE, go on to
  2193.     Producing the Chart. If it is not EXAMPLE, retrieve the  EXAMPLE
  2194.     database.
  2195.  
  2196.     PRODUCING THE CHART
  2197.  
  2198.     Choose the option D) CROSSTABULATIONS, CHI-SQUARE from the menu and
  2199.     specify to enter data from a database. You will be asked to enter the
  2200.     variables to analyze. Choose the variables GROUP and STATUS by
  2201.     entering 1,7. KWIKSTAT will display the results of the chi-square test
  2202.     in a contingency table. Pressing Enter will bring you to the
  2203.     Crosstabulations Analysis menu. Using the up and down arrow keys,
  2204.     highlight 3-D Bar Chart and press Enter. You will be given a default
  2205.     title for the chart and prompted to enter an alternative if desired.
  2206.     You will be similarly prompted for labels for "row" and "column" axes.
  2207.     Default labels are also given.
  2208.  
  2209.     The disappearing menu at the bottom of the screen gives you the
  2210.     options of (R)eplot, (P)rint, or (D)etail (Press Enter to make it
  2211.     reappear.)  Pressing D selects Detail, which allows you to look at a
  2212.     part of the chart in isolation. For example, suppose in this case you
  2213.     want to see a detail of the second category (B) in the "row" field
  2214.     (GROUP) by all categories (1,2,3,4,5) of the "column" field (STATUS).
  2215.     Press D for detail and you will be prompted to specify the detail
  2216.     parameters. When prompted for the first and last row, type 2,2 (that
  2217.     is, begin at row 2 and end at row 2). When prompted for the first and
  2218.     last column, type 1,5 (begin at column 1 and end at column 5). Figure
  2219.     4.27 shows the display of the detail requested. To exit from the plot
  2220.     press Esc.
  2221.  
  2222.     MCNEMAR'S TEST
  2223.  
  2224.     McNemar's test is appropriate for use with paired, dichotomous (i.e.,
  2225.     0, 1 data) data. This test is sometimes called a test for related
  2226.     samples or a test for the significance of changes. It is useful for
  2227.     comparing paired or related observations in which the response is
  2228.     dichotomous, that is, the response is one of only two possible
  2229.     outcomes. McNemar's test is the 2 by 2 version of Cochran's Q test
  2230.     described in the section on non-parametric tests. The test assumes
  2231.     that any pair of observations is independent of any other pair of
  2232.     observations, although clearly the observations within a pair are not
  2233.     independent of each other.
  2234.  
  2235.  
  2236.  
  2237.  
  2238.  
  2239.                                 ---------------
  2240.                                 Please Register
  2241.  
  2242.                                        38
  2243.  
  2244.  
  2245.     KWIKSTAT 3
  2246.  
  2247.  
  2248.     USING LIFE TABLES AND SURVIVAL ANALYSIS PROCEDURES
  2249.  
  2250.     As the name indicates, this module performs life tables and
  2251.     survival analysis procedures. The data must be in the following
  2252.     form:
  2253.  
  2254.     1) a TIME variable which contains a time (e.g., minutes, days,
  2255.     years, etc.) in which the subject or component has been observed to
  2256.     be alive (not failed).
  2257.  
  2258.     2) a CENSOR variable which must take on the values 0 or 1,  where
  2259.     1 means the subject has died (failed), and a 0 means the subject
  2260.     was still alive (not failed) at the last available time period.
  2261.  
  2262.     3) optionally, a GROUPING variable which may have up to ten values
  2263.     (numeric or character), i.e., the data may be in groups.
  2264.     Once the data are entered into the program, a life table for each
  2265.     group is produced which includes, for each time interval, the
  2266.     number entered, withdrawn, lost, dead, exposed, the proportion
  2267.     dead, proportion surviving, cumulative proportion surviving, hazard
  2268.     and density.
  2269.  
  2270.     A plot is given for the cumulative proportion surviving in the
  2271.     group(s) against time. If more than one group is entered, a
  2272.     Mantel-Haenszel test is performed to test the hypothesis of equal
  2273.     survival patterns for the groups.
  2274.  
  2275.     A small version of the survival plot will appear on the screen, and
  2276.     if you choose to print a report of the session the report will
  2277.     include a larger version of the plot along with other information
  2278.     from the analysis.
  2279.  
  2280.     EXAMPLE 4.31A: LIFE TABLE ANALYSIS
  2281.  
  2282.     The data for this example are in the LIFE database on the KWIKSTAT
  2283.     disk. These data are from Prentice (1973).
  2284.  
  2285.     Open the LIFE database, and begin the Life Table Module from the
  2286.     Analyze menu. Use the up and down cursor keys to highlight Life Tables
  2287.     and Survival Analysis and press Enter, or simply press B.
  2288.  
  2289.     You will be prompted to choose a time variable indicating the
  2290.     amount of survival time observed, and a censor variable indicating
  2291.     which subjects are still alive (censored) at the last time period.
  2292.     In this case, enter 1,2 to choose SURVIVAL as the time variable and
  2293.     CENSOR as the censor variable.
  2294.  
  2295.     You will then be prompted to choose a grouping variable if you
  2296.     wish. If there is no grouping variable or you don't wish to group
  2297.     the data, simply press Enter. In this case, type 3 to choose GROUP
  2298.                                 ---------------
  2299.                                 Please Register
  2300.  
  2301.                                        39
  2302.  
  2303.  
  2304.     KWIKSTAT 3
  2305.  
  2306.  
  2307.     as the grouping variable, and press Enter. KWIKSTAT reports the
  2308.     names and sizes of the groups and then asks you to specify the
  2309.     length of each interval for the table to be produced. You can
  2310.     specify a desired interval length or you can use the default length
  2311.     by simply pressing Enter.
  2312.  
  2313.     KWIKSTAT will perform the calculations and display a table which
  2314.     includes the numbers of subjects entered alive, withdrawn, dead,
  2315.     exposed, the proportion dead, proportion alive, cumulative survival
  2316.     proportion and standard error for the first group. Press Enter and
  2317.     a second table appears, which includes 95% confidence limits on the
  2318.     cumulative survival proportion. A summary of the upper table also
  2319.     appears. KWIKSTAT now creates the two similar tables for the second
  2320.     group.
  2321.  
  2322.     From the tables, you can see that, in the first group, 22 of 37
  2323.     exposed, or 59.5% died in the first interval (0.0-99.0) and two
  2324.     were withdrawn. In the second group, 12 of 23.5 exposed (51.1%)
  2325.     died and one was withdrawn in the first interval.
  2326.  
  2327.     KWIKSTAT also draws a small graph of the two survival curves, and
  2328.     performs the Mantel-Haenszel comparison of the two curves testing
  2329.     the hypothesis:
  2330.  
  2331.     Ho: The survival curves are the same.
  2332.     Ha: The survival curves are not the same.
  2333.  
  2334.     A chi-square statistic is reported, as well as a p-value. A low
  2335.     p-value is taken to indicate rejection of the null hypothesis.
  2336.  
  2337.     In this example, the Mantel-Haenszel comparison procedure results in a
  2338.     chi-square statistic of 0.7191 and a p-value of 0.397. This p-value is
  2339.     too large to reject the hypothesis of equal curves. This indicates
  2340.     that the two distributions are not significantly different - thus
  2341.     neither treatment is superior in terms of survival distributions. At
  2342.     the end of a survival analysis, you will be asked if you want to print
  2343.     the results to the printer.
  2344.  
  2345.     PART V - USING KWIKSTAT UTILITIES
  2346.     --------------------------------------------------------
  2347.  
  2348.     The KWIKSTAT UTILITY module contains a number of utilities that do not
  2349.     fit into any of the other modules.
  2350.  
  2351.  
  2352.  
  2353.  
  2354.  
  2355.  
  2356.  
  2357.                                 ---------------
  2358.                                 Please Register
  2359.  
  2360.                                        40
  2361.  
  2362.  
  2363.     KWIKSTAT 3
  2364.  
  2365.  
  2366.     EXPORTING DATA
  2367.  
  2368.     You may output the data from your KWIKSTAT (DBF) file into a standard
  2369.     ASCII TEXT file. (Often called an SDF file - Standard Data Format
  2370.     file.)
  2371.  
  2372.     PRINTING A REPORT
  2373.  
  2374.     You may output a listing of the data in the dataset (or a selected
  2375.     subset of the database) by using the report facility. To use this
  2376.     procedure, choose the Print REPORT to printer or file option from the
  2377.     Utilities menu.
  2378.  
  2379.     IMPORTING DATA FROM 1-2-3 TYPE FILES
  2380.  
  2381.     This option is useful for translating 1-2-3 files into a DBF format
  2382.     that can be used by the KWIKSTAT program. Begin this option by
  2383.     choosing the Convert WKS file to DBF option on the Utilities Menu.
  2384.     This translation facility will translate most versions of WK* files.
  2385.     An example file on disk to translate is TEST.WKS, which contains data
  2386.     in cells A1.H6. The import program will not allow you to specify more
  2387.     than 128 columns to translate into a DBF file.
  2388.  
  2389.     CREATING AND EDITING KWIKSTAT IMAGES
  2390.  
  2391.     The image program allows you to create or edit images to be use by
  2392.     the Pictograph procedure. When you begin the IMAGE module, you will be
  2393.     asked if you want to create a NEW image, or to edit an OLD image. If
  2394.     you choose to enter a NEW image, you will be asked the pixel size.
  2395.     Maximum size for an image is 40 pixels (dots) wide and 30 pixels high.
  2396.     The Pictograph routine will adjust its graph according to the size of
  2397.     the image. In the editor, you may move the cursor around the grid, and
  2398.     select to fill a dot by pressing the numbers 1, 2 or 3. To unfill a
  2399.     dot, place the cursor at the dot and press the space bar or 0. You
  2400.     will see a version of the image in its correct size at the upper right
  2401.     of the screen. Once you have created or edited an image, choose the
  2402.     (S)ave option to write the information to disk.
  2403.  
  2404.     APPENDIX
  2405.  
  2406.     INTERPRETING ERROR CODES: If the program encounters a problem it does
  2407.     not know how to resolve, it will usually display an error message
  2408.     containing an error and reference code. Many times, you can correct
  2409.     this error situation by understanding what caused it. For example, if
  2410.     you were to get an error number 27, you would know that it was caused
  2411.     by your printer sending an "Out of Paper" message to the program.
  2412.  
  2413.     If you are unable to resolve a problem, please write down the steps
  2414.     you took before the error was encountered, and send it in on the
  2415.     Problem Report Form.
  2416.                                 ---------------
  2417.                                 Please Register
  2418.  
  2419.                                        41
  2420.  
  2421.  
  2422.     KWIKSTAT 3
  2423.  
  2424.  
  2425.  
  2426.     ERROR CODES:
  2427.     5=Illegal function call         57=Device I/O error
  2428.     6=Overflow                      58=File already exists
  2429.     7=Out of Memory                 61=Disk full
  2430.     9=Subscript out of range        62=Input past end of file
  2431.     11=Division by zero             63=Bad record number
  2432.     14=Out of String Space          64=Bad filename
  2433.     24=Device Timeout               67=Too many files
  2434.     25=Device fault                 68=Device unavailable
  2435.     27=Out of Paper                 70=Permission denied
  2436.     50=FIELD overflow               71=Disk not ready
  2437.     51=Internal Error               72=Disk media error
  2438.     52=Bad filename or number       74=Rename across disks
  2439.     53=File not found               75=Path/File access error
  2440.     54=Bad file mode                76=Path not found
  2441.     55=File already open            81=Invalid filename
  2442.  
  2443.  
  2444.  
  2445.  
  2446.  
  2447.  
  2448.  
  2449.  
  2450.  
  2451.  
  2452.  
  2453.  
  2454.  
  2455.  
  2456.  
  2457.  
  2458.  
  2459.  
  2460.  
  2461.  
  2462.  
  2463.  
  2464.  
  2465.  
  2466.  
  2467.  
  2468.  
  2469.  
  2470.  
  2471.  
  2472.  
  2473.  
  2474.  
  2475.                                 ---------------
  2476.                                 Please Register
  2477.  
  2478.                                        42
  2479.  
  2480.  
  2481.     KWIKSTAT 3
  2482.  
  2483.  
  2484.                         Problem Report form: KWIKSTAT
  2485.  
  2486.     Please explain in detail the problem that occurred. If possible,
  2487.     send a print out of the results or Print Screen.
  2488.     KWIKSTAT VERSION YOU ARE USING:________________________
  2489.     KWIKSTAT MODULE where problem occurred:____________________
  2490.     YOUR COMPUTER: BRAND/Model_____________________________
  2491.     MONITOR TYPE:________AMOUNT OF MEMORY:_______________
  2492.     VERSION OF DOS YOU ARE USING:____________________________
  2493.     MEMORY RESIDENT PROGRAMS YOU USE:____________________
  2494.     PROBLEM:
  2495.  
  2496.  
  2497.  
  2498.  
  2499.  
  2500.  
  2501.  
  2502.  
  2503.  
  2504.  
  2505.  
  2506.  
  2507.  
  2508.  
  2509.  
  2510.  
  2511.  
  2512.  
  2513.  
  2514.  
  2515.  
  2516.  
  2517.  
  2518.  
  2519.  
  2520.  
  2521.  
  2522.  
  2523.  
  2524.     Mail to:TexaSoft, P.O. Box 1169, Cedar Hill, Texas 75104. Or fax to
  2525.     214-291-3400, or send E-Mail to Compuserve 70721,3145.
  2526.  
  2527.  
  2528.  
  2529.  
  2530.  
  2531.  
  2532.  
  2533.  
  2534.                                 ---------------
  2535.                                 Please Register
  2536.  
  2537.                                        43
  2538.  
  2539.  
  2540.     KWIKSTAT 3
  2541.  
  2542.  
  2543.                                 USER'S BALLOT
  2544.  
  2545.     Indicate your preference for improvements in KWIKSTAT. On a scale of 0
  2546.     to 10: 0 = Low priority, 10 = High priority
  2547.  
  2548.     Vote  Proposed change
  2549.     ----  -----------------------------------------------------
  2550.     ____  Allow "Spreadsheet-like" entry of data
  2551.     ____  Ability to sort database
  2552.     ____  More ANOVA types
  2553.     ____  More Non-parametric statistical tests
  2554.     ____  General Linear Model
  2555.     ____  Make Report more flexible
  2556.     ____  Stem and leaf plot
  2557.     ____  Quality Control Module
  2558.     ____  More speed
  2559.     ____  More graphics
  2560.     ____  Improve graphic quality
  2561.     ____  Cluster analysis
  2562.     ____  Discriminant analysis
  2563.     ____  Automate analysis from a command file
  2564.     ____  _____________________________________________
  2565.     ____  _____________________________________________
  2566.     Comments:
  2567.  
  2568.  
  2569.  
  2570.  
  2571.  
  2572.  
  2573.  
  2574.  
  2575.  
  2576.  
  2577.  
  2578.  
  2579.  
  2580.  
  2581.  
  2582.  
  2583.  
  2584.     Mail to:TexaSoft, P.O. Box 1169, Cedar Hill, Texas 75104. Fax
  2585.     to:214-291-3400 or send E-Mail to Compuserve 70721,3145.
  2586.  
  2587.  
  2588.  
  2589.  
  2590.  
  2591.  
  2592.  
  2593.  
  2594.  
  2595.  
  2596.                                        44
  2597.  
  2598.  
  2599.