home *** CD-ROM | disk | FTP | other *** search
/ Monster Media 1993 #2 / Image.iso / math / mvsp21.zip / MVSP.DOC < prev    next >
Text File  |  1993-06-08  |  126KB  |  2,353 lines

  1.  
  2.  
  3.  
  4.  
  5.  
  6.  
  7.  
  8.  
  9.  
  10.  
  11.  
  12.              _______________________________________________________
  13.  
  14.               MMMMMMMMMMMM    VV       VV    SSSSSSSS      PPPPPPPP
  15.               MM   MM   MM     VV     VV     SS            PP    PP
  16.               MM   MM   MM      VV   VV      SSSSSSSS      PPPPPPPP
  17.               MM   MM   MM       VV VV             SS      PP
  18.               MM   MM   MM  *     VVV  *     SSSSSSSS *    PP     *
  19.              _______________________________________________________
  20.  
  21.  
  22.                                 S H A R E W A R E 
  23.                                 -----------------
  24.  
  25.  
  26.                         A MultiVariate Statistics Package 
  27.                          for the IBM PC and Compatibles
  28.  
  29.                     (C) Copyright Warren L. Kovach, 1986-1993
  30.  
  31.                             Kovach Computing Services
  32.                                  85 Nant-y-Felin 
  33.                      Pentraeth, Anglesey LL75 8UY Wales U.K.
  34.  
  35.                       Internet: warrenk@cix.compulink.co.uk 
  36.                              CompuServe: 100016,2265 
  37.  
  38.                               Ver. 2.1, June, 1993
  39.  
  40.  
  41.  
  42.         This program is being distributed as shareware.  You may evaluate
  43.         it for up to 30 days.  If after that period you decide to
  44.         continue using the program you must register.  This costs 65 UK
  45.         pounds or the equivalent in US dollars.  See page 4 of this
  46.         manual, the file REGISTER.DOC, or the "Register" option on the
  47.         main menu for more details.
  48.         MVSP Ver. 2.1 -- Users Manual                              Page 2
  49.         
  50.                                  ACKNOWLEDGEMENTS
  51.  
  52.         In the years since I first released MVSP, I have received
  53.         countless letters about this program, many with some very useful
  54.         suggestions and comments.  I have considered all of these and
  55.         have incorporated most into this new version.  My thanks go to
  56.         all of those who have sent in comments.  Special thanks go to
  57.         John Birks (Bergen, Norway), Geoffrey King (Pickering, Yorkshire,
  58.         England), Lou Maher (Madison, Wisconsin, USA), John Breen
  59.         (Limerick, Ireland), and Bill Briggs (Boulder, Colorado, USA) for
  60.         numerous comments on both the old and new versions of the
  61.         program.  Very special thanks go to my wife, Catherine Duigan,
  62.         for numerous suggestions for improvements in the program, help in
  63.         designing this manual and the cover, assistance in the
  64.         distribution of MVSP, and for putting up with many hours of
  65.         computer-widowhood.
  66.  
  67.         Warren L. Kovach 
  68.         "Tigh an-Oilean" 
  69.         Pentraeth, Anglesey, Wales 
  70.         June 1993
  71.  
  72.  
  73.  
  74.  
  75.  
  76.  
  77.  
  78.  
  79.  
  80.  
  81.  
  82.  
  83.  
  84.  
  85.  
  86.  
  87.  
  88.  
  89.  
  90.  
  91.  
  92.  
  93.  
  94.  
  95.  
  96.         This manual and the accompanying program are protected by
  97.         international copyright laws; (C) Copyright 1986-1993 Dr. Warren
  98.         L. Kovach.  This manual and the accompanying computer program may
  99.         not be reproduced except as outlined in the section below
  100.         entitled "Limited User Licence".
  101.  
  102.         MVSP Ver. 2.1 -- Users Manual                              Page 3
  103.         
  104.                                 TABLE OF CONTENTS
  105.  
  106.         Acknowledgements................................................2
  107.         Introduction....................................................4
  108.         The Shareware Concept...........................................4
  109.         Limited Warranty................................................5
  110.         General Use of Program..........................................6
  111.           Starting the program..........................................6
  112.           Menus.........................................................6
  113.           Entering and Editing Text.....................................7
  114.         Menu Options....................................................7
  115.           A-F: Statistical Procedures...................................7
  116.           M: Manipulate Data............................................7
  117.           I: Import/Export..............................................8
  118.           S: Change Drive or Sub-directory..............................8
  119.           Q: Quit MVSP..................................................8
  120.           X: Execute DOS commands.......................................8
  121.           P: Change Program Defaults....................................8
  122.              Screen Colors..............................................8
  123.              Data File and Work File Path...............................8
  124.              Data File Extension........................................9
  125.              Output Format.............................................10
  126.              Graphics Options..........................................11
  127.              Printer Setup.............................................13
  128.         MVSP Data Editor...............................................14
  129.           Entering Data Labels.........................................15
  130.           Entering Data................................................15
  131.           Editing Labels and Data......................................16
  132.           Saving Data Matrix...........................................16
  133.         Data File Format...............................................16
  134.         Data Manipulation..............................................19
  135.         Import/Export Data.............................................22
  136.         Running Numerical Procedures...................................23
  137.           Principal Components Analysis................................24
  138.           Principal Coordinates Analysis...............................26
  139.           Correspondence Analysis......................................26
  140.           Distances and Similarities...................................29
  141.           Cluster Analysis.............................................32
  142.           Diversity Indices............................................34
  143.         Utilities......................................................35
  144.           Sortdata.....................................................35
  145.         Disclaimer.....................................................36
  146.         80x87 Support..................................................37
  147.         Protected Mode Version.........................................37
  148.         Appendices.....................................................38
  149.         References.....................................................39
  150.         Other Products from Kovach Computing Services..................41
  151.         MVSP Ver. 2.1 -- Users Manual                              Page 4
  152.         
  153.                                    INTRODUCTION
  154.  
  155.         MVSP is a package of common multivariate statistical procedures
  156.         widely used in many areas of biology and geology, as well as
  157.         other fields.  These procedures include principal components
  158.         analysis (PCA), principal coordinates analysis (PCO),
  159.         correspondence analysis (CA; also called reciprocal averaging),
  160.         distance or similarity measures, hierarchical cluster analysis,
  161.         and diversity indices.  MVSP provides a great deal of flexibility
  162.         in the analyses, but is simple to use.  Options for different
  163.         forms of these analyses can be chosen from menus and these
  164.         settings can be saved for future use.  Most analyses can be run
  165.         with as few as half a dozen keystrokes.
  166.  
  167.         One possible drawback to ease of use is that some users may be
  168.         very tempted to take a "black box" approach to using these
  169.         statistics, feeding in numbers and coming up with "The Answer".
  170.         I must strongly warn the users of this program that statistics
  171.         can be DANGEROUS!  All these procedures make assumptions about
  172.         the data and have restrictions on what they can and cannot do. If
  173.         these assumptions and restrictions are violated, the results
  174.         could be meaningless.  I urge you to become familiar with the
  175.         methods before you use this program.  This manual contains a list
  176.         of references that I have found very useful in understanding
  177.         these techniques.  In particular, Sneath & Sokal (1973), Gauch
  178.         (1982), Pielou (1984), Manly (1986), Davis (1986), and Kent and
  179.         Coker (1992) are very well written and give very clear
  180.         discussions of these techniques.
  181.  
  182.         I am always interested to see how MVSP is being used.  I would
  183.         appreciate receiving reprints of any papers you have published in
  184.         which MVSP was used for data analysis.  Thank you!
  185.  
  186.  
  187.                               THE SHAREWARE CONCEPT
  188.  
  189.         This software package is being distributed under the shareware
  190.         concept.  In case you haven't run across this software
  191.         phenomenon, the following is a brief discussion of it's tenets.
  192.         Shareware software is an experiment in "grass-roots" software
  193.         distribution and development.  Andrew Fluegelman, one of the
  194.         pioneers of this phenomenon in the microcomputer world, expressed
  195.         it this way:
  196.  
  197.           1) The value and utility of software is best assessed by the
  198.              user on his or her own system, under actual working
  199.              conditions.
  200.  
  201.           2) The creation of new and useful software should be supported
  202.              by the computing community.
  203.  
  204.           3) Copying and sharing of software that you have found useful
  205.              should be encouraged, rather than restricted.
  206.  
  207.         Shareware programs are freely distributed to the computing
  208.         community, through the network of electronic bulletin board
  209.         services, local computer user groups, shareware disk vendors, and
  210.         MVSP Ver. 2.1 -- Users Manual                              Page 5
  211.         
  212.         networks of friends and colleagues with similar interests.  You
  213.         are allowed to try out the program for a certain period to see if
  214.         it fits your needs.  If it does and you intend to continue using
  215.         it, then you must register the program with the author by paying
  216.         a registration fee.  In return you will generally get a copy of
  217.         the latest version of the program, a printed manual, and perhaps
  218.         other extras the author offers to encourage you to register.
  219.  
  220.         Shareware means that you don't have to pay outrageous prices for
  221.         a program without getting a chance to test drive it first to see
  222.         if it really meets your needs.  Shareware means that if you
  223.         decide that this program is worth supporting, then you support it
  224.         voluntarily, for a reasonable cost, and without the hassles of
  225.         copy-protection and the high cost of advertising.
  226.  
  227.         You are encouraged to copy and distribute MVSP Shareware.  If
  228.         after a 30 day evaluation period you find this program to be
  229.         useful and decide to continue using it, then a registration fee
  230.         of 65 UK pounds or the equivalent in US dollars should be sent to
  231.         the author.  See the file REGISTER.DOC, or the "Register" option
  232.         on the main menu for details on how to register.
  233.  
  234.         In return for the contribution, you will receive:
  235.  
  236.         o the latest version of the program (without the shareware
  237.           reminder messages)
  238.         o a full printed manual, including the graphics and appendices
  239.           that are not in the shareware version
  240.         o the ability to take advantage of the 80x87 math coprocessor for
  241.           faster and more accurate analyses
  242.         o a protected mode version that will directly use up to 16Mb of
  243.           RAM memory for faster analyses of larger data sets
  244.         o the SORTDATA utility that creates graphic representations of
  245.           your data matrices, sorted in the order of the dendrograms
  246.         o notification of future versions as well as of other programs
  247.           produced by Kovach Computing Services
  248.         o special upgrade prices
  249.         o technical support by phone, fax, e-mail or post
  250.  
  251.         This program is copyrighted.  MVSP Shareware can be freely copied
  252.         and distributed in accordance with the regulations specified in
  253.         the accompanying file VENDOR.DOC.  MVSP Shareware may not be
  254.         modified or dis-assembled in any way or for any reason.
  255.         Distribution of modified versions are also forbidden.
  256.  
  257.  
  258.                                  LIMITED WARRANTY
  259.  
  260.         Kovach Computing Services warrants any physical diskettes and
  261.         physical documentation provided under this agreement to be free
  262.         of defects in materials and workmanship for a period of sixty
  263.         days from the purchase.
  264.  
  265.         KOVACH COMPUTING SERVICES SPECIFICALLY DISCLAIMS ALL OTHER
  266.         WARRANTIES OF ANY KIND, EXPRESSED OR IMPLIED, INCLUDING BUT NOT
  267.         LIMITED TO ANY WARRANTIES OF MERCHANTABILITY AND/OR FITNESS FOR A
  268.         PARTICULAR PURPOSE.
  269.  
  270.         MVSP Ver. 2.1 -- Users Manual                              Page 6
  271.         
  272.         The total liability of Kovach Computing Services for any claim or
  273.         damage arising out of the use of the licensed program or
  274.         otherwise related to this licence shall be limited to direct
  275.         damages which shall not exceed the price paid for the program.
  276.  
  277.         IN NO EVENT SHALL THE LICENSOR BE LIABLE TO THE LICENSEE FOR
  278.         ADDITIONAL DAMAGES, INCLUDING ANY LOST PROFITS, LOST SAVINGS OR
  279.         OTHER INCIDENTAL OR CONSEQUENTIAL DAMAGES ARISING OUT OF THE USE
  280.         OF OR INABILITY TO USE THE LICENSED PROGRAM, EVEN IF LICENSOR HAS
  281.         BEEN ADVISED OF THE POSSIBILITY OF SUCH DAMAGES.
  282.  
  283.         This agreement does not affect your statutory rights.  The
  284.         agreement shall be interpreted and enforced in accordance with
  285.         and shall be governed by the laws of England and Wales.
  286.  
  287.  
  288.                             GENERAL USE OF THE PROGRAM
  289.  
  290.         Starting the program:
  291.         This program is simple to use and menu-driven, presenting you
  292.         with the possible options at each step.  It is initiated by first
  293.         logging into the disk and directory containing the program (using
  294.         the DOS commands CD, A:, C:, etc.) and typing the name of the
  295.         program, "MVSPSHAR". For instance, if you have installed MVSP on
  296.         you hard disk in the directory C:\MVSP, type:
  297.  
  298.         C:
  299.         CD C:\MVSP
  300.         MVSPSHAR
  301.  
  302.         The program file MVSPSHAR.EXE must be in the default directory
  303.         (the one specified in the CD command above) for the program to
  304.         work properly.  If you wish to use the help facility, the file
  305.         MVSP.HLP must also be in this directory.  If you have changed any
  306.         of the program defaults, the configuration file named MVSP.CNF
  307.         (which is created when you save your changes) must also be on the
  308.         default drive for the new options to be reinstated.
  309.  
  310.         You may also specify the location of the MVSP files using DOS
  311.         environment variables and the commands "SET" and "PATH".  For
  312.         instance, if the MVSP files are in the directory C:\MVSP, you may
  313.         place the two following commands in your AUTOEXEC.BAT file:
  314.  
  315.         PATH C:\;C:\MVSP   (this line may also contain other directories)
  316.         SET MVSP=C:\MVSP
  317.  
  318.         After rebooting, you may start the program by typing MVSP,
  319.         regardless of the current directory.  You may edit your
  320.         AUTOEXEC.BAT file with any word processor or text editor that
  321.         produces plain text (ASCII) files.  Many will have a special non-
  322.         document mode for this.  Refer to your word processor manual for
  323.         details.  Also, DOS' EDIT or EDLIN program may be used.
  324.  
  325.         Menus: 
  326.         When the program is loaded, you will see an introductory screen
  327.         giving the name  of the author, then after pressing any key you
  328.         will be presented with a menu of available procedures.  The first
  329.         MVSP Ver. 2.1 -- Users Manual                              Page 7
  330.         
  331.         option on the menu will be highlighted by a rectangular cursor.
  332.         This cursor can be moved through the list of options by using the
  333.         up and down arrow keys.  A choice is made by pressing the
  334.         carriage return when the correct one is highlighted, or
  335.         alternatively by typing the letter preceding the desired option.
  336.         Usually, choosing an option will bring up a second menu, from
  337.         which you can often call up a third, and so on.  The number
  338.         preceding the title on each menu indicates the level you are at
  339.         in the hierarchy;  If you get lost, remember that pressing 'Q' or
  340.         ESC will bring you back to the previous menu.
  341.  
  342.         MVSP has an extensive help facility that provides information
  343.         about every menu option.  To get help, just place the cursor on
  344.         the desired option and press the F1 key.  After reading the text,
  345.         pressing any key will bring you back to the menu.
  346.  
  347.         Entering and editing text: 
  348.         You will often be asked to type in a string of text, such as the
  349.         name of a data file.  In some cases you are provided with a
  350.         default choice, which you can accept or modify.  MVSP has a
  351.         number of editing commands to help in this modification.  You can
  352.         use the cursor keys to move the cursor back and forth, the DEL
  353.         and Backspace keys for deleting text, and the letter keys for
  354.         adding text.  When you first begin editing a text string, the
  355.         program is in insert mode, so that any text you type will be
  356.         inserted and the remaining text will be pushed the right.
  357.         Pressing the INS key toggles insert mode on or off (indicated by
  358.         the thickness of the cursor); with it off old text is overwritten
  359.         by the new.  Pressing ESC will clear the input line to allow you
  360.         to start from scratch.  If you press the Enter key after clearing
  361.         the line you will exit that procedure.
  362.  
  363.         When you are entering the name of the input data file, pressing
  364.         F3 will recall the last valid filename you entered during that
  365.         session.  You may then use that file again or modify it if you
  366.         want to use a similarly named file.
  367.  
  368.         MENU OPTIONS 
  369.         The main menu lists the six available numerical procedures as
  370.         well as a few other options.  It looks like this:
  371.  
  372.         <Graphic placed here in printed manual>
  373.  
  374.         Options A-F: 
  375.         These options are the basic numerical procedures; principal
  376.         components analysis, principal coordinates analysis,
  377.         correspondence analysis (reciprocal averaging), similarities and
  378.         distances, cluster analysis, and diversity indices.  These are
  379.         described later in this document.
  380.  
  381.         Option M: 
  382.         The MANIPULATE DATA option provides facilities for data entry,
  383.         editing, and transformation.  A simple spreadsheet-like data
  384.         editor is provided for initial entry and subsequent modification
  385.         of the data.  Procedures are also provided for transposing and
  386.         transforming the data, converting to other scales, and deleting
  387.         rows and columns.  The full use of these facilities is described
  388.         MVSP Ver. 2.1 -- Users Manual                              Page 8
  389.         
  390.         below.
  391.  
  392.         Option I: 
  393.         The IMPORT/EXPORT option allows you to transfer data between MVSP
  394.         files and other file formats.  Currently Lotus 1-2-3/Symphony and
  395.         Cornell Ecology Program file formats are supported.  The full use
  396.         of this option is described on page 8.
  397.  
  398.         Option S: 
  399.         This option, CHANGE DRIVE OR SUBDIRECTORY, allows you to specify
  400.         the default location of the input and output data files.  If you
  401.         enter a path name without a drive specification, the default
  402.         drive is assumed.  If you enter just a drive specification (e.g.
  403.         "A" or "A:") the default path will be the current directory of
  404.         that drive.  A "?" lists the sub-directories of the current
  405.         directory.  A carriage return with no other input exits this
  406.         option with no changes.
  407.  
  408.         Option Q: 
  409.         QUIT MVSP will exit the MVSP program and return to the DOS
  410.         prompt.
  411.  
  412.         Option X: 
  413.         The EXECUTE DOS COMMANDS option allows you to temporarily drop
  414.         out to (or "shell to") DOS while you are running MVSP.  Rather
  415.         than exiting the program completely, this option allows you to
  416.         keep MVSP loaded in memory, with all you current options intact,
  417.         while you work at the DOS prompt.  When you are ready to return
  418.         to MVSP, simply type the command "exit" at the DOS prompt.
  419.  
  420.         When you shell to DOS, the running program of MVSP will be saved
  421.         to disk or EMS memory, allowing as much DOS memory to be freed up
  422.         as possible.  On typing "exit" this saved image will be reloaded
  423.         and you will be returned to MVSP in the state it was when you
  424.         left.
  425.  
  426.         Option P: 
  427.         The CHANGE PROGRAM DEFAULTS option allows you to change many of
  428.         the default settings for the program.  These specifications can
  429.         be saved to the file MVSP.CNF, which will be reloaded each time
  430.         the program is run, reinstating these defaults.  When you choose
  431.         this option you will be presented with a menu asking which type
  432.         of default should be changed.
  433.  
  434.         <Graphic placed here in printed manual>
  435.  
  436.         C - SCREEN COLOURS allows you to change the colour of the regular
  437.         text and background, the menu text and background, the menu
  438.         frame, and the help screens and error messages.  Choosing one of
  439.         these will cause a menu of available colours to appear.  You can
  440.         experiment with colour combinations easily, quitting the colour
  441.         menu when you are satisfied.  Note that option "F" on the menu
  442.         resets black and white colours.  This option can be useful in
  443.         case you get yourself into a colour combination that is so
  444.         unreadable that you can't see the options available!
  445.  
  446.         P - DATA FILE AND WORK FILE PATH changes the default path used
  447.         MVSP Ver. 2.1 -- Users Manual                              Page 9
  448.         
  449.         for data files, just like option S above.  If you are using a two
  450.         floppy disk system, it is often most useful to have the program
  451.         files in drive A: and to have the default data file path set to
  452.         B:, so that data files are on another disk.  If you have a hard
  453.         disk, you could have the program files in a subdirectory named
  454.         C:\MVSP (which would be the default directory when you invoke the
  455.         program) and the data either on a floppy disk in drive A: or B:,
  456.         or in a hard disk directory named C:\MVSP\DATA.  You would then
  457.         specify the default data file path through this option.  You can
  458.         even set up separate directories for different types of data,
  459.         which is where the temporary path change option ("S" on main
  460.         menu) would come in handy.  You can always override the default
  461.         path option by specifying the drive and path when you are asked
  462.         for the name of the data file while running one of the
  463.         statistical procedures.
  464.  
  465.         After entering the default data file path, you will be asked for
  466.         a disk drive where the temporary work files will be stored.  If
  467.         the data set you are analysing is too large to fit in memory,
  468.         parts of it will be stored on disk until needed.  This will slow
  469.         down the calculations considerably, since data retrieval from a
  470.         disk is much slower than from memory.  Floppy disks are much
  471.         slower than hard disks, so always choose a hard disk for the work
  472.         files if you have one available.  If your computer has extended
  473.         or expanded memory (memory above 640K), then you can set this up
  474.         as a RAMdisk that will emulate a disk drive but operate much
  475.         faster, thus speeding up any analyses that must write data to
  476.         disk.  See Appendix 4 (only included with the registered version)
  477.         for details of how to do this and general information on memory
  478.         management in MVSP.
  479.  
  480.         E - DATA FILE EXTENSIONS allows you to change the default
  481.         extensions for your input and output files.  The default values
  482.         are *.MVS for input files and *.OUT for output files, but you can
  483.         easily change this and save your changes.  The PCO and cluster
  484.         analysis procedures can have different defaults, which
  485.         facilitates the input of similarity or distance coefficients.
  486.         The coefficients program will output a symmetrical matrix in the
  487.         form required by the PCO or cluster procedures, if so asked, and
  488.         will default to the extension that you specify for PCO and
  489.         cluster analysis input (*.MVD is the initial setting).  The
  490.         output files for these can also have their own default extension
  491.         (*.OT2 initially).  You can also specify default extensions for
  492.         the tree description and tree order files produced by cluster
  493.         analysis.
  494.  
  495.         R - REREAD CONFIGURATION FILE will reread the MVSP.CNF
  496.         configuration file that contains the user default settings.  This
  497.         will reinstate the default settings that are normally active when
  498.         the program is initiated.  This can be handy if you have made a
  499.         lot of changes to defaults during a session (without saving
  500.         them!) and you wish to return to your old defaults.
  501.  
  502.         S - SAVE DEFAULTS TO FILE MVSP.CNF will save any changes in the
  503.         defaults to a configuration file, which will be reloaded every
  504.         time the program is run.  If this file is not found in the same
  505.         directory as the other MVSP program files, the internal defaults
  506.         MVSP Ver. 2.1 -- Users Manual                             Page 10
  507.         
  508.         will be set.
  509.  
  510.         Q - QUIT CONFIGURE will return to the main menu.
  511.  
  512.         O - OUTPUT FORMAT allows you to change the format of the
  513.         printouts obtained from MVSP analyses as well as the method used
  514.         for writing to the video screen.
  515.  
  516.         <Graphic placed here in printed manual>
  517.  
  518.         P - The PAGE WIDTH option sets the number of characters that can
  519.         be printed per line on your printer.  Normally this is 80
  520.         characters, but if you have a wide carriage printer or a printer
  521.         capable of compressed printing at 15 characters per inch, then
  522.         this can be reset to 130.  The "Printer Setup" option described
  523.         below allows you to set your printer to  print in compressed
  524.         mode.  The "Page Width" option also affects the length of lines
  525.         in data files created by the "Data Manipulation" and "Distances
  526.         and Similarities" procedures.
  527.  
  528.         C - RESULTS COLUMN WIDTH sets the number of characters used to
  529.         represent each number and column heading on the printout of the
  530.         results.  With numbers, this column width is for the entire
  531.         number, including the decimal point, decimal fraction, and the
  532.         space between numbers.  Thus " 2345.67" requires a column width
  533.         of at least 8 spaces, including a leading space.  Narrower column
  534.         widths allow more columns to be printed across a page, thus
  535.         saving paper, but some numbers may be too large to be represented
  536.         in the smaller space.  If a number is larger, the whole number
  537.         will be printed and the alignment of the columns will be
  538.         disrupted.  Symmetrical matrices created by the "Distances and
  539.         Similarities" procedure also use the values specified here and in
  540.         option D.
  541.  
  542.         D - RESULTS DECIMAL PLACES sets the number of decimal places to
  543.         be displayed for each number.  Generally this should be at least
  544.         2 or 3.  Whole numbers (those that have a decimal portion that is
  545.         zero to the accuracy of the computer) will be displayed without
  546.         the decimal portion.  Numbers that are smaller than can be
  547.         represented in the allotted decimal places will be printed in
  548.         exponential form.  For instance, if the decimal places option is
  549.         set to 3, and a number 0.00001 must be printed, it will be
  550.         printed as 1.0E-05 (1.0 x 10-5).
  551.  
  552.         O & E - DATA COLUMN WIDTH and DATA DECIMAL PLACES are similar to
  553.         the above two options, but they apply only to printouts of the
  554.         raw data and to data files created by the "Data Manipulation"
  555.         procedure.  For instance, if your data are always whole numbers
  556.         less than 100, then you could set the data decimal places to 0
  557.         and the data column width to 4.
  558.  
  559.         M - SCREEN OUTPUT METHOD lets you toggle between two methods of
  560.         screen output, direct screen memory output and BIOS output.  The
  561.         direct memory method writes data directly to the area of memory
  562.         that controls the screen, while the BIOS method uses calls to
  563.         your computer's BIOS (basic input/output system).  The direct
  564.         output method is much faster, but only works on computers that
  565.         MVSP Ver. 2.1 -- Users Manual                             Page 11
  566.         
  567.         are hardware-compatible with the IBM-PC (almost all IBM
  568.         compatibles sold these days are hardware-compatible).  Direct
  569.         output also will cause problems when  used under some windowing
  570.         environments such as older versions (ver. 2) of Microsoft's
  571.         Windows.  If you are using one of these environments, you must
  572.         either run MVSP as a full-screen application or choose BIOS
  573.         output to allow MVSP to run in a window.  Note that both Windows
  574.         3 and Quarterdeck's Desqview will run MVSP in a window without
  575.         choosing BIOS output, thus allowing faster screen output.
  576.  
  577.         V - CHECK FOR VIDEO "SNOW".  On some brands of colour graphics
  578.         adapter boards (most notably IBM's original), the fast method of
  579.         writing directly to the screen memory can cause interference, or
  580.         "snow", on the screen.  This occurs when both the program and the
  581.         computer's graphics hardware try to work on the screen memory at
  582.         the same time.  This option forces the program to check the
  583.         screen memory before writing to it to make sure there will be no
  584.         interference.  This eliminates snow, but also slows down the
  585.         output somewhat.  If your graphics adapter is not susceptible to
  586.         snow, then this option should be set to "No" for optimal speed.
  587.         If snow appears, then set the option to "Yes".
  588.  
  589.         G - GRAPHICS OPTIONS allows you to change a number of defaults
  590.         related to the scattergrams produced by the ordination
  591.         procedures.
  592.  
  593.         <Graphic placed here in printed manual>
  594.  
  595.         P - SCATTERPLOT/DENDROGRAM TYPE lets you select either text or
  596.         graphics plots.  Text plots are produced using regular characters
  597.         such as "-" and "|" and "*" that can be printed on any printer or
  598.         video screen.  The placement of the points for scatterplots is
  599.         restricted to a grid of 70x22 or 110x55 characters, therefore the
  600.         accuracy of these graphs is limited.   Text-based dendrograms
  601.         will be scaled to fit the width of the page and will extend as
  602.         long as necessary, even over multiple pages.  Graphics plots are
  603.         produced by switching your video monitor to graphics mode and
  604.         drawing the graphs with lines and dots.  These are more accurate
  605.         and aesthetic (see example below).  However you must have a
  606.         graphics monitor to display these.  MVSP supports CGA, EGA, VGA,
  607.         VESA Super VGA, Hercules, and AT&T or Compaq plasma display 400-
  608.         line graphics monitors.  Except for the case of the 400-line mode
  609.         (see "400 LINE GRAPHICS MODE" below), MVSP will detect which type
  610.         of monitor is present and adjust accordingly.  The appropriate
  611.         device driver file (CGA.BGI, EGAVGA.BGI, VESA.BGI, HERC.BGI, or
  612.         ATT.BGI) must be in the same directory as the program files
  613.  
  614.         <Graphic placed here in printed manual>
  615.  
  616.         Graphics scatterplots can be printed on dot matrix printers
  617.         either directly or through the DOS GRAPHICS screen-dump facility.
  618.         If you have a printer that is compatible with those listed under
  619.         "Printer Setup", plots can be output directly by choosing the
  620.         PRINT GRAPHICS AUTOMATICALLY option described below.  For those
  621.         with other types of printers, check your DOS manual to see if
  622.         your printer is supported by the GRAPHICS command.  If so,
  623.         running GRAPHICS before MVSP will allow you to print the graph
  624.         MVSP Ver. 2.1 -- Users Manual                             Page 12
  625.         
  626.         using the Print Screen key.  Note, though, that printing directly
  627.         from MVSP will give much higher resolution plots.
  628.  
  629.         W - WIDE TEXT PLOTS are plots that are produced with a grid of
  630.         110x55 characters.  If you have a wide carriage printer and paper
  631.         or a dot matrix printer capable of compressed mode printing (see
  632.         "PRINTER SETUP" below), then these graphs can be used, giving
  633.         higher resolution.  Normally, a single wide text plot will fill a
  634.         whole page.  However, I usually use a special print mode that is
  635.         a combination of compressed and superscript characters with a
  636.         line spacing of 12 lines per inch instead of the default 6
  637.         ("tiny" print on the "TEXT STYLE" menu below).  This produces
  638.         tiny but readable characters and allows two plots per page.
  639.  
  640.         G - PLOTS PER PAGE allow you to specify how many plots to print
  641.         before issuing a new page command to the printer, thus ensuring
  642.         that plots aren't printed over the fold of the paper.  In regular
  643.         text mode two plots fit per page but only one fits in wide text
  644.         mode (but see previous paragraph).   In graphics mode you will be
  645.         able to fit one plot per page.  If you are using the DOS GRAPHICS
  646.         utility to do a screen dump of the plot, then set this option to
  647.         one plot per page as well.
  648.  
  649.         L - DATUM LABEL TYPES.  By default, MVSP represents each plotted
  650.         point with a letter or other character.  These symbols are also
  651.         listed on the printouts in a column headed "PLOT" so that you can
  652.         tell which case or variable is represented by each point.  This
  653.         is the "Sequential" mode of data labelling.  You may also choose
  654.         "Label" mode in which the first character of each datum label is
  655.         plotted.  This is useful if you can assign the cases or variables
  656.         to distinct groups (such as environment type, sociological group,
  657.         or taxon)  In these cases you use different letters or symbols as
  658.         the first character of each label in order to represent each
  659.         group.  With these plotted, you can tell at a glance how well the
  660.         groups are distinguished by the analysis.
  661.  
  662.         M - 400 LINE GRAPHICS MODE is a special mode used in AT&T 6300
  663.         and Compaq Portable III and 386 computers, among others.  This is
  664.         similar to CGA high resolution mode but uses a resolution of
  665.         640x400 rather than 640x200.  MVSP can usually tell what type of
  666.         display is being used, but these 400 line mode displays will be
  667.         detected as CGA monitors.  To take advantage of the 400 line
  668.         mode, set this option to "Yes".  The file ATT.BGI must be present
  669.         in the directory containing the MVSP program files.
  670.  
  671.         A - PLOTS PER ANALYSIS allows you to specify how many axes to
  672.         plot for each analysis.  If you know ahead of time that you want
  673.         to see the first three axes plotted against each other, set this
  674.         value to 3.  You may wish to see the results before deciding how
  675.         many axes to plot.  In this case, enter "-1" for the number of
  676.         plots; you will then be asked how many to plot as the procedure
  677.         is running.
  678.  
  679.         E - PRINT GRAPHICS AUTOMATICALLY specifies that you wish to have
  680.         the graphics plots automatically printed rather than drawn on the
  681.         screen.  Set this option to "Yes" to do this.  If you instead
  682.         wish to examine the plot on the screen before deciding to print
  683.         MVSP Ver. 2.1 -- Users Manual                             Page 13
  684.         
  685.         it, set this option to "No".  When the plot is drawn on the
  686.         screen, the program will pause to allow you to look at it.  If
  687.         you decide to print it, simply press the "P" key, otherwise press
  688.         any other key to go on.  Also use the "No" option if you aren't
  689.         going to print the graphics mode plots, or if you are using the
  690.         DOS GRAPHICS screen-dump facility to print them.
  691.  
  692.         T - PRINTER SETUP option - This option allows you to specify what
  693.         type of printer(s) you are using.  Separate printers can be used
  694.         for the output of text results and graphics plots, so that you
  695.         could, for instance, have the results printed on a dot matrix
  696.         printer and the graphs on a plotter or high resolution laser
  697.         printer.  There are several options on this menu:
  698.  
  699.         <Graphic placed here in printed manual>
  700.  
  701.         T - TEXT PRINTER - This option allows you to choose one of
  702.         several printers for the output of text results.  This output
  703.         will include the numeric results as well as graphs if text mode
  704.         plots are chosen under the "Scatterplot/Dendrogram Type" option.
  705.         The "Plain ASCII" option will send text to the printer without
  706.         any control codes.  The "Other" option allows you to specify the
  707.         printer codes in a similar manner as in MVSP version 2.0.  To do
  708.         this you must first consult your printer manual to determine the
  709.         codes needed for the desired text effect.  Then, using this
  710.         option, enter the decimal (not hexadecimal) codes with each
  711.         individual value preceeded by a slash (e.g. "\27\69" for bold
  712.         print on an Epson printer).  You may enter the codes to set a
  713.         certain text effect and to reset the printer to its default
  714.         condition at the end.
  715.  
  716.         Y - TEXT STYLE - MVSP can automatically set up your printer to
  717.         use different text styles for the printouts.  Normal printing
  718.         gives output in your printer's default text mode.  Compressed
  719.         will give text that can fit up to 130 columns on a single page of
  720.         A4 or 8.5"x11" paper.  Tiny print is also compressed to allow for
  721.         130 columns but the text itself is also half as high as normal,
  722.         allowing for twice as many lines per page as well.  If you choose
  723.         compressed or tiny print, make sure to set the "Page Width"
  724.         option (page 10) to 130 columns.
  725.  
  726.         Z - PAPER SIZE - This allows you to choose the size of paper used
  727.         in your printer.  You may specify letter, legal, or A4 size.  If
  728.         you are using wide carriage paper, choose the size that matches
  729.         the length of your paper.
  730.  
  731.         P - GRAPHICS PRINTER - You may choose from several types of
  732.         printers and plotters for your graphics output.  You may also
  733.         save the graphs to a .PCX bitmap file at 640x480 resolution.
  734.  
  735.         M - GRAPHICS PRINTER MODE - Each printer type has a number of
  736.         modes associated with it.  These modes cover the resolution of
  737.         output and/or the page size.  The available modes vary for each
  738.         printer type.  Note that with some printers, most notably the HP
  739.         Laserjet, the highest resolution printouts can often take a long
  740.         time to complete.
  741.  
  742.         MVSP Ver. 2.1 -- Users Manual                             Page 14
  743.         
  744.         D - GRAPHICS OUTPUT DEVICE - You may specify to which parallel or
  745.         serial port your printer is attached.  This allows you to have
  746.         two printers attached to one computer on different ports (the
  747.         text printer is always assumed to be on LPT1).  You can also have
  748.         graphics output directed to a file.  You can then send it to the
  749.         printer later using the DOS "COPY /B filename portname" command,
  750.         where "filename" is the name you specify for the output and
  751.         "portname" is LPT1, LPT2 COM1, or COM2.
  752.  
  753.         You can also save graphics output to a file if you want to import
  754.         the plot into a graphics program for further editing or inclusion
  755.         in other documents.  Many drawing, painting, and desktop
  756.         publishing/word processing programs allow you to import graphs in
  757.         a number of formats.  The three graphics printer types in MVSP
  758.         that can be used for this purpose are HP Plotter, Postscript, and
  759.         bitmap.  The Postscript files can be treated as Encapsulated
  760.         Postscript files (.EPS or .AI) by many programs.
  761.  
  762.         W - PLOT WIDTH (CM) - This option allows you to specify the width
  763.         (in centimetres) of the graph on the page.  The graph will be
  764.         centred on the page.  If the value you specify is larger than the
  765.         page size it will be scaled to fill the page.
  766.  
  767.         H - PLOT HEIGHT (CM) - This option, together with "Plot Width",
  768.         allows you to specify the size of the graph.
  769.  
  770.  
  771.                                    DATA EDITOR
  772.  
  773.         Data files may be constructed using the MVSP data editor.  This
  774.         editor is  similar to a spreadsheet program.  Data are entered
  775.         and presented in a tabular format, with the rows being the
  776.         variables and the columns being the individual cases or objects.
  777.  
  778.         To use the data editor, first choose the "Manipulate Data" option
  779.         from the main menu and specify a filename.  If that file exists,
  780.         it will be loaded into the editor for modification; if not, you
  781.         will be asked if you want to create a new file.  You will now be
  782.         presented with the Data Manipulation menu.  Choose "Enter/Edit
  783.         Data".  If you are creating a new file, you will have the option
  784.         of reading in data from another file for modification and saving
  785.         under the new name.
  786.  
  787.         You will next be asked to enter the maximum number of rows and
  788.         columns needed for the data matrix.  MVSP must set aside a
  789.         certain amount of memory for working with the data matrix.  If
  790.         you are editing an existing data matrix and don't plan to add new
  791.         rows or columns, then just accept the default values for rows and
  792.         columns.  If you are adding rows or columns to either a new or
  793.         old matrix, then enter the maximum number needed.  If you aren't
  794.         sure of the exact number, over-estimate.  This will only cause
  795.         MVSP to set aside some extra memory while you are editing; it
  796.         will not have any lasting effect.
  797.  
  798.         You will also be asked to enter or modify a title for the file.
  799.         This title identifies the data and will be printed out along with
  800.         the results of each analysis.  You may enter up to 79 characters,
  801.         MVSP Ver. 2.1 -- Users Manual                             Page 15
  802.         
  803.         so be as descriptive as you can.  Note, however, that the
  804.         "Distances and Similarities" procedure uses the last few
  805.         characters of the title to place a label on the output symmetric
  806.         matrix file identifying the coefficient used.  If you use most or
  807.         all of the 79 available characters, make sure no vital
  808.         information is at the end of the title, or it will be overwritten
  809.         by the identifier.
  810.  
  811.         Entering data labels: 
  812.         When creating a new file, you are first presented with a blank
  813.         spreadsheet with the cursor in the upper left corner.  You must
  814.         first enter some labels for the rows and columns.  You will
  815.         notice that the cursor will only move about in rows and columns
  816.         that have labels or in the next blank row or column.  This is to
  817.         avoid having spurious values placed in areas that aren't meant
  818.         for data.  By entering a row or column label, you are telling the
  819.         program that this is another variable or case to include in the
  820.         matrix.  When you enter a new label, that row or column will then
  821.         be filled with zeros to indicate that it is now considered part
  822.         of the data matrix.
  823.  
  824.         To enter labels, all you need to do is to start typing the label
  825.         while the cursor is in the desired row or column.  When you start
  826.         typing, the bottom line will display the word "INPUT>" and the
  827.         characters you type will appear on this line.  You may edit the
  828.         text using the backspace, cursor, insert, and delete keys, as
  829.         described in the section "Entering and editing text" above.  Once
  830.         you are finished typing the label, you then place the label in
  831.         the matrix by typing one of the cursor keys (but not the Enter
  832.         key).  This tells the editor whether the label is for a row or
  833.         column.  Typing the up or down arrow cursor keys declare that
  834.         label to be for a row, while a left or right arrow key indicates
  835.         a column label.  The cursor will also move in the appropriate
  836.         direction so that you are ready to enter another label.
  837.  
  838.         The labels themselves can be up to ten characters long and may
  839.         consist of any printable character, except spaces.  The following
  840.         are all valid labels:
  841.  
  842.           ROW1
  843.           COLUMN_2
  844.           1st-Loc.
  845.           #3-Site
  846.  
  847.         This label is NOT valid:
  848.  
  849.           SITE 1
  850.  
  851.         It will be read as two labels, "SITE" and "1".  If you are using
  852.         labels that begin with a number (such as 1st-Loc.), you must
  853.         precede the label with a single or double quote (' or ") so that
  854.         the program will know that you are not attempting to enter
  855.         numeric data.
  856.  
  857.         Entering data: 
  858.         Once you have a few labels entered, you may start entering the
  859.         data themselves.  This is done in a similar way to the labels;
  860.         MVSP Ver. 2.1 -- Users Manual                             Page 16
  861.         
  862.         just start typing a number when the cursor is in the appropriate
  863.         place.  Input of each number is finished by pressing one of the
  864.         cursor keys or the "Enter" key.  If you enter any characters that
  865.         cannot be converted to numeric form, an error message will be
  866.         displayed and you may edit the input to correct the mistake.  The
  867.         only valid characters for numeric data are '0'-'9', '-', '+',
  868.         '.', and 'E'.  The 'E' is used for entering numbers in scientific
  869.         notation, so that 0.00001 (1.0 x 10-5) may also be entered as
  870.         "1.0E-05".  Binary (presence/absence) data should be entered as
  871.         "0" and "1", with a "0" indicating absence.
  872.  
  873.         Editing labels and data: 
  874.         Editing of data and labels can be done in two ways.  In either
  875.         case, the cursor must first be placed in the appropriate row and
  876.         column.  Then you may either type the value anew, as you would
  877.         for entering data, or you may use one of the editing function
  878.         keys.  The function of each of these keys is listed at the bottom
  879.         of the screen.  Pressing F2 will bring the datum to the bottom
  880.         line of the screen, where it can be edited.  F3 will allow you to
  881.         edit the row label and F4 the column label.  These can be edited
  882.         and entered into the matrix as described above.
  883.  
  884.         Saving data matrix: 
  885.         Pressing the F9 key will save the data matrix to a file along
  886.         with all the changes you have made so far.  I would suggest doing
  887.         this frequently to avoid losing any changes you have made due to
  888.         malfunction or mistakes in editing.  The F10 key will save the
  889.         changes and exit back to the main menu.  If you decide to abandon
  890.         the current editing session, press the ESC key.  You will first
  891.         be asked to confirm that you want to exit, then you will be
  892.         returned to the main menu.  All changes made since your last save
  893.         will be lost.
  894.  
  895.  
  896.                                 DATA FILE FORMAT
  897.  
  898.         Data files from other sources can be imported to MVSP either
  899.         directly or with minor editing.  If your data are in Lotus 1-2-3
  900.         or Symphony worksheets or in files for the Cornell Ecology
  901.         Programs (Decorana and Twinspan) then they can be imported
  902.         directly (see page 22). Otherwise the data can be transferred as
  903.         text files.
  904.  
  905.         Most database and spreadsheet programs have an option for
  906.         outputting data to plain text (ASCII) files.  A word processor or
  907.         text editor can then be used to modify the resulting files to the
  908.         appropriate format for MVSP (mainly by adding the file header
  909.         information, discussed below).
  910.  
  911.         Data files for MVSP must be in ASCII format.  This means that
  912.         they should consist only of letters or numbers, spaces, and most
  913.         other symbols represented on the keyboard.  Many word processers
  914.         insert special formatting characters that will not be able to be
  915.         read by MVSP.  You can check whether your word processor is one
  916.         of these by listing a word processed file to the screen with the
  917.         DOS TYPE command and looking for strange characters.  If your
  918.         word processor uses these extra characters, make sure you modify
  919.         MVSP Ver. 2.1 -- Users Manual                             Page 17
  920.         
  921.         your data files in a non-document mode that creates normal ASCII
  922.         files.
  923.  
  924.         DATA FILE HEADER: The first line of the data file should be a
  925.         header line, which will give the program some information about
  926.         the data, such as the number of rows and columns.  It should look
  927.         something like this:
  928.  
  929.         * 10 15
  930.  
  931.         This header line should begin with an asterisk ("*") in the first
  932.         column of the first line of the file.  This asterisk tells the
  933.         program that a header is present.  If the asterisk is not found,
  934.         the program assumes that the header information is not present,
  935.         and it will prompt the user for the information.  MAKE SURE that
  936.         if this header information is present, there is an asterisk
  937.         before it; if not, the header information will be read as data!
  938.         The two numbers are the number of rows and columns in the data
  939.         matrix.  The above example has 10 rows and 15 columns.
  940.  
  941.         You may also include data labels in the data file.  These labels
  942.         will be printed on your output to help make sense of the masses
  943.         of numbers that will be spewed out.  If labels are included, this
  944.         must be specified in the file header.  For example:
  945.  
  946.         *L 10 15
  947.  
  948.         specifies a data file that includes data labels and that has 10
  949.         rows and 15 columns (NOT including the labels themselves).  The
  950.         "L" must come immediately after the "*", with no intervening
  951.         spaces, or it will be read as the number of rows, and an error
  952.         will occur.  The numbers of rows and columns must be separated by
  953.         at least one space from each other.
  954.  
  955.         DATA LABELS: The format of the data labels is explained above
  956.         under "Entering Data Labels".  When data labels are included,
  957.         both row and column labels must be present.  The column labels
  958.         should be in the second row of the data file, after the header
  959.         line, and the labels should be separated by at least one space.
  960.         The labels may be continued on to subsequent lines; the program
  961.         will continue reading column labels until it has read as many as
  962.         the number of columns you have specified in the header line.
  963.         Row labels occur on the same line as the data row to which they
  964.         apply, and should precede the first datum in that row, with a
  965.         space separating the label and datum.
  966.  
  967.         DATA FILE TITLES: A title may also be added to your data file on
  968.         the header line, so that you know what these data represent.
  969.         Here's an example
  970.  
  971.         *L 10 15 Test data file for MVSP
  972.  
  973.         This title will be listed to the screen and placed on the output
  974.         when that file is selected.  It must be separated from the other
  975.         elements of the header by at least one space, and it cannot be
  976.         more than 79 characters long.  The Distances and Similarities
  977.         procedure will also place this title in the header of the matrix
  978.         MVSP Ver. 2.1 -- Users Manual                             Page 18
  979.         
  980.         output file, along with the specification of which coefficient
  981.         was used, so that the title is carried over to the clustering
  982.         program.
  983.  
  984.         DATA MATRIX: The data matrix itself should consist of the data
  985.         points separated by at least one space.  The data for one row can
  986.         be continued on the next line.  If the number of rows or columns
  987.         you specify is wrong, the data matrix will be read incorrectly,
  988.         often without warning.  If you have a 10x10 matrix without labels
  989.         and specify 9 columns by mistake, the last datum on the first row
  990.         will be read as the first datum of the second row, and so on.
  991.         This, needless to say, can raise havoc with your results!  All
  992.         procedures can print out the raw data so that you can check to
  993.         make sure it was read correctly.   Here is a complete example
  994.         data file:
  995.  
  996.         *L 5 10 Test data set for MVSP
  997.         COL1 COL2 COL3 COL4 COL5 COL6 COL7 COL8 COL9 COL10
  998.         ROW1 23  2  4 53  6 45  2  3 67  5
  999.         ROW2 10  2  4 34  1  4  3 10 20  3
  1000.         ROW3  2 34  0  1 35 12  1 90 10  9
  1001.         ROW4 98 12 10  4 10  9 10  5 20 31
  1002.         ROW5  1  7  9 11 75  7  5 21  0 10
  1003.  
  1004.         The input data files for the cluster analysis and PCO programs
  1005.         use a slightly different header format.  Here is an example:
  1006.  
  1007.         *L 15 DIS Test data set for MVSP
  1008.  
  1009.         Since the clustering and PCO programs use a symmetrical matrix as
  1010.         input, it only needs one number for the size of the data matrix.
  1011.         In this case the size of the matrix is 15x15.  The third element
  1012.         of the header is a three letter abbreviation specifying whether
  1013.         the matrix is a similarity (SIM) or distance (DIS) matrix.  This
  1014.         code MUST be separated from the number of objects by only one
  1015.         space, or it will not be read correctly.  The "Distance and
  1016.         Similarity" procedure of this program automatically sets up its
  1017.         output files in this manner for input into these procedures.
  1018.  
  1019.         Here is an example of a symmetrical input file, generated from an
  1020.         analysis of the above matrix, using the Spearman Rank Order
  1021.         Correlation Coefficient:
  1022.  
  1023.         *L 10 SIM Test data set for MVSP - SPEARMAN
  1024.         COL1 COL2 COL3 COL4 COL5 COL6 COL7 COL8 COL9 COL10
  1025.          1.00
  1026.         -0.15  1.00
  1027.          0.36 -0.05  1.00
  1028.          0.20 -0.97  0.05  1.00
  1029.         -0.60  0.67  0.15 -0.60  1.00
  1030.          0.30  0.21 -0.31 -0.00  0.10  1.00
  1031.          0.30 -0.05  0.97  0.00  0.10 -0.50  1.00
  1032.         -0.80  0.62 -0.41 -0.70  0.60 -0.30 -0.30  1.00
  1033.          0.82 -0.55 -0.03  0.62 -0.82  0.41 -0.10 -0.87  1.00
  1034.          0.10  0.67  0.67 -0.60  0.70  0.10  0.60  0.10 -0.41  1.00
  1035.  
  1036.         Note that this is a lower half matrix, with diagonals (the
  1037.         MVSP Ver. 2.1 -- Users Manual                             Page 19
  1038.         
  1039.         1.00's) included.  Other forms of matrices may also be specified
  1040.         for input to the clustering program, as discussed below, but this
  1041.         is the default output format of the similarities and distances
  1042.         procedure.
  1043.  
  1044.  
  1045.                                 DATA MANIPULATION
  1046.  
  1047.         When you choose the "Manipulate Data" option from the main menu,
  1048.         you are first asked to provide an input filename.  You may then
  1049.         transpose or transform those data, convert them to other scales,
  1050.         drop rows or columns that are either selected by yourself or that
  1051.         have totals of zero.  Any combination of these options may be
  1052.         chosen.  When the Run command is chosen, a new data file will be
  1053.         produced with all the changes you have selected.  You will be
  1054.         asked to provide a name for the new file; this must be different
  1055.         from the input file.
  1056.  
  1057.         <Graphic placed here in printed manual>
  1058.  
  1059.         Transform data: 
  1060.         The Transform Data option allows you to choose to have the data
  1061.         log or square root transformed before analysis.  Most of these
  1062.         procedures assume a normal distribution of the data, but this
  1063.         assumption is often not met.  Log transforming the data can
  1064.         reduce the skewness of the data (Sokal & Rohlf, 1981), resulting
  1065.         in a more interpretable analysis.  In my work with fossil plant
  1066.         data, I've found this to be invaluable, as I always have some
  1067.         samples with extremely high abundances of certain taxa, and these
  1068.         taxa tend to dominate the analysis due to their large numbers.
  1069.         Log transforming the data evens this out.  You are given the
  1070.         option of what base of logarithm to use.  Square root
  1071.         transformation is also often used when the data are in the form
  1072.         of counts.  Please note that the log transformations are
  1073.         performed on the values x+1, rather than x.  This is done to
  1074.         avoid computer errors when the data value is 0, since the log of
  1075.         0 is undefined, and to avoid negative results when the value is
  1076.         less than 1.
  1077.  
  1078.         The logratio transformation (Aitchison, 1986) was designed
  1079.         specifically for compositional (percentage or proportional) data.
  1080.         These data are affected by closure, in which the increase of one
  1081.         variable necessitates the relative decrease of another, even if
  1082.         the absolute value of the other doesn't change.  This can cause
  1083.         many problems in statistical analyses.  The logratio
  1084.         transformation eliminates the closure problem by replacing the
  1085.         proportions with the log of the ratio between the proportion and
  1086.         the geometric mean of the sample.  In mathematical terms, this
  1087.         is:
  1088.  
  1089.         x'    = log(x    / g )
  1090.           i,j        i,j    i
  1091.  
  1092.         where:
  1093.  
  1094.          x     = proportion of taxon j in the ith sample
  1095.           i,j
  1096.  
  1097.         MVSP Ver. 2.1 -- Users Manual                             Page 20
  1098.         
  1099.          x'    = transformed value
  1100.            i,j
  1101.  
  1102.          g     = (x   +...+x   )1/n = geometric mean
  1103.           i        i,1      i,n
  1104.  
  1105.          n     = number of taxa in the sample
  1106.  
  1107.         It should be emphasized that, for the logratio transformation to
  1108.         be calculated properly, the samples MUST be the columns of the
  1109.         data file.  Otherwise the calculations will be meaningless.
  1110.  
  1111.         Problems arise with the logratio transformation when some of the
  1112.         proportions are zeros, since taking the log of zero produces an
  1113.         error.  This is remedied in MVSP by replacing them with a very
  1114.         small value and then readjusting all other proportions so that
  1115.         the total is 1.0.  The replacement values are calculated using
  1116.         Aitchison's (1986, p.269) zero replacement formula.  This formula
  1117.         incorporates a maximum rounding-off value that can affect the
  1118.         final results.  You can set this value when choosing the logratio
  1119.         transformation.  The new value can be saved to the configuration
  1120.         file.  You may want to try several runs with different values to
  1121.         assess the effect.
  1122.  
  1123.         Transpose data: 
  1124.         The "Transpose Data" option is another that is common to all
  1125.         procedures.  This allows you to transpose a matrix before
  1126.         analysis, so that the rows of the matrix are treated as columns.
  1127.  
  1128.         Convert data: 
  1129.         Convert Data allows you to change the scale of the data to
  1130.         percentages, proportions, standardized scores, binary, the octave
  1131.         class scale, or range-through type stratigraphic data.  In
  1132.         percentage and proportional data, the values are adjusted so that
  1133.         the columns sum to 100 or 1.0 (respectively).  The standardized
  1134.         scores are adjusted by rows to zero mean and unit standard
  1135.         deviation.  Binary converts all non-zero values to 1.  It is
  1136.         sometimes useful to perform analyses on binary data to remove the
  1137.         effects of abundance on the results.
  1138.  
  1139.         The octave scale, which is often used in plant community ecology
  1140.         (Gauch, 1982), is a ten point abundance class scale, roughly
  1141.         based on log2.  Percentage data are converted to the classes
  1142.         based on the following scale:
  1143.  
  1144.             0            = 0
  1145.            >0 - 0.5%     = 1
  1146.            >0.5 - 1%     = 2
  1147.            >1 - 2%       = 3
  1148.            >2 - 4%       = 4
  1149.            >4 - 8%       = 5
  1150.            >8 - 16%      = 6
  1151.            >16 - 32%     = 7
  1152.            >32 - 64%     = 8
  1153.            >64 - 100%    = 9
  1154.  
  1155.         The scale was first developed as a convenience for visual
  1156.         MVSP Ver. 2.1 -- Users Manual                             Page 21
  1157.         
  1158.         estimation of abundances.  It may also be used to convert fully
  1159.         quantitative data to a simpler scale.  Much of the minor
  1160.         variation in abundances can be viewed as stochastic noise rather
  1161.         than significant trends (Gauch, 1982).  By breaking the data into
  1162.         ten classes this minor variation is eliminated and only the major
  1163.         'signal' is preserved.  Arguably, the multivariate methods
  1164.         provided by MVSP should also separate out these major trends,
  1165.         leaving the noise in the background but very noisy data can
  1166.         complicate this and, in ordinations, will cause the major trends
  1167.         to account for only a small proportion of the total variance.  In
  1168.         comparisons of PCAs performed on raw, octave transformed, and
  1169.         logratio transformed data, the octave scale performed equally as
  1170.         well as the logratio, with very little difference in the results
  1171.         on the first three axes (Kovach & Batten, in press).
  1172.  
  1173.         The range-through conversion is provided as a convenience to
  1174.         geological biostratigraphers.  In analysing the stratigraphic
  1175.         distribution of fossil organisms it is often desirable to treat
  1176.         taxa as being present in all samples between the first and last
  1177.         occurrence in a vertical sequence.  This assumes that the absence
  1178.         of a species in the middle of its range is due to ecological
  1179.         differences or sampling bias rather than the actual absence of
  1180.         the organism from the region at that time.  In performing the
  1181.         range-through conversion, it is assumed that the columns are
  1182.         samples, that they are arranged in stratigraphic order, and that
  1183.         the data values are abundance or presence-absence (with absence
  1184.         indicated by a 0).  Each row (taxon) is scanned for the first and
  1185.         last occurrence of that taxon, then those and all samples in
  1186.         between are converted to 1's, to indicate the presence of that
  1187.         species.  All other samples are left at 0.
  1188.  
  1189.         Drop rows and columns: 
  1190.         There will often be times when you wish to analyse a subset of
  1191.         your data.  This option allows you to easily create new data
  1192.         files that are subsets of another.  When this option is set to
  1193.         "Yes" and the procedure run, you will be presented with a list of
  1194.         the row labels.  You may move the cursor around the list and mark
  1195.         the labels of the rows you wish to delete by pressing the space
  1196.         bar.  This will cause that label to be shown in reverse
  1197.         highlighting (after you move the cursor), indicating that it will
  1198.         be dropped.  You may unmark the label by pressing the space bar
  1199.         again.  When all the labels to be dropped are marked, press the
  1200.         carriage return.  You will next see a list of the column labels,
  1201.         which you can mark in the same way.  Press the carriage return
  1202.         again and a new data file will be created without those elements
  1203.         that were marked.
  1204.  
  1205.         Drop zero elements: 
  1206.         This option will scan through the data matrix looking for and
  1207.         removing any rows or columns that have totals of zero.  Often
  1208.         when rows and columns are dropped using the previous option, some
  1209.         cases or variables are left with only zero elements.  This can
  1210.         cause problems with some procedures; the CA procedure won't work
  1211.         at all if there are any columns or rows with zero elements while
  1212.         they can distort the results of other analyses.  It is a good
  1213.         idea to set this option as well when you are choosing rows and
  1214.         columns to be deleted.
  1215.  
  1216.         MVSP Ver. 2.1 -- Users Manual                             Page 22
  1217.         
  1218.                                 IMPORT/EXPORT DATA
  1219.  
  1220.         You can transfer data between MVSP and two other file formats.
  1221.         This is done through the "Import/Export Data" menu option.  With
  1222.         this option, you are first presented with a menu allowing you to
  1223.         specify which file format you want to use and whether to import
  1224.         or export data.  When you choose "Run", you are then asked for
  1225.         the file name, and can request a directory listing of all files
  1226.         of that format.
  1227.  
  1228.         CEP Files: 
  1229.         These are files produced for the Cornell Ecology Program series,
  1230.         including DECORANA, TWINSPAN, as well as related programs such as
  1231.         Cajo T.F. ter Braak's CANOCO program (ter Braak, 1986).  These
  1232.         programs use a compressed data file format in which only non-zero
  1233.         abundances are included.  The data are presented in couplets,
  1234.         with the first number indicating the taxon (variable) and the
  1235.         second being the actual abundance.  The couplets for each sample
  1236.         are grouped on one or more lines, with the sample number being
  1237.         specified at the beginning of each.
  1238.  
  1239.         This import option works in a similar way, and replaces, the
  1240.         separate utility REFORMAT that was distributed with earlier
  1241.         version of MVSP.
  1242.  
  1243.         Lotus 1-2-3/Symphony Files: 
  1244.         The spreadsheet files used in Lotus' programs 1-2-3 and Symphony
  1245.         can be read and written by numerous other programs, so that this
  1246.         format has become a common means of data exchange among IBM-PC
  1247.         compatible software.
  1248.  
  1249.         MVSP can read files produced for 1-2-3 versions 1 and 2, as well
  1250.         as Symphony version 1 files (those with the extensions .WKS,
  1251.         .WK1, and .WK2).  The files it produces are .WKS files, for 1-2-3
  1252.         version 1.
  1253.  
  1254.         When reading Lotus files, MVSP assumes that the data are in a
  1255.         matrix form, similar to the MVSP file format itself.  First, it
  1256.         will assume that you have a title for the data file at the top of
  1257.         the spreadsheet grid, preferably in row 1.  The next row will
  1258.         contain the column labels, with each label occurring in the same
  1259.         column as the associated data.  Next the actual data will occur,
  1260.         with each row of data (variables) on a single row of the
  1261.         spreadsheet grid and each sample in a single column.  The row
  1262.         labels occur on the same row as their associated data and occur
  1263.         before any of the data (preferably in column A).
  1264.  
  1265.         MVSP will scan through the file first before actually importing
  1266.         it to determine exactly where the data and labels are located, so
  1267.         there is some scope for flexibility in the placement of the data.
  1268.         However, if you follow the format specified above there is less
  1269.         chance of failure in importing the data.  After the data have
  1270.         been imported you will want to check the resulting matrix for
  1271.         columns or rows with the labels "ROWn" or "COLn", where n is a
  1272.         number.  These indicate that MVSP overestimated the extent of the
  1273.         data matrix (usually due to stray cells in the spreadsheet).
  1274.         These should be filled with zeros but if they actually contain
  1275.         MVSP Ver. 2.1 -- Users Manual                             Page 23
  1276.         
  1277.         data, then you will need to check the rest of the data and the
  1278.         spreadsheet for inconsistencies.
  1279.  
  1280.         Any formulae in the data matrix will be read as numbers, with the
  1281.         current result of the formula being placed in the MVSP file.
  1282.         Otherwise, the data are assumed to be numbers.  If any non-
  1283.         numeric data is found in the area where MVSP expects to find
  1284.         numeric data, these will be replaced with a missing value marker
  1285.         (-999999999) so that you can easily find them and replace them
  1286.         with meaningful data.  You will be warned if this has occurred
  1287.         during import.
  1288.  
  1289.  
  1290.                            RUNNING NUMERICAL PROCEDURES
  1291.  
  1292.         When one of the numerical procedure options (A-F on the main
  1293.         menu) are chosen, you will be asked for the name of the input
  1294.         data file.  The program will automatically add your default
  1295.         extension if none is specified.  So, if your datafile is named
  1296.         "STUDY1.MVS" and your default extension is .MVS, you need only
  1297.         type "STUDY1".  If you specify another extension, or have a
  1298.         filename with no extension, the program will recognize those as
  1299.         long as the full name is specified.  Pressing the carriage return
  1300.         while the line is blank will return you to the main menu.
  1301.  
  1302.         You may obtain a directory of the default data disk and path by
  1303.         typing a "?".  You may then specify a certain file mask, such as
  1304.         "*.MVS" for all files with a .MVS extension or "*.*" for all
  1305.         files.  You will then be presented with a list of all files
  1306.         matching that specification.  You can now move the cursor around
  1307.         with the cursor keys until you find the one you want, then press
  1308.         "Enter" to select that file.  If there are more files than can
  1309.         fit on one screen you can use the PageUp and PageDown keys to
  1310.         move between screens.  Pressing ESC will take you back to the
  1311.         filename prompt.
  1312.  
  1313.         After an input file has been selected, you will be presented with
  1314.         an "Analytical Defaults" menu.  This allows you to set a number
  1315.         of options concerning the analysis about to be performed.  The
  1316.         following is the menu for the principal components analysis
  1317.         procedure:
  1318.  
  1319.         <Graphic placed here in printed manual>
  1320.  
  1321.          The "Transform" and "Transpose Data" options work in a similar
  1322.         way to those in the Data Manipulation procedure.  All procedures
  1323.         also allow you to access the "Change Program Defaults" menu,
  1324.         described above, and to save the new defaults.  "Quit" will
  1325.         return you to the main menu, and "Run" will initiate the running
  1326.         of the procedure.
  1327.  
  1328.         The "Printed Output" option allows you to specify what ancillary
  1329.         information is to be output as well as the destination of the
  1330.         output.  You may select to have the raw or transformed data
  1331.         printed or other intermediary results such as the similarity
  1332.         matrix in the eigenanalysis procedures.  It is useful in initial
  1333.         analyses to see the original data to ensure they have been read
  1334.         MVSP Ver. 2.1 -- Users Manual                             Page 24
  1335.         
  1336.         correctly, and it can be informative to peruse the intermediate
  1337.         results.  In the eigenanalysis procedures, you can also choose to
  1338.         have the results graphed or to have the original data matrix
  1339.         sorted by first axis scores and printed.  This can be useful for
  1340.         seeing patterns in the original data.
  1341.  
  1342.         <Graphic placed here in printed manual>
  1343.  
  1344.         The "Save to WKS File" option allows you to specify that the
  1345.         resulting eigenvalues and scores from the ordination will be
  1346.         separately saved to a Lotus-format file.  This allows you to use
  1347.         a spreadsheet or graphics program to produce plots of the scores
  1348.         or to do further numerical analyses with the scores.
  1349.  
  1350.         Note that all the results are stored in the file, with the
  1351.         eigenvalues and percentages at the top, followed by the
  1352.         components loadings or species scores, and ending with the
  1353.         component scores or samples scores.  If you wish to transfer just
  1354.         one block of scores to your other programs you may need to edit
  1355.         the spreadsheet file and delete the unneeded rows.
  1356.         Alternatively, some programs that import Lotus files allow you to
  1357.         specify in what row and column the results start.
  1358.  
  1359.         The "Output Destination" menu allows you to choose whether to
  1360.         send output to the printer or a file and whether to also show the
  1361.         results on the screen.  I often find it useful to send the
  1362.         results to a file so that they can be input to other programs.
  1363.         For instance, if you have a publication quality graphics program
  1364.         available, you can edit the output file, deleting the extra text
  1365.         so that only the loadings and scores are left, and then import
  1366.         these coordinates into the graphics program for plotting, thus
  1367.         saving you from having to retype them.  You may first get a hard
  1368.         copy of the results by sending the file to the printer with the
  1369.         DOS command
  1370.  
  1371.             COPY filename PRN
  1372.               or
  1373.             PRINT filename
  1374.  
  1375.         If you have specified that the output should be sent to a file,
  1376.         you will be prompted for the name of the output file when you run
  1377.         the analysis.  If you enter a blank carriage return, this output
  1378.         file will default to the input file name plus the default output
  1379.         file extension you have specified.  The output file for an
  1380.         analysis of STUDY1.MVS will default to STUDY1.OUT if your default
  1381.         output extension is  *.OUT.
  1382.  
  1383.         Principal components analysis: 
  1384.         This procedure performs a R-mode principal components analysis.
  1385.         The component loadings are scaled to unity, so that the sum of
  1386.         squares of an eigenvector equals 1, and the  component scores are
  1387.         scaled so that the sum of squares equals the eigenvalue.  Q-mode
  1388.         PCA will generally have the opposite scaling.  Note that many
  1389.         packages, such as SPSS and SYSTAT, perform Q-mode PCA, and thus
  1390.         their eigenvectors will be scaled to the eigenvalue, rather than
  1391.         unity.  For details on the computation and assumptions of the
  1392.         technique, see Orloci (1978), Gauch (1982), Pielou (1984), Manley
  1393.         MVSP Ver. 2.1 -- Users Manual                             Page 25
  1394.         
  1395.         (1986), and Jolliffe (1986).  Orloci and Jolliffe give detailed
  1396.         mathematical discussion of PCA, while Gauch, Pielou and Manley
  1397.         give very clear and understandable discussions of the basis of
  1398.         the technique and its use and assumptions.
  1399.  
  1400.         In the R-mode analysis, similarity coefficients are calculated
  1401.         for the descriptors (or variables), which are the rows of the
  1402.         matrix and component scores are calculated for the objects (or
  1403.         cases), which are the columns of the matrix.
  1404.  
  1405.         STANDARDIZATION AND CENTRING - The Analytical Defaults menu has
  1406.         two options that affect how the PCA is calculated.  You may
  1407.         choose to standardize the similarity matrix before eigenanalysis
  1408.         (thus creating a correlation rather than a covariance matrix),
  1409.         and you may use either a centred or uncentred data matrix.
  1410.         Generally a centred covariance matrix is used, but if different
  1411.         units of measurement are used in the data matrix, these will need
  1412.         to be standardized, and thus a correlation matrix should be used.
  1413.         Standardization may also be desired in ecological studies to
  1414.         reduce the effects of dominant species, so that rarer species
  1415.         play a greater role in the resulting configuration.  An uncentred
  1416.         data matrix is called for when there is appreciable between-axes
  1417.         heterogeneity.  This means that different clusters of points are
  1418.         associated with different axes, and have little projection on
  1419.         other axes.  This often occurs when different groups of samples
  1420.         have completely different sets of common species, with little
  1421.         overlap.  See Noy-Meir (1973) and Pielou (1984) for more on this
  1422.         phenomenon.
  1423.  
  1424.         MINIMUM EIGENVALUE - You may also specify the minimum eigenvalue
  1425.         for which components are printed out.  The possible options are
  1426.         to have all components printed, only those above a certain
  1427.         eigenvalue that you supply, or to base the minimum eigenvalue on
  1428.         one of two rules.  Kaiser's rule states that the minimum
  1429.         eigenvalue should be the average of all eigenvalues (or 1 if the
  1430.         correlation matrix is used).  This is often considered a good
  1431.         rule of thumb for determining whether a component is
  1432.         interpretable (Legendre & Legendre, 1983).  Jolliffe (1986)
  1433.         proposed a modification of this rule in which the minimum
  1434.         eigenvalue is 0.7 times the average eigenvalue.  This will
  1435.         usually give one or more extra components over Kaiser's rule.
  1436.  
  1437.         ACCURACY - The accuracy and speed of the eigenanalysis can be
  1438.         controlled by using the "Accuracy of Solution" option.
  1439.         Eigenanalysis in MVSP is performed using the cyclic Jacobi
  1440.         method, which is an iterative procedure that makes repeated
  1441.         passes through the matrix improving the accuracy of the solution.
  1442.         The iterations stop when a certain level of accuracy, which is
  1443.         supplied by the user, is reached.  Greater accuracy in the
  1444.         solution means that more passes must be made through the matrix,
  1445.         therefore the program takes longer to run.  The accuracy level
  1446.         that you supply to MVSP usually turns out to be roughly equal to
  1447.         the number of correct significant digits in the loadings and
  1448.         scores of the most important components (those greater than 10%
  1449.         of the total variance), so that a level of 1.0 x 10-6 means that
  1450.         these should have roughly six significant digits.  You can
  1451.         experiment with different levels to determine the trade-offs
  1452.         MVSP Ver. 2.1 -- Users Manual                             Page 26
  1453.         
  1454.         between speed and accuracy.
  1455.  
  1456.         RUNNING THE ANALYSIS - Choosing "Run" will initiate the analysis.
  1457.         Status messages will be listed to the screen during the analysis
  1458.         to let you know how things are proceeding.  When it is done, the
  1459.         eigenvalues and their percentage of the total variation will be
  1460.         printed along with the component coefficients (or eigenvectors),
  1461.         then the component scores for each principal component will be
  1462.         calculated and printed.
  1463.  
  1464.         If you have chosen to have the results graphed and have provided
  1465.         a set number of axes to plot through the Graphics Options menu,
  1466.         then these plots will be produced automatically.  If the "Plots
  1467.         Per Analysis" option on the Graphics Options menu has been set to
  1468.         "Ask", you will first be prompted to enter the number.  Entering
  1469.         a zero will bypass the plotting procedure.  See the Graphics
  1470.         Option section above for more details about plotting in MVSP.
  1471.  
  1472.         Principal coordinates analysis: 
  1473.         Principal coordinates analysis (PCO) is a generalized form of
  1474.         PCA.  Whereas PCA implicitly uses either a covariance or
  1475.         correlation matrix, PCO allows you to input any matrix of metric
  1476.         values.  PCO may be used with any of the distances calculated by
  1477.         MVSP except for the squared Euclidean distance.  Of the
  1478.         similarity measures only Gower's is metric.  PCO is calculated as
  1479.         a Q-mode eigenanalysis, therefore it only gives the eigenvectors,
  1480.         not scores.  Note that a PCO of Euclidean distances will give the
  1481.         same results as a Q-mode PCA.
  1482.  
  1483.         Many of the options available for PCA are not applicable to PCO.
  1484.         There is one new option:
  1485.  
  1486.         MATRIX INPUT - A matrix of distance measures must first be
  1487.         calculated using the "Distances and Similarities" procedure (see
  1488.         below).  This matrix is then read by the PCO procedure and the
  1489.         eigenvalues and eigenvectors are calculated.  A number of
  1490.         different input formats are available, including various forms of
  1491.         half matrices and full matrices.  This defaults to the same form
  1492.         specified in the "Matrix Output" option of the "Distances and
  1493.         Similarities" procedure.
  1494.  
  1495.         Correspondence analysis: 
  1496.         The correspondence analysis (or reciprocal averaging) procedure
  1497.         performs several varieties of correspondence analysis (Pielou,
  1498.         1984; see also Hill, 1973, Gauch, 1982, Greenacre, 1984),
  1499.         including detrended correspondence analysis (DCA; Hill & Gauch,
  1500.         1980).  Correspondence analysis in general is well suited for
  1501.         working with count or presence/absence data, whereas PCA is
  1502.         geared more towards measurement data on a continuous scale
  1503.         (although PCA can also be performed on count and binary data;
  1504.         Jolliffe, 1986).
  1505.  
  1506.         DCA was developed by Hill and Gauch (1980) in order to correct
  1507.         two flaws in most ordination techniques.  The "arch effect" or
  1508.         "horseshoe effect" is a common feature of most ordinations.  This
  1509.         is manifested by the points on the ordination plot being arranged
  1510.         along an arch on the first two axes, rather than a straight line
  1511.         MVSP Ver. 2.1 -- Users Manual                             Page 27
  1512.         
  1513.         as expected if the first axis represents a gradient.  This is a
  1514.         artifact of the data reduction process that occurs in ordination
  1515.         and represents a mathematical relationship between the first two
  1516.         axes, which are supposed to be independent.  As a result of this
  1517.         arch, the second flaw occurs in which the points at either end of
  1518.         the first axis are closer together than those in the middle.
  1519.         These flaws also occur in subsequent axes.
  1520.  
  1521.         DCA was designed to remove this arch from the ordination diagram.
  1522.         It does this by dividing the first axis into a number of
  1523.         segments, then adjusting the scores of the points on the second
  1524.         axis so that the mean score within each segment is the same.
  1525.         Thus it is like cutting the plot into a number of vertical strips
  1526.         and moving each up and down until the points are in a straight
  1527.         line.  The scores are also adjusted along the first axis so that
  1528.         they are more evenly spread.
  1529.  
  1530.         This method can often give more interpretable results, but it can
  1531.         also introduce distortion of its own.  It is always a good idea
  1532.         to try both regular and detrended correspondence analysis on a
  1533.         data set and compare the results.
  1534.  
  1535.         Detrended correspondence analysis assumes that the actual data
  1536.         being analysed are abundances of a set of variables (taxa in an
  1537.         ecological study) in a set of samples.  Presence/absence data may
  1538.         also be used (entered as 0 and 1), but the none of the data may
  1539.         be negative.  It is also assumed that the samples come from a
  1540.         gradient in which different variables (taxa) characterize
  1541.         different parts of the gradient.  Although it is most commonly
  1542.         used in ecology, this method may also be used in other fields
  1543.         where these assumptions hold, such as archaeology or market
  1544.         research.
  1545.  
  1546.         Many of the options in CA/DCA are similar to those in the PCA
  1547.         procedure.  There are several new ones:
  1548.  
  1549.         ALGORITHM - MVSP normally uses the cyclic Jacobi method of
  1550.         calculating ordinations.  This method calculates the scores for
  1551.         all axes simultaneously. However, the detrending process cannot
  1552.         be performed with this algorithm, since each axis must be
  1553.         detrended against the final scores of the previous axis.  Thus an
  1554.         alternative algorithm can be used in which the solution for each
  1555.         axis is calculated separately.  This is done using the reciprocal
  1556.         averaging method described by Hill (1973).  The two algorithms
  1557.         are referred to as "Cyclic Jacobi" and "Reciprocal Averaging"
  1558.         respectively.
  1559.  
  1560.         Reciprocal averaging must be used if detrending is desired.  You
  1561.         may also want to use the algorithm for non-detrended analyses as
  1562.         well.  The algorithm only extracts the first four axes and is
  1563.         usually much faster than the eigenanalysis by the cyclic Jacobi
  1564.         algorithm, which must extract all axes.  This is most pronounced
  1565.         with large data sets.  However, you often need to see more than
  1566.         the first four axes, particularly if the first four do not
  1567.         account for much of the total variability in the data set.  Also,
  1568.         in cases where two or more of the axes have similar eigenvalues
  1569.         the reciprocal averaging method may not give accurate results.
  1570.         MVSP Ver. 2.1 -- Users Manual                             Page 28
  1571.         
  1572.         If this happens a warning message will be displayed.
  1573.  
  1574.         The actual scores produced using the two algorithms will differ,
  1575.         because the scaling is different, but the actual configuration on
  1576.         a plot will be the same.  The scores produced by the reciprocal
  1577.         averaging method will be scaled to the standard deviation of the
  1578.         species abundance along the gradient represented by the axis.  If
  1579.         we assume species abundance along a gradient is normally
  1580.         distributed, then a species will appear, rise to its highest
  1581.         abundance, and disappear in about 4 standard deviation units
  1582.         (sd).  Thus if the ordination axis is relatively short (less than
  1583.         3-4 sd units) then the species turnover along the gradient will
  1584.         be low, whereas long axes (say 12 sd units) will probably have
  1585.         completely different sets of species at either end.  Following
  1586.         Hills' original DECORANA program, the sd units are multiplied by
  1587.         100, so a distance of 400 along the axis represents 4 sd units.
  1588.         The scaling of the axes produced by the eigenanalysis algorithm
  1589.         will be related to the original species abundances, unless the
  1590.         option is chosen to scale them to percentages.
  1591.  
  1592.         DETRENDING - This option invokes the detrending procedure.  It
  1593.         can only be used with the reciprocal averaging algorithm and the
  1594.         setting of the algorithm option will be changed when this option
  1595.         is chosen.
  1596.  
  1597.         WEIGHTING - When using the Jacobi algorithm, the analysis can be
  1598.         run with a weighting of either the rare or the common species.
  1599.         See Orloci (1978, pp. 152-168) for details of these methods of
  1600.         weighting.  Also, the scores can be adjusted to percentages.  The
  1601.         data file should have species as the rows and samples as the
  1602.         columns, as in the PCA procedure.
  1603.  
  1604.         DOWNWEIGHT RARE SPECIES - MVSP follows Hill's DECORANA program in
  1605.         allowing the rare species to be downweighted before the analysis.
  1606.         This is only available when the reciprocal averaging algorithm is
  1607.         used.  It can be useful if you want most weight to be given to
  1608.         the common species, but you still want to see how the rarer taxa
  1609.         are affected.  Those taxa that occur in fewer than 1/5 the number
  1610.         of samples that the most common taxon occurs in will be
  1611.         downweighted.  The amount that the species is downweighted is
  1612.         related to its frequency of occurrence.
  1613.  
  1614.         SEGMENTS FOR DETRENDING - This option sets the number of segments
  1615.         the axis should be divided into for the detrending process.  The
  1616.         default value, 26, should be adequate for most analyses, but if
  1617.         the detrending does not seem to be as effective as it could be a
  1618.         larger number can be tried.
  1619.  
  1620.         RESCALING CYCLES - When detrending is in force, the axes can also
  1621.         be rescaled so that the points at the end are not closer together
  1622.         than those in the middle. This rescaling is done several times
  1623.         and this option allows you to vary the number of times.  It is
  1624.         generally not advisable to change this from the default of 4,
  1625.         however, as further rescaling may reduce the effectiveness of the
  1626.         ordination.  Rescaling may be bypassed by entering 0 for this
  1627.         option.
  1628.  
  1629.         MVSP Ver. 2.1 -- Users Manual                             Page 29
  1630.         
  1631.         Distances and similarities: 
  1632.         This procedure calculates a variety of distance and similarity
  1633.         measures.  The distances are calculated between the columns of
  1634.         the data matrix.  An option to transpose the data matrix is
  1635.         included, to allow analysis of the rows without requiring re-
  1636.         entry of the data.  There are numerous publications that discuss
  1637.         different type of measures.  I have relied on the following in
  1638.         implementing the formulae used in this procedure:  Prentice
  1639.         (1980), Sneath & Sokal (1973), Pielou (1984), Greig-Smith (1983),
  1640.         Gordon (1981), and Everitt (1980).  You may refer to these for
  1641.         details about the measures provided in MVSP.
  1642.  
  1643.         MATRIX OUTPUT -  This procedure is set up to allow easy input of
  1644.         the resulting symmetric matrices into the cluster analysis and
  1645.         PCO procedures.  If you choose to input the distance matrix into
  1646.         these, a copy of it, along with the appropriate header
  1647.         information, will be put into a file.  This matrix file can then
  1648.         be used as input to the other analyses.  When the procedure is
  1649.         run, another filename must be specified for this matrix file.
  1650.         This filename defaults to the symmetric matrix default extension.
  1651.         You may use the matrix output option to specify the type of
  1652.         matrix (e.g. upper or lower half matrix, diagonal present or
  1653.         absent).
  1654.  
  1655.         COEFFICIENT - There are presently eighteen measures available.
  1656.         These, and their formulae, are listed below.  In these formulae,
  1657.         i and j represent two columns of the data matrix, k represents
  1658.         the rows, and therefore X   would be the datum in the kth row of
  1659.                                  ik 
  1660.         column i.  Following the name of each measure is the marker
  1661.         placed in the output file created by the "Distances and
  1662.         Similarities" procedure (see section on "Data file format").
  1663.         This marker identifies the coefficient that was used to calculate
  1664.         the matrix.  It is checked by the cluster analysis procedure when
  1665.         the minimum variance strategy is used.  Minimum variance
  1666.         clustering can only be performed on squared Euclidean distances,
  1667.         so this marker allows the program to ensure that the correct
  1668.         distance is being used.
  1669.  
  1670.         Euclidean distance (EUCLID):
  1671.  
  1672.                              2 ½
  1673.         Ed   = (S (X   - X  ) )
  1674.           ij     k  ik    jk
  1675.  
  1676.         Squared Euclidean distance (SEUCLID):
  1677.  
  1678.                                2
  1679.           SEd   = S (X   - X  )
  1680.              ij    k  ik    jk
  1681.  
  1682.         Standardized Euclidean distance (STEUCLID):
  1683.  
  1684.                                       2 ½
  1685.            StEd   = (S (X   - X  /sd ) )
  1686.                ij     k  ik    jk   k
  1687.  
  1688.         MVSP Ver. 2.1 -- Users Manual                             Page 30
  1689.         
  1690.                 where:  sd  = standard deviation of all the elements of k
  1691.                           k
  1692.  
  1693.         Cosine theta (or normalized Euclidean) distance (COSINE):
  1694.  
  1695.                                              2 ½
  1696.            CTd   = (Sk((X  /ss ) - (X  /ss )) )
  1697.               ij     k   ik   i      jk   j
  1698.  
  1699.                                      2 ½
  1700.                 where: ss  = (S (X  ) )
  1701.                          x     x  xk
  1702.  
  1703.         Manhattan metric distance (MANHAT):
  1704.  
  1705.            MMd   = S  |X   - X  |
  1706.               ij    k   ik    jk
  1707.  
  1708.         Canberra metric distance (CANBER):
  1709.  
  1710.            CMd   = S  (|X   - X  | / (X   + X  ))
  1711.               ij    k    ik    jk      ik    jk
  1712.  
  1713.         Chord distance (CHORD):
  1714.  
  1715.                          ½      ½ 2 ½
  1716.            Cd   = (S (X    - X   ) )
  1717.              ij     k  ik     jk
  1718.  
  1719.         Chi-square distance (formula X2 of Prentice, 1980) (CHISQR):
  1720.  
  1721.                                   2        ½
  1722.            CSd   = (S ((X   - X  ) /S X  ))
  1723.               ij     k   ik    jk    l lk
  1724.  
  1725.         Average distance (AVERAGE):
  1726.  
  1727.                                   2   ½
  1728.            Ad   = ((S (X   - X  )) /n)
  1729.              ij      k  ik    jk
  1730.  
  1731.                 where: n = number of elements in each variable (i or j)
  1732.  
  1733.         Mean character difference distance (MEANCHAR):
  1734.  
  1735.                                        ½
  1736.            MCDd   = ((S |X   - X  |)/n)
  1737.                ij      k  ik    jk
  1738.  
  1739.                 where: n = number of elements in each variable (i or j)
  1740.  
  1741.         MVSP Ver. 2.1 -- Users Manual                             Page 31
  1742.         
  1743.         Pearson product moment correlation coefficient (PEARS):
  1744.  
  1745.                                       _           _
  1746.                              S (X   - X  ) (X   - X )
  1747.                               k  ik    i     jk    j
  1748.            PCC   =  ----------------------------------------
  1749.               ij                  _  2 ½           _  2 ½
  1750.                         (S (X   - X ) )  (S (X   - X ) )
  1751.                           k  ik    i       k  jk    j
  1752.  
  1753.         Spearman rank order correlation coefficient (SPEAR):
  1754.  
  1755.                                            2
  1756.                             6 S (R   - R  )
  1757.                                k  ik    jk
  1758.            SCC   = 1 -    -----------------------
  1759.               ij                    3
  1760.                                    n  - n
  1761.  
  1762.                 where: R = rank order of element in variable
  1763.  
  1764.         Percent similarity coefficient (PERCENT):
  1765.  
  1766.                             S  min(X  , X  )
  1767.                              k      ik   jk
  1768.             PSc   =  200   --------------------
  1769.                ij              S (X   + X  )
  1770.                                 k  ik    jk
  1771.  
  1772.                 where: min = minimum of two values
  1773.  
  1774.         Gower general similarity coefficient (GOWER):
  1775.  
  1776.                         S (w    s   )
  1777.                          k  ijk  ijk
  1778.            GGSc   =   ------------------
  1779.                ij           Skw
  1780.                                ijk
  1781.  
  1782.                                    |x   - x  |
  1783.                                      ik    jk
  1784.                where: si   = 1 -  -------------  for quantitative data,
  1785.                         jk          range(k)
  1786.  
  1787.                            = 1 for matches of binary or multistate data,
  1788.                            = 0 for all mismatches
  1789.                    w       = 0 for negative matches of binary data,
  1790.                     ijk    = 1 in all other situations
  1791.  
  1792.         For this coefficient, the data type for each variable (row) must
  1793.         be declared.  This is done through the first two characters of
  1794.         the data labels:  those beginning with "B_" are taken to be
  1795.         binary, those with "M_" multistate, anything else is considered
  1796.         quantitative.  For instance a variable indicating the presence or
  1797.         absence of sepals in a flower would have the label B_SEPAL, that
  1798.         indicating the colour of the petals (one of four possible) would
  1799.         be named M_COLOUR, and petal length would be recorded in the row
  1800.         MVSP Ver. 2.1 -- Users Manual                             Page 32
  1801.         
  1802.         with the label LENGTH.
  1803.  
  1804.         The following binary (presence/absence) coefficients are based on
  1805.         a table of frequency of matches and mis-matches of the presence
  1806.         or absence of a single variable.  The binary data should be
  1807.         entered into the data matrix as 0 (zero) and 1 (one).  Any number
  1808.         that is not zero is also treated as a one, indicating presence.
  1809.  
  1810.                                                 Sample j
  1811.  
  1812.                                         Presence        Absence
  1813.                                        ┌───────────────────────┐
  1814.         Sample i        Presence       │   a                b  │
  1815.                                        │                       │
  1816.                         Absence        │   c                d  │
  1817.                                        └───────────────────────┘
  1818.  
  1819.         Sorensen's coefficient (SOREN):
  1820.  
  1821.            Sc   = 2a / (2a + b + c)
  1822.              ij
  1823.  
  1824.         Jaccard's coefficient (JACCA):
  1825.  
  1826.            Jc   = a / (a + b + c)
  1827.              ij
  1828.  
  1829.         Simple matching coefficient (MATCH):
  1830.  
  1831.            SMc   = (a + d) / (a + b + c + d)
  1832.               ij
  1833.  
  1834.         Yule coefficient (YULE):
  1835.  
  1836.            Yc   = (ad - bc) / (ad + bc)
  1837.              ij
  1838.  
  1839.         Cluster analysis: 
  1840.         This procedure performs hierarchical agglomerative cluster
  1841.         analysis of an input matrix of distance or similarity measures.
  1842.         Seven forms of clustering are presently available: the four
  1843.         average linkage procedures (unweighted pair group, unweighted
  1844.         centroid, weighted pair group, and weighted centroid [or
  1845.         median]); nearest and farthest linkage, and minimum variance.
  1846.         The actual algorithm is based on Lance & William's (1966)
  1847.         generalized clustering procedure.  For clear and concise
  1848.         explanations of the theory and practice behind cluster analysis,
  1849.         see Sneath and Sokal (1973), Everritt (1980), Grieg-Smith (1983),
  1850.         and Pielou (1984).
  1851.  
  1852.         MATRIX INPUT - A number of different input formats are available,
  1853.         including various forms of half matrices and full matrices.  This
  1854.         defaults to the same form specified in the Matrix Output option
  1855.         of the Distances and Similarities procedure.
  1856.  
  1857.         TREE DESCRIPTION FILE - When the clustering is finished, you can
  1858.         have a description of the resulting dendrogram output to a file.
  1859.         MVSP Ver. 2.1 -- Users Manual                             Page 33
  1860.         
  1861.         This description is in the form of labels enclosed in parentheses
  1862.         and commas, which delimit the clusters.  Also after each label
  1863.         and closing bracket is the distance between that object or group
  1864.         and the next in the hierarchy.  An example of this description
  1865.         is:
  1866.  
  1867.         ((LENGTH:125.71,WIDTH:125.71):170.50,HEIGHT:296.21);
  1868.  
  1869.         This would correspond to a dendrogram of the form:
  1870.  
  1871.         <Graphic placed here in printed manual>
  1872.  
  1873.         Christopher Meacham has written a program called PLOTGRAM which
  1874.         can be used to plot dendrograms and cladograms described in the
  1875.         above format.  For PLOTGRAM to properly read the description
  1876.         produced by MVSP, the following two options must be set:
  1877.  
  1878.            DIAGRAMTYPE Y
  1879.            TIPS Y
  1880.  
  1881.         Plotgram is no longer included with MVSP, since MVSP can now
  1882.         automatically plot dendrograms (see below).  If you wish to get a
  1883.         copy of Plotgram that will work with MVSP-generated files, one
  1884.         may be obtained, along with the Pascal source code, at cost from
  1885.         Kovach Computing Services.  We cannot, however, provide support
  1886.         for the program or endeavour to add new types of printers.
  1887.  
  1888.         TREE ORDER FILE - MVSP can also produce a file in which the data
  1889.         labels are listed in the order they occupy in the dendrogram.
  1890.         This type of file can be read by the program SORTDATA, which
  1891.         accompanies the registered version of MVSP.  This program is
  1892.         useful for producing combination dendrograms in which two
  1893.         dendrograms, one for the columns of the data matrix and another
  1894.         for the rows, are plotted together with the original data matrix
  1895.         in between in graphic form (see example below; also Kovach,
  1896.         1988a,b; 1989 and Duigan & Kovach, 1991).  This allows you to see
  1897.         how the data are affecting the clustering.  See the Utilities
  1898.         section below for details about SORTDATA.
  1899.  
  1900.         <Graphic placed here in printed manual>
  1901.  
  1902.         RANDOMIZE INPUT ORDER - There have recently been some suggestions
  1903.         (Bayer, 1985; Lespérance, 1990) that input order of the data
  1904.         matrix can affect the results of clustering with certain types of
  1905.         data sets.  Changing the input order can not only change the
  1906.         order of objects in the dendrogram but more importantly can also
  1907.         cause some objects to be joined to different clusters.  This is
  1908.         particularly possible when two or more pairs of objects have
  1909.         identical similarities either at the beginning or after
  1910.         recalculation during the clustering procedure.
  1911.  
  1912.         Normally the clustering procedure scans through the similarity
  1913.         matrix sequentially looking for the next pair of objects to fuse.
  1914.         Choosing the "Randomize" option causes the matrix to be scanned
  1915.         in a random order which changes each time the procedure is run.
  1916.         In order to check for chaotic behaviour in clustering, try
  1917.         running two or three clusterings of the same data matrix with
  1918.         MVSP Ver. 2.1 -- Users Manual                             Page 34
  1919.         
  1920.         this option set, then compare the dendrograms.  Note that changes
  1921.         in the actual order of objects in the dendrogram are to be
  1922.         expected; a cluster diagram can be viewed as a 'mobile' hanging
  1923.         from a ceiling in which the different clusters can rotate around.
  1924.         It is the branching order in the dendrogram that is important and
  1925.         this is what should be compared when testing for chaotic
  1926.         behaviour.
  1927.  
  1928.         CONSTRAINED CLUSTERING - As stated above, normally the actual
  1929.         order of objects in the dendrogram is not important.  However, if
  1930.         you are working with sequential data (such as in stratigraphic
  1931.         geological studies), a special constrained form of cluster
  1932.         analysis can be used (Birks & Gordon, 1985; Kovach, in press).
  1933.         When this option is chosen, clustering proceeds as usual except
  1934.         that the objects to be fused are constrained to be adjacent in
  1935.         the data matrix.  Therefore, the dendrogram that is produced will
  1936.         have the objects in the same order as the input matrix.
  1937.  
  1938.         This type of constraint can often cause distortion in the
  1939.         dendrogram.  In particular, reversals often occur where the
  1940.         distance (and therefore the branching level) between two objects
  1941.         is greater than that between the cluster of those two and the
  1942.         next object in the hierarchy.  In sequences where there is a lot
  1943.         of variability, this can cause the dendrogram to be almost
  1944.         uninterpretable.
  1945.  
  1946.         OUTPUT - The output of the procedure consists of a report of the
  1947.         status of the clustering procedure as each new object is added to
  1948.         the cluster.  The average similarity or distance of the two
  1949.         groups that have just been joined is printed out, along with a
  1950.         listing of the two groups and the number of objects in the newly
  1951.         fused group.  If a single object is added to another cluster, the
  1952.         label for that object (or a numerical label corresponding to its
  1953.         position in the data matrix) is printed out.  If a whole group is
  1954.         added, the node at which that group was last added to is printed
  1955.         out.  For instance, a report such as:
  1956.  
  1957.                                                    NUMBER OF OBJECTS 
  1958.         NODE   GROUP 1   GROUP 2    DISSIMILARITY   IN FUSED GROUP
  1959.           1     LENGTH      WIDTH         125.706        2
  1960.           2     NODE 1     HEIGHT         296.206        3
  1961.  
  1962.         would correspond to the dendrogram shown previously.
  1963.  
  1964.         The results of the cluster analyses are also automatically
  1965.         displayed as dendrograms.  These may either be text-based or
  1966.         drawn in graphics mode, depending on the setting of the
  1967.         "Scatterplot/Dendrogram Type" option of the "Graphics Output"
  1968.         menu (under the "Program Defaults" menu).  The text-based
  1969.         dendrograms will automatically be directed to the same file or
  1970.         printer that the results are going to.  Graphics dendrograms may
  1971.         be printed by pressing "P" when the dendrogram is on the screen.
  1972.         See the "Printer Setup" options on page 13 for more information.
  1973.  
  1974.         Diversity indices: 
  1975.         This procedure computes three diversity indices commonly used in
  1976.         ecology, Simpson's, Shannon's, and Brillouin's.  See Pielou
  1977.         MVSP Ver. 2.1 -- Users Manual                             Page 35
  1978.         
  1979.         (1969) for a discussion of the use and derivation of these
  1980.         indices.
  1981.  
  1982.         The input data file should be set up with species as rows and
  1983.         samples as columns.  The diversity, then, is calculated for each
  1984.         column.  Be forewarned that the Brillouin index calculates
  1985.         factorials of the species abundances, and if any of your
  1986.         abundances are high, this could take a very long time!  For
  1987.         abundances greater than 1000 the factorial is estimated using
  1988.         Stirling's formula, which is much faster and, at these
  1989.         abundances, provides a close approximation.
  1990.  
  1991.         The LOG BASE option allows you to specify whether to use
  1992.         logarithms to the base 10, 2, or e.  The output consists not only
  1993.         of the diversity index, but also the number of species and the
  1994.         evenness, which is defined as the diversity divided by the log of
  1995.         the number of species.
  1996.  
  1997.  
  1998.                                     UTILITIES
  1999.  
  2000.         Sortdata: 
  2001.         In many of my analyses I perform clusterings of both the samples
  2002.         and species.  I've found it very valuable to present the
  2003.         resulting two diagrams with the original data matrix in between,
  2004.         sorted in the order of the dendrograms.  The data can be split
  2005.         into abundance classes, which are represented by different
  2006.         characters, so that the differing abundances can be seen at a
  2007.         glance.  In this way the structure revealed by the cluster
  2008.         analyses can be seen directly in the data matrix (see Kovach,
  2009.         1988a,b; 1989 for some examples).  SORTDATA is a utility I've
  2010.         written to help produce these diagrams.  It is only included with
  2011.         the registered version of MVSP.
  2012.  
  2013.         To produce one of these combination diagrams, you must first run
  2014.         two cluster analyses of the same data matrix, one with the matrix
  2015.         transposed, the other not.  Make sure that the "Tree Order"
  2016.         option is turned on.  This will produce two files with the order
  2017.         of the objects in the dendrogram for SORTDATA.  Next run SORTDATA
  2018.         with the following parameters:
  2019.  
  2020.          SORTDATA datafile.MVS order1.ORD order2.ORD [output.SRT]
  2021.  
  2022.         where "datafile.MVS" is your original data file used for input to
  2023.         the distance and similarity procedure, "order1.ORD" and
  2024.         "order2.ORD" are the tree order files for analyses of the
  2025.         transposed and non-transposed matrices, and "output.SRT" is the
  2026.         file that will contain the sorted data matrix.  If "output.SRT"
  2027.         is missing the output will be put into a file named "datafile"
  2028.         with a .SRT extension.
  2029.  
  2030.         When the program is run, it will first read the original data
  2031.         matrix, determine the lowest and highest data values, and then
  2032.         ask you to define the ranges of four data classes.  First you
  2033.         must enter the value below which no symbol is plotted; if your
  2034.         data are counts, this value will be 1.  Then enter the cutoff
  2035.         points between the four classes.  When you are done the program
  2036.         MVSP Ver. 2.1 -- Users Manual                             Page 36
  2037.         
  2038.         will sort the data and translate them to the abundance classes,
  2039.         placing the results in a file.
  2040.  
  2041.         To assemble the resulting diagram, you must first print out the
  2042.         sorted data matrix.  You can use your word processor to print it,
  2043.         perhaps adjusting the character font (pica, elite, or condensed)
  2044.         and the line spacing to fit the diagram on one page.  Then
  2045.         measure the width and length of the matrix and use MVSP to
  2046.         produce the dendrograms, setting the "Plot Height" and "Plot
  2047.         Width" parameters on the "Printer Setup" menu to the appropriate
  2048.         length (in cm) so that the dendrogram will be the same size as
  2049.         the sorted data matrix.  Alternatively you can reduce or enlarge
  2050.         dendrograms you've already plotted with a photocopier or
  2051.         photographically.  The whole diagram may then be assembled on a
  2052.         large (A3 or 11"x17") piece of paper.
  2053.  
  2054.         To obtain the registered version of MVSP, with the SORTDATA
  2055.         utility, see page 4, the REGISTER.DOC file, or the "Register"
  2056.         option on the main menu.
  2057.  
  2058.  
  2059.                                     DISCLAIMER
  2060.  
  2061.         The accuracy of this program has of course been extensively
  2062.         tested against the results of other programs.  However,
  2063.         unforeseen errors in computation can and have crept up even in
  2064.         the most sophisticated and widely used statistical packages.  You
  2065.         may wish to initially run comparisons with the results of other
  2066.         programs, using your own data set, to ensure that it is working
  2067.         properly with your type of data.
  2068.  
  2069.         Note when running comparisons that there are often many methods
  2070.         of computing the same routine, and results may vary, especially
  2071.         in the more complex eigenanalysis procedures.  In principal
  2072.         components analysis, for instance, there are numerous ways of
  2073.         transforming the data before eigenanalysis (see Greig-Smith,
  2074.         1983, pp. 247ff), and the component loadings can be scaled either
  2075.         to unity (as they are here) or to the variance of that principal
  2076.         component, or in other manners.  Also, the eigenanalysis can
  2077.         rotate the cloud of points in different directions, so that signs
  2078.         of the scores are reversed and the actual values different.  The
  2079.         configuration of the points will be the same, however.
  2080.  
  2081.         If you do run into any problems with this program, whether they
  2082.         be in the results or abnormalities in the running of the program,
  2083.         please contact me by post or through electronic mail at the
  2084.         addresses given on the cover page.  Please give full details of
  2085.         the problem and, if possible, the data set which you were running
  2086.         when the bug cropped up.
  2087.  
  2088.         Please note that no warranty is given for this program.  The
  2089.         author (Warren L. Kovach) shall not be legally liable for any
  2090.         damages or lost profits arising from use or misuse of this
  2091.         program.   Refer to the "Limited Warranty" section on page 5 for
  2092.         full details.
  2093.  
  2094.  
  2095.         MVSP Ver. 2.1 -- Users Manual                             Page 37
  2096.         
  2097.                                   80x87 SUPPORT
  2098.  
  2099.         If you aren't satisfied with the speed of this program, a faster
  2100.         version that uses the 80x87 math coprocessor is distributed with
  2101.         MVSP Plus, the registered version of MVSP.  This coprocessor
  2102.         (which is an optional chip that can be plugged into your
  2103.         computer) greatly speeds up the processing of real number,
  2104.         floating point arithmetic.  Often this increase in speed can
  2105.         amount to 10 times!  This is particularly noticeable for
  2106.         calculation that use logarithms and trigonometric calculations.
  2107.         The calculation of the Brillouin diversity index, which uses log
  2108.         factorials, for an 84x84 matrix took 9 minutes 14 seconds without
  2109.         a math chip but 2 minutes 41 seconds with one.  A PCA, which uses
  2110.         mostly arithmetic operations, of a 45x45 data matrix took one
  2111.         hour with the standard version of the program, but only twenty
  2112.         minutes with the 80x87 version (tests run on a 12 MHz 80286 based
  2113.         Compaq Portable III).
  2114.  
  2115.         Borland Pascal, the compiler used in developing MVSP, has an
  2116.         option for creating programs that take advantage of this
  2117.         processor.  The programs compiled using this option will only
  2118.         work on machines that have the 80x87 installed.  The installation
  2119.         program will detect whether your computer has a math chip and
  2120.         will install the appropriate version.
  2121.  
  2122.         To obtain the registered version of MVSP, with 80x87 support, see
  2123.         page 4, the REGISTER.DOC file, or the "Register" option on the
  2124.         main menu.
  2125.  
  2126.  
  2127.                               PROTECTED MODE VERSION
  2128.  
  2129.         New with MVSP ver. 2.1 is a special protected mode version.  It
  2130.         is only provided with MVSP Plus, the registered version of MVSP.
  2131.         This is compiled to run in what is called "protected mode" on the
  2132.         Intel 80286, 80386, 80486, and Pentium microprocessors.  The
  2133.         primary advantage in using protected mode, as opposed to the
  2134.         "real mode" which is compatible with the older 8088 and 8086
  2135.         chips, is that all of the RAM memory in the machine can be
  2136.         directly accessed, whereas real mode programs are limited to
  2137.         640Kb of RAM memory.  So, if you have 16 Mb of RAM in your
  2138.         computer MVSP in protected mode can directly use all of it for
  2139.         storing data while calculating.  Under real mode, MVSP would have
  2140.         to dump parts of large arrays onto disk while calculating, which
  2141.         slows down the process tremendously.  For example, a cluster
  2142.         analysis of a 400x400 matrix, which needs to store 937kb of data
  2143.         on disk under real mode, took 191 minutes whereas the same
  2144.         analysis under protected mode took only 41 minutes. (test run on
  2145.         a 16MHz 386SX based machine with 5Mb RAM).
  2146.  
  2147.         MVSP Protected Mode requires a computer with a 80286 or higher
  2148.         microprocessor and at least 2 Mb of RAM.  If your computer has
  2149.         these capabilities, then the MVSP installation program will give
  2150.         you the option of installing the protected mode version as well.
  2151.  
  2152.         The protected mode version of MVSP was produced using Borland
  2153.         International's Borland Pascal 7.0 compiler.  The program runs
  2154.         MVSP Ver. 2.1 -- Users Manual                             Page 38
  2155.         
  2156.         under the DPMI (DOS Protected Mode Interface) standard.  This
  2157.         requires that a DPMI compatible server is installed. Some 386
  2158.         memory managers (such as QEMM 386) provide optional DPMI support,
  2159.         as does Microsoft Windows 3.x in enhanced mode.  If you do not
  2160.         have a DPMI server installed, then Borland's server will
  2161.         automatically be loaded and used.  You need do nothing except
  2162.         type the command MVSPPROT at the DOS prompt.
  2163.  
  2164.         For MVSP Protected Mode to work properly, two files must be
  2165.         present in the same directory as the MVSPPROT.EXE program.  These
  2166.         are DPMI16BI.OVL and RTM.EXE.  These are files produced by
  2167.         Borland International.  They will be automatically installed
  2168.         along with MVSP Protected Mode.  Accompanying them is a
  2169.         documentation file called DPMIUSER.DOC that explains more about
  2170.         running protected mode programs, as well as discussing some other
  2171.         utility programs that are included with MVSP Protected Mode.  If
  2172.         you have any problems running the protected mode version refer to
  2173.         this documentation file first.
  2174.  
  2175.         To obtain the registered version of MVSP, with the protected mode
  2176.         version, see page 4, the REGISTER.DOC file, or the "Register"
  2177.         option on the main menu.
  2178.  
  2179.  
  2180.                                     APPENDICES
  2181.  
  2182.         The printed manual with the registered version of MVSP has
  2183.         several large appendices at this point, describing the example
  2184.         data files, listing error messages and their meanings, explaining
  2185.         the format of the configuration file, and giving information on
  2186.         efficient memory management.  These have been omitted from the
  2187.         shareware version for brevity.
  2188.  
  2189.         MVSP Ver. 2.1 -- Users Manual                             Page 39
  2190.         
  2191.                                     REFERENCES
  2192.  
  2193.         Aitchison, J., 1986.  The Statistical Analysis of Compositional
  2194.         Data.  Chapman and Hall, London.
  2195.  
  2196.         Bayer, U., 1985.  Lecture notes in earth sciences. 2 Pattern
  2197.         recognition problems in geology and palaeontology.  Springer-
  2198.         Verlag.
  2199.  
  2200.         Birks, H.J.B. & Gordon, A.D., 1985.  Numerical Methods in
  2201.         Quaternary Pollen Analysis.  Academic Press, London.
  2202.  
  2203.         Cooke, D., Craven, A.H., & Clarke, G.M., 1982.  Basic Statistical
  2204.         Computing.  Edward Arnold (Publishers) Ltd., London.
  2205.  
  2206.         Davis, J.C., 1986.  Statistics and Data Analysis in Geology, 2nd
  2207.         Edition.  John Wiley & Sons, New York.
  2208.  
  2209.         Duigan, C. A. & Kovach, W.L., 1991.  A study of the distribution
  2210.         and ecology of littoral freshwater chydorid (Crustacea,
  2211.         Cladocera) communities in Ireland using multivariate analyses.
  2212.         Journal of Biogeography, 18:267-280.
  2213.  
  2214.         Everitt, B., 1980.  Cluster Analysis.  2nd Edition.  Gower
  2215.         Publishing Co., Hampshire, 136 pp.
  2216.  
  2217.         Gauch, H.G. Jr., 1982.  Multivariate Analysis in Community
  2218.         Ecology.  Cambridge University Press, New York.
  2219.  
  2220.         Gordon, A.D., 1981.  Classification.  Chapman and Hall, London.
  2221.  
  2222.         Greenacre, M.J., 1984.  Theory and applications of correspondence
  2223.         analysis.  Academic Press, London.
  2224.  
  2225.         Greig-Smith, P., 1983.  Quantitative Plant Ecology.  University
  2226.         of California Press, Berkeley.
  2227.  
  2228.         Hill, M.O., 1973.  Reciprocal averaging: An eigenvector method of
  2229.         ordination.  Journal of Ecology, 61:237-249.
  2230.  
  2231.         Hill, M.O., & Gauch, H.G. Jr., 1980.  Detrended correspondence
  2232.         analysis: An improved ordination technique.  Vegetatio, 42:47-58.
  2233.  
  2234.         Jolicoeur, P., & Mosimann, J.E., 1960.  Size and shape variation
  2235.         in the Painted Turtle.  A principal component analysis.  Growth,
  2236.         24:339-354.
  2237.  
  2238.         Jolliffe, I.T., 1986.  Principal Components Analysis.  Springer-
  2239.         Verlag, New York.
  2240.  
  2241.         Kent, M., & Coker, P., 1992.  Vegetation description and
  2242.         analysis. A practical approach.  Belhaven Press, London.
  2243.  
  2244.         Kovach, W. L., 1988a.  Multivariate methods of analyzing
  2245.         paleoecological data.  In: W. A. DiMichele & S. L. Wing (eds.),
  2246.         Methods and applications of plant paleoecology.  The
  2247.         Paleontological Society Special Publication, 3:72-104.
  2248.  
  2249.         MVSP Ver. 2.1 -- Users Manual                             Page 40
  2250.         
  2251.         Kovach, W.L., 1988b.  Quantitative palaeoecology of megaspores
  2252.         and other dispersed plant remains from the Cenomanian of Kansas,
  2253.         USA.  Cretaceous Research, 9:265-283.
  2254.  
  2255.         Kovach, W.L., 1989. Comparisons of multivariate analytical
  2256.         techniques for use in pre-Quaternary plant paleoecology.  Review
  2257.         of Palaeobotany and Palynology, 60:255-282.
  2258.  
  2259.         Kovach, W.L., in press.  Multivariate techniques for
  2260.         biostratigraphical correlation.  Journal of the Geological
  2261.         Society, London.
  2262.  
  2263.         Kovach, W.L. & Batten, D.J., in press.  Association of
  2264.         palynomorphs and palynodebris with depositional environments:
  2265.         quantitative approaches.  In: Traverse, A. (ed.), Sedimentation
  2266.         of Organic Particles.  Cambridge University Press.
  2267.  
  2268.         Lance, G.N. & Williams, W.T., 1966.  A generalized sorting
  2269.         strategy for computer classifications.  Nature, 212:218.
  2270.  
  2271.         Legendre, L., & Legendre, P., 1983. Numerical Ecology.  Elsevier
  2272.         Scientific Publishing Company, New York.
  2273.  
  2274.         Lespérance, P.J., 1990.  Cluster analysis of previously described
  2275.         communities from the Ludlow of the Welsh Borderland.
  2276.         Palaeontology, 33:209-224.
  2277.  
  2278.         Manly, B.F.J., 1986.  Multivariate statistical methods.  A
  2279.         primer.  Chapman & Hall, London.
  2280.  
  2281.         Noy-Meir, I., 1973.  Data transformations in ecological
  2282.         ordination. I. Some advantages of non-centering.  Journal of
  2283.         Ecology, 61:329-341.
  2284.  
  2285.         Orloci, L., 1978.  Multivariate Analysis in Vegetation Research,
  2286.         2nd edition.  W. Junk, Boston.
  2287.  
  2288.         Pielou, E.C., 1969.  An Introduction to Mathematical Ecology.
  2289.         Wiley-Interscience, New York.
  2290.  
  2291.         Pielou, E.C., 1984.  The Interpretation of Ecological Data.
  2292.         Wiley-Interscience, New York.
  2293.  
  2294.         Prentice, I.C., 1980.  Multidimensional scaling as a research
  2295.         tool in Quaternary palynology: A review of theory and methods.
  2296.         Review of Palaeobotany & Palynology, 31:71-104.
  2297.  
  2298.         Sneath, D.H., & Sokal, R.R., 1973.  Numerical Taxonomy.  W.H.
  2299.         Freeman & Co., San Francisco.
  2300.  
  2301.         Sokal, R.R. & Rohlf, F.J., 1981.  Biometry.  2nd Edition.  W.H.
  2302.         Freeman & Co., San Fransisco.
  2303.  
  2304.         ter Braak, C.J.F., 1986.  Canonical correspondence analysis: A
  2305.         new eigenvector technique for multivariate direct gradient
  2306.         analysis.  Ecology, 67:1167-1179.
  2307.  
  2308.         MVSP Ver. 2.1 -- Users Manual                             Page 41
  2309.         
  2310.                   OTHER PRODUCTS FROM KOVACH COMPUTING SERVICES
  2311.  
  2312.         Wa-Tor for Windows - A population ecology simulation program for
  2313.         Microsoft Windows.  
  2314.         Pit hungry sharks against tasty fish in an endless ocean.  You
  2315.         can set the initial numbers of fish and sharks, their birth
  2316.         rates, and the shark starvation time.  The population
  2317.         fluctuations may be watched on the graphic display and via three
  2318.         types of data plots.  Based on an idea from Scientific American.
  2319.         Price: £10.
  2320.  
  2321.         Coming soon: Oriana - Orientation analysis for the IBM-PC and
  2322.         compatibles.  
  2323.         This program calculates circular statistics on orientation data
  2324.         measured in degrees.  Calculates the circular mean, standard
  2325.         deviation, and  polar coordinates of a sample and compares pairs
  2326.         of samples using Watson's F-test and the Chi-square test.  Price:
  2327.         TBA.
  2328.  
  2329.         Coming soon: Rarefact - Rarefaction analysis for the IBM-PC and
  2330.         compatibles.  
  2331.         This program estimates ecological diversity while taking into
  2332.         account differing samples sizes.  It uses Hurlbert & Simberloff's
  2333.         method of estimating the expected number of taxa in a random
  2334.         sample of a certain size, allowing samples to be compared on a
  2335.         equal basis.  Also calculates the variance around the estimate.
  2336.         Price: TBA.
  2337.  
  2338.         Consulting 
  2339.         Do you have a data analysis problem but don't have the time to do
  2340.         it properly or would rather have an expert do it?  Then contact
  2341.         Kovach Computing Services.  We provide data analysis services
  2342.         using all appropriate methods in any field.  Services include
  2343.         publication quality graphics and full reports describing the
  2344.         results and providing comments on their robustness.
  2345.  
  2346.         ----
  2347.  
  2348.         Kovach Computing Services 
  2349.         85 Nant-y-Felin 
  2350.         Pentraeth, Anglesey LL75 8UY
  2351.         Wales U.K.
  2352.  
  2353.