home *** CD-ROM | disk | FTP | other *** search
/ The World of Computer Software / World_Of_Computer_Software-02-385-Vol-1of3.iso / e / estat21.zip / EASIDOC.ZIP / ESCHAP05.DOC < prev    next >
Text File  |  1992-09-14  |  31KB  |  926 lines

  1.  
  2.  
  3.      Chapter 5: DATA MANAGEMENT COMMANDS
  4.  
  5.      In this section we describe how to manipulate the data
  6.      which EASISTAT uses. For details on how to read and write
  7.      data files on disk see the section on file management
  8.      commands and the DATA command.
  9.  
  10.  
  11.      5:1. Edit
  12.  
  13.      Format: Ed[it]
  14.  
  15.      EDIT is the command used to invoke EASISTAT's special
  16.      data editor. This consists simply of a table of rows and
  17.      columns into which data values are typed. Using the
  18.      cursor keys you can move freely over this table and
  19.      inspect, change or add values at will.
  20.  
  21.      Special keys are used to operate the editor in a way
  22.      which does not apply to the rest of EASISTAT's commands.
  23.      It is not possible to operate the editor from a command
  24.      file (though it can be invoked from a command file) - the
  25.      editor can only be operated directly from the keyboard.
  26.  
  27.      Examples:
  28.  
  29.      Select command -  edit
  30.      Select command -  ED
  31.      Select command -  ed
  32.  
  33.      All the above commands will invoke the editor.
  34.  
  35.      Movement keys
  36.  
  37.      RIGHT ARROW              - move one cell right
  38.      LEFT ARROW               - move one cell left
  39.      UP ARROW                 - move one cell up
  40.      DOWN ARROW               - move one cell down
  41.      TAB                      - move half page right
  42.      SHIFT-TAB                - move half page left
  43.      PAGE UP                  - move half page up
  44.      PAGE DOWN                - move half page down
  45.      HOME                     - move to left hand edge of screen
  46.      END                      - move to right hand edge of screen
  47.      CONTROL-PAGE UP          - move to first row of data
  48.      CONTROL-PAGE DOWN        - move to last row of data
  49.      CONTROL-HOME             - move to first column of data
  50.      CONTROL-END              - move to last column of data
  51.  
  52.      Keys to add new row and columns
  53.  
  54.      ENTER                    - move down a row and go to first
  55.                                     column of it, and if on last
  56.                                     row create a new row below it
  57.      CONTROL-RIGHT ARROW      - if on last column, create a new
  58.                                     column to the right
  59.      CONTROL-N                - create a new column in the middle
  60.                                     of the table, to the right of
  61.                                     the cursor
  62.  
  63.  
  64.  
  65.      
  66.        36 
  67.         Data management commands  
  68.      
  69.      Keys to change column format
  70.  
  71.      CONTROL-W                - widens whole column
  72.      CONTROL-D                - increases number of decimal places
  73.                                     displayed
  74.  
  75.      Special keys
  76.  
  77.      CONTROL-F                - "fast" key: the cursor moves
  78.                                     around the data but the
  79.                                     screen is not redrawn, so one
  80.                                     can move quickly to any
  81.                                     location
  82.      DELETE                   - deletes the contents of a cell
  83.      BACKSPACE                - deletes last letter typed
  84.      ESCAPE                   - finishes editing, returns to main
  85.                                     program
  86.  
  87.      So to enter your data using the editor proceed as
  88.      follows:
  89.  
  90.      1) When asked to "Select command -" enter ED.
  91.  
  92.      2) Move the cursor to the titles row, which if the table
  93.      is empty will say NEW.
  94.  
  95.      3) Type in the title which you want, using CONTROL-W to
  96.      make the column wider first if necessary.
  97.  
  98.      4) Press CONTROL-RIGHT ARROW to make a new column to the
  99.      right.
  100.  
  101.      5) Keep repeating steps 3 and 4 until you have enough
  102.      columns. (Note that every column must have a title, you
  103.      cannot leave the title blank.)
  104.  
  105.      6) Press ENTER to go to start of the next row of values.
  106.  
  107.      7) Enter the correct value in a cell.
  108.  
  109.      8) Press RIGHT ARROW to move to the next column.
  110.  
  111.      9) Keep repeating steps 7 and 8 until you have filled the
  112.      row.
  113.  
  114.      10) Keep repeating steps 6, 7, 8 and 9 until you have
  115.      entered all the data.
  116.  
  117.      11) Press ESCAPE.
  118.  
  119.      12) Use the DATA SAVE command to save your data to disk
  120.      (eg enter DATA SAVE MYDATA.DAT, see the section on the
  121.      DATA command for details).
  122.  
  123.      Note the following points:
  124.  
  125.      If you make a mistake just go back to the cell and type
  126.      in the correct value.
  127.  
  128.      If the column is too narrow for your values then use
  129.      CONTROL-W to widen it.
  130.  
  131.      
  132.        37 
  133.         Data management commands  
  134.      
  135.      If you want to have more decimal places displayed in a
  136.      column then use CONTROL-D.
  137.  
  138.      Although the following functions can be performed by
  139.      special EASISTAT commands, they cannot be performed from
  140.      within the editor: deleting a column or row, adding a row
  141.      in the middle of the table, narrowing a column or
  142.      reducing the number of decimal places displayed, deriving
  143.      the values in one column from another. If you wish to do
  144.      any of these things then leave the editor first (by
  145.      pressing ESCAPE) and then select the appropriate command.
  146.      You can return to the editor later by selecting the EDIT
  147.      command again.
  148.  
  149.      If when you try to use CONTROL-D you find that the column
  150.      cannot be widened any further, it may be that you have
  151.      more digits than you need displayed before the decimal
  152.      point. If this is the case you will have to leave the
  153.      editor (by pressing ESCAPE) and use the FORMAT command to
  154.      adjust the number of decimal places displayed.
  155.  
  156.  
  157.      5:2. Titles
  158.  
  159.      Format: T[itles]
  160.  
  161.      This command outputs a list of the titles or labels of
  162.      the columns of the data table. This is helpful to remind
  163.      you which data is in which columns.
  164.  
  165.      Examples:
  166.  
  167.      Select command -  t
  168.      Select command -  TITLE
  169.      Select command -  Ti
  170.  
  171.      All these commands will have the same effect.
  172.  
  173.      Example output:
  174.  
  175.      NO        - c1       AGE       - c2       SEX       - c3
  176.      MSW       - c4       OCC       - c5       EMP       - c6
  177.      UK        - c7       ADD       - c8       ETH       - c9
  178.      ADM       - c10      PC        - c11      SYM       - c12
  179.      TIM       - c13      PD        - c14      GHQ       - c15
  180.      HDA       - c16      HDD       - c17      CIS       - c18
  181.      A         - c19      B         - c20      C         - c21
  182.      D         - c22      TOT       - c23      BCD       - c24
  183.      DX1       - c25      DX2       - c26      SEV       - c27
  184.      PPH       - c28      ASK       - c29      HLP       - c30
  185.      DIF       - c31      REF       - c32      NOT       - c33
  186.  
  187.      Comments
  188.  
  189.      You make like to use TITLES in conjunction with the
  190.      OUTPUT PRN command to print off a list of column titles
  191.      that you can refer to while working with EASISTAT.
  192.  
  193.      Don't forget that if you insert or delete columns in the
  194.      middle of your data set then that will change the values
  195.      which the column numbers refer to.
  196.  
  197.      
  198.        38 
  199.         Data management commands  
  200.      
  201.      If nothing happens when you use the TITLES command, it's
  202.      probably because you haven't given EASISTAT any data yet.
  203.  
  204.  
  205.      5:3. List
  206.  
  207.      Format: L[ist] [if condition or v[ariables] or vv]
  208.  
  209.      This command lists all the rows of data, or can be
  210.      followed by an optional condition to list only some of
  211.      the rows. Alternatively the values of the general purpose
  212.      variables can be listed.
  213.  
  214.      Examples:
  215.  
  216.      Select command -  l
  217.      Select command -  LI
  218.  
  219.      These will have the same effect of listing out all the rows.
  220.  
  221.      Select command -  l if c1<5
  222.  
  223.      This will only list out those rows in which the first value is less than 5.
  224.  
  225.      Select command -  LIST IF ROW<5
  226.  
  227.      This will only list out the first 4 rows.
  228.  
  229.      Example output:
  230.  
  231.      Listing data lines for which  ROW<5
  232.      NO  AGE SEX MSW OCC EMP UK  ADD ETH ADM PC  SYM TIM
  233.        1   3   1   2   2   1   1   3   1   1   0   1   2
  234.        2   1   1   1   2   2   1   2   1   2   0   1   3
  235.        3   3   1   2   3   1   1   3   1   2   0   1   2
  236.        4   1   1   1   5   2   1   2   1   2   0   1   3
  237.  
  238.      Columns are listed according to the format currently
  239.      assigned to that column in terms of column width and
  240.      number of decimal places displayed. You can alter these
  241.      with the FORMAT command.
  242.  
  243.      The two sets of general purpose variables can also be
  244.      listed by using the option VARIABLES, which can be
  245.      shortened down to V, or the option VV:
  246.  
  247.      Select command -  LIST VAR
  248.      Select command -  LIST VV
  249.  
  250.      The first will list V1 to V20, the second will list VV1
  251.      to VV20.
  252.  
  253.      Example output:
  254.  
  255.      VV1         VV2         VV3         VV4         VV5
  256.      1.0000      100.0000    1.0000      50.5000     833.2500
  257.  
  258.      VV6         VV7         VV8         VV9         VV10
  259.      28.8661     2.9011      0.0000      0.0000      -1.2361
  260.  
  261.      VV11        VV12        VV13        VV14        VV15
  262.      0.0000      0.0000      0.0000      0.0000      0.0000
  263.      
  264.        39 
  265.         Data management commands  
  266.      
  267.      VV16        VV17        VV18        VV19        VV20
  268.      0.0000      0.0000      0.0000      0.0000      0.0000
  269.  
  270.      The LIST command can sometimes be useful to locate
  271.      certain rows in your data set. For example, suppose that
  272.      column 23 is supposed to be the total of columns 19, 20,
  273.      21 and 22, but that you think you might have entered some
  274.      of the data wrongly. Then:
  275.  
  276.      Select command -  l if c23!=(c19+c20+c21+c22)
  277.  
  278.      will output a list of any rows for which the total is
  279.      wrong. If one column of those rows contains an
  280.      identification number (or perhaps the row number itself)
  281.      then one can make a note of which rows are incorrect and
  282.      then use EDIT to go back to them and change them.
  283.  
  284.      Alternatively the LIST command might be used to locate
  285.      the row containing a particular value, for example to
  286.      locate any rows for which the value of GHQ is 23 then one
  287.      could just enter:
  288.  
  289.      Select command -  l if GHQ=23
  290.  
  291.  
  292.      5:4. New
  293.  
  294.      Format: Ne[w] [column or next [label [width dec]]] or [row [number]]
  295.  
  296.      Inserts a new column or row in the data table. If instead
  297.      of a numbered column the keyword NEXT is used then a new
  298.      column will be created to the right of the table. The
  299.      column number can optionally be followed by a title for
  300.      the new column, and this may optionally be followed by
  301.      the desired width and number of decimal places to be
  302.      displayed. If no title is given then the column will be
  303.      given the name NEW. If no values are given for the width
  304.      and number of decimal places then the defaults will be
  305.      used (as set by the FORMAT command).
  306.  
  307.      If instead of a number after the keyword ROW the keyword
  308.      NEXT is given then a new row will be added to the bottom
  309.      of the table. The new column or row is filled with
  310.      zeroes.
  311.  
  312.      Examples:
  313.  
  314.      Select command -  new c2
  315.  
  316.      Creates a new column in the second position.
  317.  
  318.      Select command -  new c4 fred 6 3
  319.  
  320.      Creates a new column in the fourth position, with title
  321.      FRED and width 6 characters, displayed to 3 decimal
  322.      places.
  323.  
  324.      Select command -  new row 4
  325.  
  326.      Creates a new row in the fourth position.
  327.  
  328.  
  329.      
  330.        40 
  331.         Data management commands  
  332.      
  333.      Select command -  ne row next
  334.  
  335.      Adds a new row on the bottom of the table.
  336.  
  337.      Select command -  NEW
  338.      Enter column to insert (NEXT for next available): c13
  339.  
  340.      If no row or column is given EASISTAT assumes you want to
  341.      insert a column and asks you what the position of it
  342.      should be, so that the above sequence would insert a new
  343.      column 13.
  344.  
  345.  
  346.      5:5. Delete
  347.  
  348.      Format: Del[ete] [column] or [row [number]] or [all]
  349.  
  350.      Deletes a row or column. All the other rows or columns
  351.      are moved up or to the left one space to fill the gap. If
  352.      the keyword ALL is given instead of a row or column then
  353.      the whole data table is deleted.
  354.  
  355.      Examples:
  356.  
  357.      Select command -  delete c2
  358.  
  359.      Deletes second column.
  360.  
  361.      Select command -  DEL ROW 4
  362.  
  363.      Deletes fourth row.
  364.  
  365.      Select command -  del row 
  366.      Enter row to delete:   100
  367.  
  368.      If no column or row number is supplied EASISTAT will ask
  369.      for one. This would delete row 100.
  370.  
  371.  
  372.      5:6. Label
  373.  
  374.      Format: La[bel] [column or variable [new name]]
  375.  
  376.      This is the command used to change the title appearing at
  377.      the top of a column or the label of a variable.
  378.  
  379.      Examples:
  380.  
  381.      Select command -  lab c2 Alog
  382.  
  383.      Now the new title for c2 is Alog.
  384.  
  385.      Select command -  lab v4 theta
  386.  
  387.      Now the fourth general purpose variable can be referred
  388.      to as THETA.
  389.  
  390.      Select command -  label 
  391.      Enter column to label:   c3 
  392.      Current label is  AGE, enter new label:   fred
  393.  
  394.  
  395.      
  396.        41 
  397.         Data management commands  
  398.      
  399.      If the column or the new label is missing EASISTAT will
  400.      ask you to supply them. The third column, which did have
  401.      the title AGE, now has the title FRED.
  402.  
  403.      The new title cannot be displayed if it is longer than
  404.      the column width. If you wish to have a longer title, you
  405.      should first increase the column width by using the
  406.      FORMAT command.
  407.  
  408.      The title cannot contain spaces or non-ASCII characters
  409.      (it cannot include the pound sign). Make sure you check
  410.      the rules for valid labels at the end of the previous
  411.      chapter, otherwise the parser may get confused.
  412.  
  413.  
  414.      5:7. Format
  415.  
  416.      Format: F[ormat] [column or default or variable [width
  417.      decimals]]
  418.  
  419.      The FORMAT command allows changes in the way a column is
  420.      displayed by EDIT, LIST and when the DATA SAVE command is
  421.      used. The column width and number of decimal places
  422.      displayed can be changed. If instead of a column the
  423.      keyword DEFAULT is used, then all new columns will be
  424.      created according to the specification given. The format
  425.      of a variable can also be changed, to alter the number of
  426.      decimal places displayed.
  427.  
  428.      Examples:
  429.  
  430.      Select command -  f c2 6 3
  431.  
  432.      This changes the format of the second column so that it
  433.      is six characters wide and three decimal places be
  434.      displayed after the decimal point, e.g. numbers will be
  435.      shown as 23.319, 6.000.
  436.  
  437.      Select command -  FO c3
  438.      Width is 4, enter new width or blank line for unchanged:5
  439.      Decimal places currently 2, enter new value or blank line
  440.      for unchanged:  3
  441.  
  442.      If the column or width and decimals parameters are
  443.      omitted from the command line EASISTAT will request them.
  444.  
  445.      Select command - F V4 8 6
  446.  
  447.      Variable 4 will now be displayed to six decimal places.
  448.  
  449.      Select command - FO DEF 5 2
  450.  
  451.      Here the keyword DEFAULT is used so that from now on
  452.      whenever the NEW command is used to insert a new column,
  453.      the column will be displayed with two decimal places and
  454.      a total width of five characters. When new data is read
  455.      in from a data file all columns will be displayed with at
  456.      least two decimal places.
  457.  
  458.  
  459.  
  460.  
  461.      
  462.        42 
  463.         Data management commands  
  464.      
  465.      Comments
  466.  
  467.      It is vital to realise that when you save data to disk
  468.      you are only saving the values to the precision of the
  469.      current column format. All the time EASISTAT holds data
  470.      in its memory it treats values as floating point numbers
  471.      which are stored with a high precision. As soon as they
  472.      are saved to disk however they are treated as digits as
  473.      you see them displayed, so that if a fractional number is
  474.      displayed with no decimal places then it will be saved as
  475.      a whole number and the fractional part will be lost.
  476.  
  477.      The total column width must always be at least 2 wider
  478.      than the number of decimal places, so that there is room
  479.      for the "0." part of the number, as in 0.67. The column
  480.      width must lie between 2 and 12, and the default column
  481.      width must lie between 3 and 12.
  482.  
  483.      You will not be allowed to make the width too small for
  484.      either the number or the column title. If values produced
  485.      by the DERIVE command or read in by the DATA command
  486.      would be too large to fit in the column with the format
  487.      specified then the width is increased automatically.
  488.  
  489.      If these two numbers occur in the same column:
  490.  
  491.      125.6 
  492.      12.45
  493.  
  494.      then you cannot have a column width of 5 and and display
  495.      2 decimal places because the numbers would appear like
  496.      this:
  497.  
  498.      125.60 
  499.      12.45
  500.  
  501.      so the total column width would have to be at least 6.
  502.  
  503.  
  504.      5:8. Derive
  505.  
  506.      Format: Der[ive] [column [expression]]
  507.  
  508.      This is a very powerful command which allows you to
  509.      derive the values in one column from the values in
  510.      others. One column can be set to be the total of three
  511.      others, the maximum, the product, or can be produced by
  512.      an arbitrarily complicated arithmetic and logical
  513.      expression. In addition two special options are provided
  514.      to make one column the rank of the values in another, or
  515.      to be the normalised version of those values i.e. with
  516.      the column mean subtracted and divided by the column
  517.      standard deviation.
  518.  
  519.      The command can also be applied to variables and indeed
  520.      is the only way that a variable can be set to a given
  521.      value.
  522.  
  523.      In the format set out above "expression" can be an
  524.      arithmetic and/or logical expression like (c3+c4)/2 or it
  525.      can be one of these two special functions of a column,
  526.      ZED or RANK:
  527.      
  528.        43 
  529.         Data management commands  
  530.      
  531.      ZED column     - (column - mean)/standard deviation
  532.  
  533.      RANK column    - rank of the values in given the column
  534.  
  535.      Examples:
  536.  
  537.      Select command -  der c3 c4-c5
  538.  
  539.      This sets the values in column 3 to be those in column 4
  540.      minus those in column 5.
  541.  
  542.      Select command -  DERIVE 
  543.      Enter column to derive:   c3 
  544.      Enter formula for new values:   c4+c5
  545.  
  546.      If you don't supply the column and expression on the
  547.      command line then EASISTAT will ask for them. Here is
  548.      third column becomes the sum of the fourth and fifth.
  549.  
  550.      Select command -  der c6 zed c5
  551.  
  552.      Values in column 5 have the column mean subtracted and
  553.      are then divided by the standard deviation so that the
  554.      values in column 6 will now have mean of zero and
  555.      standard deviation of one.
  556.  
  557.      Select command -  der c6 rank c5
  558.  
  559.      Now the values in column 6 are derived from the ranks of
  560.      those in column 5, so that the row containing the lowest
  561.      value in column 5 will have a 1 in column 6, the next
  562.      lowest a 2, and so on.
  563.  
  564.      Select command -  der v3 arccos(-1)+v2
  565.  
  566.      The third general purpose variable is set to the value of
  567.      the second added to pi (the arccosine in radians of -1).
  568.  
  569.      Select command -  der v3 c4
  570.  
  571.      Now the third variable takes the value from the fourth
  572.      column of the first valid row. When the DERIVE command is
  573.      applied to a column, it is applied repeatedly to that
  574.      column for every row of the data table. However when it
  575.      is applied to a variable then any references to columns
  576.      are taken to apply to the first valid row of the table.
  577.      (Valid means as selected by the NARROW and WIDEN
  578.      commands. This feature is similar to the usage of the
  579.      ARITHMETIC command, where again column references apply
  580.      to the first valid row.)
  581.  
  582.      Advanced tips
  583.  
  584.      Select command - der c6 (c3*c4*c5) pow (1/3)
  585.  
  586.      This makes column 6 the geometric mean of the previous
  587.      three columns.
  588.  
  589.      Select command -  der c6 c3*(c3>c4)+c4*(c4>=c3) 
  590.      Select command -  der c6 c5*(c5>c6)+c6*(c6>=c5)
  591.  
  592.  
  593.      
  594.        44 
  595.         Data management commands  
  596.      
  597.      These two lines would make column 6 the maximum of the
  598.      previous three (if you don't see why refer back to the
  599.      section on "Combining arithmetic and logical
  600.      expressions").
  601.  
  602.      Select command -  der c6 ln(c5/(1-c5))
  603.  
  604.      Here column 6 is derived from column 5 by the "logit"
  605.      transformation which statisticians sometimes use.
  606.  
  607.      If you have one hundred rows of data the following lines
  608.      will produce a table showing the probability value for
  609.      Student's t with 5 degrees of freedom over a range from 0
  610.      to 10:
  611.  
  612.      Select command -  new c1
  613.      Select command -  der c1 row/10
  614.      Select command -  fo c1 4 1
  615.      Select command -  new c2
  616.      Select command -  der c2 5
  617.      Select command -  new c3
  618.      Select command -  fo c3 7 5
  619.      Select command -  der c3 c1 pt c2
  620.  
  621.      Three new columns are created. The first consists of a
  622.      series of numbers ascending from 0.1 to 10.0 (assuming
  623.      there are 100 rows) in steps of 0.1. The second column is
  624.      set to all 5's. The third is derived from the first two
  625.      using the PT function. The first column is formatted to
  626.      display one decimal place, and the third to display five.
  627.  
  628.      The DERIVE command can be used to put data into classes
  629.      to make further manipulation easier. Suppose that column
  630.      3 contains values for age, then we can make column 4
  631.      contain a coding for up to 15, 16-25, 26-35, 36-45, 46-55
  632.      and 56+ like this:
  633.  
  634.      Select command -  der c4 1*(c3<=15) + 2*(c3>15&c3<=25) 
  635.      Select command -  der c4 c4 + 3*(c3>25&c3<=35) 
  636.      Select command -  der c4 c4 + 4*(c3>35&c3<=45) 
  637.      Select command -  der c4 c4 + 5*(c3>45&c3<=55) + 6*(c3>55)
  638.  
  639.      Again, referring to the section on "Combining arithmetic
  640.      and logical operators" may be helpful if you do not
  641.      understand this. Note the necessity to include column 4
  642.      itself in the second, third and fourth expressions, so as
  643.      not to lose the result of the first one.
  644.  
  645.      The same effect can be achieved with the following
  646.      sequence of NARROW and WIDEN commands. More commands are
  647.      needed, but it may be clearer to see what is going on:
  648.  
  649.      Select command -  narrow (c3<=15)
  650.      Select command -  der c4 1
  651.      Select command -  widen
  652.      Select command -  narrow (c3>15&c3<=25)
  653.      Select command -  der c4 2
  654.      Select command -  widen
  655.      Select command -  narrow (c3>25&c3<=35)
  656.      Select command -  der c4 3
  657.      Select command -  widen
  658.      Select command -  narrow (c3>35&c3<=45)
  659.      
  660.        45 
  661.         Data management commands  
  662.      
  663.      Select command -  der c4 4
  664.      Select command -  widen
  665.      Select command -  narrow (c3>45&c3<=55)
  666.      Select command -  der c4 5
  667.      Select command -  widen
  668.      Select command -  narrow (c3>55)
  669.      Select command -  der c4 6
  670.      Select command -  widen
  671.  
  672.      It is possible to number the data rows as follows:
  673.  
  674.      Select command - new c1 rnum 
  675.      Select command - derive rnum row
  676.  
  677.      A new first column is created called RNUM, and is filled
  678.      with the value of each row of the table.
  679.  
  680.  
  681.      5:9. Sort
  682.  
  683.      Format: So[rt] [d[own]] [column]
  684.  
  685.      The SORT command arranges all the rows in order according
  686.      to the values in the column specified. If the keyword
  687.      DOWN (which can be abbreviated down to D) is given they
  688.      are arranged in descending order, otherwise ascending.
  689.  
  690.      Examples:
  691.  
  692.      Select command -  SORT C3 
  693.      Select command -  s d AGE
  694.  
  695.      Example output:
  696.  
  697.      Sorted into ascending order using C3 (SEX)
  698.  
  699.      Comments
  700.  
  701.      Only one column can be sorted at a time. If you want to
  702.      sort rows into order according to two variables you must
  703.      first produce a dummy variable from the first two. For
  704.      example if the first column contains the month and the
  705.      second column the day of the month, you could not sort
  706.      the rows into date order by sorting first on c2 and then
  707.      on c1, since the second sort would disturb the results of
  708.      the first. Instead you would need to produce a combined
  709.      date in a third column first by following this procedure:
  710.  
  711.      Select command -  DERIVE C3 C1*100+C2 
  712.      Select command -  SORT C3
  713.  
  714.  
  715.      5:10.  Narrow
  716.  
  717.      Format: N[arrow] condition
  718.  
  719.      The NARROW command narrows down the data set to include
  720.      only those rows for which the given condition applies.
  721.      All operations will subsequently only apply to the
  722.      reduced data set except the following: EDIT, TITLES, NEW,
  723.      DELETE, FORMAT. The data set remains narrowed until a
  724.      WIDEN command is issued.
  725.      
  726.        46 
  727.         Data management commands  
  728.      
  729.      Examples:
  730.  
  731.      Select command -  NARROW C3=1
  732.  
  733.      Only the rows whose first value is 1.
  734.  
  735.      Select command -  n row<50
  736.  
  737.      The first 49 rows.
  738.  
  739.      Select command -  n c3!=9 & c4!=9
  740.  
  741.      The rows which do not have a 9 in either the third or
  742.      fourth column.
  743.  
  744.      Example output:
  745.  
  746.      Narrowing data set to include only lines for which C3=1
  747.  
  748.      Comments
  749.  
  750.      Note that you must supply the condition in the command
  751.      line. A NARROW command on its own will just be ignored.
  752.  
  753.      The NARROW command has a similar function to the IF
  754.      option available for some commands, except that it can be
  755.      used before commands which do not have an IF option.
  756.  
  757.      If a second NARROW command is used on a data set which
  758.      has already been narrowed down, then the narrowed data
  759.      set is narrowed still further, so that the only rows
  760.      remaining are those for which both conditions are true.
  761.  
  762.      Note that NARROW affects all commands except those
  763.      specified above. In particular the DERIVE command will
  764.      only change values in rows which remain in the narrowed
  765.      down data set and other rows will remain unchanged. An
  766.      example of the way this can be used to code groups of
  767.      values has been shown in the section on the DERIVE
  768.      command.
  769.  
  770.      This feature also provides the only way to produce an
  771.      absolute reference to individual cells in the table from
  772.      commands rather than from the data editor, by narrowing
  773.      the table down to just one row. Then one can set a given
  774.      column of that row to a certain value using the DERIVE
  775.      command, or can read a value from that column. Suppose
  776.      for example you wished to find the mean of the means of
  777.      columns 1, 2 and 3:
  778.  
  779.      Select command -  wid
  780.      Select command -  bas c1
  781.      Select command -  n row=1
  782.      Select command -  der c4 xmean
  783.      Select command -  wid
  784.      Select command -  bas c2
  785.      Select command -  n row=2
  786.      Select command -  der c4 xmean
  787.      Select command -  wid
  788.      Select command -  bas c3
  789.      Select command -  n row=3
  790.      Select command -  der c4 xmean
  791.      
  792.        47 
  793.         Data management commands  
  794.      
  795.      Select command -  wid
  796.      Select command -  n row<=3
  797.      Select command -  bas c4
  798.  
  799.      The mean of c1 is put in the first row of c4, the mean of
  800.      c2 in the second and the mean of c3 in the third. Finally
  801.      the BASICS command is applied to all three values. This
  802.      example is just to show the kind of things that can be
  803.      done with EASISTAT if necessary.
  804.  
  805.      EASISTAT does not have built in support for missing data
  806.      values. It is up to you to code a special value to
  807.      indicate that data is missing in some rows of a given
  808.      column. For example if the value of 9 is used for this
  809.      and you wish to perform tests on the column but to
  810.      exclude those subjects (rows) for whom data is missing,
  811.      you would use the NARROW command to use only the rows
  812.      having a value other than 9:
  813.  
  814.      Select command -  n c4!=9
  815.  
  816.  
  817.      5:11.  Widen
  818.  
  819.      Format: Wid[en] [condition]
  820.  
  821.      The WIDEN command restores the data set after a NARROW
  822.      command. If no condition is given then all the the rows
  823.      are included. If a condition is given, then all the rows
  824.      previously included will remain, but any others that
  825.      comply with the condition will be included in addition.
  826.  
  827.      Examples:
  828.  
  829.      Select command -  WIDEN
  830.  
  831.      Includes all rows.
  832.  
  833.      Select command -  wid c3=4
  834.  
  835.      Adds in rows for which third entry is 4.
  836.  
  837.      Select command -  n c2>7
  838.        ...
  839.        ...
  840.      Select command -  wid c2<3
  841.  
  842.      Now data set includes all rows whose second entry is
  843.      greater than 7 or less than 3.
  844.  
  845.      Example output:
  846.  
  847.      Widening data set to include all lines
  848.  
  849.      Widening data set to include lines for which C2<7
  850.  
  851.      Comment
  852.  
  853.      In practice it is quite rarely helpful to use WIDEN with
  854.      a condition. Generally one just uses it on its own and
  855.      then uses NARROW to reduce the data set again. The rows
  856.      remaining after a NARROW and then a WIDEN command are
  857.      
  858.        48 
  859.         Data management commands  
  860.      
  861.      those for which either condition is true. Note that the
  862.      order in which the NARROW and WIDEN commands are issued
  863.      is important.
  864.  
  865.  
  866.      5:12.  Copy
  867.  
  868.      Format: Cop[y] [left, top, right, bottom, new-left,
  869.      new-top]
  870.  
  871.      The COPY command copies a block of data from one part of
  872.      the data table to another, and may occasionally be of use
  873.      when it is necessary to reorganise data. It is designed
  874.      to be used if the data is not arranged correctly for a
  875.      particular analysis, for instance if the values in two
  876.      different columns should actually be in the same column
  877.      one under the other. Alternatively it may be possible to
  878.      use the COPY command to merge data sets. For example if
  879.      some new columns of values are to be added to a data
  880.      table then it may be possible to edit the data file with
  881.      a text editor and insert the new columns initially under
  882.      the original columns in new rows. Then the file can be
  883.      read in by EASISTAT, and the COPY command used to move
  884.      the new block of data to the correct position to the
  885.      right of the original columns.
  886.  
  887.      Example:
  888.  
  889.      Select command -  copy 1,2,3,4,5,6
  890.  
  891.      This copies a block from the first to third column and
  892.      the second to fourth row so that the top left corner of
  893.      the block moves to the fifth column and sixth row (the
  894.      bottom right corner would be copied to the seventh column
  895.      and eighth row).
  896.  
  897.      Note that the space must already exist in the table for
  898.      the block to be copied to, no new rows or columns are
  899.      created. Additionally the destination block must not
  900.      overlap the source block. Single rows or columns can be
  901.      copied by specifying the same value for the top and
  902.      bottom row, or for the left and right column.
  903.  
  904.  
  905.  
  906.  
  907.  
  908.  
  909.  
  910.  
  911.  
  912.  
  913.  
  914.  
  915.  
  916.  
  917.  
  918.  
  919.  
  920.  
  921.  
  922.  
  923.      
  924.        49 
  925.  
  926.