home *** CD-ROM | disk | FTP | other *** search
/ Frozen Fish 1: Amiga / FrozenFish-Apr94.iso / bbs / alib / d1xx / d168 / dillonstuff.lha / doc / dasm.doc < prev    next >
Text File  |  1988-11-22  |  20KB  |  598 lines

  1.  
  2.  
  3. DOCUMENTATION FOR DASM V2.11, a high level macro cross assembler for:
  4.  
  5.     -6502
  6.     -68705
  7.     -6803
  8.     -HD6303 (extension of 6803)
  9.  
  10.     Soon will work for 68HC11 (next ver)
  11.  
  12.     (C)Copyright 1987,1988 Matthew Dillon, All Rights Reserved
  13.  
  14.     Publicly distributable for non-profit only.  Must be distributed
  15.     as is, with NO CHANGES to the documentation or code.  If you want
  16.     your (general) changes to be made part of the distribution, send
  17.     them to me.
  18.  
  19.     Over the last year my work has included writing software to drive small
  20.     single-chip microcomputers for various things (remote telemetry units,
  21.     for instance).  I have had need to program quite a few different
  22.     processors over that time.
  23.  
  24.     At the beginning, I used an awful macro assembler running on an IBM-PC.
  25.     I *really* wanted to do it on my Amiga.  Thus the writing of this
  26.     program.
  27.  
  28.     Feel free to suggest other similar processors for me to add to the list!
  29.     The processor type is specified with a pseudo-op (see below).  This
  30.     assembler produces only binary output in one of three formats described
  31.     below.  In general, one has a master assembly file which INCLUDEs all
  32.     the modules.
  33.  
  34.     Also provided is FTOHEX which converts an output file in one of the
  35.     three formats to an intel-hex format suitable for many intelligent
  36.     prom programmers (I have a GTEK).
  37.  
  38.     YES it's packed with features!
  39.  
  40. FEATURES:
  41.  
  42.     -fast assembly
  43.     -supports several common 8 bit processor models (NOT 8086, thank god!)
  44.     -takes as many passes as needed
  45.     -automatic checksum generation, special symbol '...'
  46.     -several binary output formats available.  Format 2 allows reverse
  47.      indexed origins.
  48.     -multiple segments, BSS segments (no generation), relocatable origin.
  49.     -expressions, as in C but [] is used instead of () for parenthesis.
  50.      (all expressions are computed with 32 bit integers)
  51.     -no real limitation on label size, label values are 32 bits.
  52.     -complex pseudo ops, repeat loops, macros, etc....
  53.  
  54.  
  55. COMMAND LINE:
  56.  
  57.     asm srcfile [options]
  58.  
  59.     options:    -f#     select output format 1-3 (default 1, see below)
  60.             -oname  select output file name (else a.out)
  61.             -lname  select list file name   (else none generated)
  62.             -sname  select symbol dump file (else none generated)
  63.             -v#     select verboseness 0-4 (default 0, see below)
  64.             -d        debug mode
  65.             -DSYMBOL            predefine a symbol, set to 0
  66.             -DSYMBOL=EXPRESSION     predefine a symbol, set to exp
  67.  
  68.     Note: file names should be in RAM: for speed.  If a list file is
  69.     specified, it should be in the RAM: disk (assembly is slowed down
  70.     quite a bit anyway).
  71.  
  72.     Example:    asm master.asm -f2 -oram:out -lram:list -v3 -DVER=4
  73.  
  74. FORMAT OPTIONS:
  75.  
  76.     1  (DEFAULT)
  77.  
  78.     The output file contains a two byte origin in LSB,MSB order, then
  79.     data until the end of the file.
  80.  
  81.     Restrictions:    Any instructions which generate output (within an
  82.     initialized segment) must do so with an ascending PC.  Initialized
  83.     segments must occur in ascending order.
  84.  
  85.     2  RAS (Random Access Segment)
  86.  
  87.     The output file contains one or more hunks.  Each hunk consists
  88.     of a 2 byte origin (LSB,MSB), 2 byte length (LSB,MSB), and that
  89.     number of data bytes.  The hunks occur in the same order as
  90.     initialized segments in the assembly.  There are no restrictions
  91.     to segment ordering (i.e. reverse indexed ORG statements are
  92.     allowed).  The next hunk begins after the previous hunk's data,
  93.     until the end of the file.
  94.  
  95.     3  RAW (Raw)
  96.  
  97.     The output file contains data only (format #1 without the 2 byte
  98.     header).  Restrictions are the same as for format #1.
  99.  
  100.     Format 3    RAW (Raw format)
  101.         Same as format 1, but NO header origin is generated.  You get
  102.         nothing but data.
  103.  
  104. VERBOSE OPTIONS:
  105.  
  106.     0    (default)
  107.  
  108.     Only warnings and errors are generated
  109.  
  110.     1
  111.     -Segment list information generated after each pass
  112.     -Include file names are displayed
  113.     -statistics on why the assembler is going to make another pass
  114.         R1,R2 reason code: R3
  115.         where R1 is the number of times the assembler encountered
  116.         something requiring another pass to resolve.  R2 is the
  117.         number of references to unknown symbols which occured in the
  118.         pass (but only R1 determines the need for another pass).  R3
  119.         is a BITMASK of the reasons why another pass is required.
  120.         See the end of this document for bit designations.
  121.  
  122.     2
  123.     mismatches between program labels and equates are displayed
  124.     on every pass (usually none occur in the first pass unless you
  125.     have re-declared a symbol name).
  126.  
  127.     displayed information for symbols:
  128.         ???? = unknown value
  129.         str  = symbol is a string
  130.         eqm  = symbol is an eqm macro
  131.         (r)  = symbol has been referenced
  132.         (s)  = symbol created with SET or EQM pseudo-op
  133.  
  134.     3
  135.         Unresolved and unreferenced symbols are displayed every pass
  136.         (unsorted, sorry)
  137.  
  138.     4
  139.         An entire symbol list is displayed every pass to STDOUT.
  140.         (unsorted, sorry)
  141.  
  142. PROCESSOR MODEL:
  143.  
  144.     The processor model is chosen with the PROCESSOR pseudo-op and should
  145.     be the first thing you do in your assembly file.   Different processor
  146.     models use different integer formats (see below).  The word order does
  147.     not effect the headers in the output files (-f1 and -f2), which are
  148.     always LSB,MSB.  The word ordering effects all address, word, and
  149.     long generation.
  150.  
  151.     Only one PROCESSOR pseudo-op may be declared in the entire assembly,
  152.     and should be the first thing encountered.
  153.  
  154.     -6502        LSB,MSB
  155.     -68HC11     MSB,LSB (next release)
  156.     -68705        MSB,LSB
  157.     -6803        MSB,LSB
  158.     -HD6303     MSB,LSB
  159.  
  160. SEGMENTS:
  161.     The SEG pseudo-op creates/sets the current segment.  Each segment has
  162.     it's own origin and is optionally an 'uninitialized' segment.
  163.     Unitialized segments produce no output and have no restrictions.  This
  164.     is useful for determining the size of a certain assembly sequence
  165.     without generating code, and for assigning RAM to labels.
  166.  
  167.     'Initialized' segments produce output.  The following should be
  168.     considered when generating roms:
  169.  
  170.     (1) The default fill character when using ORG (and format 1 or 3) to
  171.     skip forward is 00.  This is a GLOBAL default and effects all
  172.     segments.  See ORG.
  173.  
  174.     (2) The default fill character for DS is 00 and is independant of
  175.     the default fill character for ORG (see DS).
  176.  
  177. GENERAL:
  178.     Most everything is recursive.  You cannot have a macro DEFINITION
  179.     within a macro definition, but can nest macro calls, repeat loops,
  180.     and include files.
  181.  
  182.     The other major feature in this assembler is the SUBROUTINE pseudo-op,
  183.     which logically separates local labels (starting with a dot).  This
  184.     allows you to reuse label names (for example, .1 .fail) rather than
  185.     think up crazy combinations of the current subroutine to keep it all
  186.     unique.
  187.  
  188.     Almost nothing need be resolved in pass 1.    The assembler will make
  189.     multiple passes in an attempt to resolve the assembly (including just
  190.     one pass if everything is resolved immediately).
  191.  
  192.  
  193. PSEUDOPS:
  194.  
  195.     INCLUDE     "name"
  196.  
  197.         Include another assembly file.
  198.  
  199. [label] SEG[.U]     name
  200.  
  201.         This sets the current segment, creating it if neccessary.  If
  202.         a .U extension is specified on segment creation, the segment
  203.         is an UNINITIALIZED segment.  The .U is not needed when going
  204.         back to an already created uninitialized segment, though it
  205.         makes the code more readable.
  206.  
  207. [label] DC[.BWL]    exp,exp,exp ...
  208.  
  209.         Declare data in the current segment.  No output is generated if
  210.         within a .U segment.  Note that the byte ordering for the
  211.         selected processor is used for each entry.
  212.  
  213.         The default size extension is a byte.
  214.  
  215. [label] DS[.BWL]    exp[,filler]
  216.  
  217.         declare space (default filler is 0). Data is not generated if
  218.         within an uninitialized segment.  Note that the number of bytes
  219.         generated is exp * entrysize (1,2, or 4)
  220.  
  221.         The default size extension is a byte.
  222.  
  223.         Note that the default filler is always 0 (has nothing to do
  224.         with the ORG default filler).
  225.  
  226. [label] DV[.BWL]    eqmlabel exp,exp,exp....
  227.  
  228.         This is equivalent to DC, but each exp in the list is passed
  229.         through the symbolic expression specified by the EQM label.
  230.         The expression is held in a special symbol dotdot '..' on each
  231.         call to the EQM label.
  232.  
  233.         See EQM below
  234.  
  235. [label] HEX        hh hh hh..
  236.  
  237.         This sets down raw HEX data.  Spaces are optional between bytes.
  238.         NO EXPRESSIONS are allowed.  Note that you do NOT place a $
  239.         in front of the digits.  This is a short form for creating
  240.         tables compactly.  Data is always layed down on a byte-by-byte
  241.         basis.
  242.  
  243.         Example:        HEX 1A45 45 13254F 3E12
  244.  
  245.     ERR
  246.  
  247.         Abort assembly.
  248.  
  249. [label] ORG        exp[,DefaultFillVal]
  250.  
  251.         This pseudop sets the current origin.  You can also set the
  252.         global default fill character (a byte value) with this
  253.         pseudoop.  NOTE that no filler is generated until the first
  254.         data-generating opcode/psueoop is encountered after this one.
  255.         Sequences like:
  256.  
  257.         org  0,255
  258.         org  100,0
  259.         org  200
  260.         dc   23
  261.  
  262.         will result in 200 zero's and a 23. This allows you to specify
  263.         some ORG, then change your mind and specify some other (lower
  264.         address) ORG without causing an error (assuming nothing is
  265.         generated inbetween).
  266.  
  267.         Normally, DS and ALIGN are used to generate specific filler
  268.         values.
  269.  
  270. [label] RORG        exp
  271.  
  272.         This activates the relocatable origin.  All generated
  273.         addresses, including '.', although physically placed at the
  274.         true origin, will use values from the relocatable origin.
  275.         While in effect both the physical origin and relocatable origin
  276.         are updated.
  277.  
  278.         The relocatable origin can skip around (no limitations).  The
  279.         relocatable origin is a function of the segment.  That is, you
  280.         can still SEG to another segment that does not have a
  281.         relocatable origin activated, do other (independant) stuff
  282.         there, and then switch back to the current segment and continue
  283.         where you left off.
  284.  
  285.     PROCESSOR model
  286.  
  287.         do not quote.  model is one of: 6502,6803,HD6303,68705,68HC11
  288.         Can only be executed once, and should be the first thing
  289.         encountered by the assembler.  the 68HC11 will be available
  290.         next release.
  291.  
  292.     ECHO exp,exp,exp
  293.  
  294.         The expressions (which may also be strings), are echod on the
  295.         screen and into the list file
  296.  
  297. [label] REND
  298.  
  299.         Deactivate the relocatable origin for the current segment.
  300.         Generation uses the real origin for reference.
  301.  
  302. [label] ALIGN        N[,fill]
  303.  
  304.         Align the current PC to an N byte boundry.    The default
  305.         fill character is always 0, and has nothing to do with
  306.         the default fill character specifiable in an ORG.
  307.  
  308. [label] SUBROUTINE  name
  309.  
  310.         This isn't really a subroutine, but a boundry between sets of
  311.         temporary labels (which begin with a dot).  Temporary label
  312.         names are unique within segments of code bounded by SUBROUTINE:
  313.  
  314.         CHARLIE subroutine
  315.             ldx #10
  316.         .1    dex
  317.             bne .1
  318.         BEN    subroutine
  319.             ldx #20
  320.         .qq    dex
  321.             bne .qq
  322.  
  323.         Automatic temporary label boundries occur for each macro level.
  324.         Usually temporary labels are used in macros and within actual
  325.         subroutines (so you don't have to think up a thousand different
  326.         names)
  327.  
  328.  
  329. symbol    EQU        exp
  330.  
  331.         The expression is evaluated and the result assigned to the
  332.         symbol.
  333.  
  334. symbol    EQM        exp
  335.  
  336.         The STRING representing the expression is assigned to the
  337.         symbol.  Occurances of the label in later expressions causes
  338.         the string to be evaluated for each occurance.  Also used in
  339.         conjuction with the DV psuedo-op.
  340.  
  341. symbol    SET        exp
  342.  
  343.         Same as EQU, but the symbol may be reassigned later.
  344.  
  345.     MAC        name
  346.  
  347.         Declare a macro.  lines between MAC and ENDM are the macro.
  348.         You cannot recursively declare a macro.  You CAN recursively
  349.         use a macro (reference a macro in a macro).  No label is
  350.         allowed to the left of MAC or ENDM.
  351.  
  352.         Arguments passed to macros are referenced with: {#}.  The first
  353.         argument passed to a macro would thus be {1}.  You should
  354.         always use LOCAL labels (.name) inside macros which you use
  355.         more than once. {0} represents an EXACT substitution of the
  356.         ENTIRE argument line.
  357.  
  358.     ENDM
  359.  
  360.         end of macro def.  NO LABEL ALLOWED ON THE LEFT!
  361.  
  362.     MEXIT
  363.  
  364.         Used in conjuction with conditionals.  Exits the current macro
  365.         level.
  366.  
  367. [label] IFCONST     exp
  368.  
  369.         Is TRUE if the expression result is defined,  FALSE otherwise
  370.         and NO error is generated if the expression is undefined.
  371.  
  372. [label] IFNCONST    exp
  373.  
  374.         Is TRUE if the expression result is undefined, FALSE otherwise
  375.         and NO error is generated if the expression is undefined.
  376.  
  377. [label] IF        exp
  378.  
  379.         Is TRUE if the expression result is defined AND non-zero.
  380.         Is FALSE if the expression result is defined AND zero.
  381.         Neither IF or ELSE will be executed if the expression result
  382.         is undefined.  If the expression is undefined, another assembly
  383.         pass is automatically taken.
  384.  
  385. [label] ELSE
  386.  
  387.         ELSE the current IF.
  388.  
  389. [label] ENDIF
  390. [label] EIF
  391.  
  392.         Terminate an IF. ENDIF and EIF are equivalent.
  393.  
  394. [label] REPEAT        exp
  395. [label] REPEND
  396.  
  397.         Repeat code between REPEAT/REPEND 'exp' times.  if exp == 0,
  398.         the code repeats forever.  exp is evaluated once.
  399.  
  400.         Y   SET     0
  401.             REPEAT  10
  402.         X   SET     0
  403.             REPEAT  10
  404.             DC        X,Y
  405.         X   SET     X + 1
  406.             REPEND
  407.         Y   SET     Y + 1
  408.             REPEND
  409.  
  410.         generates an output table:    0,0 1,0 2,0 ... 9,0  0,1 1,1 2,1
  411.         ... 9,1, etc...
  412.  
  413.         Labels within a REPEAT/REPEND should be temporary labels with a
  414.         SUBROUTINE pseudoop to keep them unique.
  415.  
  416.         The Label to the left of REPEND is assigned AFTER the loop
  417.         FINISHES.
  418.  
  419.  
  420. [label] XXX[.force] operand
  421.  
  422.         XXX is some mnemonic, not necessarily three characters long.
  423.         The .FORCE optional extension is used to force specific
  424.         addressing modes (see below).
  425.  
  426. GENERAL:
  427.  
  428.     The label will be set to the current ORG/RORG either before or after
  429.     a pseudo-op is executed.  Most of the time, the label to the left of a
  430.     pseudo-op is the current ORG/RORG. The following pseudo-op's labels are
  431.     created AFTER execution of the pseudo-op:
  432.  
  433.     SEG, ORG, RORG, REND, ALIGN
  434.  
  435. EXTENSIONS:
  436.  
  437.     FORCE extensions are used to force an addressing mode.  In some cases,
  438.     you can optimize the assembly to take fewer passes by telling it the
  439.     addressing mode.  Force extensions are also used with DS,DC, and DV
  440.     to determine the element size.  NOT ALL EXTENSIONS APPLY TO ALL
  441.     PROCESSORS!
  442.  
  443.     example:    lda.z   charlie
  444.  
  445.     i   -implied
  446.     ind -indirect word
  447.     0   -implied
  448.     0x  -implied indexing (0,x)
  449.     0y  -implied indexing (0,y)
  450.     b   -byte address
  451.     bx  -byte address indexed x
  452.     by  -byte address indexed y
  453.     w   -word address
  454.     wx  -word address indexed x
  455.     wy  -word address indexed y
  456.     l   -longword (4 bytes) (DS/DC/DV)
  457.     r   -relative
  458.     u   -uninitialized (SEG)
  459.  
  460.     First character equivalent substitutions:
  461.  
  462.     b z d        (byte, zeropage, direct)
  463.     w e a        (word, extended, absolute)
  464.  
  465.  
  466. ASSEMBLER PASSES:
  467.     The assembler may have to make several passes through the source
  468.     code to resolve all generation.  The number of passes is not
  469.     limited to two.  Since this may result in an unexpected, verbose
  470.     option 2, 3, and 4 have been provided to allow determination of the
  471.     cause. The assembler will give up if it thinks it can't do the
  472.     assembly in *any* number of passes.
  473.  
  474.     Error reporting could be better....
  475.  
  476.  
  477. EXPRESSIONS:
  478.     [] may be used to group expressions.  The precedense of operators
  479.     is the same as for the C language in almost all respects.  Use
  480.     brackets [] when you are unsure.  The reason () cannot be used to
  481.     group expressions is due to a conflict with the 6502 and other
  482.     assembly languages.
  483.  
  484.     Some operators, such as ||, can return a resolved value even if
  485.     one of the expressions is not resolved.   Operators are as follows:
  486.  
  487.     NOTE WELL!  Some operations will result in non-byte values when a
  488.     byte value was wanted.    For example:    ~1  is NOT $FF, but
  489.     $FFFFFFFF.  Preceding it with a < (take LSB of) will solve the
  490.     problem.  ALL ARITHMETIC IS CARRIED OUT IN 32 BITS.  The final
  491.     Result will be automatically truncated to the maximum handleable
  492.     by the particular machine language (usually a word) when applied
  493.     to standard mnemonics.
  494.  
  495.     prec        UNARY
  496.  
  497.     20  ~exp    one's complement.
  498.     20  -exp    negation
  499.     20  !exp    not expression (returns 0 if exp non-zero, 1 if exp zero)
  500.     20  <exp    take LSB byte of a 16 bit expression
  501.     20  >exp    take MSB byte of an expression
  502.  
  503.             BINARY
  504.  
  505.     19  *        multiplication
  506.     19  /        division
  507.     19  %        mod
  508.     18  +        addition
  509.     18  -        subtraction
  510.     17  >>,<<   shift right, shift left
  511.     16  >,>=    greater, greater equal
  512.     16  <,<=    smaller, smaller equal
  513.     15  ==        equal to.  Try to use this instead of =
  514.     15  =        exactly the same as == (exists compatibility)
  515.     15  !=        not equal to
  516.     14  &        logical and
  517.     13  ^        logical xor
  518.     12  |        logical or
  519.     11  &&        left expression is true AND right expression is true
  520.     10  ||        left expression is true OR right expression is true
  521.      9  ?        if left expression is true, result is right expression,
  522.             else result is 0.    [10 ? 20] returns 20
  523.      8  []        group expressions
  524.      7  ,        separate expressions in list (also used in
  525.             addressing mode resolution, BE CAREFUL!
  526.  
  527.     Constants:
  528.  
  529.     nnn    decimal
  530.     0nnn    octal
  531.     %nnn    binary
  532.     $nnn    hex
  533.     'c      character
  534.     "cc.."  string (NOT zero terminated if in DC/DS/DV)
  535.     [exp]d    the constant expressions is evaluated and it's decimal
  536.         result turned into an ascii string.
  537.  
  538.     Symbols:
  539.  
  540.     ...    -holds CHECKSUM so far (of actual-generated stuff)
  541.     ..    -holds evaluated value in DV pseudo op
  542.     .name    -represents a temporary symbol name.  Temporary symbols
  543.          may be reused inside MACROS and between SUBROUTINES, but
  544.          may not be referenced across macros or across SUBROUTINEs.
  545.     .    -current program counter (as of the beginning of the
  546.          instruction).
  547.     name    -beginning with an alpha character and containing letters,
  548.          numbers, or '_'.  Represents some global symbol name.
  549.  
  550.  
  551. WHY codes:
  552.     Each bit in the WHY word (verbose option 1) is a reason (why
  553.     the assembler needs to do another pass), as follows:
  554.  
  555.     bit 0   expression in mnemonic not resolved
  556.     1   -
  557.     2   expression in a DC not resolved
  558.     3   expression in a DV not resolved (probably in DV's EQM symbol)
  559.     4   expression in a DV not resolved (could be in DV's EQM symbol)
  560.     5   expression in a DS not resolved
  561.     6   expression in an ALIGN not resolved
  562.     7   ALIGN: Relocatable origin not known (if in RORG at the time)
  563.     8   ALIGN: Normal origin not known    (if in ORG at the time)
  564.     9   EQU:   expression not resolved
  565.     10  EQU:   value mismatch from previous pass (phase error)
  566.     11  IF:     expression not resolved
  567.     12  REPEAT: expression not resolved
  568.  
  569.     13  a program label has been defined after it has been
  570.         referenced (forward reference) and thus we need another
  571.         pass
  572.     14  a program label's value is different from that of the
  573.         previous pass (phase error)
  574.  
  575.     Certain errors will cause the assembly to abort immediately, others
  576.     will wait until the current pass is other.    The remaining allow another
  577.     pass to occur in the hopes the error will fix itself.
  578.  
  579.  
  580. VERSIONS:
  581.  
  582.     V2.11
  583.     -Fixed <exp >exp bug, <exp now means LSB, >exp MSB (it used to
  584.      be reversed).
  585.     -Fixed many bugs in macros and other things
  586.     -Added automatic checksumming ... no more doing checksums manually!
  587.     -Added several new processors, including 6502.
  588.     -Source is now 16/32 bit int compatible, and will compile on an
  589.      IBM-PC (the ultimate portability test)
  590.  
  591.     V2.01
  592.  
  593.     -can now have REPEAT/REPEND's within macros
  594.     -fill field for DS.W is a word (used to be a byte fill)
  595.     -fill field for DS.L is a long (used to be a byte fill)
  596.  
  597.  
  598.