home *** CD-ROM | disk | FTP | other *** search
/ OS/2 Professional / OS2PRO194.ISO / os2 / editor / pminfo / gcc.inf (.txt) < prev    next >
GNU Info File  |  1994-01-31  |  42KB  |  726 lines

  1. This is Info file gcc.info, produced by Makeinfo-1.43 from the input
  2. file gcc.texi.
  3.    This file documents the use and the internals of the GNU compiler.
  4.    Copyright (C) 1988, 1989, 1992 Free Software Foundation, Inc.
  5.    Permission is granted to make and distribute verbatim copies of
  6. this manual provided the copyright notice and this permission notice
  7. are preserved on all copies.
  8.    Permission is granted to copy and distribute modified versions of
  9. this manual under the conditions for verbatim copying, provided also
  10. that the section entitled "GNU General Public License" is included
  11. exactly as in the original, and provided that the entire resulting
  12. derived work is distributed under the terms of a permission notice
  13. identical to this one.
  14.    Permission is granted to copy and distribute translations of this
  15. manual into another language, under the above conditions for modified
  16. versions, except that the section entitled "GNU General Public
  17. License" and this permission notice may be included in translations
  18. approved by the Free Software Foundation instead of in the original
  19. English.
  20. File: gcc.info,  Node: Patterns,  Next: Example,  Prev: Machine Desc,  Up: Machine Desc
  21. Everything about Instruction Patterns
  22. =====================================
  23.    Each instruction pattern contains an incomplete RTL expression,
  24. with pieces to be filled in later, operand constraints that restrict
  25. how the pieces can be filled in, and an output pattern or C code to
  26. generate the assembler output, all wrapped up in a `define_insn'
  27. expression.
  28.    A `define_insn' is an RTL expression containing four or five
  29. operands:
  30.   1. An optional name.  The presence of a name indicate that this
  31.      instruction pattern can perform a certain standard job for the
  32.      RTL-generation pass of the compiler.  This pass knows certain
  33.      names and will use the instruction patterns with those names, if
  34.      the names are defined in the machine description.
  35.         The absence of a name is indicated by writing an empty string
  36.      where the name should go.  Nameless instruction patterns are never
  37.      used for generating RTL code, but they may permit several simpler
  38.      insns to be combined later on.
  39.         Names that are not thus known and used in RTL-generation have
  40.      no effect; they are equivalent to no name at all.
  41.   2. The "RTL template" (*note RTL Template::.) is a vector of
  42.      incomplete RTL expressions which show what the instruction should
  43.      look like.  It is incomplete because it may contain
  44.      `match_operand', `match_operator', and `match_dup' expressions
  45.      that stand for operands of the instruction.
  46.         If the vector has only one element, that element is the
  47.      template for the instruction pattern.  If the vector has multiple
  48.      elements, then the instruction pattern is a `parallel' expression
  49.      containing the elements described.
  50.   3. A condition.  This is a string which contains a C expression that
  51.      is the final test to decide whether an insn body matches this
  52.      pattern.
  53.         For a named pattern, the condition (if present) may not depend
  54.      on the data in the insn being matched, but only the
  55.      target-machine-type flags.  The compiler needs to test these
  56.      conditions during initialization in order to learn exactly which
  57.      named instructions are available in a particular run.
  58.         For nameless patterns, the condition is applied only when
  59.      matching an individual insn, and only after the insn has matched
  60.      the pattern's recognition template.  The insn's operands may be
  61.      found in the vector `operands'.
  62.   4. The "output template": a string that says how to output matching
  63.      insns as assembler code.  `%' in this string specifies where to
  64.      substitute the value of an operand.  *Note Output Template::.
  65.         When simple substitution isn't general enough, you can specify
  66.      a piece of C code to compute the output.  *Note Output
  67.      Statement::.
  68.   5. Optionally, a vector containing the values of attributes for
  69.      insns matching this pattern.  *Note Insn Attributes::.
  70. File: gcc.info,  Node: Example,  Next: RTL Template,  Prev: Patterns,  Up: Machine Desc
  71. Example of `define_insn'
  72. ========================
  73.    Here is an actual example of an instruction pattern, for the
  74. 68000/68020.
  75.      (define_insn "tstsi"
  76.        [(set (cc0)
  77.              (match_operand:SI 0 "general_operand" "rm"))]
  78.        ""
  79.        "*
  80.      { if (TARGET_68020 || ! ADDRESS_REG_P (operands[0]))
  81.          return \"tstl %0\";
  82.        return \"cmpl #0,%0\"; }")
  83.    This is an instruction that sets the condition codes based on the
  84. value of a general operand.  It has no condition, so any insn whose
  85. RTL description has the form shown may be handled according to this
  86. pattern.  The name `tstsi' means "test a `SImode' value" and tells the
  87. RTL generation pass that, when it is necessary to test such a value,
  88. an insn to do so can be constructed using this pattern.
  89.    The output control string is a piece of C code which chooses which
  90. output template to return based on the kind of operand and the specific
  91. type of CPU for which code is being generated.
  92.    `"rm"' is an operand constraint.  Its meaning is explained below.
  93. File: gcc.info,  Node: RTL Template,  Next: Output Template,  Prev: Example,  Up: Machine Desc
  94. RTL Template for Generating and Recognizing Insns
  95. =================================================
  96.    The RTL template is used to define which insns match the particular
  97. pattern and how to find their operands.  For named patterns, the RTL
  98. template also says how to construct an insn from specified operands.
  99.    Construction involves substituting specified operands into a copy
  100. of the template.  Matching involves determining the values that serve
  101. as the operands in the insn being matched.  Both of these activities
  102. are controlled by special expression types that direct matching and
  103. substitution of the operands.
  104. `(match_operand:M N PREDICATE CONSTRAINT)'
  105.      This expression is a placeholder for operand number N of the
  106.      insn.  When constructing an insn, operand number N will be
  107.      substituted at this point.  When matching an insn, whatever
  108.      appears at this position in the insn will be taken as operand
  109.      number N; but it must satisfy PREDICATE or this instruction
  110.      pattern will not match at all.
  111.      Operand numbers must be chosen consecutively counting from zero in
  112.      each instruction pattern.  There may be only one `match_operand'
  113.      expression in the pattern for each operand number.  Usually
  114.      operands are numbered in the order of appearance in
  115.      `match_operand' expressions.
  116.      PREDICATE is a string that is the name of a C function that
  117.      accepts two arguments, an expression and a machine mode.  During
  118.      matching, the function will be called with the putative operand
  119.      as the expression and M as the mode argument (if M is not
  120.      specified, `VOIDmode' will be used, which normally causes
  121.      PREDICATE to accept any mode).  If it returns zero, this
  122.      instruction pattern fails to match.  PREDICATE may be an empty
  123.      string; then it means no test is to be done on the operand, so
  124.      anything which occurs in this position is valid.
  125.      Most of the time, PREDICATE will reject modes other than M--but
  126.      not always.  For example, the predicate `address_operand' uses M
  127.      as the mode of memory ref that the address should be valid for. 
  128.      Many predicates accept `const_int' nodes even though their mode is
  129.      `VOIDmode'.
  130.      CONSTRAINT controls reloading and the choice of the best register
  131.      class to use for a value, as explained later (*note
  132.      Constraints::.).
  133.      People are often unclear on the difference between the constraint
  134.      and the predicate.  The predicate helps decide whether a given
  135.      insn matches the pattern.  The constraint plays no role in this
  136.      decision; instead, it controls various decisions in the case of
  137.      an insn which does match.
  138.      On CISC machines, PREDICATE is most often `"general_operand"'. 
  139.      This function checks that the putative operand is either a
  140.      constant, a register or a memory reference, and that it is valid
  141.      for mode M.
  142.      For an operand that must be a register, PREDICATE should be
  143.      `"register_operand"'.  It would be valid to use
  144.      `"general_operand"', since the reload pass would copy any
  145.      non-register operands through registers, but this would make GNU
  146.      CC do extra work, it would prevent invariant operands (such as
  147.      constant) from being removed from loops, and it would prevent the
  148.      register allocator from doing the best possible job.  On RISC
  149.      machines, it is usually most efficient to allow PREDICATE to
  150.      accept only objects that the constraints allow.
  151.      For an operand that must be a constant, either use
  152.      `"immediate_operand"' for PREDICATE, or make the instruction
  153.      pattern's extra condition require a constant, or both.  You cannot
  154.      expect the constraints to do this work!  If the constraints allow
  155.      only constants, but the predicate allows something else, the
  156.      compiler will crash when that case arises.
  157. `(match_scratch:M N CONSTRAINT)'
  158.      This expression is also a placeholder for operand number N and
  159.      indicates that operand must be a `scratch' or `reg' expression.
  160.      When matching patterns, this is completely equivalent to
  161.           (match_operand:M N "scratch_operand" PRED)
  162.      but, when generating RTL, it produces a (`scratch':M) expression.
  163.      If the last few expressions in a `parallel' are `clobber'
  164.      expressions whose operands are either a hard register or
  165.      `match_scratch', the combiner can add them when necessary.  *Note
  166.      Side Effects::.
  167. `(match_dup N)'
  168.      This expression is also a placeholder for operand number N.  It
  169.      is used when the operand needs to appear more than once in the
  170.      insn.
  171.      In construction, `match_dup' behaves exactly like
  172.      `match_operand': the operand is substituted into the insn being
  173.      constructed.  But in matching, `match_dup' behaves differently. 
  174.      It assumes that operand number N has already been determined by a
  175.      `match_operand' appearing earlier in the recognition template,
  176.      and it matches only an identical-looking expression.
  177. `(match_operator:M N PREDICATE [OPERANDS...])'
  178.      This pattern is a kind of placeholder for a variable RTL
  179.      expression code.
  180.      When constructing an insn, it stands for an RTL expression whose
  181.      expression code is taken from that of operand N, and whose
  182.      operands are constructed from the patterns OPERANDS.
  183.      When matching an expression, it matches an expression if the
  184.      function PREDICATE returns nonzero on that expression *and* the
  185.      patterns OPERANDS match the operands of the expression.
  186.      Suppose that the function `commutative_operator' is defined as
  187.      follows, to match any expression whose operator is one of the
  188.      commutative arithmetic operators of RTL and whose mode is MODE:
  189.           int
  190.           commutative_operator (x, mode)
  191.                rtx x;
  192.                enum machine_mode mode;
  193.           {
  194.             enum rtx_code code = GET_CODE (x);
  195.             if (GET_MODE (x) != mode)
  196.               return 0;
  197.             return GET_RTX_CLASS (code) == 'c' || code == EQ || code == NE;
  198.           }
  199.      Then the following pattern will match any RTL expression
  200.      consisting of a commutative operator applied to two general
  201.      operands:
  202.           (match_operator:SI 3 "commutative_operator"
  203.             [(match_operand:SI 1 "general_operand" "g")
  204.              (match_operand:SI 2 "general_operand" "g")])
  205.      Here the vector `[OPERANDS...]' contains two patterns because the
  206.      expressions to be matched all contain two operands.
  207.      When this pattern does match, the two operands of the commutative
  208.      operator are recorded as operands 1 and 2 of the insn.  (This is
  209.      done by the two instances of `match_operand'.)  Operand 3 of the
  210.      insn will be the entire commutative expression: use `GET_CODE
  211.      (operands[3])' to see which commutative operator was used.
  212.      The machine mode M of `match_operator' works like that of
  213.      `match_operand': it is passed as the second argument to the
  214.      predicate function, and that function is solely responsible for
  215.      deciding whether the expression to be matched "has" that mode.
  216.      When constructing an insn, argument 3 of the gen-function will
  217.      specify the operation (i.e. the expression code) for the
  218.      expression to be made.  It should be an RTL expression, whose
  219.      expression code is copied into a new expression whose operands
  220.      are arguments 1 and 2 of the gen-function.  The subexpressions of
  221.      argument 3 are not used; only its expression code matters.
  222.      When `match_operator' is used in a pattern for matching an insn,
  223.      it usually best if the operand number of the `match_operator' is
  224.      higher than that of the actual operands of the insn.  This
  225.      improves register allocation because the register allocator often
  226.      looks at operands 1 and 2 of insns to see if it can do register
  227.      tying.
  228.      There is no way to specify constraints in `match_operator'.  The
  229.      operand of the insn which corresponds to the `match_operator'
  230.      never has any constraints because it is never reloaded as a whole. 
  231.      However, if parts of its OPERANDS are matched by `match_operand'
  232.      patterns, those parts may have constraints of their own.
  233. `(address (match_operand:M N "address_operand" ""))'
  234.      This complex of expressions is a placeholder for an operand number
  235.      N in a "load address" instruction: an operand which specifies a
  236.      memory location in the usual way, but for which the actual operand
  237.      value used is the address of the location, not the contents of the
  238.      location.
  239.      `address' expressions never appear in RTL code, only in machine
  240.      descriptions.  And they are used only in machine descriptions
  241.      that do not use the operand constraint feature.  When operand
  242.      constraints are in use, the letter `p' in the constraint serves
  243.      this purpose.
  244.      M is the machine mode of the *memory location being addressed*,
  245.      not the machine mode of the address itself.  That mode is always
  246.      the same on a given target machine (it is `Pmode', which normally
  247.      is `SImode'), so there is no point in mentioning it; thus, no
  248.      machine mode is written in the `address' expression.  If some day
  249.      support is added for machines in which addresses of different
  250.      kinds of objects appear differently or are used differently (such
  251.      as the PDP-10), different formats would perhaps need different
  252.      machine modes and these modes might be written in the `address'
  253.      expression.
  254. File: gcc.info,  Node: Output Template,  Next: Output Statement,  Prev: RTL Template,  Up: Machine Desc
  255. Output Templates and Operand Substitution
  256. =========================================
  257.    The "output template" is a string which specifies how to output the
  258. assembler code for an instruction pattern.  Most of the template is a
  259. fixed string which is output literally.  The character `%' is used to
  260. specify where to substitute an operand; it can also be used to
  261. identify places where different variants of the assembler require
  262. different syntax.
  263.    In the simplest case, a `%' followed by a digit N says to output
  264. operand N at that point in the string.
  265.    `%' followed by a letter and a digit says to output an operand in an
  266. alternate fashion.  Four letters have standard, built-in meanings
  267. described below.  The machine description macro `PRINT_OPERAND' can
  268. define additional letters with nonstandard meanings.
  269.    `%cDIGIT' can be used to substitute an operand that is a constant
  270. value without the syntax that normally indicates an immediate operand.
  271.    `%nDIGIT' is like `%cDIGIT' except that the value of the constant
  272. is negated before printing.
  273.    `%aDIGIT' can be used to substitute an operand as if it were a
  274. memory reference, with the actual operand treated as the address. 
  275. This may be useful when outputting a "load address" instruction,
  276. because often the assembler syntax for such an instruction requires
  277. you to write the operand as if it were a memory reference.
  278.    `%lDIGIT' is used to substitute a `label_ref' into a jump
  279. instruction.
  280.    `%' followed by a punctuation character specifies a substitution
  281. that does not use an operand.  Only one case is standard: `%%' outputs
  282. a `%' into the assembler code.  Other nonstandard cases can be defined
  283. in the `PRINT_OPERAND' macro.  You must also define which punctuation
  284. characters are valid with the `PRINT_OPERAND_PUNCT_VALID_P' macro.
  285.    The template may generate multiple assembler instructions.  Write
  286. the text for the instructions, with `\;' between them.
  287.    When the RTL contains two operands which are required by constraint
  288. to match each other, the output template must refer only to the
  289. lower-numbered operand.  Matching operands are not always identical,
  290. and the rest of the compiler arranges to put the proper RTL expression
  291. for printing into the lower-numbered operand.
  292.    One use of nonstandard letters or punctuation following `%' is to
  293. distinguish between different assembler languages for the same
  294. machine; for example, Motorola syntax versus MIT syntax for the 68000.
  295.  Motorola syntax requires periods in most opcode names, while MIT
  296. syntax does not.  For example, the opcode `movel' in MIT syntax is
  297. `move.l' in Motorola syntax.  The same file of patterns is used for
  298. both kinds of output syntax, but the character sequence `%.' is used
  299. in each place where Motorola syntax wants a period.  The
  300. `PRINT_OPERAND' macro for Motorola syntax defines the sequence to
  301. output a period; the macro for MIT syntax defines it to do nothing.
  302. File: gcc.info,  Node: Output Statement,  Next: Constraints,  Prev: Output Template,  Up: Machine Desc
  303. C Statements for Generating Assembler Output
  304. ============================================
  305.    Often a single fixed template string cannot produce correct and
  306. efficient assembler code for all the cases that are recognized by a
  307. single instruction pattern.  For example, the opcodes may depend on
  308. the kinds of operands; or some unfortunate combinations of operands
  309. may require extra machine instructions.
  310.    If the output control string starts with a `@', then it is actually
  311. a series of templates, each on a separate line.  (Blank lines and
  312. leading spaces and tabs are ignored.)  The templates correspond to the
  313. pattern's constraint alternatives (*note Multi-Alternative::.).  For
  314. example, if a target machine has a two-address add instruction `addr'
  315. to add into a register and another `addm' to add a register to memory,
  316. you might write this pattern:
  317.      (define_insn "addsi3"
  318.        [(set (match_operand:SI 0 "general_operand" "r,m")
  319.              (plus:SI (match_operand:SI 1 "general_operand" "0,0")
  320.                       (match_operand:SI 2 "general_operand" "g,r")))]
  321.        ""
  322.        "@
  323.         addr %1,%0
  324.         addm %1,%0")
  325.    If the output control string starts with a `*', then it is not an
  326. output template but rather a piece of C program that should compute a
  327. template.  It should execute a `return' statement to return the
  328. template-string you want.  Most such templates use C string literals,
  329. which require doublequote characters to delimit them.  To include these
  330. doublequote characters in the string, prefix each one with `\'.
  331.    The operands may be found in the array `operands', whose C data type
  332. is `rtx []'.
  333.    It is very common to select different ways of generating assembler
  334. code based on whether an immediate operand is within a certain range. 
  335. Be careful when doing this, because the result of `INTVAL' is an
  336. integer on the host machine.  If the host machine has more bits in an
  337. `int' than the target machine has in the mode in which the constant
  338. will be used, then some of the bits you get from `INTVAL' will be
  339. superfluous.  For proper results, you must carefully disregard the
  340. values of those bits.
  341.    It is possible to output an assembler instruction and then go on to
  342. output or compute more of them, using the subroutine
  343. `output_asm_insn'.  This receives two arguments: a template-string and
  344. a vector of operands.  The vector may be `operands', or it may be
  345. another array of `rtx' that you declare locally and initialize
  346. yourself.
  347.    When an insn pattern has multiple alternatives in its constraints,
  348. often the appearance of the assembler code is determined mostly by
  349. which alternative was matched.  When this is so, the C code can test
  350. the variable `which_alternative', which is the ordinal number of the
  351. alternative that was actually satisfied (0 for the first, 1 for the
  352. second alternative, etc.).
  353.    For example, suppose there are two opcodes for storing zero,
  354. `clrreg' for registers and `clrmem' for memory locations.  Here is how
  355. a pattern could use `which_alternative' to choose between them:
  356.      (define_insn ""
  357.        [(set (match_operand:SI 0 "general_operand" "r,m")
  358.              (const_int 0))]
  359.        ""
  360.        "*
  361.        return (which_alternative == 0
  362.                ? \"clrreg %0\" : \"clrmem %0\");
  363.        ")
  364.    The example above, where the assembler code to generate was
  365. *solely* determined by the alternative, could also have been specified
  366. as follows, having the output control string start with a `@':
  367.      (define_insn ""
  368.        [(set (match_operand:SI 0 "general_operand" "r,m")
  369.              (const_int 0))]
  370.        ""
  371.        "@
  372.         clrreg %0
  373.         clrmem %0")
  374. File: gcc.info,  Node: Constraints,  Next: Standard Names,  Prev: Output Statement,  Up: Machine Desc
  375. Operand Constraints
  376. ===================
  377.    Each `match_operand' in an instruction pattern can specify a
  378. constraint for the type of operands allowed.  Constraints can say
  379. whether an operand may be in a register, and which kinds of register;
  380. whether the operand can be a memory reference, and which kinds of
  381. address; whether the operand may be an immediate constant, and which
  382. possible values it may have.  Constraints can also require two
  383. operands to match.
  384. * Menu:
  385. * Simple Constraints::  Basic use of constraints.
  386. * Multi-Alternative::   When an insn has two alternative constraint-patterns.
  387. * Class Preferences::   Constraints guide which hard register to put things in.
  388. * Modifiers::           More precise control over effects of constraints.
  389. * No Constraints::      Describing a clean machine without constraints.
  390. File: gcc.info,  Node: Simple Constraints,  Next: Multi-Alternative,  Prev: Constraints,  Up: Constraints
  391. Simple Constraints
  392. ------------------
  393.    The simplest kind of constraint is a string full of letters, each of
  394. which describes one kind of operand that is permitted.  Here are the
  395. letters that are allowed:
  396.      A memory operand is allowed, with any kind of address that the
  397.      machine supports in general.
  398.      A memory operand is allowed, but only if the address is
  399.      "offsettable".  This means that adding a small integer (actually,
  400.      the width in bytes of the operand, as determined by its machine
  401.      mode) may be added to the address and the result is also a valid
  402.      memory address.
  403.      For example, an address which is constant is offsettable; so is an
  404.      address that is the sum of a register and a constant (as long as a
  405.      slightly larger constant is also within the range of
  406.      address-offsets supported by the machine); but an autoincrement
  407.      or autodecrement address is not offsettable.  More complicated
  408.      indirect/indexed addresses may or may not be offsettable
  409.      depending on the other addressing modes that the machine supports.
  410.      Note that in an output operand which can be matched by another
  411.      operand, the constraint letter `o' is valid only when accompanied
  412.      by both `<' (if the target machine has predecrement addressing)
  413.      and `>' (if the target machine has preincrement addressing).
  414.      A memory operand that is not offsettable.  In other words,
  415.      anything that would fit the `m' constraint but not the `o'
  416.      constraint.
  417.      A memory operand with autodecrement addressing (either
  418.      predecrement or postdecrement) is allowed.
  419.      A memory operand with autoincrement addressing (either
  420.      preincrement or postincrement) is allowed.
  421.      A register operand is allowed provided that it is in a general
  422.      register.
  423. `d', `a', `f', ...
  424.      Other letters can be defined in machine-dependent fashion to
  425.      stand for particular classes of registers.  `d', `a' and `f' are
  426.      defined on the 68000/68020 to stand for data, address and floating
  427.      point registers.
  428.      An immediate integer operand (one with constant value) is allowed. 
  429.      This includes symbolic constants whose values will be known only
  430.      at assembly time.
  431.      An immediate integer operand with a known numeric value is
  432.      allowed.  Many systems cannot support assembly-time constants for
  433.      operands less than a word wide.  Constraints for these operands
  434.      should use `n' rather than `i'.
  435. `I', `J', `K', ... `P'
  436.      Other letters in the range `I' through `P' may be defined in a
  437.      machine-dependent fashion to permit immediate integer operands
  438.      with explicit integer values in specified ranges.  For example,
  439.      on the 68000, `I' is defined to stand for the range of values 1
  440.      to 8.  This is the range permitted as a shift count in the shift
  441.      instructions.
  442.      An immediate floating operand (expression code `const_double') is
  443.      allowed, but only if the target floating point format is the same
  444.      as that of the host machine (on which the compiler is running).
  445.      An immediate floating operand (expression code `const_double') is
  446.      allowed.
  447. `G', `H'
  448.      `G' and `H' may be defined in a machine-dependent fashion to
  449.      permit immediate floating operands in particular ranges of values.
  450.      An immediate integer operand whose value is not an explicit
  451.      integer is allowed.
  452.      This might appear strange; if an insn allows a constant operand
  453.      with a value not known at compile time, it certainly must allow
  454.      any known value.  So why use `s' instead of `i'?  Sometimes it
  455.      allows better code to be generated.
  456.      For example, on the 68000 in a fullword instruction it is
  457.      possible to use an immediate operand; but if the immediate value
  458.      is between -128 and 127, better code results from loading the
  459.      value into a register and using the register.  This is because
  460.      the load into the register can be done with a `moveq'
  461.      instruction.  We arrange for this to happen by defining the
  462.      letter `K' to mean "any integer outside the range -128 to 127",
  463.      and then specifying `Ks' in the operand constraints.
  464.      Any register, memory or immediate integer operand is allowed,
  465.      except for registers that are not general registers.
  466.      Any operand whatsoever is allowed, even if it does not satisfy
  467.      `general_operand'.  This is normally used in the constraint of a
  468.      `match_scratch' when certain alternatives will not actually
  469.      require a scratch register.
  470. `0', `1', `2', ... `9'
  471.      An operand that matches the specified operand number is allowed. 
  472.      If a digit is used together with letters within the same
  473.      alternative, the digit should come last.
  474.      This is called a "matching constraint" and what it really means is
  475.      that the assembler has only a single operand that fills two roles
  476.      considered separate in the RTL insn.  For example, an add insn
  477.      has two input operands and one output operand in the RTL, but on
  478.      most machines an add instruction really has only two operands,
  479.      one of them an input-output operand.
  480.      Matching constraints work only in circumstances like that add
  481.      insn.  More precisely, the two operands that match must include
  482.      one input-only operand and one output-only operand.  Moreover,
  483.      the digit must be a smaller number than the number of the operand
  484.      that uses it in the constraint.
  485.      For operands to match in a particular case usually means that they
  486.      are identical-looking RTL expressions.  But in a few special cases
  487.      specific kinds of dissimilarity are allowed.  For example, `*x'
  488.      as an input operand will match `*x++' as an output operand.  For
  489.      proper results in such cases, the output template should always
  490.      use the output-operand's number when printing the operand.
  491.      An operand that is a valid memory address is allowed.  This is
  492.      for "load address" and "push address" instructions.
  493.      `p' in the constraint must be accompanied by `address_operand' as
  494.      the predicate in the `match_operand'.  This predicate interprets
  495.      the mode specified in the `match_operand' as the mode of the
  496.      memory reference for which the address would be valid.
  497. `Q', `R', `S', ... `U'
  498.      Letters in the range `Q' through `U' may be defined in a
  499.      machine-dependent fashion to stand for arbitrary operand types. 
  500.      The machine description macro `EXTRA_CONSTRAINT' is passed the
  501.      operand as its first argument and the constraint letter as its
  502.      second operand.
  503.      A typical use for this would be to distinguish certain types of
  504.      memory references that affect other insn operands.
  505.      Do not define these constraint letters to accept register
  506.      references (`reg'); the reload pass does not expect this and
  507.      would not handle it properly.
  508.    In order to have valid assembler code, each operand must satisfy
  509. its constraint.  But a failure to do so does not prevent the pattern
  510. from applying to an insn.  Instead, it directs the compiler to modify
  511. the code so that the constraint will be satisfied.  Usually this is
  512. done by copying an operand into a register.
  513.    Contrast, therefore, the two instruction patterns that follow:
  514.      (define_insn ""
  515.        [(set (match_operand:SI 0 "general_operand" "r")
  516.              (plus:SI (match_dup 0)
  517.                       (match_operand:SI 1 "general_operand" "r")))]
  518.        ""
  519.        "...")
  520. which has two operands, one of which must appear in two places, and
  521.      (define_insn ""
  522.        [(set (match_operand:SI 0 "general_operand" "r")
  523.              (plus:SI (match_operand:SI 1 "general_operand" "0")
  524.                       (match_operand:SI 2 "general_operand" "r")))]
  525.        ""
  526.        "...")
  527. which has three operands, two of which are required by a constraint to
  528. be identical.  If we are considering an insn of the form
  529.      (insn N PREV NEXT
  530.        (set (reg:SI 3)
  531.             (plus:SI (reg:SI 6) (reg:SI 109)))
  532.        ...)
  533. the first pattern would not apply at all, because this insn does not
  534. contain two identical subexpressions in the right place.  The pattern
  535. would say, "That does not look like an add instruction; try other
  536. patterns." The second pattern would say, "Yes, that's an add
  537. instruction, but there is something wrong with it."  It would direct
  538. the reload pass of the compiler to generate additional insns to make
  539. the constraint true.  The results might look like this:
  540.      (insn N2 PREV N
  541.        (set (reg:SI 3) (reg:SI 6))
  542.        ...)
  543.      
  544.      (insn N N2 NEXT
  545.        (set (reg:SI 3)
  546.             (plus:SI (reg:SI 3) (reg:SI 109)))
  547.        ...)
  548.    It is up to you to make sure that each operand, in each pattern, has
  549. constraints that can handle any RTL expression that could be present
  550. for that operand.  (When multiple alternatives are in use, each
  551. pattern must, for each possible combination of operand expressions,
  552. have at least one alternative which can handle that combination of
  553. operands.)  The constraints don't need to *allow* any possible
  554. operand--when this is the case, they do not constrain--but they must
  555. at least point the way to reloading any possible operand so that it
  556. will fit.
  557.    * If the constraint accepts whatever operands the predicate permits,
  558.      there is no problem: reloading is never necessary for this
  559.      operand.
  560.      For example, an operand whose constraints permit everything except
  561.      registers is safe provided its predicate rejects registers.
  562.      An operand whose predicate accepts only constant values is safe
  563.      provided its constraints include the letter `i'.  If any possible
  564.      constant value is accepted, then nothing less than `i' will do;
  565.      if the predicate is more selective, then the constraints may also
  566.      be more selective.
  567.    * Any operand expression can be reloaded by copying it into a
  568.      register.  So if an operand's constraints allow some kind of
  569.      register, it is certain to be safe.  It need not permit all
  570.      classes of registers; the compiler knows how to copy a register
  571.      into another register of the proper class in order to make an
  572.      instruction valid.
  573.    * A nonoffsettable memory reference can be reloaded by copying the
  574.      address into a register.  So if the constraint uses the letter
  575.      `o', all memory references are taken care of.
  576.    * A constant operand can be reloaded by allocating space in memory
  577.      to hold it as preinitialized data.  Then the memory reference can
  578.      be used in place of the constant.  So if the constraint uses the
  579.      letters `o' or `m', constant operands are not a problem.
  580.    * If the constraint permits a constant and a pseudo register used
  581.      in an insn was not allocated to a hard register and is equivalent
  582.      to a constant, the register will be replaced with the constant. 
  583.      If the predicate does not permit a constant and the insn is
  584.      re-recognized for some reason, the compiler will crash.  Thus the
  585.      predicate must always recognize any objects allowed by the
  586.      constraint.
  587.    If the operand's predicate can recognize registers, but the
  588. constraint does not permit them, it can make the compiler crash.  When
  589. this operand happens to be a register, the reload pass will be
  590. stymied, because it does not know how to copy a register temporarily
  591. into memory.
  592. File: gcc.info,  Node: Multi-Alternative,  Next: Class Preferences,  Prev: Simple Constraints,  Up: Constraints
  593. Multiple Alternative Constraints
  594. --------------------------------
  595.    Sometimes a single instruction has multiple alternative sets of
  596. possible operands.  For example, on the 68000, a logical-or
  597. instruction can combine register or an immediate value into memory, or
  598. it can combine any kind of operand into a register; but it cannot
  599. combine one memory location into another.
  600.    These constraints are represented as multiple alternatives.  An
  601. alternative can be described by a series of letters for each operand. 
  602. The overall constraint for an operand is made from the letters for
  603. this operand from the first alternative, a comma, the letters for this
  604. operand from the second alternative, a comma, and so on until the last
  605. alternative.  Here is how it is done for fullword logical-or on the
  606. 68000:
  607.      (define_insn "iorsi3"
  608.        [(set (match_operand:SI 0 "general_operand" "=m,d")
  609.              (ior:SI (match_operand:SI 1 "general_operand" "%0,0")
  610.                      (match_operand:SI 2 "general_operand" "dKs,dmKs")))]
  611.        ...)
  612.    The first alternative has `m' (memory) for operand 0, `0' for
  613. operand 1 (meaning it must match operand 0), and `dKs' for operand 2. 
  614. The second alternative has `d' (data register) for operand 0, `0' for
  615. operand 1, and `dmKs' for operand 2.  The `=' and `%' in the
  616. constraints apply to all the alternatives; their meaning is explained
  617. in the next section (*note Class Preferences::.).
  618.    If all the operands fit any one alternative, the instruction is
  619. valid.  Otherwise, for each alternative, the compiler counts how many
  620. instructions must be added to copy the operands so that that
  621. alternative applies.  The alternative requiring the least copying is
  622. chosen.  If two alternatives need the same amount of copying, the one
  623. that comes first is chosen.  These choices can be altered with the `?'
  624. and `!' characters:
  625.      Disparage slightly the alternative that the `?' appears in, as a
  626.      choice when no alternative applies exactly.  The compiler regards
  627.      this alternative as one unit more costly for each `?' that appears
  628.      in it.
  629.      Disparage severely the alternative that the `!' appears in.  This
  630.      alternative can still be used if it fits without reloading, but
  631.      if reloading is needed, some other alternative will be used.
  632.    When an insn pattern has multiple alternatives in its constraints,
  633. often the appearance of the assembler code is determined mostly by
  634. which alternative was matched.  When this is so, the C code for
  635. writing the assembler code can use the variable `which_alternative',
  636. which is the ordinal number of the alternative that was actually
  637. satisfied (0 for the first, 1 for the second alternative, etc.). 
  638. *Note Output Statement::.
  639. File: gcc.info,  Node: Class Preferences,  Next: Modifiers,  Prev: Multi-Alternative,  Up: Constraints
  640. Register Class Preferences
  641. --------------------------
  642.    The operand constraints have another function: they enable the
  643. compiler to decide which kind of hardware register a pseudo register
  644. is best allocated to.  The compiler examines the constraints that
  645. apply to the insns that use the pseudo register, looking for the
  646. machine-dependent letters such as `d' and `a' that specify classes of
  647. registers.  The pseudo register is put in whichever class gets the
  648. most "votes".  The constraint letters `g' and `r' also vote: they vote
  649. in favor of a general register.  The machine description says which
  650. registers are considered general.
  651.    Of course, on some machines all registers are equivalent, and no
  652. register classes are defined.  Then none of this complexity is
  653. relevant.
  654. File: gcc.info,  Node: Modifiers,  Next: No Constraints,  Prev: Class Preferences,  Up: Constraints
  655. Constraint Modifier Characters
  656. ------------------------------
  657.      Means that this operand is write-only for this instruction: the
  658.      previous value is discarded and replaced by output data.
  659.      Means that this operand is both read and written by the
  660.      instruction.
  661.      When the compiler fixes up the operands to satisfy the
  662.      constraints, it needs to know which operands are inputs to the
  663.      instruction and which are outputs from it.  `=' identifies an
  664.      output; `+' identifies an operand that is both input and output;
  665.      all other operands are assumed to be input only.
  666.      Means (in a particular alternative) that this operand is written
  667.      before the instruction is finished using the input operands. 
  668.      Therefore, this operand may not lie in a register that is used as
  669.      an input operand or as part of any memory address.
  670.      `&' applies only to the alternative in which it is written.  In
  671.      constraints with multiple alternatives, sometimes one alternative
  672.      requires `&' while others do not.  See, for example, the `movdf'
  673.      insn of the 68000.
  674.      `&' does not obviate the need to write `='.
  675.      Declares the instruction to be commutative for this operand and
  676.      the following operand.  This means that the compiler may
  677.      interchange the two operands if that is the cheapest way to make
  678.      all operands fit the constraints.  This is often used in patterns
  679.      for addition instructions that really have only two operands: the
  680.      result must go in one of the arguments.  Here for example, is how
  681.      the 68000 halfword-add instruction is defined:
  682.           (define_insn "addhi3"
  683.             [(set (match_operand:HI 0 "general_operand" "=m,r")
  684.                (plus:HI (match_operand:HI 1 "general_operand" "%0,0")
  685.                         (match_operand:HI 2 "general_operand" "di,g")))]
  686.             ...)
  687.      Says that all following characters, up to the next comma, are to
  688.      be ignored as a constraint.  They are significant only for
  689.      choosing register preferences.
  690.      Says that the following character should be ignored when choosing
  691.      register preferences.  `*' has no effect on the meaning of the
  692.      constraint as a constraint, and no effect on reloading.
  693.      Here is an example: the 68000 has an instruction to sign-extend a
  694.      halfword in a data register, and can also sign-extend a value by
  695.      copying it into an address register.  While either kind of
  696.      register is acceptable, the constraints on an address-register
  697.      destination are less strict, so it is best if register allocation
  698.      makes an address register its goal.  Therefore, `*' is used so
  699.      that the `d' constraint letter (for data register) is ignored
  700.      when computing register preferences.
  701.           (define_insn "extendhisi2"
  702.             [(set (match_operand:SI 0 "general_operand" "=*d,a")
  703.                   (sign_extend:SI
  704.                    (match_operand:HI 1 "general_operand" "0,g")))]
  705.             ...)
  706. File: gcc.info,  Node: No Constraints,  Prev: Modifiers,  Up: Constraints
  707. Not Using Constraints
  708. ---------------------
  709.    Some machines are so clean that operand constraints are not
  710. required.  For example, on the Vax, an operand valid in one context is
  711. valid in any other context.  On such a machine, every operand
  712. constraint would be `g', excepting only operands of "load address"
  713. instructions which are written as if they referred to a memory
  714. location's contents but actual refer to its address.  They would have
  715. constraint `p'.
  716.    For such machines, instead of writing `g' and `p' for all the
  717. constraints, you can choose to write a description with empty
  718. constraints.  Then you write `""' for the constraint in every
  719. `match_operand'.  Address operands are identified by writing an
  720. `address' expression around the `match_operand', not by their
  721. constraints.
  722.    When the machine description has just empty constraints, certain
  723. parts of compilation are skipped, making the compiler faster.  However,
  724. few machines actually do not need constraints; all machine descriptions
  725. now in existence use constraints.
  726.