home *** CD-ROM | disk | FTP | other *** search
/ OS/2 Shareware BBS: 10 Tools / 10-Tools.zip / crypl200.zip / BNLIB / LBN80386.H < prev    next >
C/C++ Source or Header  |  1996-05-16  |  4KB  |  124 lines

  1. /*
  2.  * lbn80386.h - This file defines the interfaces to the 80386
  3.  * assembly primitives.  It is intended to be included in "lbn.h"
  4.  * via the "#include BNINCLUDE" mechanism.
  5.  */
  6.  
  7. #define BN_LITTLE_ENDIAN 1
  8.  
  9. /* MS-DOS needs the calling convention described to it. */
  10. #ifdef unix
  11. #define CDECL /*nothing*/
  12. #else
  13. #define CDECL __cdecl
  14. #endif
  15.  
  16. #ifdef __cplusplus
  17. extern "C" {
  18. #endif
  19.  
  20. /* Function prototypes for the asm routines */
  21. void CDECL
  22. lbnMulN1_32(unsigned long *out, unsigned long const *in,
  23.             unsigned len, unsigned long k);
  24. #define lbnMulN1_32 lbnMulN1_32
  25.             
  26. unsigned long CDECL
  27. lbnMulAdd1_32(unsigned long *out, unsigned long const *in,
  28.               unsigned len, unsigned long k);
  29. #define lbnMulAdd1_32 lbnMulAdd1_32
  30.        
  31. unsigned long CDECL
  32. lbnMulSub1_32(unsigned long *out, unsigned long const *in,
  33.               unsigned len, unsigned long k);
  34. #define lbnMulSub1_32 lbnMulSub1_32
  35.  
  36. unsigned long CDECL
  37. lbnDiv21_32(unsigned long *q, unsigned long nh, unsigned long nl,
  38.             unsigned long d);
  39. #define lbnDiv21_32 lbnDiv21_32
  40.  
  41. unsigned CDECL
  42. lbnModQ_32(unsigned long const *n, unsigned len, unsigned long d);
  43. #define lbnModQ_32 lbnModQ_32
  44.  
  45. #ifdef __cplusplus
  46. }
  47. #endif
  48.  
  49.  
  50. #if __GNUC__
  51. /*
  52.  * Use the (massively cool) GNU inline-assembler extension to define
  53.  * inline expansions for various operations.
  54.  *
  55.  * The massively cool part is that the assembler can have inputs
  56.  * and outputs, and you specify the operands and which effective
  57.  * addresses are legal and they get substituted into the code.
  58.  * (For example, some of the code requires a zero.  Rather than
  59.  * specify an immediate constant, the expansion specifies an operand
  60.  * of zero which can be in various places.  This lets GCC use an
  61.  * immediate zero, or a register which contains zero if it's available.)
  62.  *
  63.  * The syntax is asm("asm_code" : outputs : inputs : trashed)
  64.  * %0, %1 and so on in the asm code are substituted by the operands
  65.  * in left-to-right order (outputs, then inputs).
  66.  * The operands contain constraint strings and values to use.
  67.  * Outputs must be lvalues, inputs may be rvalues.  In the constraints:
  68.  * "a" means that the operand must be in eax.
  69.  * "d" means that the operand must be in edx.
  70.  * "g" means that the operand may be any effective address.
  71.  * "=" means that the operand is assigned to.
  72.  * "%" means that this operand and the following one may be
  73.  *     interchanged if desirable.
  74.  * "bcDSmn" means that the operand must be in ebx, ecx, esi, edi, memory,
  75.  *          or an immediate constant.  (This is almost the same as "g"
  76.  *          but allowing it in eax wouldn't help because x is already
  77.  *          assigned there, and it must not be in edx, since edx is
  78.  *          overwritten by the multiply before a and b are read.)
  79.  *
  80.  * Note that GCC uses AT&T assembler syntax, which is rather
  81.  * different from Intel syntax.  The length (b, w or l) of the
  82.  * operation is appended to the opcode, and the *second* operand
  83.  * is the destination, not the first.  Finally, the register names
  84.  * are all preceded with "%".  (Doubled here because % is a
  85.  * magic character.)
  86.  */
  87.  
  88. /* (ph<<32) + pl = x*y */
  89. #define mul32_ppmm(ph,pl,x,y)    \
  90.     __asm__("mull %3" : "=d"(ph), "=a"(pl) : "%a"(x), "g"(y))
  91.  
  92. /* (ph<<32) + pl = x*y + a */
  93. #define mul32_ppmma(ph,pl,x,y,a)    \
  94.     __asm__("mull %3\n\t"        \
  95.             "addl %4,%%eax\n\t"    \
  96.             "adcl %5,%%edx"        \
  97.             : "=&d"(ph), "=a"(pl)    \
  98.             : "%a"(x), "g"(y), "bcDSmn"(a), "bcDSmn"(0))
  99.  
  100. /* (ph<<32) + pl = x*y + a + b */
  101. #define mul32_ppmmaa(ph,pl,x,y,a,b)    \
  102.     __asm__("mull %3\n\t"        \
  103.             "addl %4,%%eax\n\t"    \
  104.             "adcl %6,%%edx\n\t"    \
  105.             "addl %5,%%eax\n\t"    \
  106.             "adcl %6,%%edx"        \
  107.             : "=&d"(ph), "=a"(pl)    \
  108.             : "%a"(x), "g"(y), "%bcDSmn"(a), "bcDSmn"(b), "bcDSmn"(0))
  109.  
  110. /* q = ((nh<<32) + nl) / d, return remainder.  nh guaranteed < d. */
  111. #undef lbnDiv21_32
  112. #define lbnDiv21_32(q,nh,nl,d)    \
  113.     ({unsigned _;    \
  114.       __asm__("divl %4" : "=d"(_), "=a"(*q)    : "d"(nh), "a"(nl), "g"(d)); \
  115.       _;})
  116.  
  117. /* No quotient, just return remainder ((nh<<32) + nl) % d */
  118. #define lbnMod21_32(nh,nl,d)    \
  119.     ({unsigned _;    \
  120.       __asm__("divl %3" : "=d"(_) : "d"(nh), "a"(nl), "g"(d) : "ax"); \
  121.       _;})
  122.  
  123. #endif /* __GNUC__ */
  124.