home *** CD-ROM | disk | FTP | other *** search
/ OS/2 Shareware BBS: 22 gnu / 22-gnu.zip / gmp202.zip / mpn / generic / bdivmod.c < prev    next >
C/C++ Source or Header  |  1996-05-24  |  4KB  |  130 lines

  1. /* mpn/bdivmod.c: mpn_bdivmod for computing U/V mod 2^d.
  2.  
  3. Copyright (C) 1991, 1993, 1994, 1995, 1996 Free Software Foundation, Inc.
  4.  
  5. This file is part of the GNU MP Library.
  6.  
  7. The GNU MP Library is free software; you can redistribute it and/or modify
  8. it under the terms of the GNU Library General Public License as published by
  9. the Free Software Foundation; either version 2 of the License, or (at your
  10. option) any later version.
  11.  
  12. The GNU MP Library is distributed in the hope that it will be useful, but
  13. WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
  14. or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Library General Public
  15. License for more details.
  16.  
  17. You should have received a copy of the GNU Library General Public License
  18. along with the GNU MP Library; see the file COPYING.LIB.  If not, write to
  19. the Free Software Foundation, Inc., 59 Temple Place - Suite 330, Boston,
  20. MA 02111-1307, USA. */
  21.  
  22. /* q_high = mpn_bdivmod (qp, up, usize, vp, vsize, d).
  23.  
  24.    Puts the low d/BITS_PER_MP_LIMB limbs of Q = U / V mod 2^d at qp, and
  25.    returns the high d%BITS_PER_MP_LIMB bits of Q as the result.
  26.  
  27.    Also, U - Q * V mod 2^(usize*BITS_PER_MP_LIMB) is placed at up.  Since the
  28.    low d/BITS_PER_MP_LIMB limbs of this difference are zero, the code allows
  29.    the limb vectors at qp to overwrite the low limbs at up, provided qp <= up.
  30.  
  31.    Preconditions:
  32.    1.  V is odd.
  33.    2.  usize * BITS_PER_MP_LIMB >= d.
  34.    3.  If Q and U overlap, qp <= up.
  35.  
  36.    Ken Weber (kweber@mat.ufrgs.br, kweber@mcs.kent.edu)
  37.  
  38.    Funding for this work has been partially provided by Conselho Nacional
  39.    de Desenvolvimento Cienti'fico e Tecnolo'gico (CNPq) do Brazil, Grant
  40.    301314194-2, and was done while I was a visiting reseacher in the Instituto
  41.    de Matema'tica at Universidade Federal do Rio Grande do Sul (UFRGS).
  42.  
  43.    References:
  44.        T. Jebelean, An algorithm for exact division, Journal of Symbolic
  45.        Computation, v. 15, 1993, pp. 169-180.
  46.  
  47.        K. Weber, The accelerated integer GCD algorithm, ACM Transactions on
  48.        Mathematical Software, v. 21 (March), 1995, pp. 111-122.  */
  49.  
  50. #include "gmp.h"
  51. #include "gmp-impl.h"
  52. #include "longlong.h"
  53.  
  54. mp_limb_t
  55. #if __STDC__
  56. mpn_bdivmod (mp_ptr qp, mp_ptr up, mp_size_t usize,
  57.          mp_srcptr vp, mp_size_t vsize, unsigned long int d)
  58. #else
  59. mpn_bdivmod (qp, up, usize, vp, vsize, d)
  60.      mp_ptr qp;
  61.      mp_ptr up;
  62.      mp_size_t usize;
  63.      mp_srcptr vp;
  64.      mp_size_t vsize;
  65.      unsigned long int d;
  66. #endif
  67. {
  68.   /* Cache for v_inv is used to make mpn_accelgcd faster.  */
  69.   static mp_limb_t previous_low_vlimb = 0;
  70.   static mp_limb_t v_inv;        /* 1/V mod 2^BITS_PER_MP_LIMB.  */
  71.  
  72.   if (vp[0] != previous_low_vlimb)    /* Cache miss; compute v_inv.  */
  73.     {
  74.       mp_limb_t v = previous_low_vlimb = vp[0];
  75.       mp_limb_t make_zero = 1;
  76.       mp_limb_t two_i = 1;
  77.       v_inv = 0;
  78.       do
  79.     {
  80.       while ((two_i & make_zero) == 0)
  81.         two_i <<= 1, v <<= 1;
  82.       v_inv += two_i;
  83.       make_zero -= v;
  84.     }
  85.       while (make_zero);
  86.     }
  87.  
  88.   /* Need faster computation for some common cases in mpn_accelgcd.  */
  89.   if (usize == 2 && vsize == 2 &&
  90.       (d == BITS_PER_MP_LIMB || d == 2*BITS_PER_MP_LIMB))
  91.     {
  92.       mp_limb_t hi, lo;
  93.       mp_limb_t q = up[0] * v_inv;
  94.       umul_ppmm (hi, lo, q, vp[0]);
  95.       up[0] = 0, up[1] -= hi + q*vp[1], qp[0] = q;
  96.       if (d == 2*BITS_PER_MP_LIMB)
  97.     q = up[1] * v_inv, up[1] = 0, qp[1] = q;
  98.       return 0;
  99.     }
  100.  
  101.   /* Main loop.  */
  102.   while (d >= BITS_PER_MP_LIMB)
  103.     {
  104.       mp_limb_t q = up[0] * v_inv;
  105.       mp_limb_t b = mpn_submul_1 (up, vp, MIN (usize, vsize), q);
  106.       if (usize > vsize)
  107.     mpn_sub_1 (up + vsize, up + vsize, usize - vsize, b);
  108.       d -= BITS_PER_MP_LIMB;
  109.       up += 1, usize -= 1;
  110.       *qp++ = q;
  111.     }
  112.  
  113.   if (d)
  114.     {
  115.       mp_limb_t b;
  116.       mp_limb_t q = (up[0] * v_inv) & (((mp_limb_t)1<<d) - 1);
  117.       switch (q)
  118.     {
  119.       case 0:  return 0;
  120.       case 1:  b = mpn_sub_n (up, up, vp, MIN (usize, vsize));   break;
  121.       default: b = mpn_submul_1 (up, vp, MIN (usize, vsize), q); break;
  122.     }
  123.       if (usize > vsize)
  124.     mpn_sub_1 (up + vsize, up + vsize, usize - vsize, b);
  125.       return q;
  126.     }
  127.  
  128.   return 0;
  129. }
  130.