home *** CD-ROM | disk | FTP | other *** search
/ InfoMagic Source Code 1993 July / THE_SOURCE_CODE_CD_ROM.iso / bsd_srcs / lib / libc / vax / stdlib / atof.s < prev    next >
Encoding:
Text File  |  1991-04-12  |  11.4 KB  |  353 lines

  1. /*
  2.  * Copyright (c) 1980 Regents of the University of California.
  3.  * All rights reserved.
  4.  *
  5.  * Redistribution and use in source and binary forms, with or without
  6.  * modification, are permitted provided that the following conditions
  7.  * are met:
  8.  * 1. Redistributions of source code must retain the above copyright
  9.  *    notice, this list of conditions and the following disclaimer.
  10.  * 2. Redistributions in binary form must reproduce the above copyright
  11.  *    notice, this list of conditions and the following disclaimer in the
  12.  *    documentation and/or other materials provided with the distribution.
  13.  * 3. All advertising materials mentioning features or use of this software
  14.  *    must display the following acknowledgement:
  15.  *    This product includes software developed by the University of
  16.  *    California, Berkeley and its contributors.
  17.  * 4. Neither the name of the University nor the names of its contributors
  18.  *    may be used to endorse or promote products derived from this software
  19.  *    without specific prior written permission.
  20.  *
  21.  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
  22.  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
  23.  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
  24.  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
  25.  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
  26.  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
  27.  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
  28.  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
  29.  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
  30.  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  31.  * SUCH DAMAGE.
  32.  */
  33.  
  34. #if defined(LIBC_SCCS) && !defined(lint)
  35.     .asciz "@(#)atof.s    5.6 (Berkeley) 6/1/90"
  36. #endif /* LIBC_SCCS and not lint */
  37.  
  38. #include "DEFS.h"
  39.  
  40. /*
  41.  *    atof: convert ascii to floating
  42.  *
  43.  *    C usage:
  44.  *
  45.  *        double atof (s)
  46.  *        char *s;
  47.  *
  48.  *    Register usage:
  49.  *
  50.  *        r0-1:    value being developed
  51.  *        r2:    first section: pointer to the next character
  52.  *            second section: binary exponent
  53.  *        r3:    flags
  54.  *        r4:    first section: the current character
  55.  *            second section: scratch
  56.  *        r5:    the decimal exponent
  57.  *        r6-7:    scratch
  58.  */
  59.     .set    msign,0        # mantissa has negative sign
  60.     .set    esign,1        # exponent has negative sign
  61.     .set    decpt,2        # decimal point encountered
  62.  
  63. ENTRY(atof, R6|R7)
  64. /*
  65.  *    Initialization
  66.  */
  67.     clrl    r3        # All flags start out false
  68.     movl    4(ap),r2    # Address the first character
  69.     clrl    r5        # Clear starting exponent
  70. /*
  71.  *    Skip leading white space
  72.  */
  73. sk0:    movzbl    (r2)+,r4    # Fetch the next (first) character
  74.     cmpb    $' ,r4        # Is it blank?
  75.     jeql    sk0        #   ...yes
  76.     cmpb    r4,$8        # 8 is lowest of white-space group
  77.     jlss    sk1        # Jump if char too low to be white space
  78.     cmpb    r4,$13        # 13 is highest of white-space group
  79.     jleq    sk0        # Jump if character is white space
  80. sk1:
  81. /*
  82.  *    Check for a sign
  83.  */
  84.     cmpb    $'+,r4        # Positive sign?
  85.     jeql    cs1        #   ... yes
  86.     cmpb    $'-,r4        # Negative sign?
  87.     jneq    cs2        #   ... no
  88.     bisb2    $1<msign,r3    # Indicate a negative mantissa
  89. cs1:    movzbl    (r2)+,r4    # Skip the character
  90. cs2:
  91. /*
  92.  *    Accumulate digits, keeping track of the exponent
  93.  */
  94.     clrq    r0        # Clear the accumulator
  95. ad0:    cmpb    r4,$'0        # Do we have a digit?
  96.     jlss    ad4        #   ... no, too small
  97.     cmpb    r4,$'9
  98.     jgtr    ad4        #   ... no, too large
  99. /*
  100.  *    We got a digit.  Accumulate it
  101.  */
  102.     cmpl    r1,$214748364    # Would this digit cause overflow?
  103.     jgeq    ad1        #   ... yes
  104. /*
  105.  *    Multiply (r0,r1) by 10.  This is done by developing
  106.  *    (r0,r1)*2 in (r6,r7), shifting (r0,r1) left three bits,
  107.  *    and adding the two quadwords.
  108.  */
  109.     ashq    $1,r0,r6    # (r6,r7)=(r0,r1)*2
  110.     ashq    $3,r0,r0    # (r0,r1)=(r0,r1)*8
  111.     addl2    r6,r0        # Add low halves
  112.     adwc    r7,r1        # Add high halves
  113. /*
  114.  *    Add in the digit
  115.  */
  116.     subl2    $'0,r4        # Get the digit value
  117.     addl2    r4,r0        # Add it into the accumulator
  118.     adwc    $0,r1        # Possible carry into high half
  119.     jbr    ad2        # Join common code
  120. /*
  121.  *    Here when the digit won't fit in the accumulator
  122.  */
  123. ad1:    incl    r5        # Ignore the digit, bump exponent
  124. /*
  125.  *    If we have seen a decimal point, decrease the exponent by 1
  126.  */
  127. ad2:    jbc    $decpt,r3,ad3    # Jump if decimal point not seen
  128.     decl    r5        # Decrease exponent
  129. ad3:
  130. /*
  131.  *    Fetch the next character, back for more
  132.  */
  133.     movzbl    (r2)+,r4    # Fetch
  134.     jbr    ad0        # Try again
  135. /*
  136.  *    Not a digit.  Could it be a decimal point?
  137.  */
  138. ad4:    cmpb    r4,$'.        # If it's not a decimal point, either it's
  139.     jneq    ad5        #   the end of the number or the start of
  140.                 #   the exponent.
  141.     jbcs    $decpt,r3,ad3    # If it IS a decimal point, we record that
  142.                 #   we've seen one, and keep collecting
  143.                 #   digits if it is the first one.
  144. /*
  145.  *    Check for an exponent
  146.  */
  147. ad5:    clrl    r6        # Initialize the exponent accumulator
  148.  
  149.     cmpb    r4,$'e        # We allow both lower case e
  150.     jeql    ex1        #   ... and ...
  151.     cmpb    r4,$'E        #   upper-case E
  152.     jneq    ex7
  153. /*
  154.  *    Does the exponent have a sign?
  155.  */
  156. ex1:    movzbl    (r2)+,r4    # Get next character
  157.     cmpb    r4,$'+        # Positive sign?
  158.     jeql    ex2        #   ... yes ...
  159.     cmpb    r4,$'-        # Negative sign?
  160.     jneq    ex3        #   ... no ...
  161.     bisb2    $1<esign,r3    # Indicate exponent is negative
  162. ex2:    movzbl    (r2)+,r4    # Grab the next character
  163. /*
  164.  *    Accumulate exponent digits in r6
  165.  */
  166. ex3:    cmpb    r4,$'0        # A digit is within the range
  167.     jlss    ex4        # '0' through
  168.     cmpb    r4,$'9        # '9',
  169.     jgtr    ex4        # inclusive.
  170.     cmpl    r6,$214748364    # Exponent outrageously large already?
  171.     jgeq    ex2        #   ... yes
  172.     moval    (r6)[r6],r6    # r6 *= 5
  173.     movaw    -'0(r4)[r6],r6    # r6 = r6 * 2 + r4 - '0'
  174.     jbr    ex2        # Go 'round again
  175. ex4:
  176. /*
  177.  *    Now get the final exponent and force it within a reasonable
  178.  *    range so our scaling loops don't take forever for values
  179.  *    that will ultimately cause overflow or underflow anyway.
  180.  *    A tight check on over/underflow will be done by ldexp.
  181.  */
  182.     jbc    $esign,r3,ex5    # Jump if exponent not negative
  183.     mnegl    r6,r6        # If sign, negate exponent
  184. ex5:    addl2    r6,r5        # Add given exponent to calculated exponent
  185.     cmpl    r5,$-100    # Absurdly small?
  186.     jgtr    ex6        #   ... no
  187.     movl    $-100,r5    #   ... yes, force within limit
  188. ex6:    cmpl    r5,$100        # Absurdly large?
  189.     jlss    ex7        #   ... no
  190.     movl    $100,r5        #   ... yes, force within bounds
  191. ex7:
  192. /*
  193.  *    Our number has now been reduced to a mantissa and an exponent.
  194.  *    The mantissa is a 63-bit positive binary integer in r0,r1,
  195.  *    and the exponent is a signed power of 10 in r5.  The msign
  196.  *    bit in r3 will be on if the mantissa should ultimately be
  197.  *    considered negative.
  198.  *
  199.  *    We now have to convert it to a standard format floating point
  200.  *    number.  This will be done by accumulating a binary exponent
  201.  *    in r2, as we progressively get r5 closer to zero.
  202.  *
  203.  *    Don't bother scaling if the mantissa is zero
  204.  */
  205.     movq    r0,r0        # Mantissa zero?
  206.     jeql    exit        #   ... yes
  207.  
  208.     clrl    r2        # Initialize binary exponent
  209.     tstl    r5        # Which way to scale?
  210.     jleq    sd0        # Scale down if decimal exponent <= 0
  211. /*
  212.  *    Scale up by "multiplying" r0,r1 by 10 as many times as necessary,
  213.  *    as follows:
  214.  *
  215.  *    Step 1: Shift r0,r1 right as necessary to ensure that no
  216.  *    overflow can occur when multiplying.
  217.  */
  218. su0:    cmpl    r1,$429496729    # Compare high word to (2**31)/5
  219.     jlss    su1        # Jump out if guaranteed safe
  220.     ashq    $-1,r0,r0    # Else shift right one bit
  221.     incl    r2        #    bump exponent to compensate
  222.     jbr    su0        #    and go back to test again.
  223. /*
  224.  *    Step 2: Multiply r0,r1 by 5, by appropriate shifting and
  225.  *    double-precision addition
  226.  */
  227. su1:    ashq    $2,r0,r6    # (r6,r7) := (r0,r1) * 4
  228.     addl2    r6,r0        # Add low-order halves
  229.     adwc    r7,r1        #   and high-order halves
  230. /*
  231.  *    Step 3: Increment the binary exponent to take care of the final
  232.  *    factor of 2, and go back if we still need to scale more.
  233.  */
  234.     incl    r2        # Increment the exponent
  235.     sobgtr    r5,su0        #    and back for more (maybe)
  236.  
  237.     jbr    cm0        # Merge to build final value
  238.  
  239. /*
  240.  *    Scale down.  We must "divide" r0,r1 by 10 as many times
  241.  *    as needed, as follows:
  242.  *
  243.  *    Step 0: Right now, the condition codes reflect the state
  244.  *    of r5.  If it's zero, we are done.
  245.  */
  246. sd0:    jeql    cm0        # If finished, build final number
  247. /*
  248.  *    Step 1: Shift r0,r1 left until the high-order bit (not counting
  249.  *    the sign bit) is nonzero, so that the division will preserve
  250.  *    as much precision as possible.
  251.  */
  252.     tstl    r1        # Is the entire high-order half zero?
  253.     jneq    sd2        #   ...no, go shift one bit at a time
  254.     ashq    $30,r0,r0    #   ...yes, shift left 30,
  255.     subl2    $30,r2        #   decrement the exponent to compensate,
  256.                 #   and now it's known to be safe to shift
  257.                 #   at least once more.
  258. sd1:    ashq    $1,r0,r0    # Shift (r0,r1) left one, and
  259.     decl    r2        #   decrement the exponent to compensate
  260. sd2:    jbc    $30,r1,sd1    # If the high-order bit is off, go shift
  261. /*
  262.  *    Step 2: Divide the high-order part of (r0,r1) by 5,
  263.  *    giving a quotient in r1 and a remainder in r7.
  264.  */
  265. sd3:    movl    r1,r6        # Copy the high-order part
  266.     clrl    r7        # Zero-extend to 64 bits
  267.     ediv    $5,r6,r1,r7    # Divide (cannot overflow)
  268. /*
  269.  *    Step 3: Divide the low-order part of (r0,r1) by 5,
  270.  *    using the remainder from step 2 for rounding.
  271.  *    Note that the result of this computation is unsigned,
  272.  *    so we have to allow for the fact that an ordinary division
  273.  *    by 5 could overflow.  We make allowance by dividing by 10,
  274.  *    multiplying the quotient by 2, and using the remainder
  275.  *    to adjust the modified quotient.
  276.  */
  277.     addl3    $2,r0,r6    # Dividend is low part of (r0,r1) plus
  278.     adwc    $0,r7        #  2 for rounding plus
  279.                 #  (2**32) * previous remainder
  280.     ediv    $10,r6,r0,r6    # r0 := quotient, r6 := remainder.
  281.     addl2    r0,r0        # Make r0 result of dividing by 5
  282.     cmpl    r6,$5        # If remainder is 5 or greater,
  283.     jlss    sd4        #   increment the adjustted quotient.
  284.     incl    r0
  285. /*
  286.  *    Step 4: Increment the decimal exponent, decrement the binary
  287.  *    exponent (to make the division by 5 into a division by 10),
  288.  *    and back for another iteration.
  289.  */
  290. sd4:    decl    r2        # Binary exponent
  291.     aoblss    $0,r5,sd2
  292. /*
  293.  *    We now have the following:
  294.  *
  295.  *    r0:    low-order half of a 64-bit integer
  296.  *    r1:    high-order half of the same 64-bit integer
  297.  *    r2:    a binary exponent
  298.  *
  299.  *    Our final result is the integer represented by (r0,r1)
  300.  *    multiplied by 2 to the power contained in r2.
  301.  *    We will transform (r0,r1) into a floating-point value,
  302.  *    set the sign appropriately, and let ldexp do the
  303.  *    rest of the work.
  304.  *
  305.  *    Step 1: if the high-order bit (excluding the sign) of
  306.  *    the high-order half (r1) is 1, then we have 63 bits of
  307.  *    fraction, too many to convert easily.  However, we also
  308.  *    know we won't need them all, so we will just throw the
  309.  *    low-order bit away (and adjust the exponent appropriately).
  310.  */
  311. cm0:    jbc    $30,r1,cm1    # jump if no adjustment needed
  312.     ashq    $-1,r0,r0    # lose the low-order bit
  313.     incl    r2        # increase the exponent to compensate
  314. /*
  315.  *    Step 2: split the 62-bit number in (r0,r1) into two
  316.  *    31-bit positive quantities
  317.  */
  318. cm1:    ashq    $1,r0,r0    # put the high-order bits in r1
  319.                 #   and a 0 in the bottom of r0
  320.     rotl    $-1,r0,r0    # right-justify the bits in r0
  321.                 #   moving the 0 from the ashq
  322.                 #   into the sign bit.
  323. /*
  324.  *    Step 3: convert both halves to floating point
  325.  */
  326.     cvtld    r0,r6        # low-order part in r6-r7
  327.     cvtld    r1,r0        # high-order part in r0-r1
  328. /*
  329.  *    Step 4: multiply the high order part by 2**31 and combine them
  330.  */
  331.     muld2    two31,r0    # multiply
  332.     addd2    r6,r0        # combine
  333. /*
  334.  *    Step 5: if appropriate, negate the floating value
  335.  */
  336.     jbc    $msign,r3,cm2    # Jump if mantissa not signed
  337.     mnegd    r0,r0        # If negative, make it so
  338. /*
  339.  *    Step 6: call ldexp to complete the job
  340.  */
  341. cm2:    pushl    r2        # Put exponent in parameter list
  342.     movd    r0,-(sp)    #    and also mantissa
  343.     calls    $3,_ldexp    # go combine them
  344.  
  345. exit:
  346.     ret
  347.  
  348.     .align    2
  349. two31:    .word    0x5000        # 2 ** 31
  350.     .word    0        # (=2147483648)
  351.     .word    0        # in floating-point
  352.     .word    0        # (so atof doesn't have to convert it)
  353.