home *** CD-ROM | disk | FTP | other *** search
/ High Voltage Shareware / high1.zip / high1 / DIR2 / DVPG30FS.ZIP / JREVDCT.C < prev    next >
C/C++ Source or Header  |  1993-11-27  |  21KB  |  607 lines

  1. /*
  2.  * standard jrevdct but I have reversed rows and columns for easier
  3.     changes to follow
  4.  */
  5.  
  6.  
  7. /*
  8.  * jrevdct.c
  9.  *
  10.  * Copyright (C) 1991, 1992, Thomas G. Lane.
  11.  * This file is part of the Independent JPEG Group's software.
  12.  * For conditions of distribution and use, see the accompanying README file.
  13.  *
  14.  * This file contains the basic inverse-DCT transformation subroutine.
  15.  *
  16.  * This implementation is based on an algorithm described in
  17.  *   C. Loeffler, A. Ligtenberg and G. Moschytz, "Practical Fast 1-D DCT
  18.  *   Algorithms with 11 Multiplications", Proc. Int'l. Conf. on Acoustics,
  19.  *   Speech, and Signal Processing 1989 (ICASSP '89), pp. 988-991.
  20.  * The primary algorithm described there uses 11 multiplies and 29 adds.
  21.  * We use their alternate method with 12 multiplies and 32 adds.
  22.  * The advantage of this method is that no data path contains more than one
  23.  * multiplication; this allows a very simple and accurate implementation in
  24.  * scaled fixed-point arithmetic, with a minimal number of shifts.
  25.  */
  26.  
  27. #include "jinclude.h"
  28.  
  29. /*
  30.  * This routine is specialized to the case DCTSIZE = 8.
  31.  */
  32.  
  33. #if DCTSIZE != 8
  34.   Sorry, this code only copes with 8x8 DCTs. /* deliberate syntax err */
  35. #endif
  36.  
  37. int elemptr;
  38. JSAMPLE *range_limit;
  39. JSAMPARRAY srowptr;
  40.  
  41. /*
  42.  * A 2-D IDCT can be done by 1-D IDCT on each row followed by 1-D IDCT
  43.  * on each column.  Direct algorithms are also available, but they are
  44.  * much more complex and seem not to be any faster when reduced to code.
  45.  *
  46.  * The poop on this scaling stuff is as follows:
  47.  *
  48.  * Each 1-D IDCT step produces outputs which are a factor of sqrt(N)
  49.  * larger than the true IDCT outputs.  The final outputs are therefore
  50.  * a factor of N larger than desired; since N=8 this can be cured by
  51.  * a simple right shift at the end of the algorithm.  The advantage of
  52.  * this arrangement is that we save two multiplications per 1-D IDCT,
  53.  * because the y0 and y4 inputs need not be divided by sqrt(N).
  54.  *
  55.  * We have to do addition and subtraction of the integer inputs, which
  56.  * is no problem, and multiplication by fractional constants, which is
  57.  * a problem to do in integer arithmetic.  We multiply all the constants
  58.  * by CONST_SCALE and convert them to integer constants (thus retaining
  59.  * CONST_BITS bits of precision in the constants).  After doing a
  60.  * multiplication we have to divide the product by CONST_SCALE, with proper
  61.  * rounding, to produce the correct output.  This division can be done
  62.  * cheaply as a right shift of CONST_BITS bits.  We postpone shifting
  63.  * as long as possible so that partial sums can be added together with
  64.  * full fractional precision.
  65.  *
  66.  * The outputs of the first pass are scaled up by PASS1_BITS bits so that
  67.  * they are represented to better-than-integral precision.  These outputs
  68.  * require BITS_IN_JSAMPLE + PASS1_BITS + 3 bits; this fits in a 16-bit word
  69.  * with the recommended scaling.  (To scale up 12-bit sample data further, an
  70.  * intermediate int array would be needed.)
  71.  *
  72.  * To avoid overflow of the 32-bit intermediate results in pass 2, we must
  73.  * have BITS_IN_JSAMPLE + CONST_BITS + PASS1_BITS <= 26.  Error analysis
  74.  * shows that the values given below are the most effective.
  75.  */
  76.  
  77. #ifdef EIGHT_BIT_SAMPLES
  78. #define CONST_BITS  4    /* was 13 */
  79. #define PASS1_BITS  0    /* was 2 */
  80. #else
  81. #define CONST_BITS  13
  82. junk here
  83. #define PASS1_BITS  1        /* lose a little precision to avoid overflow */
  84. #endif
  85.  
  86. #define ONE    ((int) 1)
  87.  
  88. #define CONST_SCALE (ONE << CONST_BITS)
  89.  
  90. /* Convert a positive real constant to an integer scaled by CONST_SCALE. */
  91.  
  92. #define FIX(x)    ((int) ((x) * CONST_SCALE + 0.5))
  93.  
  94. /* Some C compilers fail to reduce "FIX(constant)" at compile time, thus
  95.  * causing a lot of useless floating-point operations at run time.
  96.  * To get around this we use the following pre-calculated constants.
  97.  * If you change CONST_BITS you may want to add appropriate values.
  98.  * (With a reasonable C compiler, you can just rely on the FIX() macro...)
  99.  */
  100.  
  101. #if CONST_BITS == 13
  102. #define FIX_0_298631336  ((int)  2446)    /* FIX(0.298631336) */
  103. #define FIX_0_390180644  ((int)  3196)    /* FIX(0.390180644) */
  104. #define FIX_0_541196100  ((int)  4433)    /* FIX(0.541196100) */
  105. #define FIX_0_765366865  ((int)  6270)    /* FIX(0.765366865) */
  106. #define FIX_0_899976223  ((int)  7373)    /* FIX(0.899976223) */
  107. #define FIX_1_175875602  ((int)  9633)    /* FIX(1.175875602) */
  108. #define FIX_1_501321110  ((int)  12299)    /* FIX(1.501321110) */
  109. #define FIX_1_847759065  ((int)  15137)    /* FIX(1.847759065) */
  110. #define FIX_1_961570560  ((int)  16069)    /* FIX(1.961570560) */
  111. #define FIX_2_053119869  ((int)  16819)    /* FIX(2.053119869) */
  112. #define FIX_2_562915447  ((int)  20995)    /* FIX(2.562915447) */
  113. #define FIX_3_072711026  ((int)  25172)    /* FIX(3.072711026) */
  114. #else
  115. #define FIX_0_298631336  FIX(0.298631336)
  116. #define FIX_0_390180644  FIX(0.390180644)
  117. #define FIX_0_541196100  FIX(0.541196100)
  118. #define FIX_0_765366865  FIX(0.765366865)
  119. #define FIX_0_899976223  FIX(0.899976223)
  120. #define FIX_1_175875602  FIX(1.175875602)
  121. #define FIX_1_501321110  FIX(1.501321110)
  122. #define FIX_1_847759065  FIX(1.847759065)
  123. #define FIX_1_961570560  FIX(1.961570560)
  124. #define FIX_2_053119869  FIX(2.053119869)
  125. #define FIX_2_562915447  FIX(2.562915447)
  126. #define FIX_3_072711026  FIX(3.072711026)
  127. #endif
  128.  
  129.  
  130. /* Descale and correctly round an int value that's scaled by N bits.
  131.  * We assume RIGHT_SHIFT rounds towards minus infinity, so adding
  132.  * the fudge factor is correct for either sign of X.
  133.  */
  134.  
  135. #define DESCALE(x,n)  RIGHT_SHIFT((x) + (ONE << ((n)-1)), n)
  136.  
  137. /* Multiply an int variable by an int constant to yield an int result.
  138.  * For 8-bit samples with the recommended scaling, all the variable
  139.  * and constant values involved are no more than 16 bits wide, so a
  140.  * 16x16->32 bit multiply can be used instead of a full 32x32 multiply;
  141.  * this provides a useful speedup on many machines.
  142.  * There is no way to specify a 16x16->32 multiply in portable C, but
  143.  * some C compilers will do the right thing if you provide the correct
  144.  * combination of casts.
  145.  * NB: for 12-bit samples, a full 32-bit multiplication will be needed.
  146.  */
  147.  
  148. #ifdef EIGHT_BIT_SAMPLES
  149. #ifdef SHORTxSHORT_32        /* may work if 'int' is 32 bits */
  150. #define MULTIPLY(var,const)  (((INT16) (var)) * ((INT16) (const)))
  151. #endif
  152. #ifdef SHORTxLCONST_32        /* known to work with Microsoft C 6.0 */
  153. #define MULTIPLY(var,const)  (((INT16) (var)) * ((int) (const)))
  154. #endif
  155. #endif
  156.  
  157. #ifndef MULTIPLY        /* default definition */
  158. #define MULTIPLY(var,const)  ((var) * (const))
  159. #endif
  160.  
  161.  
  162. /*
  163.  * Perform the inverse DCT on one block of coefficients.
  164.  */
  165.  
  166. GLOBAL void near
  167. j_rev_dct (DCTBLOCK data)
  168. {
  169.   int tmp0, tmp1, tmp2, tmp3;
  170.   int    tmp10, tmp11, tmp12, tmp13;
  171.   int z1, z2, z3, z4, z5;
  172.   register DCTELEM *dataptr;
  173.   JSAMPROW data_ptr;
  174.   int rowctr;
  175.   SHIFT_TEMPS
  176.  
  177.   /* Pass 2: process columns. */
  178.   /* Note that we must descale the results by a factor of 8 == 2**3, */
  179.   /* and also undo the PASS1_BITS scaling. */
  180.  
  181.   dataptr = data;
  182.   for (rowctr = DCTSIZE-1; rowctr >= 0; rowctr--) {
  183.      /* Columns of zeroes can be exploited in the same way as we did with rows.
  184.       * However, the row calculation has created many nonzero AC terms, so the
  185.       * simplification applies less often (typically 5% to 10% of the time).
  186.       * On machines with very fast multiplication, it's possible that the
  187.       * test takes more time than it's worth.  In that case this section
  188.       * may be commented out.
  189.       */
  190.  
  191. #ifndef NO_ZERO_COLUMN_TEST
  192.      if ((dataptr[DCTSIZE*1] | dataptr[DCTSIZE*2] | dataptr[DCTSIZE*3] |
  193.      dataptr[DCTSIZE*4] | dataptr[DCTSIZE*5] | dataptr[DCTSIZE*6] |
  194.      dataptr[DCTSIZE*7]) == 0) {
  195.         /* AC terms all zero */
  196.         DCTELEM dcval = (DCTELEM) (dataptr[0] << PASS1_BITS);
  197. /*        DCTELEM dcval = (DCTELEM) DESCALE((int) dataptr[0], PASS1_BITS);*/
  198.  
  199.         dataptr[DCTSIZE*0] = dcval;
  200.         dataptr[DCTSIZE*1] = dcval;
  201.         dataptr[DCTSIZE*2] = dcval;
  202.         dataptr[DCTSIZE*3] = dcval;
  203.         dataptr[DCTSIZE*4] = dcval;
  204.         dataptr[DCTSIZE*5] = dcval;
  205.         dataptr[DCTSIZE*6] = dcval;
  206.         dataptr[DCTSIZE*7] = dcval;
  207.  
  208.         dataptr++;        /* advance pointer to next column */
  209.         continue;
  210.      }
  211. #endif
  212.  
  213.      /* Even part: reverse the even part of the forward DCT. */
  214.      /* The rotator is sqrt(2)*c(-6). */
  215.  
  216.      z2 = (int) dataptr[DCTSIZE*2];
  217.      z3 = (int) dataptr[DCTSIZE*6];
  218.  
  219.      z1 = MULTIPLY(z2 + z3, FIX_0_541196100);
  220.      tmp2 = z1 + MULTIPLY(z3, - FIX_1_847759065);
  221.      tmp3 = z1 + MULTIPLY(z2, FIX_0_765366865);
  222.  
  223.      tmp1 = ((int) dataptr[DCTSIZE*0] - (int) dataptr[DCTSIZE*4]) << CONST_BITS;
  224.      tmp0 = ((int) dataptr[DCTSIZE*0] + (int) dataptr[DCTSIZE*4]) << CONST_BITS;
  225.  
  226.      tmp10 = tmp0 + tmp3;
  227.      tmp13 = tmp0 - tmp3;
  228.      tmp11 = tmp1 + tmp2;
  229.      tmp12 = tmp1 - tmp2;
  230.  
  231.      /* Odd part per figure 8; the matrix is unitary and hence its
  232.       * transpose is its inverse.  i0..i3 are y7,y5,y3,y1 respectively.
  233.       */
  234.  
  235.      tmp0 = (int) dataptr[DCTSIZE*7];
  236.      tmp3 = (int) dataptr[DCTSIZE*1];
  237.  
  238.      z1 = tmp0 + tmp3;
  239.      z1 = MULTIPLY(z1, - FIX_0_899976223); /* sqrt(2) * (c7-c3) */
  240.      tmp1 = (int) dataptr[DCTSIZE*5];
  241.      tmp2 = (int) dataptr[DCTSIZE*3];
  242.      z2 = tmp1 + tmp2;
  243.      z2 = MULTIPLY(z2, - FIX_2_562915447); /* sqrt(2) * (-c1-c3) */
  244.      z3 = tmp0 + tmp2;
  245.      z4 = tmp1 + tmp3;
  246.      z5 = MULTIPLY(z3 + z4, FIX_1_175875602); /* sqrt(2) * c3 */
  247.  
  248.      tmp0 = MULTIPLY(tmp0, FIX_0_298631336); /* sqrt(2) * (-c1+c3+c5-c7) */
  249.      tmp1 = MULTIPLY(tmp1, FIX_2_053119869); /* sqrt(2) * ( c1+c3-c5+c7) */
  250.      tmp2 = MULTIPLY(tmp2, FIX_3_072711026); /* sqrt(2) * ( c1+c3+c5-c7) */
  251.      tmp3 = MULTIPLY(tmp3, FIX_1_501321110); /* sqrt(2) * ( c1+c3-c5-c7) */
  252.      z4 = MULTIPLY(z4, - FIX_0_390180644); /* sqrt(2) * (c5-c3) */
  253.      z3 = MULTIPLY(z3, - FIX_1_961570560); /* sqrt(2) * (-c3-c5) */
  254.  
  255.      z3 += z5;
  256.      z4 += z5;
  257.  
  258.      tmp1 += z2 + z4;
  259.      tmp3 += z1 + z4;
  260.      tmp0 += z1 + z3;
  261.      tmp2 += z2 + z3;
  262.  
  263.      /* Final output stage: inputs are tmp10..tmp13, tmp0..tmp3 */
  264.  
  265.      dataptr[DCTSIZE*1] = (DCTELEM) DESCALE(tmp11 + tmp2,
  266.                         CONST_BITS-PASS1_BITS);
  267.      dataptr[DCTSIZE*6] = (DCTELEM) DESCALE(tmp11 - tmp2,
  268.                         CONST_BITS-PASS1_BITS);
  269.      dataptr[DCTSIZE*0] = (DCTELEM) DESCALE(tmp10 + tmp3,
  270.                         CONST_BITS-PASS1_BITS);
  271.      dataptr[DCTSIZE*7] = (DCTELEM) DESCALE(tmp10 - tmp3,
  272.                         CONST_BITS-PASS1_BITS);
  273.      dataptr[DCTSIZE*2] = (DCTELEM) DESCALE(tmp12 + tmp1,
  274.                         CONST_BITS-PASS1_BITS);
  275.      dataptr[DCTSIZE*5] = (DCTELEM) DESCALE(tmp12 - tmp1,
  276.                         CONST_BITS-PASS1_BITS);
  277.      dataptr[DCTSIZE*3] = (DCTELEM) DESCALE(tmp13 + tmp0,
  278.                         CONST_BITS-PASS1_BITS);
  279.      dataptr[DCTSIZE*4] = (DCTELEM) DESCALE(tmp13 - tmp0,
  280.                         CONST_BITS-PASS1_BITS);
  281.  
  282.      dataptr++;            /* advance pointer to next column */
  283.   }
  284.  
  285.   /* Pass 1: process rows. */
  286.   /* Note results are scaled up by sqrt(8) compared to a true IDCT; */
  287.   /* furthermore, we scale the results by 2**PASS1_BITS. */
  288.  
  289.  
  290.   dataptr = data;
  291.   for (rowctr = DCTSIZE-1; rowctr >= 0; rowctr--) {
  292.     data_ptr = elemptr + srowptr[DCTSIZE - rowctr - 1];
  293.  
  294.      /* Due to quantization, we will usually find that many of the input
  295.       * coefficients are zero, especially the AC terms.  We can exploit this
  296.       * by short-circuiting the IDCT calculation for any row in which all
  297.       * the AC terms are zero.  In that case each output is equal to the
  298.       * DC coefficient (with scale factor as needed).
  299.       * With typical images and quantization tables, half or more of the
  300.       * row DCT calculations can be simplified this way.
  301.       */
  302.  
  303.      if ((dataptr[1] | dataptr[2] | dataptr[3] | dataptr[4] |
  304.      dataptr[5] | dataptr[6] | dataptr[7]) == 0) {
  305.         /* AC terms all zero */
  306.         DCTELEM dcval = (DCTELEM) DESCALE((int) dataptr[0], PASS1_BITS+3) - CENTERJSAMPLE;
  307.  
  308.         data_ptr[0] = dcval;
  309.         data_ptr[1] = dcval;
  310.         data_ptr[2] = dcval;
  311.         data_ptr[3] = dcval;
  312.         data_ptr[4] = dcval;
  313.         data_ptr[5] = dcval;
  314.         data_ptr[6] = dcval;
  315.         data_ptr[7] = dcval;
  316.  
  317.         dataptr += DCTSIZE;    /* advance pointer to next row */
  318.         continue;
  319.      }
  320.  
  321.      /* Even part: reverse the even part of the forward DCT. */
  322.      /* The rotator is sqrt(2)*c(-6). */
  323.  
  324.      z2 = (int) dataptr[2];
  325.      z3 = (int) dataptr[6];
  326.  
  327.      z1 = MULTIPLY(z2 + z3, FIX_0_541196100);
  328.     tmp2 = z1 + MULTIPLY(z3, - FIX_1_847759065);
  329.     tmp3 = z1 + MULTIPLY(z2, FIX_0_765366865);
  330.  
  331.      tmp1 = ((int) dataptr[0] - (int) dataptr[4]) << CONST_BITS;
  332.      tmp0 = ((int) dataptr[0] + (int) dataptr[4]) << CONST_BITS;
  333.  
  334.      tmp10 = tmp0 + tmp3;
  335.      tmp13 = tmp0 - tmp3;
  336.      tmp11 = tmp1 + tmp2;
  337.      tmp12 = tmp1 - tmp2;
  338.  
  339.      /* Odd part per figure 8; the matrix is unitary and hence its
  340.       * transpose is its inverse.  i0..i3 are y7,y5,y3,y1 respectively.
  341.       */
  342.  
  343.      tmp1 = (int) dataptr[5];
  344.      tmp2 = (int) dataptr[3];
  345.      tmp0 = (int) dataptr[7];
  346.      tmp3 = (int) dataptr[1];
  347.  
  348.      z1 = tmp0 + tmp3;
  349.      z2 = tmp1 + tmp2;
  350.      z3 = tmp0 + tmp2;
  351.      z4 = tmp1 + tmp3;
  352.      z5 = MULTIPLY(z3 + z4, FIX_1_175875602); /* sqrt(2) * c3 */
  353.  
  354.      tmp0 = MULTIPLY(tmp0, FIX_0_298631336); /* sqrt(2) * (-c1+c3+c5-c7) */
  355.      tmp1 = MULTIPLY(tmp1, FIX_2_053119869); /* sqrt(2) * ( c1+c3-c5+c7) */
  356.      tmp2 = MULTIPLY(tmp2, FIX_3_072711026); /* sqrt(2) * ( c1+c3+c5-c7) */
  357.      tmp3 = MULTIPLY(tmp3, FIX_1_501321110); /* sqrt(2) * ( c1+c3-c5-c7) */
  358.      z1 = MULTIPLY(z1, - FIX_0_899976223); /* sqrt(2) * (c7-c3) */
  359.      z2 = MULTIPLY(z2, - FIX_2_562915447); /* sqrt(2) * (-c1-c3) */
  360.      z4 = MULTIPLY(z4, - FIX_0_390180644); /* sqrt(2) * (c5-c3) */
  361.      z3 = MULTIPLY(z3, - FIX_1_961570560); /* sqrt(2) * (-c3-c5) */
  362.  
  363.      z3 += z5;
  364.      z4 += z5;
  365.  
  366.      tmp1 += z2 + z4;
  367.      tmp0 += z1 + z3;
  368.      tmp2 += z2 + z3;
  369.      tmp3 += z1 + z4;
  370.  
  371.      /* Final output stage: inputs are tmp10..tmp13, tmp0..tmp3 */
  372.  
  373.      data_ptr[0] = range_limit[(DCTELEM) DESCALE(tmp10 + tmp3, CONST_BITS+PASS1_BITS+3)];
  374.      data_ptr[7] = range_limit[(DCTELEM) DESCALE(tmp10 - tmp3, CONST_BITS+PASS1_BITS+3)];
  375.      data_ptr[1] = range_limit[(DCTELEM) DESCALE(tmp11 + tmp2, CONST_BITS+PASS1_BITS+3)];
  376.      data_ptr[2] = range_limit[(DCTELEM) DESCALE(tmp12 + tmp1, CONST_BITS+PASS1_BITS+3)];
  377.      data_ptr[3] = range_limit[(DCTELEM) DESCALE(tmp13 + tmp0, CONST_BITS+PASS1_BITS+3)];
  378.      data_ptr[4] = range_limit[(DCTELEM) DESCALE(tmp13 - tmp0, CONST_BITS+PASS1_BITS+3)];
  379.      data_ptr[5] = range_limit[(DCTELEM) DESCALE(tmp12 - tmp1, CONST_BITS+PASS1_BITS+3)];
  380.      data_ptr[6] = range_limit[(DCTELEM) DESCALE(tmp11 - tmp2, CONST_BITS+PASS1_BITS+3)];
  381.  
  382.      dataptr += DCTSIZE;        /* advance pointer to next row */
  383.   }
  384.  
  385. }
  386.  
  387.  
  388.  
  389.  
  390. /*
  391.  * jdmcu.c
  392.  *
  393.  * Copyright (C) 1991, 1992, 1993, Thomas G. Lane.
  394.  * This file is part of the Independent JPEG Group's software.
  395.  * For conditions of distribution and use, see the accompanying README file.
  396.  *
  397.  * This file contains MCU disassembly and IDCT control routines.
  398.  * These routines are invoked via the disassemble_MCU, reverse_DCT, and
  399.  * disassemble_init/term methods.
  400.  */
  401.  
  402. /*#include "jinclude.h"*/
  403.  
  404.  
  405. /*
  406.  * Fetch one MCU row from entropy_decode, build coefficient array.
  407.  * This version is used for noninterleaved (single-component) scans.
  408.  */
  409.  
  410. METHODDEF void
  411. disassemble_noninterleaved_MCU (decompress_info_ptr cinfo,
  412.                 JBLOCKIMAGE image_data)
  413. {
  414.   JBLOCKROW MCU_data[1];
  415.   long mcuindex;
  416.  
  417.   /* this is pretty easy since there is one component and one block per MCU */
  418.  
  419.   /* Pre-zero the target area to speed up entropy decoder */
  420.   /* (we assume wholesale zeroing is faster than retail) */
  421.   jzero_far((void FAR *) image_data[0][0],
  422.         (size_t) (cinfo->MCUs_per_row * SIZEOF(JBLOCK)));
  423.  
  424.   for (mcuindex = 0; mcuindex < cinfo->MCUs_per_row; mcuindex++) {
  425.     /* Point to the proper spot in the image array for this MCU */
  426.     MCU_data[0] = image_data[0][0] + mcuindex;
  427.     /* Fetch the coefficient data */
  428.     (*cinfo->methods->entropy_decode) (cinfo, MCU_data);
  429.   }
  430. }
  431.  
  432.  
  433. /*
  434.  * Fetch one MCU row from entropy_decode, build coefficient array.
  435.  * This version is used for interleaved (multi-component) scans.
  436.  */
  437.  
  438. METHODDEF void
  439. disassemble_interleaved_MCU (decompress_info_ptr cinfo,
  440.                  JBLOCKIMAGE image_data)
  441. {
  442.   JBLOCKROW MCU_data[MAX_BLOCKS_IN_MCU];
  443.   long mcuindex;
  444.   short blkn, ci, xpos, ypos;
  445.   jpeg_component_info * compptr;
  446.   JBLOCKROW image_ptr;
  447.  
  448.   /* Pre-zero the target area to speed up entropy decoder */
  449.   /* (we assume wholesale zeroing is faster than retail) */
  450.   for (ci = 0; ci < cinfo->comps_in_scan; ci++) {
  451.     compptr = cinfo->cur_comp_info[ci];
  452.     for (ypos = 0; ypos < compptr->MCU_height; ypos++) {
  453.       jzero_far((void FAR *) image_data[ci][ypos],
  454.         (size_t) (cinfo->MCUs_per_row * compptr->MCU_width * SIZEOF(JBLOCK)));
  455.     }
  456.   }
  457.  
  458.   for (mcuindex = 0; mcuindex < cinfo->MCUs_per_row; mcuindex++) {
  459.     /* Point to the proper spots in the image array for this MCU */
  460.     blkn = 0;
  461.      for (ci = 0; ci < cinfo->comps_in_scan; ci++) {
  462.       compptr = cinfo->cur_comp_info[ci];
  463.       for (ypos = 0; ypos < compptr->MCU_height; ypos++) {
  464.     image_ptr = image_data[ci][ypos] + (mcuindex * compptr->MCU_width);
  465.     for (xpos = 0; xpos < compptr->MCU_width; xpos++) {
  466.       MCU_data[blkn] = image_ptr;
  467.       image_ptr++;
  468.       blkn++;
  469.     }
  470.       }
  471.     }
  472.     /* Fetch the coefficient data */
  473.     (*cinfo->methods->entropy_decode) (cinfo, MCU_data);
  474.   }
  475. }
  476.  
  477.  
  478. /*
  479.  * Perform inverse DCT on each block in an MCU row's worth of data;
  480.  * output the results into a sample array starting at row start_row.
  481.  * NB: start_row can only be nonzero when dealing with a single-component
  482.  * scan; otherwise we'd have to pass different offsets for different
  483.  * components, since the heights of interleaved MCU rows can vary.
  484.  * But the pipeline controller logic is such that this is not necessary.
  485.  */
  486.  
  487. METHODDEF void
  488. reverse_DCT (decompress_info_ptr cinfo,
  489.           JBLOCKIMAGE coeff_data, JSAMPIMAGE output_data, int start_row)
  490. {
  491.   DCTBLOCK block;
  492.   JBLOCKROW browptr;
  493.   jpeg_component_info * compptr;
  494.   long blocksperrow, bi;
  495.   short numrows, ri;
  496.   short ci;
  497.  
  498.   for (ci = 0; ci < cinfo->comps_in_scan; ci++) {
  499.     compptr = cinfo->cur_comp_info[ci];
  500.     /* don't bother to IDCT an uninteresting component */
  501.      if (! compptr->component_needed)
  502.       continue;
  503.     /* calculate size of an MCU row in this component */
  504.      blocksperrow = compptr->downsampled_width / DCTSIZE;
  505.     numrows = compptr->MCU_height;
  506.     /* iterate through all blocks in MCU row */
  507.     for (ri = 0; ri < numrows; ri++) {
  508.       browptr = coeff_data[ci][ri];
  509.       srowptr = output_data[ci] + (ri * DCTSIZE + start_row);
  510.       for (bi = 0; bi < blocksperrow; bi++) {
  511.     /* copy the data into a local DCTBLOCK.  This allows for change of
  512.      * representation (if DCTELEM != JCOEF).  On 80x86 machines it also
  513.      * brings the data back from FAR storage to NEAR storage.
  514.      */
  515.     { register JCOEFPTR elemptr = browptr[bi];
  516.       register DCTELEM *localblkptr = block;
  517.       register int elem = DCTSIZE2;
  518.  
  519.       while (--elem >= 0)
  520.          *localblkptr++ = (DCTELEM) *elemptr++;
  521.     }
  522.  
  523.     range_limit = cinfo->sample_range_limit +    CENTERJSAMPLE;
  524.     elemptr = bi * DCTSIZE;
  525.     j_rev_dct(block);    /* perform inverse DCT */
  526.  
  527. #if pigs_fly
  528.     /* Output the data into the sample array.
  529.      * Note change from signed to unsigned representation:
  530.      * DCT calculation works with values +-CENTERJSAMPLE,
  531.      * but sample arrays always hold 0..MAXJSAMPLE.
  532.      * We have to do range-limiting because of quantization errors in the
  533.      * DCT/IDCT phase.  We use the sample_range_limit[] table to do this
  534.      * quickly; the CENTERJSAMPLE offset is folded into table indexing.
  535.      */
  536.     { register JSAMPROW elemptr;
  537.       register DCTELEM *localblkptr = block;
  538.       register JSAMPLE *range_limit = cinfo->sample_range_limit +
  539.                         CENTERJSAMPLE;
  540. #if DCTSIZE != 8
  541.       register int elemc;
  542. #endif
  543.       register int elemr;
  544.  
  545.       for (elemr = 0; elemr < DCTSIZE; elemr++) {
  546. #if DCTSIZE == 8        /* unroll the inner loop */
  547.          *elemptr++ = range_limit[*localblkptr++];
  548.          *elemptr++ = range_limit[*localblkptr++];
  549.          *elemptr++ = range_limit[*localblkptr++];
  550.          *elemptr++ = range_limit[*localblkptr++];
  551.          *elemptr++ = range_limit[*localblkptr++];
  552.          *elemptr++ = range_limit[*localblkptr++];
  553.          *elemptr++ = range_limit[*localblkptr++];
  554.          *elemptr = range_limit[*localblkptr++];
  555. #else
  556.          for (elemc = DCTSIZE; elemc > 0; elemc--) {
  557.             *elemptr++ = range_limit[*localblkptr++];
  558.          }
  559. #endif
  560.       }
  561.     }
  562. #endif
  563.         }
  564.      }
  565.   }
  566. }
  567.  
  568.  
  569. /*
  570.  * Initialize for processing a scan.
  571.  */
  572.  
  573. METHODDEF void
  574. disassemble_init (decompress_info_ptr cinfo)
  575. {
  576.   /* no work for now */
  577. }
  578.  
  579.  
  580. /*
  581.  * Clean up after a scan.
  582.  */
  583.  
  584. METHODDEF void
  585. disassemble_term (decompress_info_ptr cinfo)
  586. {
  587.   /* no work for now */
  588. }
  589.  
  590.  
  591.  
  592. /*
  593.  * The method selection routine for MCU disassembly.
  594.  */
  595.  
  596. GLOBAL void
  597. jseldmcu (decompress_info_ptr cinfo)
  598. {
  599.   if (cinfo->comps_in_scan == 1)
  600.     cinfo->methods->disassemble_MCU = disassemble_noninterleaved_MCU;
  601.   else
  602.     cinfo->methods->disassemble_MCU = disassemble_interleaved_MCU;
  603.   cinfo->methods->reverse_DCT = reverse_DCT;
  604.   cinfo->methods->disassemble_init = disassemble_init;
  605.   cinfo->methods->disassemble_term = disassemble_term;
  606. }
  607.