home *** CD-ROM | disk | FTP | other *** search
/ PC Welt 2004 March / PCWELT_3_2004.ISO / pcwsoft / flaskmpeg_078_39_src.z.exe / flaskmpeg / FlMemcpy.h < prev    next >
Encoding:
C/C++ Source or Header  |  2002-10-28  |  3.5 KB  |  151 lines

  1. /* 
  2.  *  FlMemcpy.h  - Our own mem copy routine
  3.  *
  4.  *    Copyright (C) Alberto Vigata - January 2000 - ultraflask@yahoo.com
  5.  *
  6.  *  This file is part of FlasKMPEG, a free MPEG to MPEG/AVI converter
  7.  *    
  8.  *  FlasKMPEG is free software; you can redistribute it and/or modify
  9.  *  it under the terms of the GNU General Public License as published by
  10.  *  the Free Software Foundation; either version 2, or (at your option)
  11.  *  any later version.
  12.  *   
  13.  *  FlasKMPEG is distributed in the hope that it will be useful,
  14.  *  but WITHOUT ANY WARRANTY; without even the implied warranty of
  15.  *  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
  16.  *  GNU General Public License for more details.
  17.  *   
  18.  *  You should have received a copy of the GNU General Public License
  19.  *  along with GNU Make; see the file COPYING.  If not, write to
  20.  *  the Free Software Foundation, 675 Mass Ave, Cambridge, MA 02139, USA. 
  21.  *
  22.  */
  23.  
  24. #ifndef FLMEMCPY_H
  25. #define FLMEMCPY_H
  26.  
  27. void static flmemcpy(void *dest, void *src, int n) 
  28. {
  29.  
  30. #if 1
  31.     __asm
  32.     {
  33.     mov  edi,dest
  34.     mov  esi,src
  35.     mov  ecx,n
  36.     push ecx
  37.      
  38.     // align 64 byte
  39.     and  ecx,63
  40.     rep  movsb
  41.     pop  ecx
  42.     shr  ecx,6
  43.     cmp  ecx,0
  44.     je   _mmx_copy_end
  45.       
  46. _mmx_copy:
  47.     
  48.     movq mm0,[esi+0]
  49.     movq mm1,[esi+8]
  50.     movq [edi+0],mm0
  51.     movq [edi+8],mm1
  52.     movq mm2,[esi+16]
  53.     movq mm3,[esi+24]
  54.     movq [edi+16],mm2
  55.     movq [edi+24],mm3
  56.     movq mm0,[esi+32]
  57.     movq mm1,[esi+40]
  58.     movq [edi+32],mm0
  59.     movq [edi+40],mm1
  60.     movq mm2,[esi+48]
  61.     movq mm3,[esi+56]
  62.     movq [edi+48],mm2
  63.     movq [edi+56],mm3
  64.       
  65.     add esi,64
  66.     add edi,64
  67.     dec ecx
  68.     jnz _mmx_copy
  69.       
  70. _mmx_copy_end:
  71.     emms   
  72.   }
  73. #else
  74.   __asm 
  75.   { 
  76.       mov esi, src 
  77.       mov ecx, n
  78.       mov ebx, ecx 
  79.       shr ebx, 11 // 2048 bytes at a time 
  80.       mov edi, dest 
  81.       
  82. loop2k: // Copy 2k into temporary buffer 
  83.     push edi 
  84.       mov edi, tbuf 
  85.       mov ecx, 2048 
  86.       shr ecx, 6 
  87.       
  88. loopMemToL1: 
  89.     prefetchnta 64[ESI] // Prefetch next loop, non-temporal 
  90.       prefetchnta 96[ESI] 
  91.       
  92.       movq mm1,  0[ESI] // Read in source data 
  93.       movq mm2,  8[ESI] 
  94.       movq mm3, 16[ESI] 
  95.       movq mm4, 24[ESI] 
  96.       movq mm5, 32[ESI] 
  97.       movq mm6, 40[ESI] 
  98.       movq mm7, 48[ESI] 
  99.       movq mm0, 56[ESI] 
  100.       
  101.       movq  0[EDI], mm1 // Store into L1 
  102.       movq  8[EDI], mm2 
  103.       movq 16[EDI], mm3 
  104.       movq 24[EDI], mm4 
  105.       movq 32[EDI], mm5 
  106.       movq 40[EDI], mm6 
  107.       movq 48[EDI], mm7 
  108.       movq 56[EDI], mm0 
  109.       add esi, 64 
  110.       add edi, 64 
  111.       dec ecx 
  112.       jnz loopMemToL1 
  113.       
  114.       pop edi // Now copy from L1 to system memory 
  115.       push esi 
  116.       mov esi, tbuf 
  117.       mov ecx, 2048 
  118.       shr ecx, 6 
  119.       
  120. loopL1ToMem: 
  121.     movq mm1, 0[ESI] // Read in source data from L1 
  122.       movq mm2, 8[ESI] 
  123.       movq mm3, 16[ESI] 
  124.       movq mm4, 24[ESI] 
  125.       movq mm5, 32[ESI] 
  126.       movq mm6, 40[ESI] 
  127.       movq mm7, 48[ESI] 
  128.       movq mm0, 56[ESI] 
  129.       
  130.       movntq 0[EDI], mm1 // Non-temporal stores 
  131.       movntq 8[EDI], mm2 
  132.       movntq 16[EDI], mm3 
  133.       movntq 24[EDI], mm4 
  134.       movntq 32[EDI], mm5 
  135.       movntq 40[EDI], mm6 
  136.       movntq 48[EDI], mm7 
  137.       movntq 56[EDI], mm0 
  138.       
  139.       add esi, 64 
  140.       add edi, 64 
  141.       dec ecx 
  142.       jnz loopL1ToMem 
  143.       
  144.       pop esi // Do next 2k block 
  145.       dec ebx 
  146.       jnz loop2k 
  147.   } 
  148. #endif  
  149. }
  150.  
  151. #endif FLMEMCPY_H