(CFLAGS-tst-align.c): Add -mpreferred-stack-boundary=4.
[glibc.git] / sysdeps / i386 / i586 / memcpy.S
blobd8181ffa1bbdf73c47cfff545aed5e87a8ac6a72
1 /* Highly optimized version for i586.
2    Copyright (C) 1997, 2000, 2003 Free Software Foundation, Inc.
3    This file is part of the GNU C Library.
4    Contributed by Ulrich Drepper <drepper@cygnus.com>, 1997.
6    The GNU C Library is free software; you can redistribute it and/or
7    modify it under the terms of the GNU Lesser General Public
8    License as published by the Free Software Foundation; either
9    version 2.1 of the License, or (at your option) any later version.
11    The GNU C Library is distributed in the hope that it will be useful,
12    but WITHOUT ANY WARRANTY; without even the implied warranty of
13    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14    Lesser General Public License for more details.
16    You should have received a copy of the GNU Lesser General Public
17    License along with the GNU C Library; if not, write to the Free
18    Software Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA
19    02111-1307 USA.  */
21 #include <sysdep.h>
22 #include "asm-syntax.h"
23 #include "bp-sym.h"
24 #include "bp-asm.h"
26 /* BEWARE: `#ifdef memcpy' means that memcpy is redefined as `mempcpy',
27    and the return value is the byte after the last one copied in
28    the destination. */
29 #define MEMPCPY_P (defined memcpy)
31 #define PARMS   LINKAGE+8       /* space for 2 saved regs */
32 #define RTN     PARMS
33 #define DEST    RTN+RTN_SIZE
34 #define SRC     DEST+PTR_SIZE
35 #define LEN     SRC+PTR_SIZE
37         .text
38 ENTRY (BP_SYM (memcpy))
39         ENTER
41         pushl   %edi
42         pushl   %esi
44         movl    DEST(%esp), %edi
45         movl    SRC(%esp), %esi
46         movl    LEN(%esp), %ecx
47         CHECK_BOUNDS_BOTH_WIDE (%edi, DEST(%esp), %ecx)
48         CHECK_BOUNDS_BOTH_WIDE (%esi, SRC(%esp), %ecx)
49         movl    %edi, %eax
51         /* We need this in any case.  */
52         cld
54         /* Cutoff for the big loop is a size of 32 bytes since otherwise
55            the loop will never be entered.  */
56         cmpl    $32, %ecx
57         jbe     L(1)
59         negl    %eax
60         andl    $3, %eax
61         subl    %eax, %ecx
62         xchgl   %eax, %ecx
64         rep; movsb
66         movl    %eax, %ecx
67         subl    $32, %ecx
68         js      L(2)
70         /* Read ahead to make sure we write in the cache since the stupid
71            i586 designers haven't implemented read-on-write-miss.  */
72         movl    (%edi), %eax
73 L(3):   movl    28(%edi), %edx
75         /* Now correct the loop counter.  Please note that in the following
76            code the flags are not changed anymore.  */
77         subl    $32, %ecx
79         movl    (%esi), %eax
80         movl    4(%esi), %edx
81         movl    %eax, (%edi)
82         movl    %edx, 4(%edi)
83         movl    8(%esi), %eax
84         movl    12(%esi), %edx
85         movl    %eax, 8(%edi)
86         movl    %edx, 12(%edi)
87         movl    16(%esi), %eax
88         movl    20(%esi), %edx
89         movl    %eax, 16(%edi)
90         movl    %edx, 20(%edi)
91         movl    24(%esi), %eax
92         movl    28(%esi), %edx
93         movl    %eax, 24(%edi)
94         movl    %edx, 28(%edi)
96         leal    32(%esi), %esi
97         leal    32(%edi), %edi
99         jns     L(3)
101         /* Correct extra loop counter modification.  */
102 L(2):   addl    $32, %ecx
103 #if !MEMPCPY_P
104         movl    DEST(%esp), %eax
105 #endif
107 L(1):   rep; movsb
109 #if MEMPCPY_P
110         movl    %edi, %eax
111 #endif
113         popl    %esi
114         popl    %edi
116         LEAVE
117         RET_PTR
118 END (BP_SYM (memcpy))
119 #if !MEMPCPY_P
120 libc_hidden_builtin_def (memcpy)
121 #endif