32bit memcmp/strcmp/strncmp optimized for SSSE3/SSS4.2
[glibc.git] / sysdeps / i386 / i686 / multiarch / memcmp.S
blobfa7c52a003e666898739abf69bec82ce87738049
1 /* Multiple versions of memcmp
2    Copyright (C) 2010 Free Software Foundation, Inc.
3    Contributed by Intel Corporation.
4    This file is part of the GNU C Library.
6    The GNU C Library is free software; you can redistribute it and/or
7    modify it under the terms of the GNU Lesser General Public
8    License as published by the Free Software Foundation; either
9    version 2.1 of the License, or (at your option) any later version.
11    The GNU C Library is distributed in the hope that it will be useful,
12    but WITHOUT ANY WARRANTY; without even the implied warranty of
13    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14    Lesser General Public License for more details.
16    You should have received a copy of the GNU Lesser General Public
17    License along with the GNU C Library; if not, write to the Free
18    Software Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA
19    02111-1307 USA.  */
21 #include <sysdep.h>
22 #include <init-arch.h>
24 /* Define multiple versions only for the definition in libc. */
25 #ifndef NOT_IN_libc
26 # ifdef SHARED
27         .text
28 ENTRY(memcmp)
29         .type   memcmp, @gnu_indirect_function
30         pushl   %ebx
31         cfi_adjust_cfa_offset (4)
32         cfi_rel_offset (ebx, 0)
33         call    __i686.get_pc_thunk.bx
34         addl    $_GLOBAL_OFFSET_TABLE_, %ebx
35         cmpl    $0, KIND_OFFSET+__cpu_features@GOTOFF(%ebx)
36         jne     1f
37         call    __init_cpu_features
38 1:      leal    __memcmp_ia32@GOTOFF(%ebx), %eax
39         testl   $bit_SSSE3, CPUID_OFFSET+index_SSSE3+__cpu_features@GOTOFF(%ebx)
40         jz      2f
41         leal    __memcmp_ssse3@GOTOFF(%ebx), %eax
42         testl   $bit_SSE4_2, CPUID_OFFSET+index_SSE4_2+__cpu_features@GOTOFF(%ebx)
43         jz      2f
44         leal    __memcmp_sse4_2@GOTOFF(%ebx), %eax
45 2:      popl    %ebx
46         cfi_adjust_cfa_offset (-4)
47         cfi_restore (ebx)
48         ret
49 END(memcmp)
50 # else
51         .text
52 ENTRY(memcmp)
53         .type   memcmp, @gnu_indirect_function
54         cmpl    $0, KIND_OFFSET+__cpu_features
55         jne     1f
56         call    __init_cpu_features
57 1:      leal    __memcmp_ia32, %eax
58         testl   $bit_SSSE3, CPUID_OFFSET+index_SSSE3+__cpu_features
59         jz      2f
60         leal    __memcmp_ssse3, %eax
61         testl   $bit_SSE4_2, FEATURE_OFFSET+index_SSE4_2+__cpu_features
62         jz      2f
63         leal    __memcmp_sse4_2, %eax
64 2:      ret
65 END(memcmp)
66 # endif
68 # undef ENTRY
69 # define ENTRY(name) \
70         .type __memcmp_ia32, @function; \
71         .p2align 4; \
72         __memcmp_ia32: cfi_startproc; \
73         CALL_MCOUNT
74 # undef END
75 # define END(name) \
76         cfi_endproc; .size __memcmp_ia32, .-__memcmp_ia32
78 # ifdef SHARED
79 #  undef libc_hidden_builtin_def
80 /* IFUNC doesn't work with the hidden functions in shared library since
81    they will be called without setting up EBX needed for PLT which is
82    used by IFUNC.  */
83 #  define libc_hidden_builtin_def(name) \
84         .globl __GI_memcmp; __GI_memcmp = __memcmp_ia32
85 # endif
86 #endif
88 #include "../memcmp.S"