Fix spelling errors in sysdeps/powerpc files.
[glibc.git] / sysdeps / powerpc / powerpc64 / power4 / strncmp.S
blob19877fa785cc960e331631cf3fb1f208e259ff56
1 /* Optimized strcmp implementation for PowerPC64.
2    Copyright (C) 2003-2013 Free Software Foundation, Inc.
3    This file is part of the GNU C Library.
5    The GNU C Library is free software; you can redistribute it and/or
6    modify it under the terms of the GNU Lesser General Public
7    License as published by the Free Software Foundation; either
8    version 2.1 of the License, or (at your option) any later version.
10    The GNU C Library is distributed in the hope that it will be useful,
11    but WITHOUT ANY WARRANTY; without even the implied warranty of
12    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13    Lesser General Public License for more details.
15    You should have received a copy of the GNU Lesser General Public
16    License along with the GNU C Library; if not, see
17    <http://www.gnu.org/licenses/>.  */
19 #include <sysdep.h>
20 #include <bp-sym.h>
21 #include <bp-asm.h>
23 /* See strlen.s for comments on how the end-of-string testing works.  */
25 /* int [r3] strncmp (const char *s1 [r3], const char *s2 [r4], size_t size [r5])  */
27 EALIGN (BP_SYM(strncmp), 4, 0)
28         CALL_MCOUNT 3
30 #define rTMP    r0
31 #define rRTN    r3
32 #define rSTR1   r3      /* first string arg */
33 #define rSTR2   r4      /* second string arg */
34 #define rN      r5      /* max string length */
35 /* Note:  The Bounded pointer support in this code is broken.  This code
36    was inherited from PPC32 and that support was never completed.
37    Current PPC gcc does not support -fbounds-check or -fbounded-pointers.  */
38 #define rWORD1  r6      /* current word in s1 */
39 #define rWORD2  r7      /* current word in s2 */
40 #define rWORD3  r10
41 #define rWORD4  r11
42 #define rFEFE   r8      /* constant 0xfefefefefefefeff (-0x0101010101010101) */
43 #define r7F7F   r9      /* constant 0x7f7f7f7f7f7f7f7f */
44 #define rNEG    r10     /* ~(word in s1 | 0x7f7f7f7f7f7f7f7f) */
45 #define rBITDIF r11     /* bits that differ in s1 & s2 words */
47         dcbt    0,rSTR1
48         or      rTMP, rSTR2, rSTR1
49         lis     r7F7F, 0x7f7f
50         dcbt    0,rSTR2
51         clrldi. rTMP, rTMP, 61
52         cmpldi  cr1, rN, 0
53         lis     rFEFE, -0x101
54         bne     L(unaligned)
55 /* We are doubleword aligned so set up for two loops.  first a double word
56    loop, then fall into the byte loop if any residual.  */
57         srdi.   rTMP, rN, 3
58         clrldi  rN, rN, 61
59         addi    rFEFE, rFEFE, -0x101
60         addi    r7F7F, r7F7F, 0x7f7f
61         cmpldi  cr1, rN, 0
62         beq     L(unaligned)
64         mtctr   rTMP    /* Power4 wants mtctr 1st in dispatch group.  */
65         ld      rWORD1, 0(rSTR1)
66         ld      rWORD2, 0(rSTR2)
67         sldi    rTMP, rFEFE, 32
68         insrdi  r7F7F, r7F7F, 32, 0
69         add     rFEFE, rFEFE, rTMP
70         b       L(g1)
72 L(g0):
73         ldu     rWORD1, 8(rSTR1)
74         bne-    cr1, L(different)
75         ldu     rWORD2, 8(rSTR2)
76 L(g1):  add     rTMP, rFEFE, rWORD1
77         nor     rNEG, r7F7F, rWORD1
78         bdz     L(tail)
79         and.    rTMP, rTMP, rNEG
80         cmpd    cr1, rWORD1, rWORD2
81         beq+    L(g0)
83 /* OK. We've hit the end of the string. We need to be careful that
84    we don't compare two strings as different because of gunk beyond
85    the end of the strings...  */
87 L(endstring):
88         and     rTMP, r7F7F, rWORD1
89         beq     cr1, L(equal)
90         add     rTMP, rTMP, r7F7F
91         xor.    rBITDIF, rWORD1, rWORD2
93         andc    rNEG, rNEG, rTMP
94         blt-    L(highbit)
95         cntlzd  rBITDIF, rBITDIF
96         cntlzd  rNEG, rNEG
97         addi    rNEG, rNEG, 7
98         cmpd    cr1, rNEG, rBITDIF
99         sub     rRTN, rWORD1, rWORD2
100         blt-    cr1, L(equal)
101         sradi   rRTN, rRTN, 63
102         ori     rRTN, rRTN, 1
103         blr
104 L(equal):
105         li      rRTN, 0
106         blr
108 L(different):
109         ldu     rWORD1, -8(rSTR1)
110         xor.    rBITDIF, rWORD1, rWORD2
111         sub     rRTN, rWORD1, rWORD2
112         blt-    L(highbit)
113         sradi   rRTN, rRTN, 63
114         ori     rRTN, rRTN, 1
115         blr
116 L(highbit):
117         srdi    rWORD2, rWORD2, 56
118         srdi    rWORD1, rWORD1, 56
119         sub     rRTN, rWORD1, rWORD2
120         blr
123 /* Oh well.  In this case, we just do a byte-by-byte comparison.  */
124         .align 4
125 L(tail):
126         and.    rTMP, rTMP, rNEG
127         cmpd    cr1, rWORD1, rWORD2
128         bne-    L(endstring)
129         addi    rSTR1, rSTR1, 8
130         bne-    cr1, L(different)
131         addi    rSTR2, rSTR2, 8
132         cmpldi  cr1, rN, 0
133 L(unaligned):
134         mtctr   rN      /* Power4 wants mtctr 1st in dispatch group */
135         ble     cr1, L(ux)
136 L(uz):
137         lbz     rWORD1, 0(rSTR1)
138         lbz     rWORD2, 0(rSTR2)
139         .align 4
140 L(u1):
141         cmpdi   cr1, rWORD1, 0
142         bdz     L(u4)
143         cmpd    rWORD1, rWORD2
144         beq-    cr1, L(u4)
145         bne-    L(u4)
146         lbzu    rWORD3, 1(rSTR1)
147         lbzu    rWORD4, 1(rSTR2)
148         cmpdi   cr1, rWORD3, 0
149         bdz     L(u3)
150         cmpd    rWORD3, rWORD4
151         beq-    cr1, L(u3)
152         bne-    L(u3)
153         lbzu    rWORD1, 1(rSTR1)
154         lbzu    rWORD2, 1(rSTR2)
155         cmpdi   cr1, rWORD1, 0
156         bdz     L(u4)
157         cmpd    rWORD1, rWORD2
158         beq-    cr1, L(u4)
159         bne-    L(u4)
160         lbzu    rWORD3, 1(rSTR1)
161         lbzu    rWORD4, 1(rSTR2)
162         cmpdi   cr1, rWORD3, 0
163         bdz     L(u3)
164         cmpd    rWORD3, rWORD4
165         beq-    cr1, L(u3)
166         bne-    L(u3)
167         lbzu    rWORD1, 1(rSTR1)
168         lbzu    rWORD2, 1(rSTR2)
169         b       L(u1)
171 L(u3):  sub     rRTN, rWORD3, rWORD4
172         blr
173 L(u4):  sub     rRTN, rWORD1, rWORD2
174         blr
175 L(ux):
176         li      rRTN, 0
177         blr
178 END (BP_SYM (strncmp))
179 libc_hidden_builtin_def (strncmp)