Optimize nearbyint{,f} on sparc.
[glibc.git] / sysdeps / sparc / sparc32 / sparcv9 / fpu / s_nearbyintf.S
blob4225b54497815fa95e90ce6e308b61c302d0e59d
1 /* Round float to int floating-point values without generating
2    an inexact exception, sparc32 v9 version.
4    Copyright (C) 2013 Free Software Foundation, Inc.
5    This file is part of the GNU C Library.
6    Contributed by David S. Miller <davem@davemloft.net>, 2013.
8    The GNU C Library is free software; you can redistribute it and/or
9    modify it under the terms of the GNU Lesser General Public
10    License as published by the Free Software Foundation; either
11    version 2.1 of the License, or (at your option) any later version.
13    The GNU C Library is distributed in the hope that it will be useful,
14    but WITHOUT ANY WARRANTY; without even the implied warranty of
15    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
16    Lesser General Public License for more details.
18    You should have received a copy of the GNU Lesser General Public
19    License along with the GNU C Library; if not, see
20    <http://www.gnu.org/licenses/>.  */
22 #include <sysdep.h>
24         /* We pop constants into the FPU registers using the incoming
25            argument stack slots, since this avoid having to use any PIC
26            references.  We also thus avoid having to allocate a register
27            window.
29            VIS instructions are used to facilitate the formation of
30            easier constants, and the propagation of the sign bit.  */
32 #define TWO_TWENTYTHREE 0x4b000000              /* 2**23 */
34 #define ZERO            %f10                    /* 0.0 */
35 #define SIGN_BIT        %f12                    /* -0.0 */
37 ENTRY (__nearbyintf)
38         st      %fsr, [%sp + 88]
39         st      %o0, [%sp + 68]
40         sethi   %hi(TWO_TWENTYTHREE), %o2
41         sethi   %hi(0xf8003e0), %o5
42         ld      [%sp + 88], %o4
43         fzeros  ZERO
44         or      %o5, %lo(0xf8003e0), %o5
45         fnegs   ZERO, SIGN_BIT
46         andn    %o4, %o5, %o4
47         st      %o4, [%sp + 80]
48         ld      [%sp + 68], %f1
49         ld      [%sp + 80], %fsr
50         st      %o2, [%sp + 68]
51         fabss   %f1, %f14
52         ld      [%sp + 68], %f16
53         fcmps   %fcc3, %f14, %f16
54         fmovsuge %fcc3, ZERO, %f16
55         fands   %f1, SIGN_BIT, SIGN_BIT
56         fors    %f16, SIGN_BIT, %f16
57         fadds   %f1, %f16, %f5
58         fsubs   %f5, %f16, %f0
59         fabss   %f0, %f0
60         fors    %f0, SIGN_BIT, %f0
61         retl
62          ld     [%sp + 88], %fsr
63 END (__nearbyintf)
64 weak_alias (__nearbyintf, nearbyintf)