aarch64: Improve strcmp unaligned performance
commit2bce01ebbaf8db52ba4a5635eb5744f989cdbf69
authorSiddhesh Poyarekar <siddhesh@sourceware.org>
Wed, 13 Dec 2017 13:20:27 +0000 (13 18:50 +0530)
committerSiddhesh Poyarekar <siddhesh@sourceware.org>
Wed, 13 Dec 2017 13:20:27 +0000 (13 18:50 +0530)
treeebe39cd2ac5534dccbda2169eb1753d3781df178
parent243b63337c2c02f30ec3a988ecc44bc0f6ffa0ad
aarch64: Improve strcmp unaligned performance

Replace the simple byte-wise compare in the misaligned case with a
dword compare with page boundary checks in place.  For simplicity I've
chosen a 4K page boundary so that we don't have to query the actual
page size on the system.

This results in up to 3x improvement in performance in the unaligned
case on falkor and about 2.5x improvement on mustang as measured using
bench-strcmp.

* sysdeps/aarch64/strcmp.S (misaligned8): Compare dword at a
time whenever possible.
ChangeLog
sysdeps/aarch64/strcmp.S