x86: Optimize strcmp-evex.S
commit8418eb3ff4b781d31c4ed5dc6c0bd7356bc45db9
authorNoah Goldstein <goldstein.w.n@gmail.com>
Mon, 10 Jan 2022 21:35:39 +0000 (10 15:35 -0600)
committerNoah Goldstein <goldstein.w.n@gmail.com>
Thu, 3 Feb 2022 22:41:41 +0000 (3 16:41 -0600)
tree9195daf9352320fb92b9e4f23be773e24c0a5cea
parentb77b06e0e296f1a2276c27a67e1d44f2cfa38d45
x86: Optimize strcmp-evex.S

Optimization are primarily to the loop logic and how the page cross
logic interacts with the loop.

The page cross logic is at times more expensive for short strings near
the end of a page but not crossing the page. This is done to retest
the page cross conditions with a non-faulty check and to improve the
logic for entering the loop afterwards. This is only particular cases,
however, and is general made up for by more than 10x improvements on
the transition from the page cross -> loop case.

The non-page cross cases as well are nearly universally improved.

test-strcmp, test-strncmp, test-wcscmp, and test-wcsncmp all pass.

Signed-off-by: Noah Goldstein <goldstein.w.n@gmail.com>
sysdeps/x86_64/multiarch/strcmp-evex.S