Bring performance estimation up to date
commitc5744608212dfcf26f7649f8444d479e05ec1b4c
authorBerk Hess <hess@kth.se>
Mon, 30 Nov 2015 16:50:19 +0000 (30 17:50 +0100)
committerBerk Hess <hess@kth.se>
Sat, 19 Dec 2015 09:15:30 +0000 (19 10:15 +0100)
treeb84c6cd591c77b70b7a966872b52cec0d5ebd31d
parent34adb7d06efe49fb3b02b8d24d69ea24e2fae9b2
Bring performance estimation up to date

The performance estimation code for estimating the PME/PP load
and the optimal DD grid setup used outdated numbers.
We now estimate using actual cycle counts on Haswell and esimate
for other architectures through a scaling factor that takes into
account the SIMD width and FMA.
The DD grid automation now ignores PBC cost for exclusions with
the Verlet scheme and the for angles and dihedrals with SIMD.

The effect of this is a more reliable PME load estimate that's
now a factor 1.4 to 1.7 higher on Haswell.
The DD grid automation will now often choose a setup that better
matches the PME `decomposition and reduce the PME redist cost.

Change-Id: I5daa6a6856f2b09ba6d17fda0eea800b816d21e4
src/gromacs/domdec/domdec_setup.cpp
src/gromacs/legacyheaders/perf_est.h
src/gromacs/mdlib/perf_est.c