gpu.c: compute effective block size
commitc7179a0ca1c2d578e9537f0342e7e0256e054e3a
authorSven Verdoolaege <skimo@kotnet.org>
Fri, 12 Apr 2013 11:41:10 +0000 (12 13:41 +0200)
committerSven Verdoolaege <skimo@kotnet.org>
Thu, 13 Jun 2013 09:26:33 +0000 (13 11:26 +0200)
treed82a0d6538d00b876691fac6bf00e4b4b07b7dd9
parent2bec1e8d3c47de73fc3e1ec1149c65a64d18cd00
gpu.c: compute effective block size

The default block sizes or those specified by the user may result in
idle threads based on other options such as the tile sizes and the
values of the parameters.
The effective block sizes are computed after tiling and take into
account the parameter values.  This should result in fewer idle threads.
The effective block sizes are used in the definition of the block and
to bound the thread ids.  The code for copying data to/from shared
memory also takes into account the effective block sizes.

Signed-off-by: Sven Verdoolaege <skimo@kotnet.org>
gpu.c
gpu.h