Performance fix for new anti-join code in nodeMergejoin.c: after finding a
commit6019e09ab7763fff6f6c0ca1966c10a3197205b6
authortgl <tgl>
Fri, 15 Aug 2008 19:20:42 +0000 (15 19:20 +0000)
committertgl <tgl>
Fri, 15 Aug 2008 19:20:42 +0000 (15 19:20 +0000)
tree14ff766882e6ea62d12b5c4e5ab4d04d6f5fdb14
parent4acb52ed4e04d6ee3471bf72263678c61d494c6d
Performance fix for new anti-join code in nodeMergejoin.c: after finding a
match in antijoin mode, we should advance to next outer tuple not next inner.
We know we don't want to return this outer tuple, and there is no point in
advancing over matching inner tuples now, because we'd just have to do it
again if the next outer tuple has the same merge key.  This makes a noticeable
difference if there are lots of duplicate keys in both inputs.

Similarly, after finding a match in semijoin mode, arrange to advance to
the next outer tuple after returning the current match; or immediately,
if it fails the extra quals.  The rationale is the same.  (This is a
performance bug in existing releases; perhaps worth back-patching?  The
planner tries to avoid using mergejoin with lots of duplicates, so it may
not be a big issue in practice.)

Nestloop and hash got this right to start with, but I made some cosmetic
adjustments there to make the corresponding bits of logic look more similar.
src/backend/executor/nodeHashjoin.c
src/backend/executor/nodeMergejoin.c
src/backend/executor/nodeNestloop.c