parser: Don't keep alloca()ing in a loop for substitutions
commitd89761b0e1652e212e9354fd3c96f977de873a06
authorнаб <nabijaczleweli@nabijaczleweli.xyz>
Thu, 5 Jan 2023 13:42:04 +0000 (5 14:42 +0100)
committerHerbert Xu <herbert@gondor.apana.org.au>
Sun, 8 Jan 2023 12:05:05 +0000 (8 20:05 +0800)
tree5303fa8c900d8dd477a8b4696a3a110466880cfc
parent4ec545e8dc98a3f461cf56bed03adafa81c64aec
parser: Don't keep alloca()ing in a loop for substitutions

When encountering
  printf %010000d | tr 0 \` | sh -n
  printf %09999d  | tr 0 \` | sh -n
you want no output and "Syntax error: EOF in backquote substitution",
respectively; instead, current dash segfaults.

This is because the alloca for the save buffer is run, naturally,
in the same function, so first it allocates one byte, then two,
then ..., then appx. 4000 (for me, depends on the binary),
then it segfaults on the memcpy (it's even worse, since due to
alignment, it usually allocates much more for the early stuff).

Nevertheless, the stack frame grows unboundedly, until we completely
destroy the stack. Instead of squirreling the out block away, then
letting subsequent allocations override the original, mark it used,
and just re-copy it to the top of the dash stack. This increases peak
memory usage somewhat
(in the most pathological case ‒ the above but with three nines ‒
 from 23.26 to 173.7KiB according to massif,
 in parsing a regular program (ratrun from ratrun 0c)
 from 28.68 to 29.19;
 a simpler program (ibid., rat) stays at 5.422;
 parsing libtoolize, debootstrap, and dkms
 (the biggest shell programs in my /[s]bin by size + by `/$( count)
 likewise stay the same at 12.02, 41.48, and 6.438)
but it's barely measurable outside of truly pathological conditions
that were a step away from a segfault previously.

Link: https://bugs.debian.org/966156
Signed-off-by: Herbert Xu <herbert@gondor.apana.org.au>
src/parser.c