awk: run using LC_ALL=C
commit0e5eefbb06eafe7d79856742caafc3099bf00d85
authorKyle J. McKay <mackyle@gmail.com>
Sun, 27 Jan 2019 00:02:13 +0000 (26 17:02 -0700)
committerKyle J. McKay <mackyle@gmail.com>
Sun, 27 Jan 2019 00:02:13 +0000 (26 17:02 -0700)
treea8934ee33ccfaf2e8ae57d8328016a0a9ec80437
parent5d02c9f55e55bf1e64fd9bda92f046aedd36561d
awk: run using LC_ALL=C

Where Girocco does use awk, it's only to do simple processing where
only the US-ASCII portion of the codepoint space is relevant.

However, if the system character set is set to a multi-byte charset
(such as UTF-8) and the input contains characters with the high bit
set (such as ISO-8859-1) then the character reading mechanism can
barf unnecessarily for a reason that's simply irrelevant to Girocco.

Avoid this by making sure that awk runs under an "LC_ALL=C" environment
so that the input stream is treated as single octet units where
codepoints in the range 0-0x7F mean US-ASCII.  Not only is this
faster, but it's the correct processing mode for Girocco.

For the most part this had already been taken care of, but this
just handles some instances where it's been previously overlooked.

Signed-off-by: Kyle J. McKay <mackyle@gmail.com>
bin/update-pwd-db
chrootsetup_dragonfly.sh
chrootsetup_freebsd.sh
chrootsetup_linux.sh
jobd/gc.sh
taskd/clone.sh
toolbox/reports/project-disk-use.sh