core.fsync: new option to harden references
commitbc22d845c4328f5bd896d019b3729f776ad4be4c
authorPatrick Steinhardt <ps@pks.im>
Fri, 11 Mar 2022 09:58:59 +0000 (11 10:58 +0100)
committerJunio C Hamano <gitster@pobox.com>
Tue, 15 Mar 2022 20:30:58 +0000 (15 13:30 -0700)
treea7f0f27f3b40768a35e7b91825245d3d9512b1c5
parent00997924001f3d8a07510613ab44d16c0a9b2883
core.fsync: new option to harden references

When writing both loose and packed references to disk we first create a
lockfile, write the updated values into that lockfile, and on commit we
rename the file into place. According to filesystem developers, this
behaviour is broken because applications should always sync data to disk
before doing the final rename to ensure data consistency [1][2][3]. If
applications fail to do this correctly, a hard crash of the machine can
easily result in corrupted on-disk data.

This kind of corruption can in fact be easily observed with Git when the
machine hard-resets shortly after writing references to disk. On
machines with ext4, this will likely lead to the "empty files" problem:
the file has been renamed, but its data has not been synced to disk. The
result is that the reference is corrupt, and in the worst case this can
lead to data loss.

Implement a new option to harden references so that users and admins can
avoid this scenario by syncing locked loose and packed references to
disk before we rename them into place.

[1]: https://thunk.org/tytso/blog/2009/03/15/dont-fear-the-fsync/
[2]: https://btrfs.wiki.kernel.org/index.php/FAQ (What are the crash guarantees of overwrite-by-rename)
[3]: https://git.kernel.org/pub/scm/linux/kernel/git/torvalds/linux.git/tree/Documentation/admin-guide/ext4.rst (see auto_da_alloc)

Signed-off-by: Patrick Steinhardt <ps@pks.im>
Signed-off-by: Junio C Hamano <gitster@pobox.com>
Documentation/config/core.txt
cache.h
config.c
refs/files-backend.c
refs/packed-backend.c