submodules: submodule paths must not contain symlinks
[git.git] / Documentation / git-pack-objects.txt
bloba9995a932ca2d246db2bf756792c92b2431970eb
1 git-pack-objects(1)
2 ===================
4 NAME
5 ----
6 git-pack-objects - Create a packed archive of objects
9 SYNOPSIS
10 --------
11 [verse]
12 'git pack-objects' [-q | --progress | --all-progress] [--all-progress-implied]
13         [--no-reuse-delta] [--delta-base-offset] [--non-empty]
14         [--local] [--incremental] [--window=<n>] [--depth=<n>]
15         [--revs [--unpacked | --all]] [--keep-pack=<pack-name>]
16         [--cruft] [--cruft-expiration=<time>]
17         [--stdout [--filter=<filter-spec>] | <base-name>]
18         [--shallow] [--keep-true-parents] [--[no-]sparse] < <object-list>
21 DESCRIPTION
22 -----------
23 Reads list of objects from the standard input, and writes either one or
24 more packed archives with the specified base-name to disk, or a packed
25 archive to the standard output.
27 A packed archive is an efficient way to transfer a set of objects
28 between two repositories as well as an access efficient archival
29 format.  In a packed archive, an object is either stored as a
30 compressed whole or as a difference from some other object.
31 The latter is often called a delta.
33 The packed archive format (.pack) is designed to be self-contained
34 so that it can be unpacked without any further information. Therefore,
35 each object that a delta depends upon must be present within the pack.
37 A pack index file (.idx) is generated for fast, random access to the
38 objects in the pack. Placing both the index file (.idx) and the packed
39 archive (.pack) in the pack/ subdirectory of $GIT_OBJECT_DIRECTORY (or
40 any of the directories on $GIT_ALTERNATE_OBJECT_DIRECTORIES)
41 enables Git to read from the pack archive.
43 The 'git unpack-objects' command can read the packed archive and
44 expand the objects contained in the pack into "one-file
45 one-object" format; this is typically done by the smart-pull
46 commands when a pack is created on-the-fly for efficient network
47 transport by their peers.
50 OPTIONS
51 -------
52 base-name::
53         Write into pairs of files (.pack and .idx), using
54         <base-name> to determine the name of the created file.
55         When this option is used, the two files in a pair are written in
56         <base-name>-<SHA-1>.{pack,idx} files.  <SHA-1> is a hash
57         based on the pack content and is written to the standard
58         output of the command.
60 --stdout::
61         Write the pack contents (what would have been written to
62         .pack file) out to the standard output.
64 --revs::
65         Read the revision arguments from the standard input, instead of
66         individual object names.  The revision arguments are processed
67         the same way as 'git rev-list' with the `--objects` flag
68         uses its `commit` arguments to build the list of objects it
69         outputs.  The objects on the resulting list are packed.
70         Besides revisions, `--not` or `--shallow <SHA-1>` lines are
71         also accepted.
73 --unpacked::
74         This implies `--revs`.  When processing the list of
75         revision arguments read from the standard input, limit
76         the objects packed to those that are not already packed.
78 --all::
79         This implies `--revs`.  In addition to the list of
80         revision arguments read from the standard input, pretend
81         as if all refs under `refs/` are specified to be
82         included.
84 --include-tag::
85         Include unasked-for annotated tags if the object they
86         reference was included in the resulting packfile.  This
87         can be useful to send new tags to native Git clients.
89 --stdin-packs::
90         Read the basenames of packfiles (e.g., `pack-1234abcd.pack`)
91         from the standard input, instead of object names or revision
92         arguments. The resulting pack contains all objects listed in the
93         included packs (those not beginning with `^`), excluding any
94         objects listed in the excluded packs (beginning with `^`).
96 Incompatible with `--revs`, or options that imply `--revs` (such as
97 `--all`), with the exception of `--unpacked`, which is compatible.
99 --cruft::
100         Packs unreachable objects into a separate "cruft" pack, denoted
101         by the existence of a `.mtimes` file. Typically used by `git
102         repack --cruft`. Callers provide a list of pack names and
103         indicate which packs will remain in the repository, along with
104         which packs will be deleted (indicated by the `-` prefix). The
105         contents of the cruft pack are all objects not contained in the
106         surviving packs which have not exceeded the grace period (see
107         `--cruft-expiration` below), or which have exceeded the grace
108         period, but are reachable from an other object which hasn't.
110 When the input lists a pack containing all reachable objects (and lists
111 all other packs as pending deletion), the corresponding cruft pack will
112 contain all unreachable objects (with mtime newer than the
113 `--cruft-expiration`) along with any unreachable objects whose mtime is
114 older than the `--cruft-expiration`, but are reachable from an
115 unreachable object whose mtime is newer than the `--cruft-expiration`).
117 Incompatible with `--unpack-unreachable`, `--keep-unreachable`,
118 `--pack-loose-unreachable`, `--stdin-packs`, as well as any other
119 options which imply `--revs`. Also incompatible with `--max-pack-size`;
120 when this option is set, the maximum pack size is not inferred from
121 `pack.packSizeLimit`.
123 --cruft-expiration=<approxidate>::
124         If specified, objects are eliminated from the cruft pack if they
125         have an mtime older than `<approxidate>`. If unspecified (and
126         given `--cruft`), then no objects are eliminated.
128 --window=<n>::
129 --depth=<n>::
130         These two options affect how the objects contained in
131         the pack are stored using delta compression.  The
132         objects are first internally sorted by type, size and
133         optionally names and compared against the other objects
134         within --window to see if using delta compression saves
135         space.  --depth limits the maximum delta depth; making
136         it too deep affects the performance on the unpacker
137         side, because delta data needs to be applied that many
138         times to get to the necessary object.
140 The default value for --window is 10 and --depth is 50. The maximum
141 depth is 4095.
143 --window-memory=<n>::
144         This option provides an additional limit on top of `--window`;
145         the window size will dynamically scale down so as to not take
146         up more than '<n>' bytes in memory.  This is useful in
147         repositories with a mix of large and small objects to not run
148         out of memory with a large window, but still be able to take
149         advantage of the large window for the smaller objects.  The
150         size can be suffixed with "k", "m", or "g".
151         `--window-memory=0` makes memory usage unlimited.  The default
152         is taken from the `pack.windowMemory` configuration variable.
154 --max-pack-size=<n>::
155         In unusual scenarios, you may not be able to create files
156         larger than a certain size on your filesystem, and this option
157         can be used to tell the command to split the output packfile
158         into multiple independent packfiles, each not larger than the
159         given size. The size can be suffixed with
160         "k", "m", or "g". The minimum size allowed is limited to 1 MiB.
161         The default is unlimited, unless the config variable
162         `pack.packSizeLimit` is set. Note that this option may result in
163         a larger and slower repository; see the discussion in
164         `pack.packSizeLimit`.
166 --honor-pack-keep::
167         This flag causes an object already in a local pack that
168         has a .keep file to be ignored, even if it would have
169         otherwise been packed.
171 --keep-pack=<pack-name>::
172         This flag causes an object already in the given pack to be
173         ignored, even if it would have otherwise been
174         packed. `<pack-name>` is the pack file name without
175         leading directory (e.g. `pack-123.pack`). The option could be
176         specified multiple times to keep multiple packs.
178 --incremental::
179         This flag causes an object already in a pack to be ignored
180         even if it would have otherwise been packed.
182 --local::
183         This flag causes an object that is borrowed from an alternate
184         object store to be ignored even if it would have otherwise been
185         packed.
187 --non-empty::
188         Only create a packed archive if it would contain at
189         least one object.
191 --progress::
192         Progress status is reported on the standard error stream
193         by default when it is attached to a terminal, unless -q
194         is specified. This flag forces progress status even if
195         the standard error stream is not directed to a terminal.
197 --all-progress::
198         When --stdout is specified then progress report is
199         displayed during the object count and compression phases
200         but inhibited during the write-out phase. The reason is
201         that in some cases the output stream is directly linked
202         to another command which may wish to display progress
203         status of its own as it processes incoming pack data.
204         This flag is like --progress except that it forces progress
205         report for the write-out phase as well even if --stdout is
206         used.
208 --all-progress-implied::
209         This is used to imply --all-progress whenever progress display
210         is activated.  Unlike --all-progress this flag doesn't actually
211         force any progress display by itself.
213 -q::
214         This flag makes the command not to report its progress
215         on the standard error stream.
217 --no-reuse-delta::
218         When creating a packed archive in a repository that
219         has existing packs, the command reuses existing deltas.
220         This sometimes results in a slightly suboptimal pack.
221         This flag tells the command not to reuse existing deltas
222         but compute them from scratch.
224 --no-reuse-object::
225         This flag tells the command not to reuse existing object data at all,
226         including non deltified object, forcing recompression of everything.
227         This implies --no-reuse-delta. Useful only in the obscure case where
228         wholesale enforcement of a different compression level on the
229         packed data is desired.
231 --compression=<n>::
232         Specifies compression level for newly-compressed data in the
233         generated pack.  If not specified,  pack compression level is
234         determined first by pack.compression,  then by core.compression,
235         and defaults to -1,  the zlib default,  if neither is set.
236         Add --no-reuse-object if you want to force a uniform compression
237         level on all data no matter the source.
239 --[no-]sparse::
240         Toggle the "sparse" algorithm to determine which objects to include in
241         the pack, when combined with the "--revs" option. This algorithm
242         only walks trees that appear in paths that introduce new objects.
243         This can have significant performance benefits when computing
244         a pack to send a small change. However, it is possible that extra
245         objects are added to the pack-file if the included commits contain
246         certain types of direct renames. If this option is not included,
247         it defaults to the value of `pack.useSparse`, which is true unless
248         otherwise specified.
250 --thin::
251         Create a "thin" pack by omitting the common objects between a
252         sender and a receiver in order to reduce network transfer. This
253         option only makes sense in conjunction with --stdout.
255 Note: A thin pack violates the packed archive format by omitting
256 required objects and is thus unusable by Git without making it
257 self-contained. Use `git index-pack --fix-thin`
258 (see linkgit:git-index-pack[1]) to restore the self-contained property.
260 --shallow::
261         Optimize a pack that will be provided to a client with a shallow
262         repository.  This option, combined with --thin, can result in a
263         smaller pack at the cost of speed.
265 --delta-base-offset::
266         A packed archive can express the base object of a delta as
267         either a 20-byte object name or as an offset in the
268         stream, but ancient versions of Git don't understand the
269         latter.  By default, 'git pack-objects' only uses the
270         former format for better compatibility.  This option
271         allows the command to use the latter format for
272         compactness.  Depending on the average delta chain
273         length, this option typically shrinks the resulting
274         packfile by 3-5 per-cent.
276 Note: Porcelain commands such as `git gc` (see linkgit:git-gc[1]),
277 `git repack` (see linkgit:git-repack[1]) pass this option by default
278 in modern Git when they put objects in your repository into pack files.
279 So does `git bundle` (see linkgit:git-bundle[1]) when it creates a bundle.
281 --threads=<n>::
282         Specifies the number of threads to spawn when searching for best
283         delta matches.  This requires that pack-objects be compiled with
284         pthreads otherwise this option is ignored with a warning.
285         This is meant to reduce packing time on multiprocessor machines.
286         The required amount of memory for the delta search window is
287         however multiplied by the number of threads.
288         Specifying 0 will cause Git to auto-detect the number of CPU's
289         and set the number of threads accordingly.
291 --index-version=<version>[,<offset>]::
292         This is intended to be used by the test suite only. It allows
293         to force the version for the generated pack index, and to force
294         64-bit index entries on objects located above the given offset.
296 --keep-true-parents::
297         With this option, parents that are hidden by grafts are packed
298         nevertheless.
300 --filter=<filter-spec>::
301         Requires `--stdout`.  Omits certain objects (usually blobs) from
302         the resulting packfile.  See linkgit:git-rev-list[1] for valid
303         `<filter-spec>` forms.
305 --no-filter::
306         Turns off any previous `--filter=` argument.
308 --missing=<missing-action>::
309         A debug option to help with future "partial clone" development.
310         This option specifies how missing objects are handled.
312 The form '--missing=error' requests that pack-objects stop with an error if
313 a missing object is encountered.  If the repository is a partial clone, an
314 attempt to fetch missing objects will be made before declaring them missing.
315 This is the default action.
317 The form '--missing=allow-any' will allow object traversal to continue
318 if a missing object is encountered.  No fetch of a missing object will occur.
319 Missing objects will silently be omitted from the results.
321 The form '--missing=allow-promisor' is like 'allow-any', but will only
322 allow object traversal to continue for EXPECTED promisor missing objects.
323 No fetch of a missing object will occur.  An unexpected missing object will
324 raise an error.
326 --exclude-promisor-objects::
327         Omit objects that are known to be in the promisor remote.  (This
328         option has the purpose of operating only on locally created objects,
329         so that when we repack, we still maintain a distinction between
330         locally created objects [without .promisor] and objects from the
331         promisor remote [with .promisor].)  This is used with partial clone.
333 --keep-unreachable::
334         Objects unreachable from the refs in packs named with
335         --unpacked= option are added to the resulting pack, in
336         addition to the reachable objects that are not in packs marked
337         with *.keep files. This implies `--revs`.
339 --pack-loose-unreachable::
340         Pack unreachable loose objects (and their loose counterparts
341         removed). This implies `--revs`.
343 --unpack-unreachable::
344         Keep unreachable objects in loose form. This implies `--revs`.
346 --delta-islands::
347         Restrict delta matches based on "islands". See DELTA ISLANDS
348         below.
351 DELTA ISLANDS
352 -------------
354 When possible, `pack-objects` tries to reuse existing on-disk deltas to
355 avoid having to search for new ones on the fly. This is an important
356 optimization for serving fetches, because it means the server can avoid
357 inflating most objects at all and just send the bytes directly from
358 disk. This optimization can't work when an object is stored as a delta
359 against a base which the receiver does not have (and which we are not
360 already sending). In that case the server "breaks" the delta and has to
361 find a new one, which has a high CPU cost. Therefore it's important for
362 performance that the set of objects in on-disk delta relationships match
363 what a client would fetch.
365 In a normal repository, this tends to work automatically. The objects
366 are mostly reachable from the branches and tags, and that's what clients
367 fetch. Any deltas we find on the server are likely to be between objects
368 the client has or will have.
370 But in some repository setups, you may have several related but separate
371 groups of ref tips, with clients tending to fetch those groups
372 independently. For example, imagine that you are hosting several "forks"
373 of a repository in a single shared object store, and letting clients
374 view them as separate repositories through `GIT_NAMESPACE` or separate
375 repos using the alternates mechanism. A naive repack may find that the
376 optimal delta for an object is against a base that is only found in
377 another fork. But when a client fetches, they will not have the base
378 object, and we'll have to find a new delta on the fly.
380 A similar situation may exist if you have many refs outside of
381 `refs/heads/` and `refs/tags/` that point to related objects (e.g.,
382 `refs/pull` or `refs/changes` used by some hosting providers). By
383 default, clients fetch only heads and tags, and deltas against objects
384 found only in those other groups cannot be sent as-is.
386 Delta islands solve this problem by allowing you to group your refs into
387 distinct "islands". Pack-objects computes which objects are reachable
388 from which islands, and refuses to make a delta from an object `A`
389 against a base which is not present in all of `A`'s islands. This
390 results in slightly larger packs (because we miss some delta
391 opportunities), but guarantees that a fetch of one island will not have
392 to recompute deltas on the fly due to crossing island boundaries.
394 When repacking with delta islands the delta window tends to get
395 clogged with candidates that are forbidden by the config. Repacking
396 with a big --window helps (and doesn't take as long as it otherwise
397 might because we can reject some object pairs based on islands before
398 doing any computation on the content).
400 Islands are configured via the `pack.island` option, which can be
401 specified multiple times. Each value is a left-anchored regular
402 expressions matching refnames. For example:
404 -------------------------------------------
405 [pack]
406 island = refs/heads/
407 island = refs/tags/
408 -------------------------------------------
410 puts heads and tags into an island (whose name is the empty string; see
411 below for more on naming). Any refs which do not match those regular
412 expressions (e.g., `refs/pull/123`) is not in any island. Any object
413 which is reachable only from `refs/pull/` (but not heads or tags) is
414 therefore not a candidate to be used as a base for `refs/heads/`.
416 Refs are grouped into islands based on their "names", and two regexes
417 that produce the same name are considered to be in the same
418 island. The names are computed from the regexes by concatenating any
419 capture groups from the regex, with a '-' dash in between. (And if
420 there are no capture groups, then the name is the empty string, as in
421 the above example.) This allows you to create arbitrary numbers of
422 islands. Only up to 14 such capture groups are supported though.
424 For example, imagine you store the refs for each fork in
425 `refs/virtual/ID`, where `ID` is a numeric identifier. You might then
426 configure:
428 -------------------------------------------
429 [pack]
430 island = refs/virtual/([0-9]+)/heads/
431 island = refs/virtual/([0-9]+)/tags/
432 island = refs/virtual/([0-9]+)/(pull)/
433 -------------------------------------------
435 That puts the heads and tags for each fork in their own island (named
436 "1234" or similar), and the pull refs for each go into their own
437 "1234-pull".
439 Note that we pick a single island for each regex to go into, using "last
440 one wins" ordering (which allows repo-specific config to take precedence
441 over user-wide config, and so forth).
444 CONFIGURATION
445 -------------
447 Various configuration variables affect packing, see
448 linkgit:git-config[1] (search for "pack" and "delta").
450 Notably, delta compression is not used on objects larger than the
451 `core.bigFileThreshold` configuration variable and on files with the
452 attribute `delta` set to false.
454 SEE ALSO
455 --------
456 linkgit:git-rev-list[1]
457 linkgit:git-repack[1]
458 linkgit:git-prune-packed[1]
462 Part of the linkgit:git[1] suite