streaming: a new API to read from the object store
[git/jnareb-git.git] / Documentation / git-read-tree.txt
blob26fdadc642a3534c4005488cb9ca2b2a47a495a1
1 git-read-tree(1)
2 ================
4 NAME
5 ----
6 git-read-tree - Reads tree information into the index
9 SYNOPSIS
10 --------
11 'git read-tree' [[-m [--trivial] [--aggressive] | --reset | --prefix=<prefix>]
12                 [-u [--exclude-per-directory=<gitignore>] | -i]]
13                 [--index-output=<file>] [--no-sparse-checkout]
14                 (--empty | <tree-ish1> [<tree-ish2> [<tree-ish3>]])
17 DESCRIPTION
18 -----------
19 Reads the tree information given by <tree-ish> into the index,
20 but does not actually *update* any of the files it "caches". (see:
21 linkgit:git-checkout-index[1])
23 Optionally, it can merge a tree into the index, perform a
24 fast-forward (i.e. 2-way) merge, or a 3-way merge, with the `-m`
25 flag.  When used with `-m`, the `-u` flag causes it to also update
26 the files in the work tree with the result of the merge.
28 Trivial merges are done by 'git read-tree' itself.  Only conflicting paths
29 will be in unmerged state when 'git read-tree' returns.
31 OPTIONS
32 -------
33 -m::
34         Perform a merge, not just a read.  The command will
35         refuse to run if your index file has unmerged entries,
36         indicating that you have not finished previous merge you
37         started.
39 --reset::
40         Same as -m, except that unmerged entries are discarded
41         instead of failing.
43 -u::
44         After a successful merge, update the files in the work
45         tree with the result of the merge.
47 -i::
48         Usually a merge requires the index file as well as the
49         files in the working tree are up to date with the
50         current head commit, in order not to lose local
51         changes.  This flag disables the check with the working
52         tree and is meant to be used when creating a merge of
53         trees that are not directly related to the current
54         working tree status into a temporary index file.
56 -v::
57         Show the progress of checking files out.
59 --trivial::
60         Restrict three-way merge by 'git read-tree' to happen
61         only if there is no file-level merging required, instead
62         of resolving merge for trivial cases and leaving
63         conflicting files unresolved in the index.
65 --aggressive::
66         Usually a three-way merge by 'git read-tree' resolves
67         the merge for really trivial cases and leaves other
68         cases unresolved in the index, so that Porcelains can
69         implement different merge policies.  This flag makes the
70         command to resolve a few more cases internally:
72 * when one side removes a path and the other side leaves the path
73   unmodified.  The resolution is to remove that path.
74 * when both sides remove a path.  The resolution is to remove that path.
75 * when both sides adds a path identically.  The resolution
76   is to add that path.
78 --prefix=<prefix>/::
79         Keep the current index contents, and read the contents
80         of named tree-ish under directory at `<prefix>`.  The
81         original index file cannot have anything at the path
82         `<prefix>` itself, and have nothing in `<prefix>/`
83         directory.  Note that the `<prefix>/` value must end
84         with a slash.
86 --exclude-per-directory=<gitignore>::
87         When running the command with `-u` and `-m` options, the
88         merge result may need to overwrite paths that are not
89         tracked in the current branch.  The command usually
90         refuses to proceed with the merge to avoid losing such a
91         path.  However this safety valve sometimes gets in the
92         way.  For example, it often happens that the other
93         branch added a file that used to be a generated file in
94         your branch, and the safety valve triggers when you try
95         to switch to that branch after you ran `make` but before
96         running `make clean` to remove the generated file.  This
97         option tells the command to read per-directory exclude
98         file (usually '.gitignore') and allows such an untracked
99         but explicitly ignored file to be overwritten.
101 --index-output=<file>::
102         Instead of writing the results out to `$GIT_INDEX_FILE`,
103         write the resulting index in the named file.  While the
104         command is operating, the original index file is locked
105         with the same mechanism as usual.  The file must allow
106         to be rename(2)ed into from a temporary file that is
107         created next to the usual index file; typically this
108         means it needs to be on the same filesystem as the index
109         file itself, and you need write permission to the
110         directories the index file and index output file are
111         located in.
113 --no-sparse-checkout::
114         Disable sparse checkout support even if `core.sparseCheckout`
115         is true.
117 --empty::
118         Instead of reading tree object(s) into the index, just empty
119         it.
121 <tree-ish#>::
122         The id of the tree object(s) to be read/merged.
125 Merging
126 -------
127 If `-m` is specified, 'git read-tree' can perform 3 kinds of
128 merge, a single tree merge if only 1 tree is given, a
129 fast-forward merge with 2 trees, or a 3-way merge if 3 trees are
130 provided.
133 Single Tree Merge
134 ~~~~~~~~~~~~~~~~~
135 If only 1 tree is specified, 'git read-tree' operates as if the user did not
136 specify `-m`, except that if the original index has an entry for a
137 given pathname, and the contents of the path match with the tree
138 being read, the stat info from the index is used. (In other words, the
139 index's stat()s take precedence over the merged tree's).
141 That means that if you do a `git read-tree -m <newtree>` followed by a
142 `git checkout-index -f -u -a`, the 'git checkout-index' only checks out
143 the stuff that really changed.
145 This is used to avoid unnecessary false hits when 'git diff-files' is
146 run after 'git read-tree'.
149 Two Tree Merge
150 ~~~~~~~~~~~~~~
152 Typically, this is invoked as `git read-tree -m $H $M`, where $H
153 is the head commit of the current repository, and $M is the head
154 of a foreign tree, which is simply ahead of $H (i.e. we are in a
155 fast-forward situation).
157 When two trees are specified, the user is telling 'git read-tree'
158 the following:
160      1. The current index and work tree is derived from $H, but
161         the user may have local changes in them since $H.
163      2. The user wants to fast-forward to $M.
165 In this case, the `git read-tree -m $H $M` command makes sure
166 that no local change is lost as the result of this "merge".
167 Here are the "carry forward" rules, where "I" denotes the index,
168 "clean" means that index and work tree coincide, and "exists"/"nothing"
169 refer to the presence of a path in the specified commit:
171         I                   H        M        Result
172        -------------------------------------------------------
173      0  nothing             nothing  nothing  (does not happen)
174      1  nothing             nothing  exists   use M
175      2  nothing             exists   nothing  remove path from index
176      3  nothing             exists   exists,  use M if "initial checkout",
177                                      H == M   keep index otherwise
178                                      exists,  fail
179                                      H != M
181         clean I==H  I==M
182        ------------------
183      4  yes   N/A   N/A     nothing  nothing  keep index
184      5  no    N/A   N/A     nothing  nothing  keep index
186      6  yes   N/A   yes     nothing  exists   keep index
187      7  no    N/A   yes     nothing  exists   keep index
188      8  yes   N/A   no      nothing  exists   fail
189      9  no    N/A   no      nothing  exists   fail
191      10 yes   yes   N/A     exists   nothing  remove path from index
192      11 no    yes   N/A     exists   nothing  fail
193      12 yes   no    N/A     exists   nothing  fail
194      13 no    no    N/A     exists   nothing  fail
196         clean (H==M)
197        ------
198      14 yes                 exists   exists   keep index
199      15 no                  exists   exists   keep index
201         clean I==H  I==M (H!=M)
202        ------------------
203      16 yes   no    no      exists   exists   fail
204      17 no    no    no      exists   exists   fail
205      18 yes   no    yes     exists   exists   keep index
206      19 no    no    yes     exists   exists   keep index
207      20 yes   yes   no      exists   exists   use M
208      21 no    yes   no      exists   exists   fail
210 In all "keep index" cases, the index entry stays as in the
211 original index file.  If the entry is not up to date,
212 'git read-tree' keeps the copy in the work tree intact when
213 operating under the -u flag.
215 When this form of 'git read-tree' returns successfully, you can
216 see which of the "local changes" that you made were carried forward by running
217 `git diff-index --cached $M`.  Note that this does not
218 necessarily match what `git diff-index --cached $H` would have
219 produced before such a two tree merge.  This is because of cases
220 18 and 19 --- if you already had the changes in $M (e.g. maybe
221 you picked it up via e-mail in a patch form), `git diff-index
222 --cached $H` would have told you about the change before this
223 merge, but it would not show in `git diff-index --cached $M`
224 output after the two-tree merge.
226 Case 3 is slightly tricky and needs explanation.  The result from this
227 rule logically should be to remove the path if the user staged the removal
228 of the path and then switching to a new branch.  That however will prevent
229 the initial checkout from happening, so the rule is modified to use M (new
230 tree) only when the content of the index is empty.  Otherwise the removal
231 of the path is kept as long as $H and $M are the same.
233 3-Way Merge
234 ~~~~~~~~~~~
235 Each "index" entry has two bits worth of "stage" state. stage 0 is the
236 normal one, and is the only one you'd see in any kind of normal use.
238 However, when you do 'git read-tree' with three trees, the "stage"
239 starts out at 1.
241 This means that you can do
243 ----------------
244 $ git read-tree -m <tree1> <tree2> <tree3>
245 ----------------
247 and you will end up with an index with all of the <tree1> entries in
248 "stage1", all of the <tree2> entries in "stage2" and all of the
249 <tree3> entries in "stage3".  When performing a merge of another
250 branch into the current branch, we use the common ancestor tree
251 as <tree1>, the current branch head as <tree2>, and the other
252 branch head as <tree3>.
254 Furthermore, 'git read-tree' has special-case logic that says: if you see
255 a file that matches in all respects in the following states, it
256 "collapses" back to "stage0":
258    - stage 2 and 3 are the same; take one or the other (it makes no
259      difference - the same work has been done on our branch in
260      stage 2 and their branch in stage 3)
262    - stage 1 and stage 2 are the same and stage 3 is different; take
263      stage 3 (our branch in stage 2 did not do anything since the
264      ancestor in stage 1 while their branch in stage 3 worked on
265      it)
267    - stage 1 and stage 3 are the same and stage 2 is different take
268      stage 2 (we did something while they did nothing)
270 The 'git write-tree' command refuses to write a nonsensical tree, and it
271 will complain about unmerged entries if it sees a single entry that is not
272 stage 0.
274 OK, this all sounds like a collection of totally nonsensical rules,
275 but it's actually exactly what you want in order to do a fast
276 merge. The different stages represent the "result tree" (stage 0, aka
277 "merged"), the original tree (stage 1, aka "orig"), and the two trees
278 you are trying to merge (stage 2 and 3 respectively).
280 The order of stages 1, 2 and 3 (hence the order of three
281 <tree-ish> command line arguments) are significant when you
282 start a 3-way merge with an index file that is already
283 populated.  Here is an outline of how the algorithm works:
285 - if a file exists in identical format in all three trees, it will
286   automatically collapse to "merged" state by 'git read-tree'.
288 - a file that has _any_ difference what-so-ever in the three trees
289   will stay as separate entries in the index. It's up to "porcelain
290   policy" to determine how to remove the non-0 stages, and insert a
291   merged version.
293 - the index file saves and restores with all this information, so you
294   can merge things incrementally, but as long as it has entries in
295   stages 1/2/3 (i.e., "unmerged entries") you can't write the result. So
296   now the merge algorithm ends up being really simple:
298   * you walk the index in order, and ignore all entries of stage 0,
299     since they've already been done.
301   * if you find a "stage1", but no matching "stage2" or "stage3", you
302     know it's been removed from both trees (it only existed in the
303     original tree), and you remove that entry.
305   * if you find a matching "stage2" and "stage3" tree, you remove one
306     of them, and turn the other into a "stage0" entry. Remove any
307     matching "stage1" entry if it exists too.  .. all the normal
308     trivial rules ..
310 You would normally use 'git merge-index' with supplied
311 'git merge-one-file' to do this last step.  The script updates
312 the files in the working tree as it merges each path and at the
313 end of a successful merge.
315 When you start a 3-way merge with an index file that is already
316 populated, it is assumed that it represents the state of the
317 files in your work tree, and you can even have files with
318 changes unrecorded in the index file.  It is further assumed
319 that this state is "derived" from the stage 2 tree.  The 3-way
320 merge refuses to run if it finds an entry in the original index
321 file that does not match stage 2.
323 This is done to prevent you from losing your work-in-progress
324 changes, and mixing your random changes in an unrelated merge
325 commit.  To illustrate, suppose you start from what has been
326 committed last to your repository:
328 ----------------
329 $ JC=`git rev-parse --verify "HEAD^0"`
330 $ git checkout-index -f -u -a $JC
331 ----------------
333 You do random edits, without running 'git update-index'.  And then
334 you notice that the tip of your "upstream" tree has advanced
335 since you pulled from him:
337 ----------------
338 $ git fetch git://.... linus
339 $ LT=`cat .git/FETCH_HEAD`
340 ----------------
342 Your work tree is still based on your HEAD ($JC), but you have
343 some edits since.  Three-way merge makes sure that you have not
344 added or modified index entries since $JC, and if you haven't,
345 then does the right thing.  So with the following sequence:
347 ----------------
348 $ git read-tree -m -u `git merge-base $JC $LT` $JC $LT
349 $ git merge-index git-merge-one-file -a
350 $ echo "Merge with Linus" | \
351   git commit-tree `git write-tree` -p $JC -p $LT
352 ----------------
354 what you would commit is a pure merge between $JC and $LT without
355 your work-in-progress changes, and your work tree would be
356 updated to the result of the merge.
358 However, if you have local changes in the working tree that
359 would be overwritten by this merge, 'git read-tree' will refuse
360 to run to prevent your changes from being lost.
362 In other words, there is no need to worry about what exists only
363 in the working tree.  When you have local changes in a part of
364 the project that is not involved in the merge, your changes do
365 not interfere with the merge, and are kept intact.  When they
366 *do* interfere, the merge does not even start ('git read-tree'
367 complains loudly and fails without modifying anything).  In such
368 a case, you can simply continue doing what you were in the
369 middle of doing, and when your working tree is ready (i.e. you
370 have finished your work-in-progress), attempt the merge again.
373 Sparse checkout
374 ---------------
376 "Sparse checkout" allows to sparsely populate working directory.
377 It uses skip-worktree bit (see linkgit:git-update-index[1]) to tell
378 Git whether a file on working directory is worth looking at.
380 "git read-tree" and other merge-based commands ("git merge", "git
381 checkout"...) can help maintaining skip-worktree bitmap and working
382 directory update. `$GIT_DIR/info/sparse-checkout` is used to
383 define the skip-worktree reference bitmap. When "git read-tree" needs
384 to update working directory, it will reset skip-worktree bit in index
385 based on this file, which uses the same syntax as .gitignore files.
386 If an entry matches a pattern in this file, skip-worktree will be
387 set on that entry. Otherwise, skip-worktree will be unset.
389 Then it compares the new skip-worktree value with the previous one. If
390 skip-worktree turns from unset to set, it will add the corresponding
391 file back. If it turns from set to unset, that file will be removed.
393 While `$GIT_DIR/info/sparse-checkout` is usually used to specify what
394 files are in. You can also specify what files are _not_ in, using
395 negate patterns. For example, to remove file "unwanted":
397 ----------------
399 !unwanted
400 ----------------
402 Another tricky thing is fully repopulating working directory when you
403 no longer want sparse checkout. You cannot just disable "sparse
404 checkout" because skip-worktree are still in the index and you working
405 directory is still sparsely populated. You should re-populate working
406 directory with the `$GIT_DIR/info/sparse-checkout` file content as
407 follows:
409 ----------------
411 ----------------
413 Then you can disable sparse checkout. Sparse checkout support in "git
414 read-tree" and similar commands is disabled by default. You need to
415 turn `core.sparseCheckout` on in order to have sparse checkout
416 support.
419 SEE ALSO
420 --------
421 linkgit:git-write-tree[1]; linkgit:git-ls-files[1];
422 linkgit:gitignore[5]
426 Part of the linkgit:git[1] suite