nl: remove deprecated --page-increment option
[coreutils.git] / HACKING
blobde8cd7bd849a1e1a9f00b492b4ec76e2b005f541
1 Coreutils Contribution Guidelines
4 Prerequisites
5 =============
6 You will need the "git" version control tools.
7 On Fedora-based systems, do "yum install git".
8 On Debian-based ones install the "git-core" package.
9 Then run "git --version".  If that says it's older than
10 version 1.4.4, then you'd do well to get a newer version.
11 At worst, just download the latest stable release from
12 http://git.or.cz/ and build from source.
14 For details on building the programs in this package, see
15 the file, README-hacking.
18 Use the latest upstream sources
19 ===============================
20 Base any changes you make on the latest upstream sources.
21 You can get a copy of the latest with this command:
23     git clone git://git.sv.gnu.org/coreutils
24     cd coreutils
26 That downloads the entire repository, including revision control history
27 dating back to 1991.  The repository (the part you download, and which
28 resides in coreutils/.git) currently weighs in at about 30MB.  So you
29 don't want to download it more often than necessary.  Once downloaded,
30 you can get incremental updates by running one of these commands from
31 inside your new coreutils/ directory:
33 If you have made *no* changes:
34     git pull
36 If you *have* made changes and mistakenly committed them to "master",
37 do the following to put your changes on a private branch, "br", and
38 to restore master to its unmodified (relative-to-upstream) state:
39     git checkout -b br
40     git checkout master
41     git reset --hard origin
43 Then "git pull" should work.
46 *Before* you commit changes
47 ===========================
49 In this project, we much prefer patches that automatically record
50 authorship.  That is important not just to give credit where due, but
51 also from a legal standpoint (see below).  To create author-annotated
52 patches with git, you must first tell git who you are.  That information
53 is best recorded in your ~/.gitconfig file.  Edit that file, creating
54 it if needed, and put your name and email address in place of these
55 example values:
57 [user]
58   name = Joe X. User
59   email = joe.user@example.com
62 Your first commit: the quick and dirty way
63 ==========================================
64 First of all, realize that to "commit" a change in git is a purely
65 local operation.  It affects only the local repository (the .git/ dir)
66 in your current coreutils/ hierarchy.
68 To try this out, modify a file or two.  If you create a new file, you'll
69 need to tell git about it with "git add new-file.c".  Commit all changes
70 with "git commit -a".  That prompts you for a log message, which should
71 include a one-line summary, a blank line, and ChangeLog-style entries
72 for all affected files.  More on that below.
74 Once your change is committed, you can create a proper patch that includes
75 a log message and authorship information as well as any permissions
76 changes.  Use this command to save that single, most-recent change set:
78   git format-patch --stdout -1 > DIFF
80 The trouble with this approach is that you've just checked in a change
81 (remember, it's only local) on the "master" branch, and that's where new
82 changes would normally appear when you pull the latest from "upstream".
83 When you "pull" from a remote repository to get the latest, your local
84 changes on "master" may well induce conflicts.   For this reason, you
85 may want to keep "master" free of any local changes, so that you can
86 use it to track unadulterated upstream sources.
88 However, if your cloned directory is for a one-shot patch submission and
89 you're going to remove it right afterwards, then this approach is fine.
90 Otherwise, for a more sustainable (and more generally useful, IMHO)
91 process, read on about "topic" branches.
94 Make your changes on a private "topic" branch
95 =============================================
96 So you checked out coreutils like this:
98   git clone git://git.sv.gnu.org/coreutils
100 Now, cd into the coreutils/ directory and run:
102   git checkout -b my-topic
104 That creates the my-topic branch and puts you on it.
105 To see which branch you're on, type "git branch".
106 Right after the clone, you were on "master" (aka the trunk).
107 To get back to the trunk, do this:
109   git checkout master
111 Note 1:
112     Be careful to run "git pull" only when on the "master" branch,
113     not when on a branch.  With newer versions of git, you can't cause
114     trouble if you forget, so this is a good reason to ensure you're
115     using 1.5.3.1 or newer.
117 Note 2:
118     It's best not to try to switch from one branch to another if
119     you have pending (uncommitted) changes.  Sometimes it works,
120     sometimes the checkout will fail, telling you that your local
121     modifications conflict with changes required to switch branches.
122     However, in any case, you will *not* lose your uncommitted changes.
124 Anyhow, get back onto your just-created branch:
126   git checkout my-topic
128 Now, modify some file and commit it:
130   git commit some-file.c
132 Personally, no matter what package I'm working on, I find it useful to
133 put the ChangeLog entries *only* in the commit log, initially, unless
134 I plan to commit/push right away.  Otherwise, I tend to get unnecessary
135 merge conflicts with each rebase (see below).  In coreutils, I've gone
136 a step further, and no longer maintain an explicit ChangeLog file in
137 version control.  Instead, in a git working directory, you can view
138 ChangeLog information via "git log".  However, each distribution tarball
139 does include a ChangeLog file that is automatically generated from the
140 git logs.
142 So, you've committed a change.  But it's only in your local repository,
143 and only on your "my-topic" branch.  Let's say you wait a day, and
144 then see that someone else changed something and pushed it to the
145 public repository.  Now, you want to update your trunk and "rebase"
146 your changes on the branch so that they are once again relative to the
147 tip of the trunk.  Currently, your branch is attached to the trunk at
148 the next-to-last change set.
150 First: update the trunk from the public repo:
151 [you've first made sure that "git diff" produces no output]
153   git checkout master
154   git pull
156 Now, return to your branch, and "rebase" relative to trunk (master):
158   git checkout my-topic
159   git rebase master
161 If there are no conflicts, this requires no more work from you.
162 However, let's say there was one in ChangeLog, since you didn't
163 follow my advice and modified it anyway.
164 git rebase will tell you there was a conflict and in which
165 file, and instruct you to resolve it and then resume with
166 "git rebase --continue" once that's done.
168 So you resolve as usual, by editing ChangeLog (which has the
169 usual conflict markers), then type "git rebase --continue".
170 That will fail, with a diagnostic telling you to mark
171 the file as "conflict resolved" by doing this:
173   git add ChangeLog
175 Then, finally, you can proceed (possibly onto more conflict resolution,
176 if there are conflicts in other files):
178   git rebase --continue
180 Once it finishes, your changes on the branch are now relative to
181 the tip of the trunk.
183 Now use git format-patch, as above.
186 Amending the most recent change on your private branch
187 ======================================================
188 Let's say you've just committed a change on your private
189 branch, and then realize that something about it is not right.
190 It's easy to adjust:
192   edit your files # this can include running "git add NEW" or "git rm BAD"
193   git commit --amend -a
194   git format-patch --stdout -1 > your-branch.diff
196 That replaces the most recent change-set with the revised one.
200 Coreutils-specific:
202 No more ChangeLog files
203 =======================
204 Do not modify any of the ChangeLog files in coreutils.  Starting in
205 2008, the policy changed.  Before, we would insert the exact same text
206 (or worse, sometimes slightly differing) into both the ChangeLog file
207 and the commit log.  Now we put that information only in the commit log,
208 and generate the top-level ChangeLog file from logs at "make dist" time.
209 As such, there are strict requirements on the form of the commit log
210 messages.
213 Commit log requirements
214 =======================
215 Your commit log should always start with a one-line summary, the second
216 line should be blank, and the remaining lines are usually ChangeLog-style
217 entries for all affected files.  However, it's fine -- even recommended --
218 to write a few lines of prose describing the change, when the summary
219 and ChangeLog entries don't give enough of the big picture.  Omit the
220 leading TABs that you're used to seeing in a "real" ChangeLog file, but
221 keep the maximum line length at 72 or smaller, so that the generated
222 ChangeLog lines, each with its leading TAB, will not exceed 80 columns.
223 As for the ChangeLog-style content, please follow these guidelines:
225   http://www.gnu.org/software/guile/changelogs/guile-changelogs_3.html
227 Try to make the summary line fit one of the following forms:
229   program_name: change-description
230   prog1, prog2: change-description
231   doc: change-description
232   tests: change-description
233   build: change-description
234   maint: change-description
236 If your commit fixes a bug, try to find the commit that introduced that
237 bug.  If you do that, add a note in your new commit log saying something
238 like "Introduced by commit v8.12-103-g54cbe6e." and add something like
239 [bug introduced in coreutils-8.13] in the corresponding NEWS blurb.
240 Assuming you found the bug in commit 54cbe6e6, "git describe 54cbe6e6"
241 will print the longer tag-relative string that you'll need.
242 Note that we used to use an 8-byte SHA1 prefix like "54cbe6e6", because
243 that was automatically rendered as a clickable link by "gitk", but with
244 git-1.7.10, the more descriptive version-containing "git describe" format
245 that we now require is also highlighted.
248 Curly braces: use judiciously
249 =============================
250 Omit the curly braces around an "if", "while", "for" etc. body only when
251 that body occupies a single line.  In every other case we require the braces.
252 This ensures that it is trivially easy to identify a single-*statement* loop:
253 each has only one *line* in its body.
255 Omitting braces with a single-line body is fine:
257      while (expr)
258        single_line_stmt ();
260 However, the moment your loop/if/else body extends onto a second line,
261 for whatever reason (even if it's just an added comment), then you should
262 add braces.  Otherwise, it would be too easy to insert a statement just
263 before that comment (without adding braces), thinking it is already a
264 multi-statement loop:
266      while (true)
267        /* comment... */      // BAD: multi-line body without braces
268        single_line_stmt ();
270 Do this instead:
272      while (true)
273        {  /* Always put braces around a multi-line body.  */
274          /* explanation... */
275          single_line_stmt ();
276        }
278 There is one exception: when the second body line is not at the same
279 indentation level as the first body line.
281      if (expr)
282        error (0, 0, _("a diagnostic that would make this line"
283                       " extend past the 80-column limit"));
285 It is safe to omit the braces in the code above, since the
286 further-indented second body line makes it obvious that this is still
287 a single-statement body.
289 To reiterate, don't do this:
291      if (expr)
292        while (expr_2)        // BAD: multi-line body without braces
293          {
294            ...
295          }
297 Do this, instead:
299      if (expr)
300        {
301          while (expr_2)
302            {
303              ...
304            }
305        }
307 However, there is one exception in the other direction, when even a
308 one-line block should have braces.  That occurs when that one-line,
309 brace-less block is an "else" block, and the corresponding "then" block
310 *does* use braces.  In that case, either put braces around the "else"
311 block, or negate the "if"-condition and swap the bodies, putting the
312 one-line block first and making the longer, multi-line block be the
313 "else" block.
315     if (expr)
316       {
317         ...
318         ...
319       }
320     else
321       x = y;    // BAD: braceless "else" with braced "then"
323 This is preferred, especially when the multi-line body is more than a
324 few lines long, because it is easier to read and grasp the semantics of
325 an if-then-else block when the simpler block occurs first, rather than
326 after the more involved block:
328     if (!expr)
329       x = y;                  /* more readable */
330     else
331       {
332         ...
333         ...
334       }
336 If you'd rather not negate the condition, then add braces:
338     if (expr)
339       {
340         ...
341         ...
342       }
343     else
344       {
345         x = y;
346       }
349 Use SPACE-only indentation in all[*] files
350 ==========================================
351 We use space-only indentation in nearly all files.
352 If you use Emacs and your coreutils working directory name matches,
353 this code enables the right mode:
355   ;; In coreutils, indent with spaces everywhere (not TABs).
356   ;; Exceptions: Makefile and ChangeLog modes.
357   (add-hook 'find-file-hook '(lambda ()
358     (if (and buffer-file-name
359              (string-match "/coreutils\\>" (buffer-file-name))
360              (not (string-equal mode-name "Change Log"))
361              (not (string-equal mode-name "Makefile")))
362         (setq indent-tabs-mode nil))))
364 If you use vim (7+ compiled with autocommands), and coreutils working
365 directory name also matches, add the following in ~/.vimrc:
367   " Set GNU style indentation, spaces instead of TABs
368   function! CoreutilsIndent()
369       " Check if 'coreutils' is part of the current working directory
370       if match(getcwd(), "coreutils") > 0
371           " The next 3 lines below set the GNU indentation
372           setlocal cinoptions=>4,n-2,{2,^-2,:2,=2,g0,h2,p5,t0,+2,(0,u0,w1,m1
373           setlocal shiftwidth=2
374           setlocal tabstop=8
375           " Coreutils specific, expand TABs with spaces
376           setlocal expandtab
377       endif
378   endfunction
380   autocmd BufEnter *.c,*.h call CoreutilsIndent()
382 [*] Makefile and ChangeLog files are exempt, of course.
385 Send patches to the address listed in --help output
386 ===================================================
387 Please follow the guidelines in the "Sending your patches." section of
388 git's own SubmittingPatches:
390   http://git.kernel.org/?p=git/git.git;a=blob;f=Documentation/SubmittingPatches
393 Add documentation
394 =================
395 If you add a feature or change some user-visible aspect of a program,
396 document it.  If you add an option, document it both in --help output
397 (i.e., in the usage function that generates the --help output) and in
398 doc/*.texi.  The man pages are generated from --help output, so
399 you shouldn't need to change anything under man/.  User-visible changes
400 are usually documented in NEWS, too.
402 When writing prose (documentation, comments, log entries), use an
403 active voice, not a passive one.  I.e., say "print the frobnozzle",
404 not "the frobnozzle will be printed".
406 Please add comments per the GNU Coding Standard:
407   http://www.gnu.org/prep/standards/html_node/Comments.html
410 Minor syntactic preferences
411 ===========================
412 [I hesitate to write this one down, because it appears to be an
413  acquired taste, at least for native-English speakers.  It seems odd
414  (if not truly backwards) to nearly anyone who doesn't have a strong
415  mathematics background and perhaps a streak of something odd in their
416  character ;-) ]
417 In writing arithmetic comparisons, use "<" and "<=" rather than
418 ">" and ">=".  For some justification, read this:
419   http://thread.gmane.org/gmane.comp.version-control.git/3903/focus=4126
421 const placement:
422 Write "Type const *var", not "const Type *var".
423 FIXME: dig up justification
426 Be nice to translators
427 ======================
428 Don't change translatable strings if you can avoid it.
429 If you must rearrange individual lines (e.g., in multi-line --help
430 strings), extract and create new strings, rather than extracting
431 and moving into existing blocks.  This avoids making unnecessary
432 work for translators.
435 Add tests
436 ==========
437 Nearly every significant change must be accompanied by a test suite
438 addition that exercises it.  If you fix a bug, add at least one test that
439 fails without the patch, but that succeeds once your patch is applied.
440 If you add a feature, add tests to exercise as much of the new code
441 as possible. Note to run tests/misc/new-test in isolation you can do:
443   (cd tests && make check TESTS=misc/new-test VERBOSE=yes)
445 Variables that are significant for tests with their default values are:
447   VERBOSE=yes
448   RUN_EXPENSIVE_TESTS=no
449   RUN_VERY_EXPENSIVE_TESTS=no
450   SHELL=/bin/sh
451   NON_ROOT_USERNAME=nobody
452   NON_ROOT_GROUP=$(id -g $NON_ROOT_USERNAME)
453   COREUTILS_GROUPS=$(id -G)
455 There are hundreds of tests in the tests/ directories.  You can use
456 tests/sample-test as a template, or one of the various Perl-based ones
457 in tests/misc.
459 If writing tests is not your thing, don't worry too much about it,
460 but do provide scenarios, input/output pairs, or whatever, along with
461 examples of running the tool to demonstrate the new or changed feature,
462 and someone else will massage that into a test (writing portable tests
463 can be a challenge).
466 Copyright assignment
467 ====================
468 If your change is significant (i.e., if it adds more than ~10 lines),
469 then you'll have to have a copyright assignment on file with the FSF.
470 Since that involves first an email exchange between you and the FSF,
471 and then the exchange (FSF to you, then back) of an actual sheet of paper
472 with your signature on it, and finally, some administrative processing
473 in Boston, the process can take a few weeks.
475 The forms to choose from are in gnulib's doc/Copyright/ directory.
476 If you want to assign a single change, you should use the file,
477 doc/Copyright/request-assign.changes:
479     http://www.gnu.org/software/gnulib/Copyright/request-assign.changes
481 If you would like to assign past and future contributions to a project,
482 you'd use doc/Copyright/request-assign.future:
484     http://www.gnu.org/software/gnulib/Copyright/request-assign.future
486 You may make assignments for up to four projects at a time.
488 In case you're wondering why we bother with all of this, read this:
490     http://www.gnu.org/licenses/why-assign.html
493 Run "make syntax-check", or even "make distcheck"
494 ================================================
495 Making either of those targets runs many integrity and
496 project-specific policy-conformance tests.  For example, the former
497 ensures that you add no trailing blanks and no uses of certain deprecated
498 functions.  The latter performs all "syntax-check" tests, and also
499 ensures that the build completes with no warnings when using a certain
500 set of gcc -W... options.  Don't even bother running "make distcheck"
501 unless you have a reasonably up to date installation including recent
502 versions of gcc and the linux kernel, and modern GNU tools.
505 Ensure that your changes are indented properly.
506 ===============================================
507 Format the code the way GNU indent does.
508 Filtering most source files through "indent --no-tabs" should
509 induce no change in indentation.  Try not to add any more.
512 Avoid trailing white space
513 ==========================
514 You may notice that the only trailing blanks in coreutils'
515 version-controlled files are in a single directory: tests/pr,
516 which contains expected output from various invocations of pr.
518 Do not add any more trailing blanks anywhere.  While "make syntax-check"
519 will alert you if you slip up, it's better to nip any problem in the
520 bud, as you're typing.  A good way to help you adapt to this rule is
521 to configure your editor to highlight any offending characters in the
522 files you edit.  If you use Emacs, customize its font-lock mode
523 or use its WhiteSpace mode:
525     http://www.emacswiki.org/emacs/WhiteSpace
527 If you use vim, add this to ~/.vimrc:
529     let c_space_errors=1
530     highlight RedundantSpaces ctermbg=red guibg=red
531     match RedundantSpaces /\s\+$\| \+\ze\t/
534 Git can help too, by stopping you from committing any change that would
535 add trailing blanks.  The example pre-commit hook contains code to check
536 for trailing whitespace and spaces before tabs; enable it by moving it
537 to the right place and making sure it is executable:
539     mv .git/hooks/pre-commit.sample .git/hooks/pre-commit
541 With a repository created by git-1.5.6 or older, use this command:
543     chmod +x .git/hooks/pre-commit
545 To manually check for whitespace errors before committing, you can use
547     git diff --check
549 Git also has some settings to enable suitable internal whitespace checks.
550 See the manpage for git-apply for details.
553 -------------------------------------------
555 Miscellaneous useful git commands
556 =================================
558   * gitk: give a graphical view of the revision graph of the current branch
559   * gitk --all: same, but display all branches
560   * git log: to get most of the same info in text form
561   * git log -p: same as above, but with diffs
562   * git log -p SOME_FILE: same as above, but limit to SOME_FILE
563   * git log -p -2 SOME_FILE: same as above, but print only two deltas
564   * git log -p -1: print the most recently committed change set
565   * git format-patch --stdout -1 > FILE: output the most recently committed
566       change set, in a format suitable to be submitted and/or applied via
567       "git am FILE".
568   * git reset --soft HEAD^: Commit the delta required to restore
569       state to the revision just before HEAD (i.e., next-to-last).
570   * git rebase -i master: run this from on a branch, and it gives
571       you an interface with which you can reorder and modify arbitrary
572       change sets on that branch.
574   * if you "misplace" a change set, i.e., via git reset --hard ..., so that
575     it's no longer reachable by any branch, you can use "git fsck" to find
576     its SHA1 and then tag it or cherry-pick it onto an existing branch.
577     For example, run this:
578       git fsck --lost-found HEAD && cd .git/lost-found/commit \
579         && for i in *; do git show $i|grep SOME_IDENTIFYING_STRING \
580         && echo $i; done
581     The "git fsck ..." command creates the .git/lost-found/... hierarchy
582     listing all unreachable objects.  Then the for loop
583     print SHA1s for commits that match via log or patch.
584     For example, say that found 556fbb57216b119155cdda824c98dc579b8121c8,
585     you could run "git show 556fbb57216b119" to examine the change set,
586     or "git checkout -b found 556fbb5721" to give it a branch name.
587     Finally, you might run "git checkout master && git cherry-pick 556fbb5721"
588     to put that change on the tip of "master".
590 -------------------------------------------
592 Finding things to do
593 ====================
594 If you don't know where to start, check out the TODO file for projects
595 that look like they're at your skill-/interest-level.  Another good
596 option is always to improve tests.  You never know what you might
597 uncover when you improve test coverage, and even if you don't find
598 any bugs your contribution is sure to be appreciated.
600 A good way to quickly assess current test coverage is to use "lcov"
601 to generate HTML coverage reports.  Follow these steps:
603   # configure with coverage information
604   ./configure CFLAGS="-g -fprofile-arcs -ftest-coverage"
605   make
606   # run whatever tests you want, i.e.:
607   make check
608   # run lcov
609   lcov -t coreutils -q -d lib -b lib -o lib.lcov -c
610   lcov -t coreutils -q -d src -b src -o src.lcov -c
611   # generate HTML from the output
612   genhtml -p `pwd` -t coreutils -q --output-directory lcov-html *.lcov
614 Then just open the index.html file (in the generated lcov-html directory)
615 in your favorite web browser.
617 ========================================================================
618 Copyright (C) 2009-2012 Free Software Foundation, Inc.
620 Permission is granted to copy, distribute and/or modify this document
621 under the terms of the GNU Free Documentation License, Version 1.3 or
622 any later version published by the Free Software Foundation; with no
623 Invariant Sections, with no Front-Cover Texts, and with no Back-Cover
624 Texts.  A copy of the license is included in the "GNU Free
625 Documentation License" file as part of this distribution.