(AC_CHECK_DECL): Assume C89 or better,
[autoconf/tsuna.git] / doc / standards.texi
blob68286df5706f1d12514a2b57402a57e96ca1fc46
1 \input texinfo @c -*-texinfo-*-
2 @c %**start of header
3 @setfilename standards.info
4 @settitle GNU Coding Standards
5 @c This date is automagically updated when you save this file:
6 @set lastupdate August 19, 2006
7 @c %**end of header
9 @dircategory GNU organization
10 @direntry
11 * Standards: (standards).        GNU coding standards.
12 @end direntry
14 @c @setchapternewpage odd
15 @setchapternewpage off
17 @c Put everything in one index (arbitrarily chosen to be the concept index).
18 @syncodeindex fn cp
19 @syncodeindex ky cp
20 @syncodeindex pg cp
21 @syncodeindex vr cp
23 @c This is used by a cross ref in make-stds.texi
24 @set CODESTD  1
25 @iftex
26 @set CHAPTER chapter
27 @end iftex
28 @ifinfo
29 @set CHAPTER node
30 @end ifinfo
32 @copying
33 The GNU coding standards, last updated @value{lastupdate}.
35 Copyright (C) 1992, 1993, 1994, 1995, 1996, 1997, 1998, 1999, 2000,
36 2001, 2002, 2003, 2004, 2005, 2006 Free Software Foundation, Inc.
38 Permission is granted to copy, distribute and/or modify this document
39 under the terms of the GNU Free Documentation License, Version 1.2
40 or any later version published by the Free Software Foundation;
41 with no Invariant Sections, with no
42 Front-Cover Texts, and with no Back-Cover Texts.
43 A copy of the license is included in the section entitled ``GNU
44 Free Documentation License''.
45 @end copying
47 @titlepage
48 @title GNU Coding Standards
49 @author Richard Stallman, et al.
50 @author last updated @value{lastupdate}
51 @page
52 @vskip 0pt plus 1filll
53 @insertcopying
54 @end titlepage
56 @contents
58 @ifnottex
59 @node Top, Preface, (dir), (dir)
60 @top Version
62 @insertcopying
63 @end ifnottex
65 @menu
66 * Preface::                     About the GNU Coding Standards
67 * Legal Issues::                Keeping Free Software Free
68 * Design Advice::               General Program Design
69 * Program Behavior::            Program Behavior for All Programs
70 * Writing C::                   Making The Best Use of C
71 * Documentation::               Documenting Programs
72 * Managing Releases::           The Release Process
73 * References::                  References to Non-Free Software or Documentation
74 * Copying This Manual::         How to Make Copies of This Manual
75 * Index::
77 @end menu
79 @node Preface
80 @chapter About the GNU Coding Standards
82 The GNU Coding Standards were written by Richard Stallman and other GNU
83 Project volunteers.  Their purpose is to make the GNU system clean,
84 consistent, and easy to install.  This document can also be read as a
85 guide to writing portable, robust and reliable programs.  It focuses on
86 programs written in C, but many of the rules and principles are useful
87 even if you write in another programming language.  The rules often
88 state reasons for writing in a certain way.
90 This release of the GNU Coding Standards was last updated
91 @value{lastupdate}.
93 @cindex where to obtain @code{standards.texi}
94 @cindex downloading this manual
95 If you did not obtain this file directly from the GNU project and
96 recently, please check for a newer version.  You can get the GNU
97 Coding Standards from the GNU web server in many
98 different formats, including the Texinfo source, PDF, HTML, DVI, plain
99 text, and more, at: @uref{http://www.gnu.org/prep/standards/}.
101 Corrections or suggestions for this document should be sent to
102 @email{bug-standards@@gnu.org}.  If you make a suggestion, please include a
103 suggested new wording for it; our time is limited.  We prefer a context
104 diff to the @file{standards.texi} or @file{make-stds.texi} files, but if
105 you don't have those files, please mail your suggestion anyway.
107 These standards cover the minimum of what is important when writing a
108 GNU package.  Likely, the needs for additional standards will come up.
109 Sometimes, you might suggest that such standards be added to this
110 document.  If you think your standards would be generally useful, please
111 do suggest them.
113 You should also set standards for your package on many questions not
114 addressed or not firmly specified here.  The most important point is to
115 be self-consistent---try to stick to the conventions you pick, and try
116 to document them as much as possible.  That way, your program will be
117 more maintainable by others.
119 The GNU Hello program serves as an example of how to follow the GNU
120 coding standards for a trivial program.
121 @uref{http://www.gnu.org/software/hello/hello.html}.
123 @node Legal Issues
124 @chapter Keeping Free Software Free
125 @cindex legal aspects
127 This chapter discusses how you can make sure that GNU software
128 avoids legal difficulties, and other related issues.
130 @menu
131 * Reading Non-Free Code::       Referring to Proprietary Programs
132 * Contributions::               Accepting Contributions
133 * Trademarks::                  How We Deal with Trademark Issues
134 @end menu
136 @node Reading Non-Free Code
137 @section Referring to Proprietary Programs
138 @cindex proprietary programs
139 @cindex avoiding proprietary code
141 Don't in any circumstances refer to Unix source code for or during
142 your work on GNU!  (Or to any other proprietary programs.)
144 If you have a vague recollection of the internals of a Unix program,
145 this does not absolutely mean you can't write an imitation of it, but
146 do try to organize the imitation internally along different lines,
147 because this is likely to make the details of the Unix version
148 irrelevant and dissimilar to your results.
150 For example, Unix utilities were generally optimized to minimize
151 memory use; if you go for speed instead, your program will be very
152 different.  You could keep the entire input file in core and scan it
153 there instead of using stdio.  Use a smarter algorithm discovered more
154 recently than the Unix program.  Eliminate use of temporary files.  Do
155 it in one pass instead of two (we did this in the assembler).
157 Or, on the contrary, emphasize simplicity instead of speed.  For some
158 applications, the speed of today's computers makes simpler algorithms
159 adequate.
161 Or go for generality.  For example, Unix programs often have static
162 tables or fixed-size strings, which make for arbitrary limits; use
163 dynamic allocation instead.  Make sure your program handles NULs and
164 other funny characters in the input files.  Add a programming language
165 for extensibility and write part of the program in that language.
167 Or turn some parts of the program into independently usable libraries.
168 Or use a simple garbage collector instead of tracking precisely when
169 to free memory, or use a new GNU facility such as obstacks.
171 @node Contributions
172 @section Accepting Contributions
173 @cindex legal papers
174 @cindex accepting contributions
176 If the program you are working on is copyrighted by the Free Software
177 Foundation, then when someone else sends you a piece of code to add to
178 the program, we need legal papers to use it---just as we asked you to
179 sign papers initially.  @emph{Each} person who makes a nontrivial
180 contribution to a program must sign some sort of legal papers in order
181 for us to have clear title to the program; the main author alone is not
182 enough.
184 So, before adding in any contributions from other people, please tell
185 us, so we can arrange to get the papers.  Then wait until we tell you
186 that we have received the signed papers, before you actually use the
187 contribution.
189 This applies both before you release the program and afterward.  If
190 you receive diffs to fix a bug, and they make significant changes, we
191 need legal papers for that change.
193 This also applies to comments and documentation files.  For copyright
194 law, comments and code are just text.  Copyright applies to all kinds of
195 text, so we need legal papers for all kinds.
197 We know it is frustrating to ask for legal papers; it's frustrating for
198 us as well.  But if you don't wait, you are going out on a limb---for
199 example, what if the contributor's employer won't sign a disclaimer?
200 You might have to take that code out again!
202 You don't need papers for changes of a few lines here or there, since
203 they are not significant for copyright purposes.  Also, you don't need
204 papers if all you get from the suggestion is some ideas, not actual code
205 which you use.  For example, if someone sent you one implementation, but
206 you write a different implementation of the same idea, you don't need to
207 get papers.
209 The very worst thing is if you forget to tell us about the other
210 contributor.  We could be very embarrassed in court some day as a
211 result.
213 We have more detailed advice for maintainers of programs; if you have
214 reached the stage of actually maintaining a program for GNU (whether
215 released or not), please ask us for a copy.  It is also available
216 online for your perusal: @uref{http://www.gnu.org/prep/maintain/}.
218 @node Trademarks
219 @section Trademarks
220 @cindex trademarks
222 Please do not include any trademark acknowledgements in GNU software
223 packages or documentation.
225 Trademark acknowledgements are the statements that such-and-such is a
226 trademark of so-and-so.  The GNU Project has no objection to the basic
227 idea of trademarks, but these acknowledgements feel like kowtowing,
228 and there is no legal requirement for them, so we don't use them.
230 What is legally required, as regards other people's trademarks, is to
231 avoid using them in ways which a reader might reasonably understand as
232 naming or labeling our own programs or activities.  For example, since
233 ``Objective C'' is (or at least was) a trademark, we made sure to say
234 that we provide a ``compiler for the Objective C language'' rather
235 than an ``Objective C compiler''.  The latter would have been meant as
236 a shorter way of saying the former, but it does not explicitly state
237 the relationship, so it could be misinterpreted as using ``Objective
238 C'' as a label for the compiler rather than for the language.
240 Please don't use ``win'' as an abbreviation for Microsoft Windows in
241 GNU software or documentation.  In hacker terminology, calling
242 something a ``win'' is a form of praise.  If you wish to praise
243 Microsoft Windows when speaking on your own, by all means do so, but
244 not in GNU software.  Usually we write the name ``Windows'' in full,
245 but when brevity is very important (as in file names and sometimes
246 symbol names), we abbreviate it to ``w''.  For instance, the files and
247 functions in Emacs that deal with Windows start with @samp{w32}.
249 @node Design Advice
250 @chapter General Program Design
251 @cindex program design
253 This chapter discusses some of the issues you should take into
254 account when designing your program.
256 @c                         Standard or ANSI C
258 @c In 1989 the American National Standards Institute (ANSI) standardized
259 @c C   as  standard  X3.159-1989.    In  December   of  that   year  the
260 @c International Standards Organization ISO  adopted the ANSI C standard
261 @c making  minor changes.   In 1990  ANSI then  re-adopted  ISO standard
262 @c C. This version of C is known as either ANSI C or Standard C.
264 @c A major revision of the C Standard appeared in 1999.
266 @menu
267 * Source Language::             Which languages to use.
268 * Compatibility::               Compatibility with other implementations
269 * Using Extensions::            Using non-standard features
270 * Standard C::                  Using Standard C features
271 * Conditional Compilation::     Compiling Code Only If A Conditional is True
272 @end menu
274 @node Source Language
275 @section Which Languages to Use
276 @cindex programming languages
278 When you want to use a language that gets compiled and runs at high
279 speed, the best language to use is C.  Using another language is like
280 using a non-standard feature: it will cause trouble for users.  Even if
281 GCC supports the other language, users may find it inconvenient to have
282 to install the compiler for that other language in order to build your
283 program.  For example, if you write your program in C++, people will
284 have to install the GNU C++ compiler in order to compile your program.
286 C has one other advantage over C++ and other compiled languages: more
287 people know C, so more people will find it easy to read and modify the
288 program if it is written in C.
290 So in general it is much better to use C, rather than the
291 comparable alternatives.
293 But there are two exceptions to that conclusion:
295 @itemize @bullet
296 @item
297 It is no problem to use another language to write a tool specifically
298 intended for use with that language.  That is because the only people
299 who want to build the tool will be those who have installed the other
300 language anyway.
302 @item
303 If an application is of interest only to a narrow part of the community,
304 then the question of which language it is written in has less effect on
305 other people, so you may as well please yourself.
306 @end itemize
308 Many programs are designed to be extensible: they include an interpreter
309 for a language that is higher level than C.  Often much of the program
310 is written in that language, too.  The Emacs editor pioneered this
311 technique.
313 @cindex GUILE
314 The standard extensibility interpreter for GNU software is GUILE
315 (@uref{http://www.gnu.org/software/guile/}), which implements the
316 language Scheme (an especially clean and simple dialect of Lisp).  We
317 don't reject programs written in other ``scripting languages'' such as
318 Perl and Python, but using GUILE is very important for the overall
319 consistency of the GNU system.
321 @node Compatibility
322 @section Compatibility with Other Implementations
323 @cindex compatibility with C and @sc{posix} standards
324 @cindex @sc{posix} compatibility
326 With occasional exceptions, utility programs and libraries for GNU
327 should be upward compatible with those in Berkeley Unix, and upward
328 compatible with Standard C if Standard C specifies their
329 behavior, and upward compatible with @sc{posix} if @sc{posix} specifies
330 their behavior.
332 When these standards conflict, it is useful to offer compatibility
333 modes for each of them.
335 @cindex options for compatibility
336 Standard C and @sc{posix} prohibit many kinds of extensions.  Feel
337 free to make the extensions anyway, and include a @samp{--ansi},
338 @samp{--posix}, or @samp{--compatible} option to turn them off.
339 However, if the extension has a significant chance of breaking any real
340 programs or scripts, then it is not really upward compatible.  So you
341 should try to redesign its interface to make it upward compatible.
343 @cindex @code{POSIXLY_CORRECT}, environment variable
344 Many GNU programs suppress extensions that conflict with @sc{posix} if the
345 environment variable @code{POSIXLY_CORRECT} is defined (even if it is
346 defined with a null value).  Please make your program recognize this
347 variable if appropriate.
349 When a feature is used only by users (not by programs or command
350 files), and it is done poorly in Unix, feel free to replace it
351 completely with something totally different and better.  (For example,
352 @code{vi} is replaced with Emacs.)  But it is nice to offer a compatible
353 feature as well.  (There is a free @code{vi} clone, so we offer it.)
355 Additional useful features are welcome regardless of whether
356 there is any precedent for them.
358 @node Using Extensions
359 @section Using Non-standard Features
360 @cindex non-standard extensions
362 Many GNU facilities that already exist support a number of convenient
363 extensions over the comparable Unix facilities.  Whether to use these
364 extensions in implementing your program is a difficult question.
366 On the one hand, using the extensions can make a cleaner program.
367 On the other hand, people will not be able to build the program
368 unless the other GNU tools are available.  This might cause the
369 program to work on fewer kinds of machines.
371 With some extensions, it might be easy to provide both alternatives.
372 For example, you can define functions with a ``keyword'' @code{INLINE}
373 and define that as a macro to expand into either @code{inline} or
374 nothing, depending on the compiler.
376 In general, perhaps it is best not to use the extensions if you can
377 straightforwardly do without them, but to use the extensions if they
378 are a big improvement.
380 An exception to this rule are the large, established programs (such as
381 Emacs) which run on a great variety of systems.  Using GNU extensions in
382 such programs would make many users unhappy, so we don't do that.
384 Another exception is for programs that are used as part of compilation:
385 anything that must be compiled with other compilers in order to
386 bootstrap the GNU compilation facilities.  If these require the GNU
387 compiler, then no one can compile them without having them installed
388 already.  That would be extremely troublesome in certain cases.
390 @node Standard C
391 @section Standard C and Pre-Standard C
392 @cindex @sc{ansi} C standard
394 1989 Standard C is widespread enough now that it is ok to use its
395 features in new programs.  There is one exception: do not ever use the
396 ``trigraph'' feature of Standard C.
398 1999 Standard C is not widespread yet, so please do not require its
399 features in programs.  It is ok to use its features if they are present.
401 However, it is easy to support pre-standard compilers in most programs,
402 so if you know how to do that, feel free.  If a program you are
403 maintaining has such support, you should try to keep it working.
405 @cindex function prototypes
406 To support pre-standard C, instead of writing function definitions in
407 standard prototype form,
409 @example
411 foo (int x, int y)
412 @dots{}
413 @end example
415 @noindent
416 write the definition in pre-standard style like this,
418 @example
420 foo (x, y)
421      int x, y;
422 @dots{}
423 @end example
425 @noindent
426 and use a separate declaration to specify the argument prototype:
428 @example
429 int foo (int, int);
430 @end example
432 You need such a declaration anyway, in a header file, to get the benefit
433 of prototypes in all the files where the function is called.  And once
434 you have the declaration, you normally lose nothing by writing the
435 function definition in the pre-standard style.
437 This technique does not work for integer types narrower than @code{int}.
438 If you think of an argument as being of a type narrower than @code{int},
439 declare it as @code{int} instead.
441 There are a few special cases where this technique is hard to use.  For
442 example, if a function argument needs to hold the system type
443 @code{dev_t}, you run into trouble, because @code{dev_t} is shorter than
444 @code{int} on some machines; but you cannot use @code{int} instead,
445 because @code{dev_t} is wider than @code{int} on some machines.  There
446 is no type you can safely use on all machines in a non-standard
447 definition.  The only way to support non-standard C and pass such an
448 argument is to check the width of @code{dev_t} using Autoconf and choose
449 the argument type accordingly.  This may not be worth the trouble.
451 In order to support pre-standard compilers that do not recognize
452 prototypes, you may want to use a preprocessor macro like this:
454 @example
455 /* Declare the prototype for a general external function.  */
456 #if defined (__STDC__) || defined (WINDOWSNT)
457 #define P_(proto) proto
458 #else
459 #define P_(proto) ()
460 #endif
461 @end example
463 @node Conditional Compilation
464 @section Conditional Compilation
466 When supporting configuration options already known when building your
467 program we prefer using @code{if (... )} over conditional compilation,
468 as in the former case the compiler is able to perform more extensive
469 checking of all possible code paths.
471 For example, please write
473 @smallexample
474   if (HAS_FOO)
475     ...
476   else
477     ...
478 @end smallexample
480 @noindent
481 instead of:
483 @smallexample
484   #ifdef HAS_FOO
485     ...
486   #else
487     ...
488   #endif
489 @end smallexample
491 A modern compiler such as GCC will generate exactly the same code in
492 both cases, and we have been using similar techniques with good success
493 in several projects.  Of course, the former method assumes that
494 @code{HAS_FOO} is defined as either 0 or 1.
496 While this is not a silver bullet solving all portability problems,
497 and is not always appropriate, following this policy would have saved
498 GCC developers many hours, or even days, per year.
500 In the case of function-like macros like @code{REVERSIBLE_CC_MODE} in
501 GCC which cannot be simply used in @code{if( ...)} statements, there is
502 an easy workaround.  Simply introduce another macro
503 @code{HAS_REVERSIBLE_CC_MODE} as in the following example:
505 @smallexample
506   #ifdef REVERSIBLE_CC_MODE
507   #define HAS_REVERSIBLE_CC_MODE 1
508   #else
509   #define HAS_REVERSIBLE_CC_MODE 0
510   #endif
511 @end smallexample
513 @node Program Behavior
514 @chapter Program Behavior for All Programs
516 This chapter describes conventions for writing robust
517 software.  It also describes general standards for error messages, the
518 command line interface, and how libraries should behave.
520 @menu
521 * Non-GNU Standards::           We consider standards such as POSIX;
522                                   we don't "obey" them.
523 * Semantics::                   Writing robust programs
524 * Libraries::                   Library behavior
525 * Errors::                      Formatting error messages
526 * User Interfaces::             Standards about interfaces generally
527 * Graphical Interfaces::        Standards for graphical interfaces
528 * Command-Line Interfaces::     Standards for command line interfaces
529 * Option Table::                Table of long options
530 * Memory Usage::                When and how to care about memory needs
531 * File Usage::                  Which files to use, and where
532 @end menu
534 @node Non-GNU Standards
535 @section Non-GNU Standards
537 The GNU Project regards standards published by other organizations as
538 suggestions, not orders.  We consider those standards, but we do not
539 ``obey'' them.  In developing a GNU program, you should implement
540 an outside standard's specifications when that makes the GNU system
541 better overall in an objective sense.  When it doesn't, you shouldn't.
543 In most cases, following published standards is convenient for
544 users---it means that their programs or scripts will work more
545 portably.  For instance, GCC implements nearly all the features of
546 Standard C as specified by that standard.  C program developers would
547 be unhappy if it did not.  And GNU utilities mostly follow
548 specifications of POSIX.2; shell script writers and users would be
549 unhappy if our programs were incompatible.
551 But we do not follow either of these specifications rigidly, and there
552 are specific points on which we decided not to follow them, so as to
553 make the GNU system better for users.
555 For instance, Standard C says that nearly all extensions to C are
556 prohibited.  How silly!  GCC implements many extensions, some of which
557 were later adopted as part of the standard.  If you want these
558 constructs to give an error message as ``required'' by the standard,
559 you must specify @samp{--pedantic}, which was implemented only so that
560 we can say ``GCC is a 100% implementation of the standard,'' not
561 because there is any reason to actually use it.
563 POSIX.2 specifies that @samp{df} and @samp{du} must output sizes by
564 default in units of 512 bytes.  What users want is units of 1k, so
565 that is what we do by default.  If you want the ridiculous behavior
566 ``required'' by POSIX, you must set the environment variable
567 @samp{POSIXLY_CORRECT} (which was originally going to be named
568 @samp{POSIX_ME_HARDER}).
570 GNU utilities also depart from the letter of the POSIX.2 specification
571 when they support long-named command-line options, and intermixing
572 options with ordinary arguments.  This minor incompatibility with
573 POSIX is never a problem in practice, and it is very useful.
575 In particular, don't reject a new feature, or remove an old one,
576 merely because a standard says it is ``forbidden'' or ``deprecated.''
578 @node Semantics
579 @section Writing Robust Programs
581 @cindex arbitrary limits on data
582 Avoid arbitrary limits on the length or number of @emph{any} data
583 structure, including file names, lines, files, and symbols, by allocating
584 all data structures dynamically.  In most Unix utilities, ``long lines
585 are silently truncated''.  This is not acceptable in a GNU utility.
587 @cindex @code{NUL} characters
588 Utilities reading files should not drop NUL characters, or any other
589 nonprinting characters @emph{including those with codes above 0177}.
590 The only sensible exceptions would be utilities specifically intended
591 for interface to certain types of terminals or printers
592 that can't handle those characters.
593 Whenever possible, try to make programs work properly with
594 sequences of bytes that represent multibyte characters, using encodings
595 such as UTF-8 and others.
597 @cindex error messages
598 Check every system call for an error return, unless you know you wish to
599 ignore errors.  Include the system error text (from @code{perror} or
600 equivalent) in @emph{every} error message resulting from a failing
601 system call, as well as the name of the file if any and the name of the
602 utility.  Just ``cannot open foo.c'' or ``stat failed'' is not
603 sufficient.
605 @cindex @code{malloc} return value
606 @cindex memory allocation failure
607 Check every call to @code{malloc} or @code{realloc} to see if it
608 returned zero.  Check @code{realloc} even if you are making the block
609 smaller; in a system that rounds block sizes to a power of 2,
610 @code{realloc} may get a different block if you ask for less space.
612 In Unix, @code{realloc} can destroy the storage block if it returns
613 zero.  GNU @code{realloc} does not have this bug: if it fails, the
614 original block is unchanged.  Feel free to assume the bug is fixed.  If
615 you wish to run your program on Unix, and wish to avoid lossage in this
616 case, you can use the GNU @code{malloc}.
618 You must expect @code{free} to alter the contents of the block that was
619 freed.  Anything you want to fetch from the block, you must fetch before
620 calling @code{free}.
622 If @code{malloc} fails in a noninteractive program, make that a fatal
623 error.  In an interactive program (one that reads commands from the
624 user), it is better to abort the command and return to the command
625 reader loop.  This allows the user to kill other processes to free up
626 virtual memory, and then try the command again.
628 @cindex command-line arguments, decoding
629 Use @code{getopt_long} to decode arguments, unless the argument syntax
630 makes this unreasonable.
632 When static storage is to be written in during program execution, use
633 explicit C code to initialize it.  Reserve C initialized declarations
634 for data that will not be changed.
635 @c ADR: why?
637 Try to avoid low-level interfaces to obscure Unix data structures (such
638 as file directories, utmp, or the layout of kernel memory), since these
639 are less likely to work compatibly.  If you need to find all the files
640 in a directory, use @code{readdir} or some other high-level interface.
641 These are supported compatibly by GNU.
643 @cindex signal handling
644 The preferred signal handling facilities are the BSD variant of
645 @code{signal}, and the @sc{posix} @code{sigaction} function; the
646 alternative USG @code{signal} interface is an inferior design.
648 Nowadays, using the @sc{posix} signal functions may be the easiest way
649 to make a program portable.  If you use @code{signal}, then on GNU/Linux
650 systems running GNU libc version 1, you should include
651 @file{bsd/signal.h} instead of @file{signal.h}, so as to get BSD
652 behavior.  It is up to you whether to support systems where
653 @code{signal} has only the USG behavior, or give up on them.
655 @cindex impossible conditions
656 In error checks that detect ``impossible'' conditions, just abort.
657 There is usually no point in printing any message.  These checks
658 indicate the existence of bugs.  Whoever wants to fix the bugs will have
659 to read the source code and run a debugger.  So explain the problem with
660 comments in the source.  The relevant data will be in variables, which
661 are easy to examine with the debugger, so there is no point moving them
662 elsewhere.
664 Do not use a count of errors as the exit status for a program.
665 @emph{That does not work}, because exit status values are limited to 8
666 bits (0 through 255).  A single run of the program might have 256
667 errors; if you try to return 256 as the exit status, the parent process
668 will see 0 as the status, and it will appear that the program succeeded.
670 @cindex temporary files
671 @cindex @code{TMPDIR} environment variable
672 If you make temporary files, check the @code{TMPDIR} environment
673 variable; if that variable is defined, use the specified directory
674 instead of @file{/tmp}.
676 In addition, be aware that there is a possible security problem when
677 creating temporary files in world-writable directories.  In C, you can
678 avoid this problem by creating temporary files in this manner:
680 @example
681 fd = open(filename, O_WRONLY | O_CREAT | O_EXCL, 0600);
682 @end example
684 @noindent
685 or by using the @code{mkstemps} function from libiberty.
687 In bash, use @code{set -C} to avoid this problem.
689 @node Libraries
690 @section Library Behavior
691 @cindex libraries
693 Try to make library functions reentrant.  If they need to do dynamic
694 storage allocation, at least try to avoid any nonreentrancy aside from
695 that of @code{malloc} itself.
697 Here are certain name conventions for libraries, to avoid name
698 conflicts.
700 Choose a name prefix for the library, more than two characters long.
701 All external function and variable names should start with this
702 prefix.  In addition, there should only be one of these in any given
703 library member.  This usually means putting each one in a separate
704 source file.
706 An exception can be made when two external symbols are always used
707 together, so that no reasonable program could use one without the
708 other; then they can both go in the same file.
710 External symbols that are not documented entry points for the user
711 should have names beginning with @samp{_}.  The @samp{_} should be
712 followed by the chosen name prefix for the library, to prevent
713 collisions with other libraries.  These can go in the same files with
714 user entry points if you like.
716 Static functions and variables can be used as you like and need not
717 fit any naming convention.
719 @node Errors
720 @section Formatting Error Messages
721 @cindex formatting error messages
722 @cindex error messages, formatting
724 Error messages from compilers should look like this:
726 @example
727 @var{source-file-name}:@var{lineno}: @var{message}
728 @end example
730 @noindent
731 If you want to mention the column number, use one of these formats:
733 @example
734 @var{source-file-name}:@var{lineno}:@var{column}: @var{message}
735 @var{source-file-name}:@var{lineno}.@var{column}: @var{message}
737 @end example
739 @noindent
740 Line numbers should start from 1 at the beginning of the file, and
741 column numbers should start from 1 at the beginning of the line.  (Both
742 of these conventions are chosen for compatibility.)  Calculate column
743 numbers assuming that space and all ASCII printing characters have
744 equal width, and assuming tab stops every 8 columns.
746 The error message can also give both the starting and ending positions
747 of the erroneous text.  There are several formats so that you can
748 avoid redundant information such as a duplicate line number.
749 Here are the possible formats:
751 @example
752 @var{source-file-name}:@var{lineno-1}.@var{column-1}-@var{lineno-2}.@var{column-2}: @var{message}
753 @var{source-file-name}:@var{lineno-1}.@var{column-1}-@var{column-2}: @var{message}
754 @var{source-file-name}:@var{lineno-1}-@var{lineno-2}: @var{message}
755 @end example
757 @noindent
758 When an error is spread over several files, you can use this format:
760 @example
761 @var{file-1}:@var{lineno-1}.@var{column-1}-@var{file-2}:@var{lineno-2}.@var{column-2}: @var{message}
762 @end example
764 Error messages from other noninteractive programs should look like this:
766 @example
767 @var{program}:@var{source-file-name}:@var{lineno}: @var{message}
768 @end example
770 @noindent
771 when there is an appropriate source file, or like this:
773 @example
774 @var{program}: @var{message}
775 @end example
777 @noindent
778 when there is no relevant source file.
780 If you want to mention the column number, use this format:
782 @example
783 @var{program}:@var{source-file-name}:@var{lineno}:@var{column}: @var{message}
784 @end example
786 In an interactive program (one that is reading commands from a
787 terminal), it is better not to include the program name in an error
788 message.  The place to indicate which program is running is in the
789 prompt or with the screen layout.  (When the same program runs with
790 input from a source other than a terminal, it is not interactive and
791 would do best to print error messages using the noninteractive style.)
793 The string @var{message} should not begin with a capital letter when
794 it follows a program name and/or file name, because that isn't the
795 beginning of a sentence.  (The sentence conceptually starts at the
796 beginning of the line.)  Also, it should not end with a period.
798 Error messages from interactive programs, and other messages such as
799 usage messages, should start with a capital letter.  But they should not
800 end with a period.
802 @node User Interfaces
803 @section Standards for Interfaces Generally
805 @cindex program name and its behavior
806 @cindex behavior, dependent on program's name
807 Please don't make the behavior of a utility depend on the name used
808 to invoke it.  It is useful sometimes to make a link to a utility
809 with a different name, and that should not change what it does.
811 Instead, use a run time option or a compilation switch or both
812 to select among the alternate behaviors.
814 @cindex output device and program's behavior
815 Likewise, please don't make the behavior of the program depend on the
816 type of output device it is used with.  Device independence is an
817 important principle of the system's design; do not compromise it merely
818 to save someone from typing an option now and then.  (Variation in error
819 message syntax when using a terminal is ok, because that is a side issue
820 that people do not depend on.)
822 If you think one behavior is most useful when the output is to a
823 terminal, and another is most useful when the output is a file or a
824 pipe, then it is usually best to make the default behavior the one that
825 is useful with output to a terminal, and have an option for the other
826 behavior.
828 Compatibility requires certain programs to depend on the type of output
829 device.  It would be disastrous if @code{ls} or @code{sh} did not do so
830 in the way all users expect.  In some of these cases, we supplement the
831 program with a preferred alternate version that does not depend on the
832 output device type.  For example, we provide a @code{dir} program much
833 like @code{ls} except that its default output format is always
834 multi-column format.
836 @node Graphical Interfaces
837 @section Standards for Graphical Interfaces
838 @cindex graphical user interface
840 @cindex gtk+
841 When you write a program that provides a graphical user interface,
842 please make it work with X Windows and the GTK+ toolkit unless the
843 functionality specifically requires some alternative (for example,
844 ``displaying jpeg images while in console mode'').
846 In addition, please provide a command-line interface to control the
847 functionality.  (In many cases, the graphical user interface can be a
848 separate program which invokes the command-line program.)  This is
849 so that the same jobs can be done from scripts.
851 @cindex corba
852 @cindex gnome
853 Please also consider providing a CORBA interface (for use from GNOME), a
854 library interface (for use from C), and perhaps a keyboard-driven
855 console interface (for use by users from console mode).  Once you are
856 doing the work to provide the functionality and the graphical interface,
857 these won't be much extra work.
859 @node Command-Line Interfaces
860 @section Standards for Command Line Interfaces
861 @cindex command-line interface
863 @findex getopt
864 It is a good idea to follow the @sc{posix} guidelines for the
865 command-line options of a program.  The easiest way to do this is to use
866 @code{getopt} to parse them.  Note that the GNU version of @code{getopt}
867 will normally permit options anywhere among the arguments unless the
868 special argument @samp{--} is used.  This is not what @sc{posix}
869 specifies; it is a GNU extension.
871 @cindex long-named options
872 Please define long-named options that are equivalent to the
873 single-letter Unix-style options.  We hope to make GNU more user
874 friendly this way.  This is easy to do with the GNU function
875 @code{getopt_long}.
877 One of the advantages of long-named options is that they can be
878 consistent from program to program.  For example, users should be able
879 to expect the ``verbose'' option of any GNU program which has one, to be
880 spelled precisely @samp{--verbose}.  To achieve this uniformity, look at
881 the table of common long-option names when you choose the option names
882 for your program (@pxref{Option Table}).
884 It is usually a good idea for file names given as ordinary arguments to
885 be input files only; any output files would be specified using options
886 (preferably @samp{-o} or @samp{--output}).  Even if you allow an output
887 file name as an ordinary argument for compatibility, try to provide an
888 option as another way to specify it.  This will lead to more consistency
889 among GNU utilities, and fewer idiosyncrasies for users to remember.
891 @cindex standard command-line options
892 @cindex options, standard command-line
893 @cindex CGI programs, standard options for
894 @cindex PATH_INFO, specifying standard options as
895 All programs should support two standard options: @samp{--version}
896 and @samp{--help}.  CGI programs should accept these as command-line
897 options, and also if given as the @env{PATH_INFO}; for instance,
898 visiting @url{http://example.org/p.cgi/--help} in a browser should
899 output the same information as invoking @samp{p.cgi --help} from the
900 command line.
902 @table @code
903 @cindex @samp{--version} option
904 @item --version
905 This option should direct the program to print information about its name,
906 version, origin and legal status, all on standard output, and then exit
907 successfully.  Other options and arguments should be ignored once this
908 is seen, and the program should not perform its normal function.
910 @cindex canonical name of a program
911 @cindex program's canonical name
912 The first line is meant to be easy for a program to parse; the version
913 number proper starts after the last space.  In addition, it contains
914 the canonical name for this program, in this format:
916 @example
917 GNU Emacs 19.30
918 @end example
920 @noindent
921 The program's name should be a constant string; @emph{don't} compute it
922 from @code{argv[0]}.  The idea is to state the standard or canonical
923 name for the program, not its file name.  There are other ways to find
924 out the precise file name where a command is found in @code{PATH}.
926 If the program is a subsidiary part of a larger package, mention the
927 package name in parentheses, like this:
929 @example
930 emacsserver (GNU Emacs) 19.30
931 @end example
933 @noindent
934 If the package has a version number which is different from this
935 program's version number, you can mention the package version number
936 just before the close-parenthesis.
938 If you @strong{need} to mention the version numbers of libraries which
939 are distributed separately from the package which contains this program,
940 you can do so by printing an additional line of version info for each
941 library you want to mention.  Use the same format for these lines as for
942 the first line.
944 Please do not mention all of the libraries that the program uses ``just
945 for completeness''---that would produce a lot of unhelpful clutter.
946 Please mention library version numbers only if you find in practice that
947 they are very important to you in debugging.
949 The following line, after the version number line or lines, should be a
950 copyright notice.  If more than one copyright notice is called for, put
951 each on a separate line.
953 Next should follow a brief statement that the program is free software,
954 and that users are free to copy and change it on certain conditions.  If
955 the program is covered by the GNU GPL, say so here.  Also mention that
956 there is no warranty, to the extent permitted by law.
958 It is ok to finish the output with a list of the major authors of the
959 program, as a way of giving credit.
961 Here's an example of output that follows these rules:
963 @smallexample
964 GNU Emacs 19.34.5
965 Copyright (C) 1996 Free Software Foundation, Inc.
966 GNU Emacs comes with NO WARRANTY,
967 to the extent permitted by law.
968 You may redistribute copies of GNU Emacs
969 under the terms of the GNU General Public License.
970 For more information about these matters,
971 see the files named COPYING.
972 @end smallexample
974 You should adapt this to your program, of course, filling in the proper
975 year, copyright holder, name of program, and the references to
976 distribution terms, and changing the rest of the wording as necessary.
978 This copyright notice only needs to mention the most recent year in
979 which changes were made---there's no need to list the years for previous
980 versions' changes.  You don't have to mention the name of the program in
981 these notices, if that is inconvenient, since it appeared in the first
982 line.  (The rules are different for copyright notices in source files;
983 see @ref{Copyright Notices,,,maintain,Information for GNU Maintainers}.)
985 Translations of the above lines must preserve the validity of the
986 copyright notices (@pxref{Internationalization}).  If the translation's
987 character set supports it, the @samp{(C)} should be replaced with the
988 copyright symbol, as follows:
990 @ifinfo
991 (the official copyright symbol, which is the letter C in a circle);
992 @end ifinfo
993 @ifnotinfo
994 @copyright{}
995 @end ifnotinfo
997 Write the word ``Copyright'' exactly like that, in English.  Do not
998 translate it into another language.  International treaties recognize
999 the English word ``Copyright''; translations into other languages do not
1000 have legal significance.
1003 @cindex @samp{--help} option
1004 @item --help
1005 This option should output brief documentation for how to invoke the
1006 program, on standard output, then exit successfully.  Other options and
1007 arguments should be ignored once this is seen, and the program should
1008 not perform its normal function.
1010 @cindex address for bug reports
1011 @cindex bug reports
1012 Near the end of the @samp{--help} option's output there should be a line
1013 that says where to mail bug reports.  It should have this format:
1015 @example
1016 Report bugs to @var{mailing-address}.
1017 @end example
1018 @end table
1020 @node Option Table
1021 @section Table of Long Options
1022 @cindex long option names
1023 @cindex table of long options
1025 Here is a table of long options used by GNU programs.  It is surely
1026 incomplete, but we aim to list all the options that a new program might
1027 want to be compatible with.  If you use names not already in the table,
1028 please send @email{bug-standards@@gnu.org} a list of them, with their
1029 meanings, so we can update the table.
1031 @c Please leave newlines between items in this table; it's much easier
1032 @c to update when it isn't completely squashed together and unreadable.
1033 @c When there is more than one short option for a long option name, put
1034 @c a semicolon between the lists of the programs that use them, not a
1035 @c period.   --friedman
1037 @table @samp
1038 @item after-date
1039 @samp{-N} in @code{tar}.
1041 @item all
1042 @samp{-a} in @code{du}, @code{ls}, @code{nm}, @code{stty}, @code{uname},
1043 and @code{unexpand}.
1045 @item all-text
1046 @samp{-a} in @code{diff}.
1048 @item almost-all
1049 @samp{-A} in @code{ls}.
1051 @item append
1052 @samp{-a} in @code{etags}, @code{tee}, @code{time};
1053 @samp{-r} in @code{tar}.
1055 @item archive
1056 @samp{-a} in @code{cp}.
1058 @item archive-name
1059 @samp{-n} in @code{shar}.
1061 @item arglength
1062 @samp{-l} in @code{m4}.
1064 @item ascii
1065 @samp{-a} in @code{diff}.
1067 @item assign
1068 @samp{-v} in @code{gawk}.
1070 @item assume-new
1071 @samp{-W} in Make.
1073 @item assume-old
1074 @samp{-o} in Make.
1076 @item auto-check
1077 @samp{-a} in @code{recode}.
1079 @item auto-pager
1080 @samp{-a} in @code{wdiff}.
1082 @item auto-reference
1083 @samp{-A} in @code{ptx}.
1085 @item avoid-wraps
1086 @samp{-n} in @code{wdiff}.
1088 @item background
1089 For server programs, run in the background.
1091 @item backward-search
1092 @samp{-B} in @code{ctags}.
1094 @item basename
1095 @samp{-f} in @code{shar}.
1097 @item batch
1098 Used in GDB.
1100 @item baud
1101 Used in GDB.
1103 @item before
1104 @samp{-b} in @code{tac}.
1106 @item binary
1107 @samp{-b} in @code{cpio} and @code{diff}.
1109 @item bits-per-code
1110 @samp{-b} in @code{shar}.
1112 @item block-size
1113 Used in @code{cpio} and @code{tar}.
1115 @item blocks
1116 @samp{-b} in @code{head} and @code{tail}.
1118 @item break-file
1119 @samp{-b} in @code{ptx}.
1121 @item brief
1122 Used in various programs to make output shorter.
1124 @item bytes
1125 @samp{-c} in @code{head}, @code{split}, and @code{tail}.
1127 @item c@t{++}
1128 @samp{-C} in @code{etags}.
1130 @item catenate
1131 @samp{-A} in @code{tar}.
1133 @item cd
1134 Used in various programs to specify the directory to use.
1136 @item changes
1137 @samp{-c} in @code{chgrp} and @code{chown}.
1139 @item classify
1140 @samp{-F} in @code{ls}.
1142 @item colons
1143 @samp{-c} in @code{recode}.
1145 @item command
1146 @samp{-c} in @code{su};
1147 @samp{-x} in GDB.
1149 @item compare
1150 @samp{-d} in @code{tar}.
1152 @item compat
1153 Used in @code{gawk}.
1155 @item compress
1156 @samp{-Z} in @code{tar} and @code{shar}.
1158 @item concatenate
1159 @samp{-A} in @code{tar}.
1161 @item confirmation
1162 @samp{-w} in @code{tar}.
1164 @item context
1165 Used in @code{diff}.
1167 @item copyleft
1168 @samp{-W copyleft} in @code{gawk}.
1170 @item copyright
1171 @samp{-C} in @code{ptx}, @code{recode}, and @code{wdiff};
1172 @samp{-W copyright} in @code{gawk}.
1174 @item core
1175 Used in GDB.
1177 @item count
1178 @samp{-q} in @code{who}.
1180 @item count-links
1181 @samp{-l} in @code{du}.
1183 @item create
1184 Used in @code{tar} and @code{cpio}.
1186 @item cut-mark
1187 @samp{-c} in @code{shar}.
1189 @item cxref
1190 @samp{-x} in @code{ctags}.
1192 @item date
1193 @samp{-d} in @code{touch}.
1195 @item debug
1196 @samp{-d} in Make and @code{m4};
1197 @samp{-t} in Bison.
1199 @item define
1200 @samp{-D} in @code{m4}.
1202 @item defines
1203 @samp{-d} in Bison and @code{ctags}.
1205 @item delete
1206 @samp{-D} in @code{tar}.
1208 @item dereference
1209 @samp{-L} in @code{chgrp}, @code{chown}, @code{cpio}, @code{du},
1210 @code{ls}, and @code{tar}.
1212 @item dereference-args
1213 @samp{-D} in @code{du}.
1215 @item device
1216 Specify an I/O device (special file name).
1218 @item diacritics
1219 @samp{-d} in @code{recode}.
1221 @item dictionary-order
1222 @samp{-d} in @code{look}.
1224 @item diff
1225 @samp{-d} in @code{tar}.
1227 @item digits
1228 @samp{-n} in @code{csplit}.
1230 @item directory
1231 Specify the directory to use, in various programs.  In @code{ls}, it
1232 means to show directories themselves rather than their contents.  In
1233 @code{rm} and @code{ln}, it means to not treat links to directories
1234 specially.
1236 @item discard-all
1237 @samp{-x} in @code{strip}.
1239 @item discard-locals
1240 @samp{-X} in @code{strip}.
1242 @item dry-run
1243 @samp{-n} in Make.
1245 @item ed
1246 @samp{-e} in @code{diff}.
1248 @item elide-empty-files
1249 @samp{-z} in @code{csplit}.
1251 @item end-delete
1252 @samp{-x} in @code{wdiff}.
1254 @item end-insert
1255 @samp{-z} in @code{wdiff}.
1257 @item entire-new-file
1258 @samp{-N} in @code{diff}.
1260 @item environment-overrides
1261 @samp{-e} in Make.
1263 @item eof
1264 @samp{-e} in @code{xargs}.
1266 @item epoch
1267 Used in GDB.
1269 @item error-limit
1270 Used in @code{makeinfo}.
1272 @item error-output
1273 @samp{-o} in @code{m4}.
1275 @item escape
1276 @samp{-b} in @code{ls}.
1278 @item exclude-from
1279 @samp{-X} in @code{tar}.
1281 @item exec
1282 Used in GDB.
1284 @item exit
1285 @samp{-x} in @code{xargs}.
1287 @item exit-0
1288 @samp{-e} in @code{unshar}.
1290 @item expand-tabs
1291 @samp{-t} in @code{diff}.
1293 @item expression
1294 @samp{-e} in @code{sed}.
1296 @item extern-only
1297 @samp{-g} in @code{nm}.
1299 @item extract
1300 @samp{-i} in @code{cpio};
1301 @samp{-x} in @code{tar}.
1303 @item faces
1304 @samp{-f} in @code{finger}.
1306 @item fast
1307 @samp{-f} in @code{su}.
1309 @item fatal-warnings
1310 @samp{-E} in @code{m4}.
1312 @item file
1313 @samp{-f} in @code{info}, @code{gawk}, Make, @code{mt}, and @code{tar};
1314 @samp{-n} in @code{sed};
1315 @samp{-r} in @code{touch}.
1317 @item field-separator
1318 @samp{-F} in @code{gawk}.
1320 @item file-prefix
1321 @samp{-b} in Bison.
1323 @item file-type
1324 @samp{-F} in @code{ls}.
1326 @item files-from
1327 @samp{-T} in @code{tar}.
1329 @item fill-column
1330 Used in @code{makeinfo}.
1332 @item flag-truncation
1333 @samp{-F} in @code{ptx}.
1335 @item fixed-output-files
1336 @samp{-y} in Bison.
1338 @item follow
1339 @samp{-f} in @code{tail}.
1341 @item footnote-style
1342 Used in @code{makeinfo}.
1344 @item force
1345 @samp{-f} in @code{cp}, @code{ln}, @code{mv}, and @code{rm}.
1347 @item force-prefix
1348 @samp{-F} in @code{shar}.
1350 @item foreground
1351 For server programs, run in the foreground;
1352 in other words, don't do anything special to run the server
1353 in the background.
1355 @item format
1356 Used in @code{ls}, @code{time}, and @code{ptx}.
1358 @item freeze-state
1359 @samp{-F} in @code{m4}.
1361 @item fullname
1362 Used in GDB.
1364 @item gap-size
1365 @samp{-g} in @code{ptx}.
1367 @item get
1368 @samp{-x} in @code{tar}.
1370 @item graphic
1371 @samp{-i} in @code{ul}.
1373 @item graphics
1374 @samp{-g} in @code{recode}.
1376 @item group
1377 @samp{-g} in @code{install}.
1379 @item gzip
1380 @samp{-z} in @code{tar} and @code{shar}.
1382 @item hashsize
1383 @samp{-H} in @code{m4}.
1385 @item header
1386 @samp{-h} in @code{objdump} and @code{recode}
1388 @item heading
1389 @samp{-H} in @code{who}.
1391 @item help
1392 Used to ask for brief usage information.
1394 @item here-delimiter
1395 @samp{-d} in @code{shar}.
1397 @item hide-control-chars
1398 @samp{-q} in @code{ls}.
1400 @item html
1401 In @code{makeinfo}, output HTML.
1403 @item idle
1404 @samp{-u} in @code{who}.
1406 @item ifdef
1407 @samp{-D} in @code{diff}.
1409 @item ignore
1410 @samp{-I} in @code{ls};
1411 @samp{-x} in @code{recode}.
1413 @item ignore-all-space
1414 @samp{-w} in @code{diff}.
1416 @item ignore-backups
1417 @samp{-B} in @code{ls}.
1419 @item ignore-blank-lines
1420 @samp{-B} in @code{diff}.
1422 @item ignore-case
1423 @samp{-f} in @code{look} and @code{ptx};
1424 @samp{-i} in @code{diff} and @code{wdiff}.
1426 @item ignore-errors
1427 @samp{-i} in Make.
1429 @item ignore-file
1430 @samp{-i} in @code{ptx}.
1432 @item ignore-indentation
1433 @samp{-I} in @code{etags}.
1435 @item ignore-init-file
1436 @samp{-f} in Oleo.
1438 @item ignore-interrupts
1439 @samp{-i} in @code{tee}.
1441 @item ignore-matching-lines
1442 @samp{-I} in @code{diff}.
1444 @item ignore-space-change
1445 @samp{-b} in @code{diff}.
1447 @item ignore-zeros
1448 @samp{-i} in @code{tar}.
1450 @item include
1451 @samp{-i} in @code{etags};
1452 @samp{-I} in @code{m4}.
1454 @item include-dir
1455 @samp{-I} in Make.
1457 @item incremental
1458 @samp{-G} in @code{tar}.
1460 @item info
1461 @samp{-i}, @samp{-l}, and @samp{-m} in Finger.
1463 @item init-file
1464 In some programs, specify the name of the file to read as the user's
1465 init file.
1467 @item initial
1468 @samp{-i} in @code{expand}.
1470 @item initial-tab
1471 @samp{-T} in @code{diff}.
1473 @item inode
1474 @samp{-i} in @code{ls}.
1476 @item interactive
1477 @samp{-i} in @code{cp}, @code{ln}, @code{mv}, @code{rm};
1478 @samp{-e} in @code{m4};
1479 @samp{-p} in @code{xargs};
1480 @samp{-w} in @code{tar}.
1482 @item intermix-type
1483 @samp{-p} in @code{shar}.
1485 @item iso-8601
1486 Used in @code{date}
1488 @item jobs
1489 @samp{-j} in Make.
1491 @item just-print
1492 @samp{-n} in Make.
1494 @item keep-going
1495 @samp{-k} in Make.
1497 @item keep-files
1498 @samp{-k} in @code{csplit}.
1500 @item kilobytes
1501 @samp{-k} in @code{du} and @code{ls}.
1503 @item language
1504 @samp{-l} in @code{etags}.
1506 @item less-mode
1507 @samp{-l} in @code{wdiff}.
1509 @item level-for-gzip
1510 @samp{-g} in @code{shar}.
1512 @item line-bytes
1513 @samp{-C} in @code{split}.
1515 @item lines
1516 Used in @code{split}, @code{head}, and @code{tail}.
1518 @item link
1519 @samp{-l} in @code{cpio}.
1521 @item lint
1522 @itemx lint-old
1523 Used in @code{gawk}.
1525 @item list
1526 @samp{-t} in @code{cpio};
1527 @samp{-l} in @code{recode}.
1529 @item list
1530 @samp{-t} in @code{tar}.
1532 @item literal
1533 @samp{-N} in @code{ls}.
1535 @item load-average
1536 @samp{-l} in Make.
1538 @item login
1539 Used in @code{su}.
1541 @item machine
1542 Used in @code{uname}.
1544 @item macro-name
1545 @samp{-M} in @code{ptx}.
1547 @item mail
1548 @samp{-m} in @code{hello} and @code{uname}.
1550 @item make-directories
1551 @samp{-d} in @code{cpio}.
1553 @item makefile
1554 @samp{-f} in Make.
1556 @item mapped
1557 Used in GDB.
1559 @item max-args
1560 @samp{-n} in @code{xargs}.
1562 @item max-chars
1563 @samp{-n} in @code{xargs}.
1565 @item max-lines
1566 @samp{-l} in @code{xargs}.
1568 @item max-load
1569 @samp{-l} in Make.
1571 @item max-procs
1572 @samp{-P} in @code{xargs}.
1574 @item mesg
1575 @samp{-T} in @code{who}.
1577 @item message
1578 @samp{-T} in @code{who}.
1580 @item minimal
1581 @samp{-d} in @code{diff}.
1583 @item mixed-uuencode
1584 @samp{-M} in @code{shar}.
1586 @item mode
1587 @samp{-m} in @code{install}, @code{mkdir}, and @code{mkfifo}.
1589 @item modification-time
1590 @samp{-m} in @code{tar}.
1592 @item multi-volume
1593 @samp{-M} in @code{tar}.
1595 @item name-prefix
1596 @samp{-a} in Bison.
1598 @item nesting-limit
1599 @samp{-L} in @code{m4}.
1601 @item net-headers
1602 @samp{-a} in @code{shar}.
1604 @item new-file
1605 @samp{-W} in Make.
1607 @item no-builtin-rules
1608 @samp{-r} in Make.
1610 @item no-character-count
1611 @samp{-w} in @code{shar}.
1613 @item no-check-existing
1614 @samp{-x} in @code{shar}.
1616 @item no-common
1617 @samp{-3} in @code{wdiff}.
1619 @item no-create
1620 @samp{-c} in @code{touch}.
1622 @item no-defines
1623 @samp{-D} in @code{etags}.
1625 @item no-deleted
1626 @samp{-1} in @code{wdiff}.
1628 @item no-dereference
1629 @samp{-d} in @code{cp}.
1631 @item no-inserted
1632 @samp{-2} in @code{wdiff}.
1634 @item no-keep-going
1635 @samp{-S} in Make.
1637 @item no-lines
1638 @samp{-l} in Bison.
1640 @item no-piping
1641 @samp{-P} in @code{shar}.
1643 @item no-prof
1644 @samp{-e} in @code{gprof}.
1646 @item no-regex
1647 @samp{-R} in @code{etags}.
1649 @item no-sort
1650 @samp{-p} in @code{nm}.
1652 @item no-splash
1653 Don't print a startup splash screen.
1655 @item no-split
1656 Used in @code{makeinfo}.
1658 @item no-static
1659 @samp{-a} in @code{gprof}.
1661 @item no-time
1662 @samp{-E} in @code{gprof}.
1664 @item no-timestamp
1665 @samp{-m} in @code{shar}.
1667 @item no-validate
1668 Used in @code{makeinfo}.
1670 @item no-wait
1671 Used in @code{emacsclient}.
1673 @item no-warn
1674 Used in various programs to inhibit warnings.
1676 @item node
1677 @samp{-n} in @code{info}.
1679 @item nodename
1680 @samp{-n} in @code{uname}.
1682 @item nonmatching
1683 @samp{-f} in @code{cpio}.
1685 @item nstuff
1686 @samp{-n} in @code{objdump}.
1688 @item null
1689 @samp{-0} in @code{xargs}.
1691 @item number
1692 @samp{-n} in @code{cat}.
1694 @item number-nonblank
1695 @samp{-b} in @code{cat}.
1697 @item numeric-sort
1698 @samp{-n} in @code{nm}.
1700 @item numeric-uid-gid
1701 @samp{-n} in @code{cpio} and @code{ls}.
1703 @item nx
1704 Used in GDB.
1706 @item old-archive
1707 @samp{-o} in @code{tar}.
1709 @item old-file
1710 @samp{-o} in Make.
1712 @item one-file-system
1713 @samp{-l} in @code{tar}, @code{cp}, and @code{du}.
1715 @item only-file
1716 @samp{-o} in @code{ptx}.
1718 @item only-prof
1719 @samp{-f} in @code{gprof}.
1721 @item only-time
1722 @samp{-F} in @code{gprof}.
1724 @item options
1725 @samp{-o} in @code{getopt}, @code{fdlist}, @code{fdmount},
1726 @code{fdmountd}, and @code{fdumount}.
1728 @item output
1729 In various programs, specify the output file name.
1731 @item output-prefix
1732 @samp{-o} in @code{shar}.
1734 @item override
1735 @samp{-o} in @code{rm}.
1737 @item overwrite
1738 @samp{-c} in @code{unshar}.
1740 @item owner
1741 @samp{-o} in @code{install}.
1743 @item paginate
1744 @samp{-l} in @code{diff}.
1746 @item paragraph-indent
1747 Used in @code{makeinfo}.
1749 @item parents
1750 @samp{-p} in @code{mkdir} and @code{rmdir}.
1752 @item pass-all
1753 @samp{-p} in @code{ul}.
1755 @item pass-through
1756 @samp{-p} in @code{cpio}.
1758 @item port
1759 @samp{-P} in @code{finger}.
1761 @item portability
1762 @samp{-c} in @code{cpio} and @code{tar}.
1764 @item posix
1765 Used in @code{gawk}.
1767 @item prefix-builtins
1768 @samp{-P} in @code{m4}.
1770 @item prefix
1771 @samp{-f} in @code{csplit}.
1773 @item preserve
1774 Used in @code{tar} and @code{cp}.
1776 @item preserve-environment
1777 @samp{-p} in @code{su}.
1779 @item preserve-modification-time
1780 @samp{-m} in @code{cpio}.
1782 @item preserve-order
1783 @samp{-s} in @code{tar}.
1785 @item preserve-permissions
1786 @samp{-p} in @code{tar}.
1788 @item print
1789 @samp{-l} in @code{diff}.
1791 @item print-chars
1792 @samp{-L} in @code{cmp}.
1794 @item print-data-base
1795 @samp{-p} in Make.
1797 @item print-directory
1798 @samp{-w} in Make.
1800 @item print-file-name
1801 @samp{-o} in @code{nm}.
1803 @item print-symdefs
1804 @samp{-s} in @code{nm}.
1806 @item printer
1807 @samp{-p} in @code{wdiff}.
1809 @item prompt
1810 @samp{-p} in @code{ed}.
1812 @item proxy
1813 Specify an HTTP proxy.
1815 @item query-user
1816 @samp{-X} in @code{shar}.
1818 @item question
1819 @samp{-q} in Make.
1821 @item quiet
1822 Used in many programs to inhibit the usual output.  Every
1823 program accepting @samp{--quiet} should accept @samp{--silent} as a
1824 synonym.
1826 @item quiet-unshar
1827 @samp{-Q} in @code{shar}
1829 @item quote-name
1830 @samp{-Q} in @code{ls}.
1832 @item rcs
1833 @samp{-n} in @code{diff}.
1835 @item re-interval
1836 Used in @code{gawk}.
1838 @item read-full-blocks
1839 @samp{-B} in @code{tar}.
1841 @item readnow
1842 Used in GDB.
1844 @item recon
1845 @samp{-n} in Make.
1847 @item record-number
1848 @samp{-R} in @code{tar}.
1850 @item recursive
1851 Used in @code{chgrp}, @code{chown}, @code{cp}, @code{ls}, @code{diff},
1852 and @code{rm}.
1854 @item reference-limit
1855 Used in @code{makeinfo}.
1857 @item references
1858 @samp{-r} in @code{ptx}.
1860 @item regex
1861 @samp{-r} in @code{tac} and @code{etags}.
1863 @item release
1864 @samp{-r} in @code{uname}.
1866 @item reload-state
1867 @samp{-R} in @code{m4}.
1869 @item relocation
1870 @samp{-r} in @code{objdump}.
1872 @item rename
1873 @samp{-r} in @code{cpio}.
1875 @item replace
1876 @samp{-i} in @code{xargs}.
1878 @item report-identical-files
1879 @samp{-s} in @code{diff}.
1881 @item reset-access-time
1882 @samp{-a} in @code{cpio}.
1884 @item reverse
1885 @samp{-r} in @code{ls} and @code{nm}.
1887 @item reversed-ed
1888 @samp{-f} in @code{diff}.
1890 @item right-side-defs
1891 @samp{-R} in @code{ptx}.
1893 @item same-order
1894 @samp{-s} in @code{tar}.
1896 @item same-permissions
1897 @samp{-p} in @code{tar}.
1899 @item save
1900 @samp{-g} in @code{stty}.
1902 @item se
1903 Used in GDB.
1905 @item sentence-regexp
1906 @samp{-S} in @code{ptx}.
1908 @item separate-dirs
1909 @samp{-S} in @code{du}.
1911 @item separator
1912 @samp{-s} in @code{tac}.
1914 @item sequence
1915 Used by @code{recode} to chose files or pipes for sequencing passes.
1917 @item shell
1918 @samp{-s} in @code{su}.
1920 @item show-all
1921 @samp{-A} in @code{cat}.
1923 @item show-c-function
1924 @samp{-p} in @code{diff}.
1926 @item show-ends
1927 @samp{-E} in @code{cat}.
1929 @item show-function-line
1930 @samp{-F} in @code{diff}.
1932 @item show-tabs
1933 @samp{-T} in @code{cat}.
1935 @item silent
1936 Used in many programs to inhibit the usual output.
1937 Every program accepting
1938 @samp{--silent} should accept @samp{--quiet} as a synonym.
1940 @item size
1941 @samp{-s} in @code{ls}.
1943 @item socket
1944 Specify a file descriptor for a network server to use for its socket,
1945 instead of opening and binding a new socket.  This provides a way to
1946 run, in a non-privileged process, a server that normally needs a
1947 reserved port number.
1949 @item sort
1950 Used in @code{ls}.
1952 @item source
1953 @samp{-W source} in @code{gawk}.
1955 @item sparse
1956 @samp{-S} in @code{tar}.
1958 @item speed-large-files
1959 @samp{-H} in @code{diff}.
1961 @item split-at
1962 @samp{-E} in @code{unshar}.
1964 @item split-size-limit
1965 @samp{-L} in @code{shar}.
1967 @item squeeze-blank
1968 @samp{-s} in @code{cat}.
1970 @item start-delete
1971 @samp{-w} in @code{wdiff}.
1973 @item start-insert
1974 @samp{-y} in @code{wdiff}.
1976 @item starting-file
1977 Used in @code{tar} and @code{diff} to specify which file within
1978 a directory to start processing with.
1980 @item statistics
1981 @samp{-s} in @code{wdiff}.
1983 @item stdin-file-list
1984 @samp{-S} in @code{shar}.
1986 @item stop
1987 @samp{-S} in Make.
1989 @item strict
1990 @samp{-s} in @code{recode}.
1992 @item strip
1993 @samp{-s} in @code{install}.
1995 @item strip-all
1996 @samp{-s} in @code{strip}.
1998 @item strip-debug
1999 @samp{-S} in @code{strip}.
2001 @item submitter
2002 @samp{-s} in @code{shar}.
2004 @item suffix
2005 @samp{-S} in @code{cp}, @code{ln}, @code{mv}.
2007 @item suffix-format
2008 @samp{-b} in @code{csplit}.
2010 @item sum
2011 @samp{-s} in @code{gprof}.
2013 @item summarize
2014 @samp{-s} in @code{du}.
2016 @item symbolic
2017 @samp{-s} in @code{ln}.
2019 @item symbols
2020 Used in GDB and @code{objdump}.
2022 @item synclines
2023 @samp{-s} in @code{m4}.
2025 @item sysname
2026 @samp{-s} in @code{uname}.
2028 @item tabs
2029 @samp{-t} in @code{expand} and @code{unexpand}.
2031 @item tabsize
2032 @samp{-T} in @code{ls}.
2034 @item terminal
2035 @samp{-T} in @code{tput} and @code{ul}.
2036 @samp{-t} in @code{wdiff}.
2038 @item text
2039 @samp{-a} in @code{diff}.
2041 @item text-files
2042 @samp{-T} in @code{shar}.
2044 @item time
2045 Used in @code{ls} and @code{touch}.
2047 @item timeout
2048 Specify how long to wait before giving up on some operation.
2050 @item to-stdout
2051 @samp{-O} in @code{tar}.
2053 @item total
2054 @samp{-c} in @code{du}.
2056 @item touch
2057 @samp{-t} in Make, @code{ranlib}, and @code{recode}.
2059 @item trace
2060 @samp{-t} in @code{m4}.
2062 @item traditional
2063 @samp{-t} in @code{hello};
2064 @samp{-W traditional} in @code{gawk};
2065 @samp{-G} in @code{ed}, @code{m4}, and @code{ptx}.
2067 @item tty
2068 Used in GDB.
2070 @item typedefs
2071 @samp{-t} in @code{ctags}.
2073 @item typedefs-and-c++
2074 @samp{-T} in @code{ctags}.
2076 @item typeset-mode
2077 @samp{-t} in @code{ptx}.
2079 @item uncompress
2080 @samp{-z} in @code{tar}.
2082 @item unconditional
2083 @samp{-u} in @code{cpio}.
2085 @item undefine
2086 @samp{-U} in @code{m4}.
2088 @item undefined-only
2089 @samp{-u} in @code{nm}.
2091 @item update
2092 @samp{-u} in @code{cp}, @code{ctags}, @code{mv}, @code{tar}.
2094 @item usage
2095 Used in @code{gawk}; same as @samp{--help}.
2097 @item uuencode
2098 @samp{-B} in @code{shar}.
2100 @item vanilla-operation
2101 @samp{-V} in @code{shar}.
2103 @item verbose
2104 Print more information about progress.  Many programs support this.
2106 @item verify
2107 @samp{-W} in @code{tar}.
2109 @item version
2110 Print the version number.
2112 @item version-control
2113 @samp{-V} in @code{cp}, @code{ln}, @code{mv}.
2115 @item vgrind
2116 @samp{-v} in @code{ctags}.
2118 @item volume
2119 @samp{-V} in @code{tar}.
2121 @item what-if
2122 @samp{-W} in Make.
2124 @item whole-size-limit
2125 @samp{-l} in @code{shar}.
2127 @item width
2128 @samp{-w} in @code{ls} and @code{ptx}.
2130 @item word-regexp
2131 @samp{-W} in @code{ptx}.
2133 @item writable
2134 @samp{-T} in @code{who}.
2136 @item zeros
2137 @samp{-z} in @code{gprof}.
2138 @end table
2140 @node Memory Usage
2141 @section Memory Usage
2142 @cindex memory usage
2144 If a program typically uses just a few meg of memory, don't bother making any
2145 effort to reduce memory usage.  For example, if it is impractical for
2146 other reasons to operate on files more than a few meg long, it is
2147 reasonable to read entire input files into core to operate on them.
2149 However, for programs such as @code{cat} or @code{tail}, that can
2150 usefully operate on very large files, it is important to avoid using a
2151 technique that would artificially limit the size of files it can handle.
2152 If a program works by lines and could be applied to arbitrary
2153 user-supplied input files, it should keep only a line in memory, because
2154 this is not very hard and users will want to be able to operate on input
2155 files that are bigger than will fit in core all at once.
2157 If your program creates complicated data structures, just make them in
2158 core and give a fatal error if @code{malloc} returns zero.
2160 @node File Usage
2161 @section File Usage
2162 @cindex file usage
2164 Programs should be prepared to operate when @file{/usr} and @file{/etc}
2165 are read-only file systems.  Thus, if the program manages log files,
2166 lock files, backup files, score files, or any other files which are
2167 modified for internal purposes, these files should not be stored in
2168 @file{/usr} or @file{/etc}.
2170 There are two exceptions.  @file{/etc} is used to store system
2171 configuration information; it is reasonable for a program to modify
2172 files in @file{/etc} when its job is to update the system configuration.
2173 Also, if the user explicitly asks to modify one file in a directory, it
2174 is reasonable for the program to store other files in the same
2175 directory.
2177 @node Writing C
2178 @chapter Making The Best Use of C
2180 This chapter provides advice on how best to use the C language
2181 when writing GNU software.
2183 @menu
2184 * Formatting::                  Formatting Your Source Code
2185 * Comments::                    Commenting Your Work
2186 * Syntactic Conventions::       Clean Use of C Constructs
2187 * Names::                       Naming Variables, Functions, and Files
2188 * System Portability::          Portability between different operating systems
2189 * CPU Portability::             Supporting the range of CPU types
2190 * System Functions::            Portability and ``standard'' library functions
2191 * Internationalization::        Techniques for internationalization
2192 * Character Set::               Use ASCII by default.
2193 * Quote Characters::            Use `...' in the C locale.
2194 * Mmap::                        How you can safely use @code{mmap}.
2195 @end menu
2197 @node Formatting
2198 @section Formatting Your Source Code
2199 @cindex formatting source code
2201 @cindex open brace
2202 @cindex braces, in C source
2203 It is important to put the open-brace that starts the body of a C
2204 function in column one, and avoid putting any other open-brace or
2205 open-parenthesis or open-bracket in column one.  Several tools look
2206 for open-braces in column one to find the beginnings of C functions.
2207 These tools will not work on code not formatted that way.
2209 It is also important for function definitions to start the name of the
2210 function in column one.  This helps people to search for function
2211 definitions, and may also help certain tools recognize them.  Thus,
2212 using Standard C syntax, the format is this:
2214 @example
2215 static char *
2216 concat (char *s1, char *s2)
2218   @dots{}
2220 @end example
2222 @noindent
2223 or, if you want to use traditional C syntax, format the definition like
2224 this:
2226 @example
2227 static char *
2228 concat (s1, s2)        /* Name starts in column one here */
2229      char *s1, *s2;
2230 @{                     /* Open brace in column one here */
2231   @dots{}
2233 @end example
2235 In Standard C, if the arguments don't fit nicely on one line,
2236 split it like this:
2238 @example
2240 lots_of_args (int an_integer, long a_long, short a_short,
2241               double a_double, float a_float)
2242 @dots{}
2243 @end example
2245 The rest of this section gives our recommendations for other aspects of
2246 C formatting style, which is also the default style of the @code{indent}
2247 program in version 1.2 and newer.  It corresponds to the options
2249 @smallexample
2250 -nbad -bap -nbc -bbo -bl -bli2 -bls -ncdb -nce -cp1 -cs -di2
2251 -ndj -nfc1 -nfca -hnl -i2 -ip5 -lp -pcs -psl -nsc -nsob
2252 @end smallexample
2254 We don't think of these recommendations as requirements, because it
2255 causes no problems for users if two different programs have different
2256 formatting styles.
2258 But whatever style you use, please use it consistently, since a mixture
2259 of styles within one program tends to look ugly.  If you are
2260 contributing changes to an existing program, please follow the style of
2261 that program.
2263 For the body of the function, our recommended style looks like this:
2265 @example
2266 if (x < foo (y, z))
2267   haha = bar[4] + 5;
2268 else
2269   @{
2270     while (z)
2271       @{
2272         haha += foo (z, z);
2273         z--;
2274       @}
2275     return ++x + bar ();
2276   @}
2277 @end example
2279 @cindex spaces before open-paren
2280 We find it easier to read a program when it has spaces before the
2281 open-parentheses and after the commas.  Especially after the commas.
2283 When you split an expression into multiple lines, split it
2284 before an operator, not after one.  Here is the right way:
2286 @cindex expressions, splitting
2287 @example
2288 if (foo_this_is_long && bar > win (x, y, z)
2289     && remaining_condition)
2290 @end example
2292 Try to avoid having two operators of different precedence at the same
2293 level of indentation.  For example, don't write this:
2295 @example
2296 mode = (inmode[j] == VOIDmode
2297         || GET_MODE_SIZE (outmode[j]) > GET_MODE_SIZE (inmode[j])
2298         ? outmode[j] : inmode[j]);
2299 @end example
2301 Instead, use extra parentheses so that the indentation shows the nesting:
2303 @example
2304 mode = ((inmode[j] == VOIDmode
2305          || (GET_MODE_SIZE (outmode[j]) > GET_MODE_SIZE (inmode[j])))
2306         ? outmode[j] : inmode[j]);
2307 @end example
2309 Insert extra parentheses so that Emacs will indent the code properly.
2310 For example, the following indentation looks nice if you do it by hand,
2312 @example
2313 v = rup->ru_utime.tv_sec*1000 + rup->ru_utime.tv_usec/1000
2314     + rup->ru_stime.tv_sec*1000 + rup->ru_stime.tv_usec/1000;
2315 @end example
2317 @noindent
2318 but Emacs would alter it.  Adding a set of parentheses produces
2319 something that looks equally nice, and which Emacs will preserve:
2321 @example
2322 v = (rup->ru_utime.tv_sec*1000 + rup->ru_utime.tv_usec/1000
2323      + rup->ru_stime.tv_sec*1000 + rup->ru_stime.tv_usec/1000);
2324 @end example
2326 Format do-while statements like this:
2328 @example
2330   @{
2331     a = foo (a);
2332   @}
2333 while (a > 0);
2334 @end example
2336 @cindex formfeed
2337 @cindex control-L
2338 Please use formfeed characters (control-L) to divide the program into
2339 pages at logical places (but not within a function).  It does not matter
2340 just how long the pages are, since they do not have to fit on a printed
2341 page.  The formfeeds should appear alone on lines by themselves.
2343 @node Comments
2344 @section Commenting Your Work
2345 @cindex commenting
2347 Every program should start with a comment saying briefly what it is for.
2348 Example: @samp{fmt - filter for simple filling of text}.  This comment
2349 should be at the top of the source file containing the @samp{main}
2350 function of the program.
2352 Also, please write a brief comment at the start of each source file,
2353 with the file name and a line or two about the overall purpose of the
2354 file.
2356 Please write the comments in a GNU program in English, because English
2357 is the one language that nearly all programmers in all countries can
2358 read.  If you do not write English well, please write comments in
2359 English as well as you can, then ask other people to help rewrite them.
2360 If you can't write comments in English, please find someone to work with
2361 you and translate your comments into English.
2363 Please put a comment on each function saying what the function does,
2364 what sorts of arguments it gets, and what the possible values of
2365 arguments mean and are used for.  It is not necessary to duplicate in
2366 words the meaning of the C argument declarations, if a C type is being
2367 used in its customary fashion.  If there is anything nonstandard about
2368 its use (such as an argument of type @code{char *} which is really the
2369 address of the second character of a string, not the first), or any
2370 possible values that would not work the way one would expect (such as,
2371 that strings containing newlines are not guaranteed to work), be sure
2372 to say so.
2374 Also explain the significance of the return value, if there is one.
2376 Please put two spaces after the end of a sentence in your comments, so
2377 that the Emacs sentence commands will work.  Also, please write
2378 complete sentences and capitalize the first word.  If a lower-case
2379 identifier comes at the beginning of a sentence, don't capitalize it!
2380 Changing the spelling makes it a different identifier.  If you don't
2381 like starting a sentence with a lower case letter, write the sentence
2382 differently (e.g., ``The identifier lower-case is @dots{}'').
2384 The comment on a function is much clearer if you use the argument
2385 names to speak about the argument values.  The variable name itself
2386 should be lower case, but write it in upper case when you are speaking
2387 about the value rather than the variable itself.  Thus, ``the inode
2388 number NODE_NUM'' rather than ``an inode''.
2390 There is usually no purpose in restating the name of the function in
2391 the comment before it, because the reader can see that for himself.
2392 There might be an exception when the comment is so long that the function
2393 itself would be off the bottom of the screen.
2395 There should be a comment on each static variable as well, like this:
2397 @example
2398 /* Nonzero means truncate lines in the display;
2399    zero means continue them.  */
2400 int truncate_lines;
2401 @end example
2403 @cindex conditionals, comments for
2404 @cindex @code{#endif}, commenting
2405 Every @samp{#endif} should have a comment, except in the case of short
2406 conditionals (just a few lines) that are not nested.  The comment should
2407 state the condition of the conditional that is ending, @emph{including
2408 its sense}.  @samp{#else} should have a comment describing the condition
2409 @emph{and sense} of the code that follows.  For example:
2411 @example
2412 @group
2413 #ifdef foo
2414   @dots{}
2415 #else /* not foo */
2416   @dots{}
2417 #endif /* not foo */
2418 @end group
2419 @group
2420 #ifdef foo
2421   @dots{}
2422 #endif /* foo */
2423 @end group
2424 @end example
2426 @noindent
2427 but, by contrast, write the comments this way for a @samp{#ifndef}:
2429 @example
2430 @group
2431 #ifndef foo
2432   @dots{}
2433 #else /* foo */
2434   @dots{}
2435 #endif /* foo */
2436 @end group
2437 @group
2438 #ifndef foo
2439   @dots{}
2440 #endif /* not foo */
2441 @end group
2442 @end example
2444 @node Syntactic Conventions
2445 @section Clean Use of C Constructs
2446 @cindex syntactic conventions
2448 @cindex implicit @code{int}
2449 @cindex function argument, declaring
2450 Please explicitly declare the types of all objects.  For example, you
2451 should explicitly declare all arguments to functions, and you should
2452 declare functions to return @code{int} rather than omitting the
2453 @code{int}.
2455 @cindex compiler warnings
2456 @cindex @samp{-Wall} compiler option
2457 Some programmers like to use the GCC @samp{-Wall} option, and change the
2458 code whenever it issues a warning.  If you want to do this, then do.
2459 Other programmers prefer not to use @samp{-Wall}, because it gives
2460 warnings for valid and legitimate code which they do not want to change.
2461 If you want to do this, then do.  The compiler should be your servant,
2462 not your master.
2464 Declarations of external functions and functions to appear later in the
2465 source file should all go in one place near the beginning of the file
2466 (somewhere before the first function definition in the file), or else
2467 should go in a header file.  Don't put @code{extern} declarations inside
2468 functions.
2470 @cindex temporary variables
2471 It used to be common practice to use the same local variables (with
2472 names like @code{tem}) over and over for different values within one
2473 function.  Instead of doing this, it is better to declare a separate local
2474 variable for each distinct purpose, and give it a name which is
2475 meaningful.  This not only makes programs easier to understand, it also
2476 facilitates optimization by good compilers.  You can also move the
2477 declaration of each local variable into the smallest scope that includes
2478 all its uses.  This makes the program even cleaner.
2480 Don't use local variables or parameters that shadow global identifiers.
2482 @cindex multiple variables in a line
2483 Don't declare multiple variables in one declaration that spans lines.
2484 Start a new declaration on each line, instead.  For example, instead
2485 of this:
2487 @example
2488 @group
2489 int    foo,
2490        bar;
2491 @end group
2492 @end example
2494 @noindent
2495 write either this:
2497 @example
2498 int foo, bar;
2499 @end example
2501 @noindent
2502 or this:
2504 @example
2505 int foo;
2506 int bar;
2507 @end example
2509 @noindent
2510 (If they are global variables, each should have a comment preceding it
2511 anyway.)
2513 When you have an @code{if}-@code{else} statement nested in another
2514 @code{if} statement, always put braces around the @code{if}-@code{else}.
2515 Thus, never write like this:
2517 @example
2518 if (foo)
2519   if (bar)
2520     win ();
2521   else
2522     lose ();
2523 @end example
2525 @noindent
2526 always like this:
2528 @example
2529 if (foo)
2530   @{
2531     if (bar)
2532       win ();
2533     else
2534       lose ();
2535   @}
2536 @end example
2538 If you have an @code{if} statement nested inside of an @code{else}
2539 statement, either write @code{else if} on one line, like this,
2541 @example
2542 if (foo)
2543   @dots{}
2544 else if (bar)
2545   @dots{}
2546 @end example
2548 @noindent
2549 with its @code{then}-part indented like the preceding @code{then}-part,
2550 or write the nested @code{if} within braces like this:
2552 @example
2553 if (foo)
2554   @dots{}
2555 else
2556   @{
2557     if (bar)
2558       @dots{}
2559   @}
2560 @end example
2562 Don't declare both a structure tag and variables or typedefs in the
2563 same declaration.  Instead, declare the structure tag separately
2564 and then use it to declare the variables or typedefs.
2566 Try to avoid assignments inside @code{if}-conditions.  For example,
2567 don't write this:
2569 @example
2570 if ((foo = (char *) malloc (sizeof *foo)) == 0)
2571   fatal ("virtual memory exhausted");
2572 @end example
2574 @noindent
2575 instead, write this:
2577 @example
2578 foo = (char *) malloc (sizeof *foo);
2579 if (foo == 0)
2580   fatal ("virtual memory exhausted");
2581 @end example
2583 @pindex lint
2584 Don't make the program ugly to placate @code{lint}.  Please don't insert any
2585 casts to @code{void}.  Zero without a cast is perfectly fine as a null
2586 pointer constant, except when calling a varargs function.
2588 @node Names
2589 @section Naming Variables, Functions, and Files
2591 @cindex names of variables, functions, and files
2592 The names of global variables and functions in a program serve as
2593 comments of a sort.  So don't choose terse names---instead, look for
2594 names that give useful information about the meaning of the variable or
2595 function.  In a GNU program, names should be English, like other
2596 comments.
2598 Local variable names can be shorter, because they are used only within
2599 one context, where (presumably) comments explain their purpose.
2601 Try to limit your use of abbreviations in symbol names.  It is ok to
2602 make a few abbreviations, explain what they mean, and then use them
2603 frequently, but don't use lots of obscure abbreviations.
2605 Please use underscores to separate words in a name, so that the Emacs
2606 word commands can be useful within them.  Stick to lower case; reserve
2607 upper case for macros and @code{enum} constants, and for name-prefixes
2608 that follow a uniform convention.
2610 For example, you should use names like @code{ignore_space_change_flag};
2611 don't use names like @code{iCantReadThis}.
2613 Variables that indicate whether command-line options have been
2614 specified should be named after the meaning of the option, not after
2615 the option-letter.  A comment should state both the exact meaning of
2616 the option and its letter.  For example,
2618 @example
2619 @group
2620 /* Ignore changes in horizontal whitespace (-b).  */
2621 int ignore_space_change_flag;
2622 @end group
2623 @end example
2625 When you want to define names with constant integer values, use
2626 @code{enum} rather than @samp{#define}.  GDB knows about enumeration
2627 constants.
2629 @cindex file-name limitations
2630 @pindex doschk
2631 You might want to make sure that none of the file names would conflict
2632 if the files were loaded onto an MS-DOS file system which shortens the
2633 names.  You can use the program @code{doschk} to test for this.
2635 Some GNU programs were designed to limit themselves to file names of 14
2636 characters or less, to avoid file name conflicts if they are read into
2637 older System V systems.  Please preserve this feature in the existing
2638 GNU programs that have it, but there is no need to do this in new GNU
2639 programs.  @code{doschk} also reports file names longer than 14
2640 characters.
2642 @node System Portability
2643 @section Portability between System Types
2644 @cindex portability, between system types
2646 In the Unix world, ``portability'' refers to porting to different Unix
2647 versions.  For a GNU program, this kind of portability is desirable, but
2648 not paramount.
2650 The primary purpose of GNU software is to run on top of the GNU kernel,
2651 compiled with the GNU C compiler, on various types of @sc{cpu}.  So the
2652 kinds of portability that are absolutely necessary are quite limited.
2653 But it is important to support Linux-based GNU systems, since they
2654 are the form of GNU that is popular.
2656 Beyond that, it is good to support the other free operating systems
2657 (*BSD), and it is nice to support other Unix-like systems if you want
2658 to.  Supporting a variety of Unix-like systems is desirable, although
2659 not paramount.  It is usually not too hard, so you may as well do it.
2660 But you don't have to consider it an obligation, if it does turn out to
2661 be hard.
2663 @pindex autoconf
2664 The easiest way to achieve portability to most Unix-like systems is to
2665 use Autoconf.  It's unlikely that your program needs to know more
2666 information about the host platform than Autoconf can provide, simply
2667 because most of the programs that need such knowledge have already been
2668 written.
2670 Avoid using the format of semi-internal data bases (e.g., directories)
2671 when there is a higher-level alternative (@code{readdir}).
2673 @cindex non-@sc{posix} systems, and portability
2674 As for systems that are not like Unix, such as MSDOS, Windows, VMS, MVS,
2675 and older Macintosh systems, supporting them is often a lot of work.
2676 When that is the case, it is better to spend your time adding features
2677 that will be useful on GNU and GNU/Linux, rather than on supporting
2678 other incompatible systems.
2680 If you do support Windows, please do not abbreviate it as ``win''.  In
2681 hacker terminology, calling something a ``win'' is a form of praise.
2682 You're free to praise Microsoft Windows on your own if you want, but
2683 please don't do this in GNU packages.  Instead of abbreviating
2684 ``Windows'' to ``un'', you can write it in full or abbreviate it to
2685 ``woe'' or ``w''.  In GNU Emacs, for instance, we use @samp{w32} in
2686 file names of Windows-specific files, but the macro for Windows
2687 conditionals is called @code{WINDOWSNT}.
2689 It is a good idea to define the ``feature test macro''
2690 @code{_GNU_SOURCE} when compiling your C files.  When you compile on GNU
2691 or GNU/Linux, this will enable the declarations of GNU library extension
2692 functions, and that will usually give you a compiler error message if
2693 you define the same function names in some other way in your program.
2694 (You don't have to actually @emph{use} these functions, if you prefer
2695 to make the program more portable to other systems.)
2697 But whether or not you use these GNU extensions, you should avoid
2698 using their names for any other meanings.  Doing so would make it hard
2699 to move your code into other GNU programs.
2701 @node CPU Portability
2702 @section Portability between @sc{cpu}s
2704 @cindex data types, and portability
2705 @cindex portability, and data types
2706 Even GNU systems will differ because of differences among @sc{cpu}
2707 types---for example, difference in byte ordering and alignment
2708 requirements.  It is absolutely essential to handle these differences.
2709 However, don't make any effort to cater to the possibility that an
2710 @code{int} will be less than 32 bits.  We don't support 16-bit machines
2711 in GNU.
2713 Similarly, don't make any effort to cater to the possibility that
2714 @code{long} will be smaller than predefined types like @code{size_t}.
2715 For example, the following code is ok:
2717 @example
2718 printf ("size = %lu\n", (unsigned long) sizeof array);
2719 printf ("diff = %ld\n", (long) (pointer2 - pointer1));
2720 @end example
2722 1989 Standard C requires this to work, and we know of only one
2723 counterexample: 64-bit programs on Microsoft Windows.  We will
2724 leave it to those who want to port GNU programs to that environment
2725 to figure out how to do it.
2727 Predefined file-size types like @code{off_t} are an exception: they are
2728 longer than @code{long} on many platforms, so code like the above won't
2729 work with them.  One way to print an @code{off_t} value portably is to
2730 print its digits yourself, one by one.
2732 Don't assume that the address of an @code{int} object is also the
2733 address of its least-significant byte.  This is false on big-endian
2734 machines.  Thus, don't make the following mistake:
2736 @example
2737 int c;
2738 @dots{}
2739 while ((c = getchar()) != EOF)
2740   write(file_descriptor, &c, 1);
2741 @end example
2743 It used to be ok to not worry about the difference between pointers
2744 and integers when passing arguments to functions.  However, on most
2745 modern 64-bit machines pointers are wider than @code{int}.
2746 Conversely, integer types like @code{long long int} and @code{off_t}
2747 are wider than pointers on most modern 32-bit machines.  Hence it's
2748 often better nowadays to use prototypes to define functions whose
2749 argument types are not trivial.
2751 In particular, if functions accept varying argument counts or types
2752 they should be declared using prototypes containing @samp{...} and
2753 defined using @file{stdarg.h}.  For an example of this, please see the
2754 @uref{http://www.gnu.org/software/gnulib/, Gnulib} error module, which
2755 declares and defines the following function:
2757 @example
2758 /* Print a message with `fprintf (stderr, FORMAT, ...)';
2759    if ERRNUM is nonzero, follow it with ": " and strerror (ERRNUM).
2760    If STATUS is nonzero, terminate the program with `exit (STATUS)'.  */
2762 void error (int status, int errnum, const char *format, ...);
2763 @end example
2765 A simple way to use the Gnulib error module is to obtain the two
2766 source files @file{error.c} and @file{error.h} from the Gnulib library
2767 source code repository at
2768 @uref{http://savannah.gnu.org/cgi-bin/viewcvs/gnulib/gnulib/lib/}.
2769 Here's a sample use:
2771 @example
2772 #include "error.h"
2773 #include <errno.h>
2774 #include <stdio.h>
2776 char *program_name = "myprogram";
2778 FILE *
2779 xfopen (char const *name)
2781   FILE *fp = fopen (name, "r");
2782   if (! fp)
2783     error (1, errno, "cannot read %s", name);
2784   return fp;
2786 @end example
2788 @cindex casting pointers to integers
2789 Avoid casting pointers to integers if you can.  Such casts greatly
2790 reduce portability, and in most programs they are easy to avoid.  In the
2791 cases where casting pointers to integers is essential---such as, a Lisp
2792 interpreter which stores type information as well as an address in one
2793 word---you'll have to make explicit provisions to handle different word
2794 sizes.  You will also need to make provision for systems in which the
2795 normal range of addresses you can get from @code{malloc} starts far away
2796 from zero.
2798 @node System Functions
2799 @section Calling System Functions
2800 @cindex library functions, and portability
2801 @cindex portability, and library functions
2803 C implementations differ substantially.  Standard C reduces but does
2804 not eliminate the incompatibilities; meanwhile, many GNU packages still
2805 support pre-standard compilers because this is not hard to do.  This
2806 chapter gives recommendations for how to use the more-or-less standard C
2807 library functions to avoid unnecessary loss of portability.
2809 @itemize @bullet
2810 @item
2811 Don't use the return value of @code{sprintf}.  It returns the number of
2812 characters written on some systems, but not on all systems.
2814 @item
2815 Be aware that @code{vfprintf} is not always available.
2817 @item
2818 @code{main} should be declared to return type @code{int}.  It should
2819 terminate either by calling @code{exit} or by returning the integer
2820 status code; make sure it cannot ever return an undefined value.
2822 @cindex declaration for system functions
2823 @item
2824 Don't declare system functions explicitly.
2826 Almost any declaration for a system function is wrong on some system.
2827 To minimize conflicts, leave it to the system header files to declare
2828 system functions.  If the headers don't declare a function, let it
2829 remain undeclared.
2831 While it may seem unclean to use a function without declaring it, in
2832 practice this works fine for most system library functions on the
2833 systems where this really happens; thus, the disadvantage is only
2834 theoretical.  By contrast, actual declarations have frequently caused
2835 actual conflicts.
2837 @item
2838 If you must declare a system function, don't specify the argument types.
2839 Use an old-style declaration, not a Standard C prototype.  The more you
2840 specify about the function, the more likely a conflict.
2842 @item
2843 In particular, don't unconditionally declare @code{malloc} or
2844 @code{realloc}.
2846 Most GNU programs use those functions just once, in functions
2847 conventionally named @code{xmalloc} and @code{xrealloc}.  These
2848 functions call @code{malloc} and @code{realloc}, respectively, and
2849 check the results.
2851 Because @code{xmalloc} and @code{xrealloc} are defined in your program,
2852 you can declare them in other files without any risk of type conflict.
2854 On most systems, @code{int} is the same length as a pointer; thus, the
2855 calls to @code{malloc} and @code{realloc} work fine.  For the few
2856 exceptional systems (mostly 64-bit machines), you can use
2857 @strong{conditionalized} declarations of @code{malloc} and
2858 @code{realloc}---or put these declarations in configuration files
2859 specific to those systems.
2861 @cindex string library functions
2862 @item
2863 The string functions require special treatment.  Some Unix systems have
2864 a header file @file{string.h}; others have @file{strings.h}.  Neither
2865 file name is portable.  There are two things you can do: use Autoconf to
2866 figure out which file to include, or don't include either file.
2868 @item
2869 If you don't include either strings file, you can't get declarations for
2870 the string functions from the header file in the usual way.
2872 That causes less of a problem than you might think.  The newer standard
2873 string functions should be avoided anyway because many systems still
2874 don't support them.  The string functions you can use are these:
2876 @example
2877 strcpy   strncpy   strcat   strncat
2878 strlen   strcmp    strncmp
2879 strchr   strrchr
2880 @end example
2882 The copy and concatenate functions work fine without a declaration as
2883 long as you don't use their values.  Using their values without a
2884 declaration fails on systems where the width of a pointer differs from
2885 the width of @code{int}, and perhaps in other cases.  It is trivial to
2886 avoid using their values, so do that.
2888 The compare functions and @code{strlen} work fine without a declaration
2889 on most systems, possibly all the ones that GNU software runs on.
2890 You may find it necessary to declare them @strong{conditionally} on a
2891 few systems.
2893 The search functions must be declared to return @code{char *}.  Luckily,
2894 there is no variation in the data type they return.  But there is
2895 variation in their names.  Some systems give these functions the names
2896 @code{index} and @code{rindex}; other systems use the names
2897 @code{strchr} and @code{strrchr}.  Some systems support both pairs of
2898 names, but neither pair works on all systems.
2900 You should pick a single pair of names and use it throughout your
2901 program.  (Nowadays, it is better to choose @code{strchr} and
2902 @code{strrchr} for new programs, since those are the standard
2903 names.)  Declare both of those names as functions returning @code{char
2904 *}.  On systems which don't support those names, define them as macros
2905 in terms of the other pair.  For example, here is what to put at the
2906 beginning of your file (or in a header) if you want to use the names
2907 @code{strchr} and @code{strrchr} throughout:
2909 @example
2910 #ifndef HAVE_STRCHR
2911 #define strchr index
2912 #endif
2913 #ifndef HAVE_STRRCHR
2914 #define strrchr rindex
2915 #endif
2917 char *strchr ();
2918 char *strrchr ();
2919 @end example
2920 @end itemize
2922 Here we assume that @code{HAVE_STRCHR} and @code{HAVE_STRRCHR} are
2923 macros defined in systems where the corresponding functions exist.
2924 One way to get them properly defined is to use Autoconf.
2926 @node Internationalization
2927 @section Internationalization
2928 @cindex internationalization
2930 @pindex gettext
2931 GNU has a library called GNU gettext that makes it easy to translate the
2932 messages in a program into various languages.  You should use this
2933 library in every program.  Use English for the messages as they appear
2934 in the program, and let gettext provide the way to translate them into
2935 other languages.
2937 Using GNU gettext involves putting a call to the @code{gettext} macro
2938 around each string that might need translation---like this:
2940 @example
2941 printf (gettext ("Processing file `%s'..."));
2942 @end example
2944 @noindent
2945 This permits GNU gettext to replace the string @code{"Processing file
2946 `%s'..."} with a translated version.
2948 Once a program uses gettext, please make a point of writing calls to
2949 @code{gettext} when you add new strings that call for translation.
2951 Using GNU gettext in a package involves specifying a @dfn{text domain
2952 name} for the package.  The text domain name is used to separate the
2953 translations for this package from the translations for other packages.
2954 Normally, the text domain name should be the same as the name of the
2955 package---for example, @samp{coreutils} for the GNU core utilities.
2957 @cindex message text, and internationalization
2958 To enable gettext to work well, avoid writing code that makes
2959 assumptions about the structure of words or sentences.  When you want
2960 the precise text of a sentence to vary depending on the data, use two or
2961 more alternative string constants each containing a complete sentences,
2962 rather than inserting conditionalized words or phrases into a single
2963 sentence framework.
2965 Here is an example of what not to do:
2967 @smallexample
2968 printf ("%s is full", capacity > 5000000 ? "disk" : "floppy disk");
2969 @end smallexample
2971 If you apply gettext to all strings, like this,
2973 @smallexample
2974 printf (gettext ("%s is full"),
2975         capacity > 5000000 ? gettext ("disk") : gettext ("floppy disk"));
2976 @end smallexample
2978 @noindent
2979 the translator will hardly know that "disk" and "floppy disk" are meant to
2980 be substituted in the other string.  Worse, in some languages (like French)
2981 the construction will not work: the translation of the word "full" depends
2982 on the gender of the first part of the sentence; it happens to be not the
2983 same for "disk" as for "floppy disk".
2985 Complete sentences can be translated without problems:
2987 @example
2988 printf (capacity > 5000000 ? gettext ("disk is full")
2989         : gettext ("floppy disk is full"));
2990 @end example
2992 A similar problem appears at the level of sentence structure with this
2993 code:
2995 @example
2996 printf ("#  Implicit rule search has%s been done.\n",
2997         f->tried_implicit ? "" : " not");
2998 @end example
3000 @noindent
3001 Adding @code{gettext} calls to this code cannot give correct results for
3002 all languages, because negation in some languages requires adding words
3003 at more than one place in the sentence.  By contrast, adding
3004 @code{gettext} calls does the job straightforwardly if the code starts
3005 out like this:
3007 @example
3008 printf (f->tried_implicit
3009         ? "#  Implicit rule search has been done.\n",
3010         : "#  Implicit rule search has not been done.\n");
3011 @end example
3013 Another example is this one:
3015 @example
3016 printf ("%d file%s processed", nfiles,
3017         nfiles != 1 ? "s" : "");
3018 @end example
3020 @noindent
3021 The problem with this example is that it assumes that plurals are made
3022 by adding `s'.  If you apply gettext to the format string, like this,
3024 @example
3025 printf (gettext ("%d file%s processed"), nfiles,
3026         nfiles != 1 ? "s" : "");
3027 @end example
3029 @noindent
3030 the message can use different words, but it will still be forced to use
3031 `s' for the plural.  Here is a better way, with gettext being applied to
3032 the two strings independently:
3034 @example
3035 printf ((nfiles != 1 ? gettext ("%d files processed")
3036          : gettext ("%d file processed")),
3037         nfiles);
3038 @end example
3040 @noindent
3041 But this still doesn't work for languages like Polish, which has three
3042 plural forms: one for nfiles == 1, one for nfiles == 2, 3, 4, 22, 23, 24, ...
3043 and one for the rest.  The GNU @code{ngettext} function solves this problem:
3045 @example
3046 printf (ngettext ("%d files processed", "%d file processed", nfiles),
3047         nfiles);
3048 @end example
3051 @node Character Set
3052 @section Character Set
3053 @cindex character set
3054 @cindex encodings
3055 @cindex ASCII characters
3056 @cindex non-ASCII characters
3058 Sticking to the ASCII character set (plain text, 7-bit characters) is
3059 preferred in GNU source code comments, text documents, and other
3060 contexts, unless there is good reason to do something else because of
3061 the application domain.  For example, if source code deals with the
3062 French Revolutionary calendar, it is OK if its literal strings contain
3063 accented characters in month names like ``Flor@'eal''.  Also, it is OK
3064 to use non-ASCII characters to represent proper names of contributors in
3065 change logs (@pxref{Change Logs}).
3067 If you need to use non-ASCII characters, you should normally stick with
3068 one encoding, as one cannot in general mix encodings reliably.
3071 @node Quote Characters
3072 @section Quote Characters
3073 @cindex quote characters
3074 @cindex locale-specific quote characters
3075 @cindex left quote
3076 @cindex grave accent
3078 In the C locale, GNU programs should stick to plain ASCII for quotation
3079 characters in messages to users: preferably 0x60 (@samp{`}) for left
3080 quotes and 0x27 (@samp{'}) for right quotes.  It is ok, but not
3081 required, to use locale-specific quotes in other locales.
3083 The @uref{http://www.gnu.org/software/gnulib/, Gnulib} @code{quote} and
3084 @code{quotearg} modules provide a reasonably straightforward way to
3085 support locale-specific quote characters, as well as taking care of
3086 other issues, such as quoting a filename that itself contains a quote
3087 character.  See the Gnulib documentation for usage details.
3089 In any case, the documentation for your program should clearly specify
3090 how it does quoting, if different than the preferred method of @samp{`}
3091 and @samp{'}.  This is especially important if the output of your
3092 program is ever likely to be parsed by another program.
3094 Quotation characters are a difficult area in the computing world at
3095 this time: there are no true left or right quote characters in Latin1;
3096 the @samp{`} character we use was standardized there as a grave
3097 accent.  Moreover, Latin1 is still not universally usable.
3099 Unicode contains the unambiguous quote characters required, and its
3100 common encoding UTF-8 is upward compatible with Latin1.  However,
3101 Unicode and UTF-8 are not universally well-supported, either.
3103 This may change over the next few years, and then we will revisit
3104 this.
3107 @node Mmap
3108 @section Mmap
3109 @findex mmap
3111 Don't assume that @code{mmap} either works on all files or fails
3112 for all files.  It may work on some files and fail on others.
3114 The proper way to use @code{mmap} is to try it on the specific file for
3115 which you want to use it---and if @code{mmap} doesn't work, fall back on
3116 doing the job in another way using @code{read} and @code{write}.
3118 The reason this precaution is needed is that the GNU kernel (the HURD)
3119 provides a user-extensible file system, in which there can be many
3120 different kinds of ``ordinary files.''  Many of them support
3121 @code{mmap}, but some do not.  It is important to make programs handle
3122 all these kinds of files.
3124 @node Documentation
3125 @chapter Documenting Programs
3126 @cindex documentation
3128 A GNU program should ideally come with full free documentation, adequate
3129 for both reference and tutorial purposes.  If the package can be
3130 programmed or extended, the documentation should cover programming or
3131 extending it, as well as just using it.
3133 @menu
3134 * GNU Manuals::                 Writing proper manuals.
3135 * Doc Strings and Manuals::     Compiling doc strings doesn't make a manual.
3136 * Manual Structure Details::    Specific structure conventions.
3137 * License for Manuals::         Writing the distribution terms for a manual.
3138 * Manual Credits::              Giving credit to documentation contributors.
3139 * Printed Manuals::             Mentioning the printed manual.
3140 * NEWS File::                   NEWS files supplement manuals.
3141 * Change Logs::                 Recording Changes
3142 * Man Pages::                   Man pages are secondary.
3143 * Reading other Manuals::       How far you can go in learning
3144                                 from other manuals.
3145 @end menu
3147 @node GNU Manuals
3148 @section GNU Manuals
3150 The preferred document format for the GNU system is the Texinfo
3151 formatting language.  Every GNU package should (ideally) have
3152 documentation in Texinfo both for reference and for learners.  Texinfo
3153 makes it possible to produce a good quality formatted book, using
3154 @TeX{}, and to generate an Info file.  It is also possible to generate
3155 HTML output from Texinfo source.  See the Texinfo manual, either the
3156 hardcopy, or the on-line version available through @code{info} or the
3157 Emacs Info subsystem (@kbd{C-h i}).
3159 Nowadays some other formats such as Docbook and Sgmltexi can be
3160 converted automatically into Texinfo.  It is ok to produce the Texinfo
3161 documentation by conversion this way, as long as it gives good results.
3163 Make sure your manual is clear to a reader who knows nothing about the
3164 topic and reads it straight through.  This means covering basic topics
3165 at the beginning, and advanced topics only later.  This also means
3166 defining every specialized term when it is first used.
3168 Programmers tend to carry over the structure of the program as the
3169 structure for its documentation.  But this structure is not
3170 necessarily good for explaining how to use the program; it may be
3171 irrelevant and confusing for a user.
3173 Instead, the right way to structure documentation is according to the
3174 concepts and questions that a user will have in mind when reading it.
3175 This principle applies at every level, from the lowest (ordering
3176 sentences in a paragraph) to the highest (ordering of chapter topics
3177 within the manual).  Sometimes this structure of ideas matches the
3178 structure of the implementation of the software being documented---but
3179 often they are different.  An important part of learning to write good
3180 documentation is to learn to notice when you have unthinkingly
3181 structured the documentation like the implementation, stop yourself,
3182 and look for better alternatives.
3184 For example, each program in the GNU system probably ought to be
3185 documented in one manual; but this does not mean each program should
3186 have its own manual.  That would be following the structure of the
3187 implementation, rather than the structure that helps the user
3188 understand.
3190 Instead, each manual should cover a coherent @emph{topic}.  For example,
3191 instead of a manual for @code{diff} and a manual for @code{diff3}, we
3192 have one manual for ``comparison of files'' which covers both of those
3193 programs, as well as @code{cmp}.  By documenting these programs
3194 together, we can make the whole subject clearer.
3196 The manual which discusses a program should certainly document all of
3197 the program's command-line options and all of its commands.  It should
3198 give examples of their use.  But don't organize the manual as a list
3199 of features.  Instead, organize it logically, by subtopics.  Address
3200 the questions that a user will ask when thinking about the job that
3201 the program does.  Don't just tell the reader what each feature can
3202 do---say what jobs it is good for, and show how to use it for those
3203 jobs.  Explain what is recommended usage, and what kinds of usage
3204 users should avoid.
3206 In general, a GNU manual should serve both as tutorial and reference.
3207 It should be set up for convenient access to each topic through Info,
3208 and for reading straight through (appendixes aside).  A GNU manual
3209 should give a good introduction to a beginner reading through from the
3210 start, and should also provide all the details that hackers want.
3211 The Bison manual is a good example of this---please take a look at it
3212 to see what we mean.
3214 That is not as hard as it first sounds.  Arrange each chapter as a
3215 logical breakdown of its topic, but order the sections, and write their
3216 text, so that reading the chapter straight through makes sense.  Do
3217 likewise when structuring the book into chapters, and when structuring a
3218 section into paragraphs.  The watchword is, @emph{at each point, address
3219 the most fundamental and important issue raised by the preceding text.}
3221 If necessary, add extra chapters at the beginning of the manual which
3222 are purely tutorial and cover the basics of the subject.  These provide
3223 the framework for a beginner to understand the rest of the manual.  The
3224 Bison manual provides a good example of how to do this.
3226 To serve as a reference, a manual should have an Index that list all the
3227 functions, variables, options, and important concepts that are part of
3228 the program.  One combined Index should do for a short manual, but
3229 sometimes for a complex package it is better to use multiple indices.
3230 The Texinfo manual includes advice on preparing good index entries, see
3231 @ref{Index Entries, , Making Index Entries, texinfo, GNU Texinfo}, and
3232 see @ref{Indexing Commands, , Defining the Entries of an
3233 Index, texinfo, GNU Texinfo}.
3235 Don't use Unix man pages as a model for how to write GNU documentation;
3236 most of them are terse, badly structured, and give inadequate
3237 explanation of the underlying concepts.  (There are, of course, some
3238 exceptions.)  Also, Unix man pages use a particular format which is
3239 different from what we use in GNU manuals.
3241 Please include an email address in the manual for where to report
3242 bugs @emph{in the text of the manual}.
3244 Please do not use the term ``pathname'' that is used in Unix
3245 documentation; use ``file name'' (two words) instead.  We use the term
3246 ``path'' only for search paths, which are lists of directory names.
3248 Please do not use the term ``illegal'' to refer to erroneous input to
3249 a computer program.  Please use ``invalid'' for this, and reserve the
3250 term ``illegal'' for activities prohibited by law.
3252 Please do not write @samp{()} after a function name just to indicate
3253 it is a function.  @code{foo ()} is not a function, it is a function
3254 call with no arguments.
3256 @node Doc Strings and Manuals
3257 @section Doc Strings and Manuals
3259 Some programming systems, such as Emacs, provide a documentation string
3260 for each function, command or variable.  You may be tempted to write a
3261 reference manual by compiling the documentation strings and writing a
3262 little additional text to go around them---but you must not do it.  That
3263 approach is a fundamental mistake.  The text of well-written
3264 documentation strings will be entirely wrong for a manual.
3266 A documentation string needs to stand alone---when it appears on the
3267 screen, there will be no other text to introduce or explain it.
3268 Meanwhile, it can be rather informal in style.
3270 The text describing a function or variable in a manual must not stand
3271 alone; it appears in the context of a section or subsection.  Other text
3272 at the beginning of the section should explain some of the concepts, and
3273 should often make some general points that apply to several functions or
3274 variables.  The previous descriptions of functions and variables in the
3275 section will also have given information about the topic.  A description
3276 written to stand alone would repeat some of that information; this
3277 redundancy looks bad.  Meanwhile, the informality that is acceptable in
3278 a documentation string is totally unacceptable in a manual.
3280 The only good way to use documentation strings in writing a good manual
3281 is to use them as a source of information for writing good text.
3283 @node Manual Structure Details
3284 @section Manual Structure Details
3285 @cindex manual structure
3287 The title page of the manual should state the version of the programs or
3288 packages documented in the manual.  The Top node of the manual should
3289 also contain this information.  If the manual is changing more
3290 frequently than or independent of the program, also state a version
3291 number for the manual in both of these places.
3293 Each program documented in the manual should have a node named
3294 @samp{@var{program} Invocation} or @samp{Invoking @var{program}}.  This
3295 node (together with its subnodes, if any) should describe the program's
3296 command line arguments and how to run it (the sort of information people
3297 would look for in a man page).  Start with an @samp{@@example}
3298 containing a template for all the options and arguments that the program
3299 uses.
3301 Alternatively, put a menu item in some menu whose item name fits one of
3302 the above patterns.  This identifies the node which that item points to
3303 as the node for this purpose, regardless of the node's actual name.
3305 The @samp{--usage} feature of the Info reader looks for such a node
3306 or menu item in order to find the relevant text, so it is essential
3307 for every Texinfo file to have one.
3309 If one manual describes several programs, it should have such a node for
3310 each program described in the manual.
3312 @node License for Manuals
3313 @section License for Manuals
3314 @cindex license for manuals
3316 Please use the GNU Free Documentation License for all GNU manuals that
3317 are more than a few pages long.  Likewise for a collection of short
3318 documents---you only need one copy of the GNU FDL for the whole
3319 collection.  For a single short document, you can use a very permissive
3320 non-copyleft license, to avoid taking up space with a long license.
3322 See @uref{http://www.gnu.org/copyleft/fdl-howto.html} for more explanation
3323 of how to employ the GFDL.
3325 Note that it is not obligatory to include a copy of the GNU GPL or GNU
3326 LGPL in a manual whose license is neither the GPL nor the LGPL.  It can
3327 be a good idea to include the program's license in a large manual; in a
3328 short manual, whose size would be increased considerably by including
3329 the program's license, it is probably better not to include it.
3331 @node Manual Credits
3332 @section Manual Credits
3333 @cindex credits for manuals
3335 Please credit the principal human writers of the manual as the authors,
3336 on the title page of the manual.  If a company sponsored the work, thank
3337 the company in a suitable place in the manual, but do not cite the
3338 company as an author.
3340 @node Printed Manuals
3341 @section Printed Manuals
3343 The FSF publishes some GNU manuals in printed form.  To encourage sales
3344 of these manuals, the on-line versions of the manual should mention at
3345 the very start that the printed manual is available and should point at
3346 information for getting it---for instance, with a link to the page
3347 @url{http://www.gnu.org/order/order.html}.  This should not be included
3348 in the printed manual, though, because there it is redundant.
3350 It is also useful to explain in the on-line forms of the manual how the
3351 user can print out the manual from the sources.
3353 @node NEWS File
3354 @section The NEWS File
3355 @cindex @file{NEWS} file
3357 In addition to its manual, the package should have a file named
3358 @file{NEWS} which contains a list of user-visible changes worth
3359 mentioning.  In each new release, add items to the front of the file and
3360 identify the version they pertain to.  Don't discard old items; leave
3361 them in the file after the newer items.  This way, a user upgrading from
3362 any previous version can see what is new.
3364 If the @file{NEWS} file gets very long, move some of the older items
3365 into a file named @file{ONEWS} and put a note at the end referring the
3366 user to that file.
3368 @node Change Logs
3369 @section Change Logs
3370 @cindex change logs
3372 Keep a change log to describe all the changes made to program source
3373 files.  The purpose of this is so that people investigating bugs in the
3374 future will know about the changes that might have introduced the bug.
3375 Often a new bug can be found by looking at what was recently changed.
3376 More importantly, change logs can help you eliminate conceptual
3377 inconsistencies between different parts of a program, by giving you a
3378 history of how the conflicting concepts arose and who they came from.
3380 @menu
3381 * Change Log Concepts::
3382 * Style of Change Logs::
3383 * Simple Changes::
3384 * Conditional Changes::
3385 * Indicating the Part Changed::
3386 @end menu
3388 @node Change Log Concepts
3389 @subsection Change Log Concepts
3391 You can think of the change log as a conceptual ``undo list'' which
3392 explains how earlier versions were different from the current version.
3393 People can see the current version; they don't need the change log
3394 to tell them what is in it.  What they want from a change log is a
3395 clear explanation of how the earlier version differed.
3397 The change log file is normally called @file{ChangeLog} and covers an
3398 entire directory.  Each directory can have its own change log, or a
3399 directory can use the change log of its parent directory--it's up to
3400 you.
3402 Another alternative is to record change log information with a version
3403 control system such as RCS or CVS.  This can be converted automatically
3404 to a @file{ChangeLog} file using @code{rcs2log}; in Emacs, the command
3405 @kbd{C-x v a} (@code{vc-update-change-log}) does the job.
3407 There's no need to describe the full purpose of the changes or how they
3408 work together.  If you think that a change calls for explanation, you're
3409 probably right.  Please do explain it---but please put the explanation
3410 in comments in the code, where people will see it whenever they see the
3411 code.  For example, ``New function'' is enough for the change log when
3412 you add a function, because there should be a comment before the
3413 function definition to explain what it does.
3415 In the past, we recommended not mentioning changes in non-software
3416 files (manuals, help files, etc.) in change logs.  However, we've been
3417 advised that it is a good idea to include them, for the sake of
3418 copyright records.
3420 However, sometimes it is useful to write one line to describe the
3421 overall purpose of a batch of changes.
3423 The easiest way to add an entry to @file{ChangeLog} is with the Emacs
3424 command @kbd{M-x add-change-log-entry}.  An entry should have an
3425 asterisk, the name of the changed file, and then in parentheses the name
3426 of the changed functions, variables or whatever, followed by a colon.
3427 Then describe the changes you made to that function or variable.
3429 @node Style of Change Logs
3430 @subsection Style of Change Logs
3431 @cindex change logs, style
3433 Here are some simple examples of change log entries, starting with the
3434 header line that says who made the change and when it was installed,
3435 followed by descriptions of specific changes.  (These examples are
3436 drawn from Emacs and GCC.)
3438 @example
3439 1998-08-17  Richard Stallman  <rms@@gnu.org>
3441 * register.el (insert-register): Return nil.
3442 (jump-to-register): Likewise.
3444 * sort.el (sort-subr): Return nil.
3446 * tex-mode.el (tex-bibtex-file, tex-file, tex-region):
3447 Restart the tex shell if process is gone or stopped.
3448 (tex-shell-running): New function.
3450 * expr.c (store_one_arg): Round size up for move_block_to_reg.
3451 (expand_call): Round up when emitting USE insns.
3452 * stmt.c (assign_parms): Round size up for move_block_from_reg.
3453 @end example
3455 It's important to name the changed function or variable in full.  Don't
3456 abbreviate function or variable names, and don't combine them.
3457 Subsequent maintainers will often search for a function name to find all
3458 the change log entries that pertain to it; if you abbreviate the name,
3459 they won't find it when they search.
3461 For example, some people are tempted to abbreviate groups of function
3462 names by writing @samp{* register.el (@{insert,jump-to@}-register)};
3463 this is not a good idea, since searching for @code{jump-to-register} or
3464 @code{insert-register} would not find that entry.
3466 Separate unrelated change log entries with blank lines.  When two
3467 entries represent parts of the same change, so that they work together,
3468 then don't put blank lines between them.  Then you can omit the file
3469 name and the asterisk when successive entries are in the same file.
3471 Break long lists of function names by closing continued lines with
3472 @samp{)}, rather than @samp{,}, and opening the continuation with
3473 @samp{(} as in this example:
3475 @example
3476 * keyboard.c (menu_bar_items, tool_bar_items)
3477 (Fexecute_extended_command): Deal with `keymap' property.
3478 @end example
3480 When you install someone else's changes, put the contributor's name in
3481 the change log entry rather than in the text of the entry.  In other
3482 words, write this:
3484 @example
3485 2002-07-14  John Doe  <jdoe@@gnu.org>
3487         * sewing.c: Make it sew.
3488 @end example
3490 @noindent
3491 rather than this:
3493 @example
3494 2002-07-14  Usual Maintainer  <usual@@gnu.org>
3496         * sewing.c: Make it sew.  Patch by jdoe@@gnu.org.
3497 @end example
3499 As for the date, that should be the date you applied the change.
3501 @node Simple Changes
3502 @subsection Simple Changes
3504 Certain simple kinds of changes don't need much detail in the change
3505 log.
3507 When you change the calling sequence of a function in a simple fashion,
3508 and you change all the callers of the function to use the new calling
3509 sequence, there is no need to make individual entries for all the
3510 callers that you changed.  Just write in the entry for the function
3511 being called, ``All callers changed''---like this:
3513 @example
3514 * keyboard.c (Fcommand_execute): New arg SPECIAL.
3515 All callers changed.
3516 @end example
3518 When you change just comments or doc strings, it is enough to write an
3519 entry for the file, without mentioning the functions.  Just ``Doc
3520 fixes'' is enough for the change log.
3522 There's no technical need to make change log entries for documentation
3523 files.  This is because documentation is not susceptible to bugs that
3524 are hard to fix.  Documentation does not consist of parts that must
3525 interact in a precisely engineered fashion.  To correct an error, you
3526 need not know the history of the erroneous passage; it is enough to
3527 compare what the documentation says with the way the program actually
3528 works.
3530 However, you should keep change logs for documentation files when the
3531 project gets copyright assignments from its contributors, so as to
3532 make the records of authorship more accurate.
3534 @node Conditional Changes
3535 @subsection Conditional Changes
3536 @cindex conditional changes, and change logs
3537 @cindex change logs, conditional changes
3539 C programs often contain compile-time @code{#if} conditionals.  Many
3540 changes are conditional; sometimes you add a new definition which is
3541 entirely contained in a conditional.  It is very useful to indicate in
3542 the change log the conditions for which the change applies.
3544 Our convention for indicating conditional changes is to use square
3545 brackets around the name of the condition.
3547 Here is a simple example, describing a change which is conditional but
3548 does not have a function or entity name associated with it:
3550 @example
3551 * xterm.c [SOLARIS2]: Include string.h.
3552 @end example
3554 Here is an entry describing a new definition which is entirely
3555 conditional.  This new definition for the macro @code{FRAME_WINDOW_P} is
3556 used only when @code{HAVE_X_WINDOWS} is defined:
3558 @example
3559 * frame.h [HAVE_X_WINDOWS] (FRAME_WINDOW_P): Macro defined.
3560 @end example
3562 Here is an entry for a change within the function @code{init_display},
3563 whose definition as a whole is unconditional, but the changes themselves
3564 are contained in a @samp{#ifdef HAVE_LIBNCURSES} conditional:
3566 @example
3567 * dispnew.c (init_display) [HAVE_LIBNCURSES]: If X, call tgetent.
3568 @end example
3570 Here is an entry for a change that takes affect only when
3571 a certain macro is @emph{not} defined:
3573 @example
3574 (gethostname) [!HAVE_SOCKETS]: Replace with winsock version.
3575 @end example
3577 @node Indicating the Part Changed
3578 @subsection Indicating the Part Changed
3580 Indicate the part of a function which changed by using angle brackets
3581 enclosing an indication of what the changed part does.  Here is an entry
3582 for a change in the part of the function @code{sh-while-getopts} that
3583 deals with @code{sh} commands:
3585 @example
3586 * progmodes/sh-script.el (sh-while-getopts) <sh>: Handle case that
3587 user-specified option string is empty.
3588 @end example
3591 @node Man Pages
3592 @section Man Pages
3593 @cindex man pages
3595 In the GNU project, man pages are secondary.  It is not necessary or
3596 expected for every GNU program to have a man page, but some of them do.
3597 It's your choice whether to include a man page in your program.
3599 When you make this decision, consider that supporting a man page
3600 requires continual effort each time the program is changed.  The time
3601 you spend on the man page is time taken away from more useful work.
3603 For a simple program which changes little, updating the man page may be
3604 a small job.  Then there is little reason not to include a man page, if
3605 you have one.
3607 For a large program that changes a great deal, updating a man page may
3608 be a substantial burden.  If a user offers to donate a man page, you may
3609 find this gift costly to accept.  It may be better to refuse the man
3610 page unless the same person agrees to take full responsibility for
3611 maintaining it---so that you can wash your hands of it entirely.  If
3612 this volunteer later ceases to do the job, then don't feel obliged to
3613 pick it up yourself; it may be better to withdraw the man page from the
3614 distribution until someone else agrees to update it.
3616 When a program changes only a little, you may feel that the
3617 discrepancies are small enough that the man page remains useful without
3618 updating.  If so, put a prominent note near the beginning of the man
3619 page explaining that you don't maintain it and that the Texinfo manual
3620 is more authoritative.  The note should say how to access the Texinfo
3621 documentation.
3623 Be sure that man pages include a copyright statement and free
3624 license.  The simple all-permissive license is appropriate for simple
3625 man pages:
3627 @example
3628 Copying and distribution of this file, with or without modification,
3629 are permitted in any medium without royalty provided the copyright
3630 notice and this notice are preserved.
3631 @end example
3633 For long man pages, with enough explanation and documentation that
3634 they can be considered true manuals, use the GFDL (@pxref{License for
3635 Manuals}).
3637 Finally, the GNU help2man program
3638 (@uref{http://www.gnu.org/software/help2man/}) is one way to automate
3639 generation of a man page, in this case from @option{--help} output.
3640 This is sufficient in many cases.
3642 @node Reading other Manuals
3643 @section Reading other Manuals
3645 There may be non-free books or documentation files that describe the
3646 program you are documenting.
3648 It is ok to use these documents for reference, just as the author of a
3649 new algebra textbook can read other books on algebra.  A large portion
3650 of any non-fiction book consists of facts, in this case facts about how
3651 a certain program works, and these facts are necessarily the same for
3652 everyone who writes about the subject.  But be careful not to copy your
3653 outline structure, wording, tables or examples from preexisting non-free
3654 documentation.  Copying from free documentation may be ok; please check
3655 with the FSF about the individual case.
3657 @node Managing Releases
3658 @chapter The Release Process
3659 @cindex releasing
3661 Making a release is more than just bundling up your source files in a
3662 tar file and putting it up for FTP.  You should set up your software so
3663 that it can be configured to run on a variety of systems.  Your Makefile
3664 should conform to the GNU standards described below, and your directory
3665 layout should also conform to the standards discussed below.  Doing so
3666 makes it easy to include your package into the larger framework of
3667 all GNU software.
3669 @menu
3670 * Configuration::               How Configuration Should Work
3671 * Makefile Conventions::        Makefile Conventions
3672 * Releases::                    Making Releases
3673 @end menu
3675 @node Configuration
3676 @section How Configuration Should Work
3677 @cindex program configuration
3679 @pindex configure
3680 Each GNU distribution should come with a shell script named
3681 @code{configure}.  This script is given arguments which describe the
3682 kind of machine and system you want to compile the program for.
3684 The @code{configure} script must record the configuration options so
3685 that they affect compilation.
3687 One way to do this is to make a link from a standard name such as
3688 @file{config.h} to the proper configuration file for the chosen system.
3689 If you use this technique, the distribution should @emph{not} contain a
3690 file named @file{config.h}.  This is so that people won't be able to
3691 build the program without configuring it first.
3693 Another thing that @code{configure} can do is to edit the Makefile.  If
3694 you do this, the distribution should @emph{not} contain a file named
3695 @file{Makefile}.  Instead, it should include a file @file{Makefile.in} which
3696 contains the input used for editing.  Once again, this is so that people
3697 won't be able to build the program without configuring it first.
3699 If @code{configure} does write the @file{Makefile}, then @file{Makefile}
3700 should have a target named @file{Makefile} which causes @code{configure}
3701 to be rerun, setting up the same configuration that was set up last
3702 time.  The files that @code{configure} reads should be listed as
3703 dependencies of @file{Makefile}.
3705 All the files which are output from the @code{configure} script should
3706 have comments at the beginning explaining that they were generated
3707 automatically using @code{configure}.  This is so that users won't think
3708 of trying to edit them by hand.
3710 The @code{configure} script should write a file named @file{config.status}
3711 which describes which configuration options were specified when the
3712 program was last configured.  This file should be a shell script which,
3713 if run, will recreate the same configuration.
3715 The @code{configure} script should accept an option of the form
3716 @samp{--srcdir=@var{dirname}} to specify the directory where sources are found
3717 (if it is not the current directory).  This makes it possible to build
3718 the program in a separate directory, so that the actual source directory
3719 is not modified.
3721 If the user does not specify @samp{--srcdir}, then @code{configure} should
3722 check both @file{.} and @file{..} to see if it can find the sources.  If
3723 it finds the sources in one of these places, it should use them from
3724 there.  Otherwise, it should report that it cannot find the sources, and
3725 should exit with nonzero status.
3727 Usually the easy way to support @samp{--srcdir} is by editing a
3728 definition of @code{VPATH} into the Makefile.  Some rules may need to
3729 refer explicitly to the specified source directory.  To make this
3730 possible, @code{configure} can add to the Makefile a variable named
3731 @code{srcdir} whose value is precisely the specified directory.
3733 The @code{configure} script should also take an argument which specifies the
3734 type of system to build the program for.  This argument should look like
3735 this:
3737 @example
3738 @var{cpu}-@var{company}-@var{system}
3739 @end example
3741 For example, an Athlon-based GNU/Linux system might be
3742 @samp{i686-pc-linux-gnu}.
3744 The @code{configure} script needs to be able to decode all plausible
3745 alternatives for how to describe a machine.  Thus,
3746 @samp{athlon-pc-gnu/linux} would be a valid alias.  There is a shell
3747 script called
3748 @uref{http://savannah.gnu.org/@/cgi-bin/@/viewcvs/@/*checkout*/@/config/@/config/@/config.sub,
3749 @file{config.sub}} that you can use as a subroutine to validate system
3750 types and canonicalize aliases.
3752 The @code{configure} script should also take the option
3753 @option{--build=@var{buildtype}}, which should be equivalent to a
3754 plain @var{buildtype} argument.  For example, @samp{configure
3755 --build=i686-pc-linux-gnu} is equivalent to @samp{configure
3756 i686-pc-linux-gnu}.  When the build type is not specified by an option
3757 or argument, the @code{configure} script should normally guess it using
3758 the shell script
3759 @uref{http://savannah.gnu.org/@/cgi-bin/@/viewcvs/@/*checkout*/@/config/@/config/@/config.guess,
3760 @file{config.guess}}.
3762 @cindex optional features, configure-time
3763 Other options are permitted to specify in more detail the software
3764 or hardware present on the machine, to include or exclude optional parts
3765 of the package, or to adjust the name of some tools or arguments to them:
3767 @table @samp
3768 @item --enable-@var{feature}@r{[}=@var{parameter}@r{]}
3769 Configure the package to build and install an optional user-level
3770 facility called @var{feature}.  This allows users to choose which
3771 optional features to include.  Giving an optional @var{parameter} of
3772 @samp{no} should omit @var{feature}, if it is built by default.
3774 No @samp{--enable} option should @strong{ever} cause one feature to
3775 replace another.  No @samp{--enable} option should ever substitute one
3776 useful behavior for another useful behavior.  The only proper use for
3777 @samp{--enable} is for questions of whether to build part of the program
3778 or exclude it.
3780 @item --with-@var{package}
3781 @c @r{[}=@var{parameter}@r{]}
3782 The package @var{package} will be installed, so configure this package
3783 to work with @var{package}.
3785 @c  Giving an optional @var{parameter} of
3786 @c @samp{no} should omit @var{package}, if it is used by default.
3788 Possible values of @var{package} include
3789 @samp{gnu-as} (or @samp{gas}), @samp{gnu-ld}, @samp{gnu-libc},
3790 @samp{gdb},
3791 @samp{x},
3793 @samp{x-toolkit}.
3795 Do not use a @samp{--with} option to specify the file name to use to
3796 find certain files.  That is outside the scope of what @samp{--with}
3797 options are for.
3799 @item @var{variable}=@var{value}
3800 Set the value of the variable @var{variable} to @var{value}.  This is
3801 used to override the default values of commands or arguments in the
3802 build process.  For example, the user could issue @samp{configure
3803 CFLAGS=-g CXXFLAGS=-g} to build with debugging information and without
3804 the default optimization.
3806 Specifying variables as arguments to @code{configure}, like this:
3807 @example
3808 ./configure CC=gcc
3809 @end example
3810 is preferable to setting them in environment variables:
3811 @example
3812 CC=gcc ./configure
3813 @end example
3814 as it helps to recreate the same configuration later with
3815 @file{config.status}.
3816 @end table
3818 All @code{configure} scripts should accept all of the ``detail''
3819 options and the variable settings, whether or not they make any
3820 difference to the particular package at hand.  In particular, they
3821 should accept any option that starts with @samp{--with-} or
3822 @samp{--enable-}.  This is so users will be able to configure an
3823 entire GNU source tree at once with a single set of options.
3825 You will note that the categories @samp{--with-} and @samp{--enable-}
3826 are narrow: they @strong{do not} provide a place for any sort of option
3827 you might think of.  That is deliberate.  We want to limit the possible
3828 configuration options in GNU software.  We do not want GNU programs to
3829 have idiosyncratic configuration options.
3831 Packages that perform part of the compilation process may support
3832 cross-compilation.  In such a case, the host and target machines for the
3833 program may be different.
3835 The @code{configure} script should normally treat the specified type of
3836 system as both the host and the target, thus producing a program which
3837 works for the same type of machine that it runs on.
3839 To compile a program to run on a host type that differs from the build
3840 type, use the configure option @option{--host=@var{hosttype}}, where
3841 @var{hosttype} uses the same syntax as @var{buildtype}.  The host type
3842 normally defaults to the build type.
3844 To configure a cross-compiler, cross-assembler, or what have you, you
3845 should specify a target different from the host, using the configure
3846 option @samp{--target=@var{targettype}}.  The syntax for
3847 @var{targettype} is the same as for the host type.  So the command would
3848 look like this:
3850 @example
3851 ./configure --host=@var{hosttype} --target=@var{targettype}
3852 @end example
3854 The target type normally defaults to the host type.
3855 Programs for which cross-operation is not meaningful need not accept the
3856 @samp{--target} option, because configuring an entire operating system for
3857 cross-operation is not a meaningful operation.
3859 Some programs have ways of configuring themselves automatically.  If
3860 your program is set up to do this, your @code{configure} script can simply
3861 ignore most of its arguments.
3863 @comment The makefile standards are in a separate file that is also
3864 @comment included by make.texinfo.  Done by roland@gnu.ai.mit.edu on 1/6/93.
3865 @comment For this document, turn chapters into sections, etc.
3866 @lowersections
3867 @include make-stds.texi
3868 @raisesections
3870 @node Releases
3871 @section Making Releases
3872 @cindex packaging
3874 You should identify each release with a pair of version numbers, a
3875 major version and a minor.  We have no objection to using more than
3876 two numbers, but it is very unlikely that you really need them.
3878 Package the distribution of @code{Foo version 69.96} up in a gzipped tar
3879 file with the name @file{foo-69.96.tar.gz}.  It should unpack into a
3880 subdirectory named @file{foo-69.96}.
3882 Building and installing the program should never modify any of the files
3883 contained in the distribution.  This means that all the files that form
3884 part of the program in any way must be classified into @dfn{source
3885 files} and @dfn{non-source files}.  Source files are written by humans
3886 and never changed automatically; non-source files are produced from
3887 source files by programs under the control of the Makefile.
3889 @cindex @file{README} file
3890 The distribution should contain a file named @file{README} which gives
3891 the name of the package, and a general description of what it does.  It
3892 is also good to explain the purpose of each of the first-level
3893 subdirectories in the package, if there are any.  The @file{README} file
3894 should either state the version number of the package, or refer to where
3895 in the package it can be found.
3897 The @file{README} file should refer to the file @file{INSTALL}, which
3898 should contain an explanation of the installation procedure.
3900 The @file{README} file should also refer to the file which contains the
3901 copying conditions.  The GNU GPL, if used, should be in a file called
3902 @file{COPYING}.  If the GNU LGPL is used, it should be in a file called
3903 @file{COPYING.LIB}.
3905 Naturally, all the source files must be in the distribution.  It is okay
3906 to include non-source files in the distribution, provided they are
3907 up-to-date and machine-independent, so that building the distribution
3908 normally will never modify them.  We commonly include non-source files
3909 produced by Bison, @code{lex}, @TeX{}, and @code{makeinfo}; this helps avoid
3910 unnecessary dependencies between our distributions, so that users can
3911 install whichever packages they want to install.
3913 Non-source files that might actually be modified by building and
3914 installing the program should @strong{never} be included in the
3915 distribution.  So if you do distribute non-source files, always make
3916 sure they are up to date when you make a new distribution.
3918 Make sure that the directory into which the distribution unpacks (as
3919 well as any subdirectories) are all world-writable (octal mode 777).
3920 This is so that old versions of @code{tar} which preserve the
3921 ownership and permissions of the files from the tar archive will be
3922 able to extract all the files even if the user is unprivileged.
3924 Make sure that all the files in the distribution are world-readable.
3926 Don't include any symbolic links in the distribution itself.  If the tar
3927 file contains symbolic links, then people cannot even unpack it on
3928 systems that don't support symbolic links.  Also, don't use multiple
3929 names for one file in different directories, because certain file
3930 systems cannot handle this and that prevents unpacking the
3931 distribution.
3933 Try to make sure that all the file names will be unique on MS-DOS.  A
3934 name on MS-DOS consists of up to 8 characters, optionally followed by a
3935 period and up to three characters.  MS-DOS will truncate extra
3936 characters both before and after the period.  Thus,
3937 @file{foobarhacker.c} and @file{foobarhacker.o} are not ambiguous; they
3938 are truncated to @file{foobarha.c} and @file{foobarha.o}, which are
3939 distinct.
3941 @cindex @file{texinfo.tex}, in a distribution
3942 Include in your distribution a copy of the @file{texinfo.tex} you used
3943 to test print any @file{*.texinfo} or @file{*.texi} files.
3945 Likewise, if your program uses small GNU software packages like regex,
3946 getopt, obstack, or termcap, include them in the distribution file.
3947 Leaving them out would make the distribution file a little smaller at
3948 the expense of possible inconvenience to a user who doesn't know what
3949 other files to get.
3951 @node References
3952 @chapter References to Non-Free Software and Documentation
3953 @cindex references to non-free material
3955 A GNU program should not recommend use of any non-free program.  We
3956 can't stop some people from writing proprietary programs, or stop
3957 other people from using them, but we can and should refuse to
3958 advertise them to new potential customers.  Proprietary software is a
3959 social and ethical problem, and the point of GNU is to solve that
3960 problem.
3962 The GNU definition of free software is found on the GNU web site at
3963 @url{http://www.gnu.org/philosophy/free-sw.html}, and the definition
3964 of free documentation is found at
3965 @url{http://www.gnu.org/philosophy/free-doc.html}.  A list of
3966 important licenses and whether they qualify as free is in
3967 @url{http://www.gnu.org/@/licenses/@/license-list.html}.  The terms
3968 ``free'' and ``non-free'', used in this document, refer to that
3969 definition.  If it is not clear whether a license qualifies as free
3970 under this definition, please ask the GNU Project by writing to
3971 @email{licensing@@gnu.org}.  We will answer, and if the license is an
3972 important one, we will add it to the list.
3974 When a non-free program or system is well known, you can mention it in
3975 passing---that is harmless, since users who might want to use it
3976 probably already know about it.  For instance, it is fine to explain
3977 how to build your package on top of some widely used non-free
3978 operating system, or how to use it together with some widely used
3979 non-free program.
3981 However, you should give only the necessary information to help those
3982 who already use the non-free program to use your program with
3983 it---don't give, or refer to, any further information about the
3984 proprietary program, and don't imply that the proprietary program
3985 enhances your program, or that its existence is in any way a good
3986 thing.  The goal should be that people already using the proprietary
3987 program will get the advice they need about how to use your free
3988 program with it, while people who don't already use the proprietary
3989 program will not see anything to lead them to take an interest in it.
3991 If a non-free program or system is obscure in your program's domain,
3992 your program should not mention or support it at all, since doing so
3993 would tend to popularize the non-free program more than it popularizes
3994 your program.  (You cannot hope to find many additional users among
3995 the users of Foobar if the users of Foobar are few.)
3997 Sometimes a program is free software in itself but depends on a
3998 non-free platform in order to run.  For instance, many Java programs
3999 depend on Sun's Java implementation, and won't run on the GNU Java
4000 Compiler (which does not yet have all the features) or won't run with
4001 the GNU Java libraries.  To recommend that program is inherently to
4002 recommend the non-free platform as well; if you should not do the
4003 latter, then don't do the former.
4005 A GNU package should not refer the user to any non-free documentation
4006 for free software.  Free documentation that can be included in free
4007 operating systems is essential for completing the GNU system, or any
4008 free operating system, so it is a major focus of the GNU Project; to
4009 recommend use of documentation that we are not allowed to use in GNU
4010 would weaken the impetus for the community to produce documentation
4011 that we can include.  So GNU packages should never recommend non-free
4012 documentation.
4014 By contrast, it is ok to refer to journal articles and textbooks in
4015 the comments of a program for explanation of how it functions, even
4016 though they be non-free.  This is because we don't include such things
4017 in the GNU system even if we are allowed to--they are outside the
4018 scope of an operating system project.
4020 Referring to a web site that describes or recommends a non-free
4021 program is in effect promoting that software, so please do not make
4022 links (or mention by name) web sites that contain such material.  This
4023 policy is relevant particularly for the web pages for a GNU package.
4025 Following links from nearly any web site can lead to non-free
4026 software; this is an inescapable aspect of the nature of the web, and
4027 in itself is no objection to linking to a site.  As long as the site
4028 does not itself recommend a non-free program, there is no need be
4029 concerned about the sites it links to for other reasons.
4031 Thus, for example, you should not make a link to AT&T's web site,
4032 because that recommends AT&T's non-free software packages; you should
4033 not make a link to a site that links to AT&T's site saying it is a
4034 place to get a non-free program; but if a site you want to link to
4035 refers to AT&T's web site in some other context (such as long-distance
4036 telephone service), that is not a problem.
4038 @node Copying This Manual
4039 @appendix Copying This Manual
4041 @menu
4042 * GNU Free Documentation License::  License for copying this manual
4043 @end menu
4045 @include fdl.texi
4047 @node Index
4048 @unnumbered Index
4049 @printindex cp
4051 @bye
4053 Local variables:
4054 eval: (add-hook 'write-file-hooks 'time-stamp)
4055 time-stamp-start: "@set lastupdate "
4056 time-stamp-end: "$"
4057 time-stamp-format: "%:b %:d, %:y"
4058 compile-command: "make just-standards"
4059 End: