benchmark inputs for sinh and cosh
[glibc.git] / manual / startup.texi
blobedd1de47bed8e9e74e0c71a22068be377a60cd60
1 @node Program Basics, Processes, Signal Handling, Top
2 @c %MENU% Writing the beginning and end of your program
3 @chapter The Basic Program/System Interface
5 @cindex process
6 @cindex program
7 @cindex address space
8 @cindex thread of control
9 @dfn{Processes} are the primitive units for allocation of system
10 resources.  Each process has its own address space and (usually) one
11 thread of control.  A process executes a program; you can have multiple
12 processes executing the same program, but each process has its own copy
13 of the program within its own address space and executes it
14 independently of the other copies.  Though it may have multiple threads
15 of control within the same program and a program may be composed of
16 multiple logically separate modules, a process always executes exactly
17 one program.
19 Note that we are using a specific definition of ``program'' for the
20 purposes of this manual, which corresponds to a common definition in the
21 context of Unix system.  In popular usage, ``program'' enjoys a much
22 broader definition; it can refer for example to a system's kernel, an
23 editor macro, a complex package of software, or a discrete section of
24 code executing within a process.
26 Writing the program is what this manual is all about.  This chapter
27 explains the most basic interface between your program and the system
28 that runs, or calls, it.  This includes passing of parameters (arguments
29 and environment) from the system, requesting basic services from the
30 system, and telling the system the program is done.
32 A program starts another program with the @code{exec} family of system calls.
33 This chapter looks at program startup from the execee's point of view.  To
34 see the event from the execor's point of view, see @ref{Executing a File}.
36 @menu
37 * Program Arguments::           Parsing your program's command-line arguments
38 * Environment Variables::       Less direct parameters affecting your program
39 * Auxiliary Vector::            Least direct parameters affecting your program
40 * System Calls::                Requesting service from the system
41 * Program Termination::         Telling the system you're done; return status
42 @end menu
44 @node Program Arguments
45 @section Program Arguments
46 @cindex program arguments
47 @cindex command line arguments
48 @cindex arguments, to program
50 @cindex program startup
51 @cindex startup of program
52 @cindex invocation of program
53 @cindex @code{main} function
54 @findex main
55 The system starts a C program by calling the function @code{main}.  It
56 is up to you to write a function named @code{main}---otherwise, you
57 won't even be able to link your program without errors.
59 In @w{ISO C} you can define @code{main} either to take no arguments, or to
60 take two arguments that represent the command line arguments to the
61 program, like this:
63 @smallexample
64 int main (int @var{argc}, char *@var{argv}[])
65 @end smallexample
67 @cindex argc (program argument count)
68 @cindex argv (program argument vector)
69 The command line arguments are the whitespace-separated tokens given in
70 the shell command used to invoke the program; thus, in @samp{cat foo
71 bar}, the arguments are @samp{foo} and @samp{bar}.  The only way a
72 program can look at its command line arguments is via the arguments of
73 @code{main}.  If @code{main} doesn't take arguments, then you cannot get
74 at the command line.
76 The value of the @var{argc} argument is the number of command line
77 arguments.  The @var{argv} argument is a vector of C strings; its
78 elements are the individual command line argument strings.  The file
79 name of the program being run is also included in the vector as the
80 first element; the value of @var{argc} counts this element.  A null
81 pointer always follows the last element: @code{@var{argv}[@var{argc}]}
82 is this null pointer.
84 For the command @samp{cat foo bar}, @var{argc} is 3 and @var{argv} has
85 three elements, @code{"cat"}, @code{"foo"} and @code{"bar"}.
87 In Unix systems you can define @code{main} a third way, using three arguments:
89 @smallexample
90 int main (int @var{argc}, char *@var{argv}[], char *@var{envp}[])
91 @end smallexample
93 The first two arguments are just the same.  The third argument
94 @var{envp} gives the program's environment; it is the same as the value
95 of @code{environ}.  @xref{Environment Variables}.  POSIX.1 does not
96 allow this three-argument form, so to be portable it is best to write
97 @code{main} to take two arguments, and use the value of @code{environ}.
99 @menu
100 * Argument Syntax::             By convention, options start with a hyphen.
101 * Parsing Program Arguments::   Ways to parse program options and arguments.
102 @end menu
104 @node Argument Syntax, Parsing Program Arguments, , Program Arguments
105 @subsection Program Argument Syntax Conventions
106 @cindex program argument syntax
107 @cindex syntax, for program arguments
108 @cindex command argument syntax
110 POSIX recommends these conventions for command line arguments.
111 @code{getopt} (@pxref{Getopt}) and @code{argp_parse} (@pxref{Argp}) make
112 it easy to implement them.
114 @itemize @bullet
115 @item
116 Arguments are options if they begin with a hyphen delimiter (@samp{-}).
118 @item
119 Multiple options may follow a hyphen delimiter in a single token if
120 the options do not take arguments.  Thus, @samp{-abc} is equivalent to
121 @samp{-a -b -c}.
123 @item
124 Option names are single alphanumeric characters (as for @code{isalnum};
125 @pxref{Classification of Characters}).
127 @item
128 Certain options require an argument.  For example, the @samp{-o} command
129 of the @code{ld} command requires an argument---an output file name.
131 @item
132 An option and its argument may or may not appear as separate tokens.  (In
133 other words, the whitespace separating them is optional.)  Thus,
134 @w{@samp{-o foo}} and @samp{-ofoo} are equivalent.
136 @item
137 Options typically precede other non-option arguments.
139 The implementations of @code{getopt} and @code{argp_parse} in @theglibc{}
140 normally make it appear as if all the option arguments were
141 specified before all the non-option arguments for the purposes of
142 parsing, even if the user of your program intermixed option and
143 non-option arguments.  They do this by reordering the elements of the
144 @var{argv} array.  This behavior is nonstandard; if you want to suppress
145 it, define the @code{_POSIX_OPTION_ORDER} environment variable.
146 @xref{Standard Environment}.
148 @item
149 The argument @samp{--} terminates all options; any following arguments
150 are treated as non-option arguments, even if they begin with a hyphen.
152 @item
153 A token consisting of a single hyphen character is interpreted as an
154 ordinary non-option argument.  By convention, it is used to specify
155 input from or output to the standard input and output streams.
157 @item
158 Options may be supplied in any order, or appear multiple times.  The
159 interpretation is left up to the particular application program.
160 @end itemize
162 @cindex long-named options
163 GNU adds @dfn{long options} to these conventions.  Long options consist
164 of @samp{--} followed by a name made of alphanumeric characters and
165 dashes.  Option names are typically one to three words long, with
166 hyphens to separate words.  Users can abbreviate the option names as
167 long as the abbreviations are unique.
169 To specify an argument for a long option, write
170 @samp{--@var{name}=@var{value}}.  This syntax enables a long option to
171 accept an argument that is itself optional.
173 Eventually, @gnusystems{} will provide completion for long option names
174 in the shell.
176 @node Parsing Program Arguments, , Argument Syntax, Program Arguments
177 @subsection Parsing Program Arguments
179 @cindex program arguments, parsing
180 @cindex command arguments, parsing
181 @cindex parsing program arguments
182 If the syntax for the command line arguments to your program is simple
183 enough, you can simply pick the arguments off from @var{argv} by hand.
184 But unless your program takes a fixed number of arguments, or all of the
185 arguments are interpreted in the same way (as file names, for example),
186 you are usually better off using @code{getopt} (@pxref{Getopt}) or
187 @code{argp_parse} (@pxref{Argp}) to do the parsing.
189 @code{getopt} is more standard (the short-option only version of it is a
190 part of the POSIX standard), but using @code{argp_parse} is often
191 easier, both for very simple and very complex option structures, because
192 it does more of the dirty work for you.
194 @menu
195 * Getopt::                      Parsing program options using @code{getopt}.
196 * Argp::                        Parsing program options using @code{argp_parse}.
197 * Suboptions::                  Some programs need more detailed options.
198 * Suboptions Example::          This shows how it could be done for @code{mount}.
199 @end menu
201 @c Getopt and argp start at the @section level so that there's
202 @c enough room for their internal hierarchy (mostly a problem with
203 @c argp).         -Miles
205 @include getopt.texi
206 @include argp.texi
208 @node Suboptions, Suboptions Example, Argp, Parsing Program Arguments
209 @c This is a @section so that it's at the same level as getopt and argp
210 @subsubsection Parsing of Suboptions
212 Having a single level of options is sometimes not enough.  There might
213 be too many options which have to be available or a set of options is
214 closely related.
216 For this case some programs use suboptions.  One of the most prominent
217 programs is certainly @code{mount}(8).  The @code{-o} option take one
218 argument which itself is a comma separated list of options.  To ease the
219 programming of code like this the function @code{getsubopt} is
220 available.
222 @comment stdlib.h
223 @deftypefun int getsubopt (char **@var{optionp}, char *const *@var{tokens}, char **@var{valuep})
225 The @var{optionp} parameter must be a pointer to a variable containing
226 the address of the string to process.  When the function returns the
227 reference is updated to point to the next suboption or to the
228 terminating @samp{\0} character if there is no more suboption available.
230 The @var{tokens} parameter references an array of strings containing the
231 known suboptions.  All strings must be @samp{\0} terminated and to mark
232 the end a null pointer must be stored.  When @code{getsubopt} finds a
233 possible legal suboption it compares it with all strings available in
234 the @var{tokens} array and returns the index in the string as the
235 indicator.
237 In case the suboption has an associated value introduced by a @samp{=}
238 character, a pointer to the value is returned in @var{valuep}.  The
239 string is @samp{\0} terminated.  If no argument is available
240 @var{valuep} is set to the null pointer.  By doing this the caller can
241 check whether a necessary value is given or whether no unexpected value
242 is present.
244 In case the next suboption in the string is not mentioned in the
245 @var{tokens} array the starting address of the suboption including a
246 possible value is returned in @var{valuep} and the return value of the
247 function is @samp{-1}.
248 @end deftypefun
250 @node Suboptions Example, , Suboptions, Parsing Program Arguments
251 @subsection Parsing of Suboptions Example
253 The code which might appear in the @code{mount}(8) program is a perfect
254 example of the use of @code{getsubopt}:
256 @smallexample
257 @include subopt.c.texi
258 @end smallexample
261 @node Environment Variables
262 @section Environment Variables
264 @cindex environment variable
265 When a program is executed, it receives information about the context in
266 which it was invoked in two ways.  The first mechanism uses the
267 @var{argv} and @var{argc} arguments to its @code{main} function, and is
268 discussed in @ref{Program Arguments}.  The second mechanism uses
269 @dfn{environment variables} and is discussed in this section.
271 The @var{argv} mechanism is typically used to pass command-line
272 arguments specific to the particular program being invoked.  The
273 environment, on the other hand, keeps track of information that is
274 shared by many programs, changes infrequently, and that is less
275 frequently used.
277 The environment variables discussed in this section are the same
278 environment variables that you set using assignments and the
279 @code{export} command in the shell.  Programs executed from the shell
280 inherit all of the environment variables from the shell.
281 @c !!! xref to right part of bash manual when it exists
283 @cindex environment
284 Standard environment variables are used for information about the user's
285 home directory, terminal type, current locale, and so on; you can define
286 additional variables for other purposes.  The set of all environment
287 variables that have values is collectively known as the
288 @dfn{environment}.
290 Names of environment variables are case-sensitive and must not contain
291 the character @samp{=}.  System-defined environment variables are
292 invariably uppercase.
294 The values of environment variables can be anything that can be
295 represented as a string.  A value must not contain an embedded null
296 character, since this is assumed to terminate the string.
299 @menu
300 * Environment Access::          How to get and set the values of
301                                  environment variables.
302 * Standard Environment::        These environment variables have
303                                  standard interpretations.
304 @end menu
306 @node Environment Access
307 @subsection Environment Access
308 @cindex environment access
309 @cindex environment representation
311 The value of an environment variable can be accessed with the
312 @code{getenv} function.  This is declared in the header file
313 @file{stdlib.h}.
314 @pindex stdlib.h
316 Libraries should use @code{secure_getenv} instead of @code{getenv}, so
317 that they do not accidentally use untrusted environment variables.
318 Modifications of environment variables are not allowed in
319 multi-threaded programs.  The @code{getenv} and @code{secure_getenv}
320 functions can be safely used in multi-threaded programs.
322 @comment stdlib.h
323 @comment ISO
324 @deftypefun {char *} getenv (const char *@var{name})
325 This function returns a string that is the value of the environment
326 variable @var{name}.  You must not modify this string.  In some non-Unix
327 systems not using @theglibc{}, it might be overwritten by subsequent
328 calls to @code{getenv} (but not by any other library function).  If the
329 environment variable @var{name} is not defined, the value is a null
330 pointer.
331 @end deftypefun
333 @comment stdlib.h
334 @comment GNU
335 @deftypefun {char *} secure_getenv (const char *@var{name})
336 This function is similar to @code{getenv}, but it returns a null
337 pointer if the environment is untrusted.  This happens when the
338 program file has SUID or SGID bits set.  General-purpose libraries
339 should always prefer this function over @code{getenv} to avoid
340 vulnerabilities if the library is referenced from a SUID/SGID program.
342 This function is a GNU extension.
343 @end deftypefun
346 @comment stdlib.h
347 @comment SVID
348 @deftypefun int putenv (char *@var{string})
349 The @code{putenv} function adds or removes definitions from the environment.
350 If the @var{string} is of the form @samp{@var{name}=@var{value}}, the
351 definition is added to the environment.  Otherwise, the @var{string} is
352 interpreted as the name of an environment variable, and any definition
353 for this variable in the environment is removed.
355 If the function is successful it returns @code{0}.  Otherwise the return
356 value is nonzero and @code{errno} is set to indicate the error.
358 The difference to the @code{setenv} function is that the exact string
359 given as the parameter @var{string} is put into the environment.  If the
360 user should change the string after the @code{putenv} call this will
361 reflect in automatically in the environment.  This also requires that
362 @var{string} is no automatic variable which scope is left before the
363 variable is removed from the environment.  The same applies of course to
364 dynamically allocated variables which are freed later.
366 This function is part of the extended Unix interface.  Since it was also
367 available in old SVID libraries you should define either
368 @var{_XOPEN_SOURCE} or @var{_SVID_SOURCE} before including any header.
369 @end deftypefun
372 @comment stdlib.h
373 @comment BSD
374 @deftypefun int setenv (const char *@var{name}, const char *@var{value}, int @var{replace})
375 The @code{setenv} function can be used to add a new definition to the
376 environment.  The entry with the name @var{name} is replaced by the
377 value @samp{@var{name}=@var{value}}.  Please note that this is also true
378 if @var{value} is the empty string.  To do this a new string is created
379 and the strings @var{name} and @var{value} are copied.  A null pointer
380 for the @var{value} parameter is illegal.  If the environment already
381 contains an entry with key @var{name} the @var{replace} parameter
382 controls the action.  If replace is zero, nothing happens.  Otherwise
383 the old entry is replaced by the new one.
385 Please note that you cannot remove an entry completely using this function.
387 If the function is successful it returns @code{0}.  Otherwise the
388 environment is unchanged and the return value is @code{-1} and
389 @code{errno} is set.
391 This function was originally part of the BSD library but is now part of
392 the Unix standard.
393 @end deftypefun
395 @comment stdlib.h
396 @comment BSD
397 @deftypefun int unsetenv (const char *@var{name})
398 Using this function one can remove an entry completely from the
399 environment.  If the environment contains an entry with the key
400 @var{name} this whole entry is removed.  A call to this function is
401 equivalent to a call to @code{putenv} when the @var{value} part of the
402 string is empty.
404 The function return @code{-1} if @var{name} is a null pointer, points to
405 an empty string, or points to a string containing a @code{=} character.
406 It returns @code{0} if the call succeeded.
408 This function was originally part of the BSD library but is now part of
409 the Unix standard.  The BSD version had no return value, though.
410 @end deftypefun
412 There is one more function to modify the whole environment.  This
413 function is said to be used in the POSIX.9 (POSIX bindings for Fortran
414 77) and so one should expect it did made it into POSIX.1.  But this
415 never happened.  But we still provide this function as a GNU extension
416 to enable writing standard compliant Fortran environments.
418 @comment stdlib.h
419 @comment GNU
420 @deftypefun int clearenv (void)
421 The @code{clearenv} function removes all entries from the environment.
422 Using @code{putenv} and @code{setenv} new entries can be added again
423 later.
425 If the function is successful it returns @code{0}.  Otherwise the return
426 value is nonzero.
427 @end deftypefun
430 You can deal directly with the underlying representation of environment
431 objects to add more variables to the environment (for example, to
432 communicate with another program you are about to execute;
433 @pxref{Executing a File}).
435 @comment unistd.h
436 @comment POSIX.1
437 @deftypevar {char **} environ
438 The environment is represented as an array of strings.  Each string is
439 of the format @samp{@var{name}=@var{value}}.  The order in which
440 strings appear in the environment is not significant, but the same
441 @var{name} must not appear more than once.  The last element of the
442 array is a null pointer.
444 This variable is declared in the header file @file{unistd.h}.
446 If you just want to get the value of an environment variable, use
447 @code{getenv}.
448 @end deftypevar
450 Unix systems, and @gnusystems{}, pass the initial value of
451 @code{environ} as the third argument to @code{main}.
452 @xref{Program Arguments}.
454 @node Standard Environment
455 @subsection Standard Environment Variables
456 @cindex standard environment variables
458 These environment variables have standard meanings.  This doesn't mean
459 that they are always present in the environment; but if these variables
460 @emph{are} present, they have these meanings.  You shouldn't try to use
461 these environment variable names for some other purpose.
463 @comment Extra blank lines make it look better.
464 @table @code
465 @item HOME
466 @cindex @code{HOME} environment variable
467 @cindex home directory
469 This is a string representing the user's @dfn{home directory}, or
470 initial default working directory.
472 The user can set @code{HOME} to any value.
473 If you need to make sure to obtain the proper home directory
474 for a particular user, you should not use @code{HOME}; instead,
475 look up the user's name in the user database (@pxref{User Database}).
477 For most purposes, it is better to use @code{HOME}, precisely because
478 this lets the user specify the value.
480 @c !!! also USER
481 @item LOGNAME
482 @cindex @code{LOGNAME} environment variable
484 This is the name that the user used to log in.  Since the value in the
485 environment can be tweaked arbitrarily, this is not a reliable way to
486 identify the user who is running a program; a function like
487 @code{getlogin} (@pxref{Who Logged In}) is better for that purpose.
489 For most purposes, it is better to use @code{LOGNAME}, precisely because
490 this lets the user specify the value.
492 @item PATH
493 @cindex @code{PATH} environment variable
495 A @dfn{path} is a sequence of directory names which is used for
496 searching for a file.  The variable @code{PATH} holds a path used
497 for searching for programs to be run.
499 The @code{execlp} and @code{execvp} functions (@pxref{Executing a File})
500 use this environment variable, as do many shells and other utilities
501 which are implemented in terms of those functions.
503 The syntax of a path is a sequence of directory names separated by
504 colons.  An empty string instead of a directory name stands for the
505 current directory (@pxref{Working Directory}).
507 A typical value for this environment variable might be a string like:
509 @smallexample
510 :/bin:/etc:/usr/bin:/usr/new/X11:/usr/new:/usr/local/bin
511 @end smallexample
513 This means that if the user tries to execute a program named @code{foo},
514 the system will look for files named @file{foo}, @file{/bin/foo},
515 @file{/etc/foo}, and so on.  The first of these files that exists is
516 the one that is executed.
518 @c !!! also TERMCAP
519 @item TERM
520 @cindex @code{TERM} environment variable
522 This specifies the kind of terminal that is receiving program output.
523 Some programs can make use of this information to take advantage of
524 special escape sequences or terminal modes supported by particular kinds
525 of terminals.  Many programs which use the termcap library
526 (@pxref{Finding a Terminal Description,Find,,termcap,The Termcap Library
527 Manual}) use the @code{TERM} environment variable, for example.
529 @item TZ
530 @cindex @code{TZ} environment variable
532 This specifies the time zone.  @xref{TZ Variable}, for information about
533 the format of this string and how it is used.
535 @item LANG
536 @cindex @code{LANG} environment variable
538 This specifies the default locale to use for attribute categories where
539 neither @code{LC_ALL} nor the specific environment variable for that
540 category is set.  @xref{Locales}, for more information about
541 locales.
543 @ignore
544 @c I doubt this really exists
545 @item LC_ALL
546 @cindex @code{LC_ALL} environment variable
548 This is similar to the @code{LANG} environment variable.  However, its
549 value takes precedence over any values provided for the individual
550 attribute category environment variables, or for the @code{LANG}
551 environment variable.
552 @end ignore
554 @item LC_ALL
555 @cindex @code{LC_ALL} environment variable
557 If this environment variable is set it overrides the selection for all
558 the locales done using the other @code{LC_*} environment variables.  The
559 value of the other @code{LC_*} environment variables is simply ignored
560 in this case.
562 @item LC_COLLATE
563 @cindex @code{LC_COLLATE} environment variable
565 This specifies what locale to use for string sorting.
567 @item LC_CTYPE
568 @cindex @code{LC_CTYPE} environment variable
570 This specifies what locale to use for character sets and character
571 classification.
573 @item LC_MESSAGES
574 @cindex @code{LC_MESSAGES} environment variable
576 This specifies what locale to use for printing messages and to parse
577 responses.
579 @item LC_MONETARY
580 @cindex @code{LC_MONETARY} environment variable
582 This specifies what locale to use for formatting monetary values.
584 @item LC_NUMERIC
585 @cindex @code{LC_NUMERIC} environment variable
587 This specifies what locale to use for formatting numbers.
589 @item LC_TIME
590 @cindex @code{LC_TIME} environment variable
592 This specifies what locale to use for formatting date/time values.
594 @item NLSPATH
595 @cindex @code{NLSPATH} environment variable
597 This specifies the directories in which the @code{catopen} function
598 looks for message translation catalogs.
600 @item _POSIX_OPTION_ORDER
601 @cindex @code{_POSIX_OPTION_ORDER} environment variable.
603 If this environment variable is defined, it suppresses the usual
604 reordering of command line arguments by @code{getopt} and
605 @code{argp_parse}.  @xref{Argument Syntax}.
607 @c !!! GNU also has COREFILE, CORESERVER, EXECSERVERS
608 @end table
610 @node Auxiliary Vector
611 @section Auxiliary Vector
612 @cindex auxiliary vector
614 When a program is executed, it receives information from the operating
615 system about the environment in which it is operating.  The form of this
616 information is a table of key-value pairs, where the keys are from the
617 set of @samp{AT_} values in @file{elf.h}.  Some of the data is provided
618 by the kernel for libc consumption, and may be obtained by ordinary
619 interfaces, such as @code{sysconf}.  However, on a platform-by-platform
620 basis there may be information that is not available any other way.
622 @subsection Definition of @code{getauxval}
623 @comment sys/auxv.h
624 @deftypefun {unsigned long int} getauxval (unsigned long int @var{type})
625 This function is used to inquire about the entries in the auxiliary
626 vector.  The @var{type} argument should be one of the @samp{AT_} symbols
627 defined in @file{elf.h}.  If a matching entry is found, the value is
628 returned; if the entry is not found, zero is returned and @code{errno} is
629 set to @code{ENOENT}.
630 @end deftypefun
632 For some platforms, the key @code{AT_HWCAP} is the easiest way to inquire
633 about any instruction set extensions available at runtime.  In this case,
634 there will (of necessity) be a platform-specific set of @samp{HWCAP_}
635 values masked together that describe the capabilities of the cpu on which
636 the program is being executed.
638 @node System Calls
639 @section System Calls
641 @cindex system call
642 A system call is a request for service that a program makes of the
643 kernel.  The service is generally something that only the kernel has
644 the privilege to do, such as doing I/O.  Programmers don't normally
645 need to be concerned with system calls because there are functions in
646 @theglibc{} to do virtually everything that system calls do.
647 These functions work by making system calls themselves.  For example,
648 there is a system call that changes the permissions of a file, but
649 you don't need to know about it because you can just use @theglibc{}'s
650 @code{chmod} function.
652 @cindex kernel call
653 System calls are sometimes called kernel calls.
655 However, there are times when you want to make a system call explicitly,
656 and for that, @theglibc{} provides the @code{syscall} function.
657 @code{syscall} is harder to use and less portable than functions like
658 @code{chmod}, but easier and more portable than coding the system call
659 in assembler instructions.
661 @code{syscall} is most useful when you are working with a system call
662 which is special to your system or is newer than @theglibc{} you
663 are using.  @code{syscall} is implemented in an entirely generic way;
664 the function does not know anything about what a particular system
665 call does or even if it is valid.
667 The description of @code{syscall} in this section assumes a certain
668 protocol for system calls on the various platforms on which @theglibc{}
669 runs.  That protocol is not defined by any strong authority, but
670 we won't describe it here either because anyone who is coding
671 @code{syscall} probably won't accept anything less than kernel and C
672 library source code as a specification of the interface between them
673 anyway.
676 @code{syscall} is declared in @file{unistd.h}.
678 @comment unistd.h
679 @comment ???
680 @deftypefun {long int} syscall (long int @var{sysno}, @dots{})
682 @code{syscall} performs a generic system call.
684 @cindex system call number
685 @var{sysno} is the system call number.  Each kind of system call is
686 identified by a number.  Macros for all the possible system call numbers
687 are defined in @file{sys/syscall.h}
689 The remaining arguments are the arguments for the system call, in
690 order, and their meanings depend on the kind of system call.  Each kind
691 of system call has a definite number of arguments, from zero to five.
692 If you code more arguments than the system call takes, the extra ones to
693 the right are ignored.
695 The return value is the return value from the system call, unless the
696 system call failed.  In that case, @code{syscall} returns @code{-1} and
697 sets @code{errno} to an error code that the system call returned.  Note
698 that system calls do not return @code{-1} when they succeed.
699 @cindex errno
701 If you specify an invalid @var{sysno}, @code{syscall} returns @code{-1}
702 with @code{errno} = @code{ENOSYS}.
704 Example:
706 @smallexample
708 #include <unistd.h>
709 #include <sys/syscall.h>
710 #include <errno.h>
712 @dots{}
714 int rc;
716 rc = syscall(SYS_chmod, "/etc/passwd", 0444);
718 if (rc == -1)
719    fprintf(stderr, "chmod failed, errno = %d\n", errno);
721 @end smallexample
723 This, if all the compatibility stars are aligned, is equivalent to the
724 following preferable code:
726 @smallexample
728 #include <sys/types.h>
729 #include <sys/stat.h>
730 #include <errno.h>
732 @dots{}
734 int rc;
736 rc = chmod("/etc/passwd", 0444);
737 if (rc == -1)
738    fprintf(stderr, "chmod failed, errno = %d\n", errno);
740 @end smallexample
742 @end deftypefun
745 @node Program Termination
746 @section Program Termination
747 @cindex program termination
748 @cindex process termination
750 @cindex exit status value
751 The usual way for a program to terminate is simply for its @code{main}
752 function to return.  The @dfn{exit status value} returned from the
753 @code{main} function is used to report information back to the process's
754 parent process or shell.
756 A program can also terminate normally by calling the @code{exit}
757 function.
759 In addition, programs can be terminated by signals; this is discussed in
760 more detail in @ref{Signal Handling}.  The @code{abort} function causes
761 a signal that kills the program.
763 @menu
764 * Normal Termination::          If a program calls @code{exit}, a
765                                  process terminates normally.
766 * Exit Status::                 The @code{exit status} provides information
767                                  about why the process terminated.
768 * Cleanups on Exit::            A process can run its own cleanup
769                                  functions upon normal termination.
770 * Aborting a Program::          The @code{abort} function causes
771                                  abnormal program termination.
772 * Termination Internals::       What happens when a process terminates.
773 @end menu
775 @node Normal Termination
776 @subsection Normal Termination
778 A process terminates normally when its program signals it is done by
779 calling @code{exit}.  Returning from @code{main} is equivalent to
780 calling @code{exit}, and the value that @code{main} returns is used as
781 the argument to @code{exit}.
783 @comment stdlib.h
784 @comment ISO
785 @deftypefun void exit (int @var{status})
786 The @code{exit} function tells the system that the program is done, which
787 causes it to terminate the process.
789 @var{status} is the program's exit status, which becomes part of the
790 process' termination status.  This function does not return.
791 @end deftypefun
793 Normal termination causes the following actions:
795 @enumerate
796 @item
797 Functions that were registered with the @code{atexit} or @code{on_exit}
798 functions are called in the reverse order of their registration.  This
799 mechanism allows your application to specify its own ``cleanup'' actions
800 to be performed at program termination.  Typically, this is used to do
801 things like saving program state information in a file, or unlocking
802 locks in shared data bases.
804 @item
805 All open streams are closed, writing out any buffered output data.  See
806 @ref{Closing Streams}.  In addition, temporary files opened
807 with the @code{tmpfile} function are removed; see @ref{Temporary Files}.
809 @item
810 @code{_exit} is called, terminating the program.  @xref{Termination Internals}.
811 @end enumerate
813 @node Exit Status
814 @subsection Exit Status
815 @cindex exit status
817 When a program exits, it can return to the parent process a small
818 amount of information about the cause of termination, using the
819 @dfn{exit status}.  This is a value between 0 and 255 that the exiting
820 process passes as an argument to @code{exit}.
822 Normally you should use the exit status to report very broad information
823 about success or failure.  You can't provide a lot of detail about the
824 reasons for the failure, and most parent processes would not want much
825 detail anyway.
827 There are conventions for what sorts of status values certain programs
828 should return.  The most common convention is simply 0 for success and 1
829 for failure.  Programs that perform comparison use a different
830 convention: they use status 1 to indicate a mismatch, and status 2 to
831 indicate an inability to compare.  Your program should follow an
832 existing convention if an existing convention makes sense for it.
834 A general convention reserves status values 128 and up for special
835 purposes.  In particular, the value 128 is used to indicate failure to
836 execute another program in a subprocess.  This convention is not
837 universally obeyed, but it is a good idea to follow it in your programs.
839 @strong{Warning:} Don't try to use the number of errors as the exit
840 status.  This is actually not very useful; a parent process would
841 generally not care how many errors occurred.  Worse than that, it does
842 not work, because the status value is truncated to eight bits.
843 Thus, if the program tried to report 256 errors, the parent would
844 receive a report of 0 errors---that is, success.
846 For the same reason, it does not work to use the value of @code{errno}
847 as the exit status---these can exceed 255.
849 @strong{Portability note:} Some non-POSIX systems use different
850 conventions for exit status values.  For greater portability, you can
851 use the macros @code{EXIT_SUCCESS} and @code{EXIT_FAILURE} for the
852 conventional status value for success and failure, respectively.  They
853 are declared in the file @file{stdlib.h}.
854 @pindex stdlib.h
856 @comment stdlib.h
857 @comment ISO
858 @deftypevr Macro int EXIT_SUCCESS
859 This macro can be used with the @code{exit} function to indicate
860 successful program completion.
862 On POSIX systems, the value of this macro is @code{0}.  On other
863 systems, the value might be some other (possibly non-constant) integer
864 expression.
865 @end deftypevr
867 @comment stdlib.h
868 @comment ISO
869 @deftypevr Macro int EXIT_FAILURE
870 This macro can be used with the @code{exit} function to indicate
871 unsuccessful program completion in a general sense.
873 On POSIX systems, the value of this macro is @code{1}.  On other
874 systems, the value might be some other (possibly non-constant) integer
875 expression.  Other nonzero status values also indicate failures.  Certain
876 programs use different nonzero status values to indicate particular
877 kinds of "non-success".  For example, @code{diff} uses status value
878 @code{1} to mean that the files are different, and @code{2} or more to
879 mean that there was difficulty in opening the files.
880 @end deftypevr
882 Don't confuse a program's exit status with a process' termination status.
883 There are lots of ways a process can terminate besides having its program
884 finish.  In the event that the process termination @emph{is} caused by program
885 termination (i.e., @code{exit}), though, the program's exit status becomes
886 part of the process' termination status.
888 @node Cleanups on Exit
889 @subsection Cleanups on Exit
891 Your program can arrange to run its own cleanup functions if normal
892 termination happens.  If you are writing a library for use in various
893 application programs, then it is unreliable to insist that all
894 applications call the library's cleanup functions explicitly before
895 exiting.  It is much more robust to make the cleanup invisible to the
896 application, by setting up a cleanup function in the library itself
897 using @code{atexit} or @code{on_exit}.
899 @comment stdlib.h
900 @comment ISO
901 @deftypefun int atexit (void (*@var{function}) (void))
902 The @code{atexit} function registers the function @var{function} to be
903 called at normal program termination.  The @var{function} is called with
904 no arguments.
906 The return value from @code{atexit} is zero on success and nonzero if
907 the function cannot be registered.
908 @end deftypefun
910 @comment stdlib.h
911 @comment SunOS
912 @deftypefun int on_exit (void (*@var{function})(int @var{status}, void *@var{arg}), void *@var{arg})
913 This function is a somewhat more powerful variant of @code{atexit}.  It
914 accepts two arguments, a function @var{function} and an arbitrary
915 pointer @var{arg}.  At normal program termination, the @var{function} is
916 called with two arguments:  the @var{status} value passed to @code{exit},
917 and the @var{arg}.
919 This function is included in @theglibc{} only for compatibility
920 for SunOS, and may not be supported by other implementations.
921 @end deftypefun
923 Here's a trivial program that illustrates the use of @code{exit} and
924 @code{atexit}:
926 @smallexample
927 @include atexit.c.texi
928 @end smallexample
930 @noindent
931 When this program is executed, it just prints the message and exits.
933 @node Aborting a Program
934 @subsection Aborting a Program
935 @cindex aborting a program
937 You can abort your program using the @code{abort} function.  The prototype
938 for this function is in @file{stdlib.h}.
939 @pindex stdlib.h
941 @comment stdlib.h
942 @comment ISO
943 @deftypefun void abort (void)
944 The @code{abort} function causes abnormal program termination.  This
945 does not execute cleanup functions registered with @code{atexit} or
946 @code{on_exit}.
948 This function actually terminates the process by raising a
949 @code{SIGABRT} signal, and your program can include a handler to
950 intercept this signal; see @ref{Signal Handling}.
951 @end deftypefun
953 @c Put in by rms.  Don't remove.
954 @cartouche
955 @strong{Future Change Warning:} Proposed Federal censorship regulations
956 may prohibit us from giving you information about the possibility of
957 calling this function.  We would be required to say that this is not an
958 acceptable way of terminating a program.
959 @end cartouche
961 @node Termination Internals
962 @subsection Termination Internals
964 The @code{_exit} function is the primitive used for process termination
965 by @code{exit}.  It is declared in the header file @file{unistd.h}.
966 @pindex unistd.h
968 @comment unistd.h
969 @comment POSIX.1
970 @deftypefun void _exit (int @var{status})
971 The @code{_exit} function is the primitive for causing a process to
972 terminate with status @var{status}.  Calling this function does not
973 execute cleanup functions registered with @code{atexit} or
974 @code{on_exit}.
975 @end deftypefun
977 @comment stdlib.h
978 @comment ISO
979 @deftypefun void _Exit (int @var{status})
980 The @code{_Exit} function is the @w{ISO C} equivalent to @code{_exit}.
981 The @w{ISO C} committee members were not sure whether the definitions of
982 @code{_exit} and @code{_Exit} were compatible so they have not used the
983 POSIX name.
985 This function was introduced in @w{ISO C99} and is declared in
986 @file{stdlib.h}.
987 @end deftypefun
989 When a process terminates for any reason---either because the program
990 terminates, or as a result of a signal---the
991 following things happen:
993 @itemize @bullet
994 @item
995 All open file descriptors in the process are closed.  @xref{Low-Level I/O}.
996 Note that streams are not flushed automatically when the process
997 terminates; see @ref{I/O on Streams}.
999 @item
1000 A process exit status is saved to be reported back to the parent process
1001 via @code{wait} or @code{waitpid}; see @ref{Process Completion}.  If the
1002 program exited, this status includes as its low-order 8 bits the program
1003 exit status.
1006 @item
1007 Any child processes of the process being terminated are assigned a new
1008 parent process.  (On most systems, including GNU, this is the @code{init}
1009 process, with process ID 1.)
1011 @item
1012 A @code{SIGCHLD} signal is sent to the parent process.
1014 @item
1015 If the process is a session leader that has a controlling terminal, then
1016 a @code{SIGHUP} signal is sent to each process in the foreground job,
1017 and the controlling terminal is disassociated from that session.
1018 @xref{Job Control}.
1020 @item
1021 If termination of a process causes a process group to become orphaned,
1022 and any member of that process group is stopped, then a @code{SIGHUP}
1023 signal and a @code{SIGCONT} signal are sent to each process in the
1024 group.  @xref{Job Control}.
1025 @end itemize