S390: Move utf8-utf32-z9.c to multiarch folder and use s390_libc_ifunc_expr macro.
[glibc.git] / manual / filesys.texi
bloba255c8f07cbdf742a4bb68b7fbbc86ab4e2983f3
1 @node File System Interface, Pipes and FIFOs, Low-Level I/O, Top
2 @c %MENU% Functions for manipulating files
3 @chapter File System Interface
5 This chapter describes @theglibc{}'s functions for manipulating
6 files.  Unlike the input and output functions (@pxref{I/O on Streams};
7 @pxref{Low-Level I/O}), these functions are concerned with operating
8 on the files themselves rather than on their contents.
10 Among the facilities described in this chapter are functions for
11 examining or modifying directories, functions for renaming and deleting
12 files, and functions for examining and setting file attributes such as
13 access permissions and modification times.
15 @menu
16 * Working Directory::           This is used to resolve relative
17                                  file names.
18 * Accessing Directories::       Finding out what files a directory
19                                  contains.
20 * Working with Directory Trees:: Apply actions to all files or a selectable
21                                  subset of a directory hierarchy.
22 * Hard Links::                  Adding alternate names to a file.
23 * Symbolic Links::              A file that ``points to'' a file name.
24 * Deleting Files::              How to delete a file, and what that means.
25 * Renaming Files::              Changing a file's name.
26 * Creating Directories::        A system call just for creating a directory.
27 * File Attributes::             Attributes of individual files.
28 * Making Special Files::        How to create special files.
29 * Temporary Files::             Naming and creating temporary files.
30 @end menu
32 @node Working Directory
33 @section Working Directory
35 @cindex current working directory
36 @cindex working directory
37 @cindex change working directory
38 Each process has associated with it a directory, called its @dfn{current
39 working directory} or simply @dfn{working directory}, that is used in
40 the resolution of relative file names (@pxref{File Name Resolution}).
42 When you log in and begin a new session, your working directory is
43 initially set to the home directory associated with your login account
44 in the system user database.  You can find any user's home directory
45 using the @code{getpwuid} or @code{getpwnam} functions; see @ref{User
46 Database}.
48 Users can change the working directory using shell commands like
49 @code{cd}.  The functions described in this section are the primitives
50 used by those commands and by other programs for examining and changing
51 the working directory.
52 @pindex cd
54 Prototypes for these functions are declared in the header file
55 @file{unistd.h}.
56 @pindex unistd.h
58 @comment unistd.h
59 @comment POSIX.1
60 @deftypefun {char *} getcwd (char *@var{buffer}, size_t @var{size})
61 @safety{@prelim{}@mtsafe{}@asunsafe{@ascuheap{}}@acunsafe{@acsmem{} @acsfd{}}}
62 @c If buffer is NULL, this function calls malloc and realloc, and, in
63 @c case of error, free.  Linux offers a getcwd syscall that we use on
64 @c GNU/Linux systems, but it may fail if the pathname is too long.  As a
65 @c fallback, and on other systems, the generic implementation opens each
66 @c parent directory with opendir, which allocates memory for the
67 @c directory stream with malloc.  If a fstatat64 syscall is not
68 @c available, very deep directory trees may also have to malloc to build
69 @c longer sequences of ../../../... than those supported by a global
70 @c const read-only string.
72 @c linux/__getcwd
73 @c  posix/__getcwd
74 @c   malloc/realloc/free if buffer is NULL, or if dir is too deep
75 @c   lstat64 -> see its own entry
76 @c   fstatat64
77 @c     direct syscall if possible, alloca+snprintf+*stat64 otherwise
78 @c   openat64_not_cancel_3, close_not_cancel_no_status
79 @c   __fdopendir, __opendir, __readdir, rewinddir
80 The @code{getcwd} function returns an absolute file name representing
81 the current working directory, storing it in the character array
82 @var{buffer} that you provide.  The @var{size} argument is how you tell
83 the system the allocation size of @var{buffer}.
85 The @glibcadj{} version of this function also permits you to specify a
86 null pointer for the @var{buffer} argument.  Then @code{getcwd}
87 allocates a buffer automatically, as with @code{malloc}
88 (@pxref{Unconstrained Allocation}).  If the @var{size} is greater than
89 zero, then the buffer is that large; otherwise, the buffer is as large
90 as necessary to hold the result.
92 The return value is @var{buffer} on success and a null pointer on failure.
93 The following @code{errno} error conditions are defined for this function:
95 @table @code
96 @item EINVAL
97 The @var{size} argument is zero and @var{buffer} is not a null pointer.
99 @item ERANGE
100 The @var{size} argument is less than the length of the working directory
101 name.  You need to allocate a bigger array and try again.
103 @item EACCES
104 Permission to read or search a component of the file name was denied.
105 @end table
106 @end deftypefun
108 You could implement the behavior of GNU's @w{@code{getcwd (NULL, 0)}}
109 using only the standard behavior of @code{getcwd}:
111 @smallexample
112 char *
113 gnu_getcwd ()
115   size_t size = 100;
117   while (1)
118     @{
119       char *buffer = (char *) xmalloc (size);
120       if (getcwd (buffer, size) == buffer)
121         return buffer;
122       free (buffer);
123       if (errno != ERANGE)
124         return 0;
125       size *= 2;
126     @}
128 @end smallexample
130 @noindent
131 @xref{Malloc Examples}, for information about @code{xmalloc}, which is
132 not a library function but is a customary name used in most GNU
133 software.
135 @comment unistd.h
136 @comment BSD
137 @deftypefn {Deprecated Function} {char *} getwd (char *@var{buffer})
138 @safety{@prelim{}@mtsafe{}@asunsafe{@ascuheap{} @ascuintl{}}@acunsafe{@acsmem{} @acsfd{}}}
139 @c Besides the getcwd safety issues, it calls strerror_r on error, which
140 @c brings in all of the i18n issues.
141 This is similar to @code{getcwd}, but has no way to specify the size of
142 the buffer.  @Theglibc{} provides @code{getwd} only
143 for backwards compatibility with BSD.
145 The @var{buffer} argument should be a pointer to an array at least
146 @code{PATH_MAX} bytes long (@pxref{Limits for Files}).  On @gnuhurdsystems{}
147 there is no limit to the size of a file name, so this is not
148 necessarily enough space to contain the directory name.  That is why
149 this function is deprecated.
150 @end deftypefn
152 @comment unistd.h
153 @comment GNU
154 @deftypefun {char *} get_current_dir_name (void)
155 @safety{@prelim{}@mtsafe{@mtsenv{}}@asunsafe{@ascuheap{}}@acunsafe{@acsmem{} @acsfd{}}}
156 @c Besides getcwd, which this function calls as a fallback, it calls
157 @c getenv, with the potential thread-safety issues that brings about.
158 @vindex PWD
159 This @code{get_current_dir_name} function is basically equivalent to
160 @w{@code{getcwd (NULL, 0)}}.  The only difference is that the value of
161 the @code{PWD} variable is returned if this value is correct.  This is a
162 subtle difference which is visible if the path described by the
163 @code{PWD} value is using one or more symbol links in which case the
164 value returned by @code{getcwd} can resolve the symbol links and
165 therefore yield a different result.
167 This function is a GNU extension.
168 @end deftypefun
170 @comment unistd.h
171 @comment POSIX.1
172 @deftypefun int chdir (const char *@var{filename})
173 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
174 This function is used to set the process's working directory to
175 @var{filename}.
177 The normal, successful return value from @code{chdir} is @code{0}.  A
178 value of @code{-1} is returned to indicate an error.  The @code{errno}
179 error conditions defined for this function are the usual file name
180 syntax errors (@pxref{File Name Errors}), plus @code{ENOTDIR} if the
181 file @var{filename} is not a directory.
182 @end deftypefun
184 @comment unistd.h
185 @comment XPG
186 @deftypefun int fchdir (int @var{filedes})
187 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
188 This function is used to set the process's working directory to
189 directory associated with the file descriptor @var{filedes}.
191 The normal, successful return value from @code{fchdir} is @code{0}.  A
192 value of @code{-1} is returned to indicate an error.  The following
193 @code{errno} error conditions are defined for this function:
195 @table @code
196 @item EACCES
197 Read permission is denied for the directory named by @code{dirname}.
199 @item EBADF
200 The @var{filedes} argument is not a valid file descriptor.
202 @item ENOTDIR
203 The file descriptor @var{filedes} is not associated with a directory.
205 @item EINTR
206 The function call was interrupt by a signal.
208 @item EIO
209 An I/O error occurred.
210 @end table
211 @end deftypefun
214 @node Accessing Directories
215 @section Accessing Directories
216 @cindex accessing directories
217 @cindex reading from a directory
218 @cindex directories, accessing
220 The facilities described in this section let you read the contents of a
221 directory file.  This is useful if you want your program to list all the
222 files in a directory, perhaps as part of a menu.
224 @cindex directory stream
225 The @code{opendir} function opens a @dfn{directory stream} whose
226 elements are directory entries.  Alternatively @code{fdopendir} can be
227 used which can have advantages if the program needs to have more
228 control over the way the directory is opened for reading.  This
229 allows, for instance, to pass the @code{O_NOATIME} flag to
230 @code{open}.
232 You use the @code{readdir} function on the directory stream to
233 retrieve these entries, represented as @w{@code{struct dirent}}
234 objects.  The name of the file for each entry is stored in the
235 @code{d_name} member of this structure.  There are obvious parallels
236 here to the stream facilities for ordinary files, described in
237 @ref{I/O on Streams}.
239 @menu
240 * Directory Entries::           Format of one directory entry.
241 * Opening a Directory::         How to open a directory stream.
242 * Reading/Closing Directory::   How to read directory entries from the stream.
243 * Simple Directory Lister::     A very simple directory listing program.
244 * Random Access Directory::     Rereading part of the directory
245                                  already read with the same stream.
246 * Scanning Directory Content::  Get entries for user selected subset of
247                                  contents in given directory.
248 * Simple Directory Lister Mark II::  Revised version of the program.
249 @end menu
251 @node Directory Entries
252 @subsection Format of a Directory Entry
254 @pindex dirent.h
255 This section describes what you find in a single directory entry, as you
256 might obtain it from a directory stream.  All the symbols are declared
257 in the header file @file{dirent.h}.
259 @comment dirent.h
260 @comment POSIX.1
261 @deftp {Data Type} {struct dirent}
262 This is a structure type used to return information about directory
263 entries.  It contains the following fields:
265 @table @code
266 @item char d_name[]
267 This is the null-terminated file name component.  This is the only
268 field you can count on in all POSIX systems.
270 @item ino_t d_fileno
271 This is the file serial number.  For BSD compatibility, you can also
272 refer to this member as @code{d_ino}.  On @gnulinuxhurdsystems{} and most POSIX
273 systems, for most files this the same as the @code{st_ino} member that
274 @code{stat} will return for the file.  @xref{File Attributes}.
276 @item unsigned char d_namlen
277 This is the length of the file name, not including the terminating
278 null character.  Its type is @code{unsigned char} because that is the
279 integer type of the appropriate size.  This member is a BSD extension.
280 The symbol @code{_DIRENT_HAVE_D_NAMLEN} is defined if this member is
281 available.
283 @item unsigned char d_type
284 This is the type of the file, possibly unknown.  The following constants
285 are defined for its value:
287 @vtable @code
288 @item DT_UNKNOWN
289 The type is unknown.  Only some filesystems have full support to
290 return the type of the file, others might always return this value.
292 @item DT_REG
293 A regular file.
295 @item DT_DIR
296 A directory.
298 @item DT_FIFO
299 A named pipe, or FIFO.  @xref{FIFO Special Files}.
301 @item DT_SOCK
302 A local-domain socket.  @c !!! @xref{Local Domain}.
304 @item DT_CHR
305 A character device.
307 @item DT_BLK
308 A block device.
310 @item DT_LNK
311 A symbolic link.
312 @end vtable
314 This member is a BSD extension.  The symbol @code{_DIRENT_HAVE_D_TYPE}
315 is defined if this member is available.  On systems where it is used, it
316 corresponds to the file type bits in the @code{st_mode} member of
317 @code{struct stat}.  If the value cannot be determined the member
318 value is DT_UNKNOWN.  These two macros convert between @code{d_type}
319 values and @code{st_mode} values:
321 @comment dirent.h
322 @comment BSD
323 @deftypefun int IFTODT (mode_t @var{mode})
324 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
325 This returns the @code{d_type} value corresponding to @var{mode}.
326 @end deftypefun
328 @comment dirent.h
329 @comment BSD
330 @deftypefun mode_t DTTOIF (int @var{dtype})
331 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
332 This returns the @code{st_mode} value corresponding to @var{dtype}.
333 @end deftypefun
334 @end table
336 This structure may contain additional members in the future.  Their
337 availability is always announced in the compilation environment by a
338 macro named @code{_DIRENT_HAVE_D_@var{xxx}} where @var{xxx} is replaced
339 by the name of the new member.  For instance, the member @code{d_reclen}
340 available on some systems is announced through the macro
341 @code{_DIRENT_HAVE_D_RECLEN}.
343 When a file has multiple names, each name has its own directory entry.
344 The only way you can tell that the directory entries belong to a
345 single file is that they have the same value for the @code{d_fileno}
346 field.
348 File attributes such as size, modification times etc., are part of the
349 file itself, not of any particular directory entry.  @xref{File
350 Attributes}.
351 @end deftp
353 @node Opening a Directory
354 @subsection Opening a Directory Stream
356 @pindex dirent.h
357 This section describes how to open a directory stream.  All the symbols
358 are declared in the header file @file{dirent.h}.
360 @comment dirent.h
361 @comment POSIX.1
362 @deftp {Data Type} DIR
363 The @code{DIR} data type represents a directory stream.
364 @end deftp
366 You shouldn't ever allocate objects of the @code{struct dirent} or
367 @code{DIR} data types, since the directory access functions do that for
368 you.  Instead, you refer to these objects using the pointers returned by
369 the following functions.
371 @comment dirent.h
372 @comment POSIX.1
373 @deftypefun {DIR *} opendir (const char *@var{dirname})
374 @safety{@prelim{}@mtsafe{}@asunsafe{@ascuheap{}}@acunsafe{@acsmem{} @acsfd{}}}
375 @c Besides the safe syscall, we have to allocate the DIR object with
376 @c __alloc_dir, that calls malloc.
377 The @code{opendir} function opens and returns a directory stream for
378 reading the directory whose file name is @var{dirname}.  The stream has
379 type @code{DIR *}.
381 If unsuccessful, @code{opendir} returns a null pointer.  In addition to
382 the usual file name errors (@pxref{File Name Errors}), the
383 following @code{errno} error conditions are defined for this function:
385 @table @code
386 @item EACCES
387 Read permission is denied for the directory named by @code{dirname}.
389 @item EMFILE
390 The process has too many files open.
392 @item ENFILE
393 The entire system, or perhaps the file system which contains the
394 directory, cannot support any additional open files at the moment.
395 (This problem cannot happen on @gnuhurdsystems{}.)
397 @item ENOMEM
398 Not enough memory available.
399 @end table
401 The @code{DIR} type is typically implemented using a file descriptor,
402 and the @code{opendir} function in terms of the @code{open} function.
403 @xref{Low-Level I/O}.  Directory streams and the underlying
404 file descriptors are closed on @code{exec} (@pxref{Executing a File}).
405 @end deftypefun
407 The directory which is opened for reading by @code{opendir} is
408 identified by the name.  In some situations this is not sufficient.
409 Or the way @code{opendir} implicitly creates a file descriptor for the
410 directory is not the way a program might want it.  In these cases an
411 alternative interface can be used.
413 @comment dirent.h
414 @comment GNU
415 @deftypefun {DIR *} fdopendir (int @var{fd})
416 @safety{@prelim{}@mtsafe{}@asunsafe{@ascuheap{}}@acunsafe{@acsmem{} @acsfd{}}}
417 @c The DIR object is allocated with __alloc_dir, that calls malloc.
418 The @code{fdopendir} function works just like @code{opendir} but
419 instead of taking a file name and opening a file descriptor for the
420 directory the caller is required to provide a file descriptor.  This
421 file descriptor is then used in subsequent uses of the returned
422 directory stream object.
424 The caller must make sure the file descriptor is associated with a
425 directory and it allows reading.
427 If the @code{fdopendir} call returns successfully the file descriptor
428 is now under the control of the system.  It can be used in the same
429 way the descriptor implicitly created by @code{opendir} can be used
430 but the program must not close the descriptor.
432 In case the function is unsuccessful it returns a null pointer and the
433 file descriptor remains to be usable by the program.  The following
434 @code{errno} error conditions are defined for this function:
436 @table @code
437 @item EBADF
438 The file descriptor is not valid.
440 @item ENOTDIR
441 The file descriptor is not associated with a directory.
443 @item EINVAL
444 The descriptor does not allow reading the directory content.
446 @item ENOMEM
447 Not enough memory available.
448 @end table
449 @end deftypefun
451 In some situations it can be desirable to get hold of the file
452 descriptor which is created by the @code{opendir} call.  For instance,
453 to switch the current working directory to the directory just read the
454 @code{fchdir} function could be used.  Historically the @code{DIR} type
455 was exposed and programs could access the fields.  This does not happen
456 in @theglibc{}.  Instead a separate function is provided to allow
457 access.
459 @comment dirent.h
460 @comment GNU
461 @deftypefun int dirfd (DIR *@var{dirstream})
462 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
463 The function @code{dirfd} returns the file descriptor associated with
464 the directory stream @var{dirstream}.  This descriptor can be used until
465 the directory is closed with @code{closedir}.  If the directory stream
466 implementation is not using file descriptors the return value is
467 @code{-1}.
468 @end deftypefun
470 @node Reading/Closing Directory
471 @subsection Reading and Closing a Directory Stream
473 @pindex dirent.h
474 This section describes how to read directory entries from a directory
475 stream, and how to close the stream when you are done with it.  All the
476 symbols are declared in the header file @file{dirent.h}.
478 @comment dirent.h
479 @comment POSIX.1
480 @deftypefun {struct dirent *} readdir (DIR *@var{dirstream})
481 @safety{@prelim{}@mtsafe{}@asunsafe{@asulock{}}@acunsafe{@aculock{}}}
482 @c This function holds dirstream's non-recursive lock, which brings
483 @c about the usual issues with locks and async signals and cancellation,
484 @c but the lock taking is not enough to make the returned value safe to
485 @c use, since it points to a stream's internal buffer that can be
486 @c overwritten by subsequent calls or even released by closedir.
487 This function reads the next entry from the directory.  It normally
488 returns a pointer to a structure containing information about the
489 file.  This structure is associated with the @var{dirstream} handle
490 and can be rewritten by a subsequent call.
492 @strong{Portability Note:} On some systems @code{readdir} may not
493 return entries for @file{.} and @file{..}, even though these are always
494 valid file names in any directory.  @xref{File Name Resolution}.
496 If there are no more entries in the directory or an error is detected,
497 @code{readdir} returns a null pointer.  The following @code{errno} error
498 conditions are defined for this function:
500 @table @code
501 @item EBADF
502 The @var{dirstream} argument is not valid.
503 @end table
505 To distinguish between an end-of-directory condition or an error, you
506 must set @code{errno} to zero before calling @code{readdir}.  To avoid
507 entering an infinite loop, you should stop reading from the directory
508 after the first error.
510 @strong{Caution:} The pointer returned by @code{readdir} points to
511 a buffer within the @code{DIR} object.  The data in that buffer will
512 be overwritten by the next call to @code{readdir}.  You must take care,
513 for instance, to copy the @code{d_name} string if you need it later.
515 Because of this, it is not safe to share a @code{DIR} object among
516 multiple threads, unless you use your own locking to ensure that
517 no thread calls @code{readdir} while another thread is still using the
518 data from the previous call.  In @theglibc{}, it is safe to call
519 @code{readdir} from multiple threads as long as each thread uses
520 its own @code{DIR} object.  POSIX.1-2008 does not require this to
521 be safe, but we are not aware of any operating systems where it
522 does not work.
524 @code{readdir_r} allows you to provide your own buffer for the
525 @code{struct dirent}, but it is less portable than @code{readdir}, and
526 has problems with very long filenames (see below).  We recommend
527 you use @code{readdir}, but do not share @code{DIR} objects.
528 @end deftypefun
530 @comment dirent.h
531 @comment GNU
532 @deftypefun int readdir_r (DIR *@var{dirstream}, struct dirent *@var{entry}, struct dirent **@var{result})
533 @safety{@prelim{}@mtsafe{}@asunsafe{@asulock{}}@acunsafe{@aculock{}}}
534 This function is a version of @code{readdir} which performs internal
535 locking.  Like @code{readdir} it returns the next entry from the
536 directory.  To prevent conflicts between simultaneously running
537 threads the result is stored inside the @var{entry} object.
539 @strong{Portability Note:} @code{readdir_r} is deprecated.  It is
540 recommended to use @code{readdir} instead of @code{readdir_r} for the
541 following reasons:
543 @itemize @bullet
544 @item
545 On systems which do not define @code{NAME_MAX}, it may not be possible
546 to use @code{readdir_r} safely because the caller does not specify the
547 length of the buffer for the directory entry.
549 @item
550 On some systems, @code{readdir_r} cannot read directory entries with
551 very long names.  If such a name is encountered, @theglibc{}
552 implementation of @code{readdir_r} returns with an error code of
553 @code{ENAMETOOLONG} after the final directory entry has been read.  On
554 other systems, @code{readdir_r} may return successfully, but the
555 @code{d_name} member may not be NUL-terminated or may be truncated.
557 @item
558 POSIX-1.2008 does not guarantee that @code{readdir} is thread-safe,
559 even when access to the same @var{dirstream} is serialized.  But in
560 current implementations (including @theglibc{}), it is safe to call
561 @code{readdir} concurrently on different @var{dirstream}s, so there is
562 no need to use @code{readdir_r} in most multi-threaded programs.  In
563 the rare case that multiple threads need to read from the same
564 @var{dirstream}, it is still better to use @code{readdir} and external
565 synchronization.
567 @item
568 It is expected that future versions of POSIX will obsolete
569 @code{readdir_r} and mandate the level of thread safety for
570 @code{readdir} which is provided by @theglibc{} and other
571 implementations today.
572 @end itemize
574 Normally @code{readdir_r} returns zero and sets @code{*@var{result}}
575 to @var{entry}.  If there are no more entries in the directory or an
576 error is detected, @code{readdir_r} sets @code{*@var{result}} to a
577 null pointer and returns a nonzero error code, also stored in
578 @code{errno}, as described for @code{readdir}.
580 It is also important to look at the definition of the @code{struct
581 dirent} type.  Simply passing a pointer to an object of this type for
582 the second parameter of @code{readdir_r} might not be enough.  Some
583 systems don't define the @code{d_name} element sufficiently long.  In
584 this case the user has to provide additional space.  There must be room
585 for at least @code{NAME_MAX + 1} characters in the @code{d_name} array.
586 Code to call @code{readdir_r} could look like this:
588 @smallexample
589   union
590   @{
591     struct dirent d;
592     char b[offsetof (struct dirent, d_name) + NAME_MAX + 1];
593   @} u;
595   if (readdir_r (dir, &u.d, &res) == 0)
596     @dots{}
597 @end smallexample
598 @end deftypefun
600 To support large filesystems on 32-bit machines there are LFS variants
601 of the last two functions.
603 @comment dirent.h
604 @comment LFS
605 @deftypefun {struct dirent64 *} readdir64 (DIR *@var{dirstream})
606 @safety{@prelim{}@mtsafe{}@asunsafe{@asulock{}}@acunsafe{@aculock{}}}
607 The @code{readdir64} function is just like the @code{readdir} function
608 except that it returns a pointer to a record of type @code{struct
609 dirent64}.  Some of the members of this data type (notably @code{d_ino})
610 might have a different size to allow large filesystems.
612 In all other aspects this function is equivalent to @code{readdir}.
613 @end deftypefun
615 @comment dirent.h
616 @comment LFS
617 @deftypefun int readdir64_r (DIR *@var{dirstream}, struct dirent64 *@var{entry}, struct dirent64 **@var{result})
618 @safety{@prelim{}@mtsafe{}@asunsafe{@asulock{}}@acunsafe{@aculock{}}}
619 The deprecated @code{readdir64_r} function is equivalent to the
620 @code{readdir_r} function except that it takes parameters of base type
621 @code{struct dirent64} instead of @code{struct dirent} in the second and
622 third position.  The same precautions mentioned in the documentation of
623 @code{readdir_r} also apply here.
624 @end deftypefun
626 @comment dirent.h
627 @comment POSIX.1
628 @deftypefun int closedir (DIR *@var{dirstream})
629 @safety{@prelim{}@mtsafe{}@asunsafe{@ascuheap{} @asulock{/hurd}}@acunsafe{@acsmem{} @acsfd{} @aculock{/hurd}}}
630 @c No synchronization in the posix implementation, only in the hurd
631 @c one.  This is regarded as safe because it is undefined behavior if
632 @c other threads could still be using the dir stream while it's closed.
633 This function closes the directory stream @var{dirstream}.  It returns
634 @code{0} on success and @code{-1} on failure.
636 The following @code{errno} error conditions are defined for this
637 function:
639 @table @code
640 @item EBADF
641 The @var{dirstream} argument is not valid.
642 @end table
643 @end deftypefun
645 @node Simple Directory Lister
646 @subsection Simple Program to List a Directory
648 Here's a simple program that prints the names of the files in
649 the current working directory:
651 @smallexample
652 @include dir.c.texi
653 @end smallexample
655 The order in which files appear in a directory tends to be fairly
656 random.  A more useful program would sort the entries (perhaps by
657 alphabetizing them) before printing them; see
658 @ref{Scanning Directory Content}, and @ref{Array Sort Function}.
661 @node Random Access Directory
662 @subsection Random Access in a Directory Stream
664 @pindex dirent.h
665 This section describes how to reread parts of a directory that you have
666 already read from an open directory stream.  All the symbols are
667 declared in the header file @file{dirent.h}.
669 @comment dirent.h
670 @comment POSIX.1
671 @deftypefun void rewinddir (DIR *@var{dirstream})
672 @safety{@prelim{}@mtsafe{}@asunsafe{@asulock{}}@acunsafe{@aculock{}}}
673 The @code{rewinddir} function is used to reinitialize the directory
674 stream @var{dirstream}, so that if you call @code{readdir} it
675 returns information about the first entry in the directory again.  This
676 function also notices if files have been added or removed to the
677 directory since it was opened with @code{opendir}.  (Entries for these
678 files might or might not be returned by @code{readdir} if they were
679 added or removed since you last called @code{opendir} or
680 @code{rewinddir}.)
681 @end deftypefun
683 @comment dirent.h
684 @comment BSD
685 @deftypefun {long int} telldir (DIR *@var{dirstream})
686 @safety{@prelim{}@mtsafe{}@asunsafe{@ascuheap{/bsd} @asulock{/bsd}}@acunsafe{@acsmem{/bsd} @aculock{/bsd}}}
687 @c The implementation is safe on most platforms, but on BSD it uses
688 @c cookies, buckets and records, and the global array of pointers to
689 @c dynamically allocated records is guarded by a non-recursive lock.
690 The @code{telldir} function returns the file position of the directory
691 stream @var{dirstream}.  You can use this value with @code{seekdir} to
692 restore the directory stream to that position.
693 @end deftypefun
695 @comment dirent.h
696 @comment BSD
697 @deftypefun void seekdir (DIR *@var{dirstream}, long int @var{pos})
698 @safety{@prelim{}@mtsafe{}@asunsafe{@ascuheap{/bsd} @asulock{/bsd}}@acunsafe{@acsmem{/bsd} @aculock{/bsd}}}
699 @c The implementation is safe on most platforms, but on BSD it uses
700 @c cookies, buckets and records, and the global array of pointers to
701 @c dynamically allocated records is guarded by a non-recursive lock.
702 The @code{seekdir} function sets the file position of the directory
703 stream @var{dirstream} to @var{pos}.  The value @var{pos} must be the
704 result of a previous call to @code{telldir} on this particular stream;
705 closing and reopening the directory can invalidate values returned by
706 @code{telldir}.
707 @end deftypefun
710 @node Scanning Directory Content
711 @subsection Scanning the Content of a Directory
713 A higher-level interface to the directory handling functions is the
714 @code{scandir} function.  With its help one can select a subset of the
715 entries in a directory, possibly sort them and get a list of names as
716 the result.
718 @comment dirent.h
719 @comment BSD/SVID
720 @deftypefun int scandir (const char *@var{dir}, struct dirent ***@var{namelist}, int (*@var{selector}) (const struct dirent *), int (*@var{cmp}) (const struct dirent **, const struct dirent **))
721 @safety{@prelim{}@mtsafe{}@asunsafe{@ascuheap{}}@acunsafe{@acsmem{} @acsfd{}}}
722 @c The scandir function calls __opendirat, __readdir, and __closedir to
723 @c go over the named dir; malloc and realloc to allocate the namelist
724 @c and copies of each selected dirent, besides the selector, if given,
725 @c and qsort and the cmp functions if the latter is given.  In spite of
726 @c the cleanup handler that releases memory and the file descriptor in
727 @c case of synchronous cancellation, an asynchronous cancellation may
728 @c still leak memory and a file descriptor.  Although readdir is unsafe
729 @c in general, the use of an internal dir stream for sequential scanning
730 @c of the directory with copying of dirents before subsequent calls
731 @c makes the use safe, and the fact that the dir stream is private to
732 @c each scandir call does away with the lock issues in readdir and
733 @c closedir.
735 The @code{scandir} function scans the contents of the directory selected
736 by @var{dir}.  The result in *@var{namelist} is an array of pointers to
737 structures of type @code{struct dirent} which describe all selected
738 directory entries and which is allocated using @code{malloc}.  Instead
739 of always getting all directory entries returned, the user supplied
740 function @var{selector} can be used to decide which entries are in the
741 result.  Only the entries for which @var{selector} returns a non-zero
742 value are selected.
744 Finally the entries in *@var{namelist} are sorted using the
745 user-supplied function @var{cmp}.  The arguments passed to the @var{cmp}
746 function are of type @code{struct dirent **}, therefore one cannot
747 directly use the @code{strcmp} or @code{strcoll} functions; instead see
748 the functions @code{alphasort} and @code{versionsort} below.
750 The return value of the function is the number of entries placed in
751 *@var{namelist}.  If it is @code{-1} an error occurred (either the
752 directory could not be opened for reading or the malloc call failed) and
753 the global variable @code{errno} contains more information on the error.
754 @end deftypefun
756 As described above, the fourth argument to the @code{scandir} function
757 must be a pointer to a sorting function.  For the convenience of the
758 programmer @theglibc{} contains implementations of functions which
759 are very helpful for this purpose.
761 @comment dirent.h
762 @comment BSD/SVID
763 @deftypefun int alphasort (const struct dirent **@var{a}, const struct dirent **@var{b})
764 @safety{@prelim{}@mtsafe{@mtslocale{}}@asunsafe{@ascuheap{}}@acunsafe{@acsmem{}}}
765 @c Calls strcoll.
766 The @code{alphasort} function behaves like the @code{strcoll} function
767 (@pxref{String/Array Comparison}).  The difference is that the arguments
768 are not string pointers but instead they are of type
769 @code{struct dirent **}.
771 The return value of @code{alphasort} is less than, equal to, or greater
772 than zero depending on the order of the two entries @var{a} and @var{b}.
773 @end deftypefun
775 @comment dirent.h
776 @comment GNU
777 @deftypefun int versionsort (const struct dirent **@var{a}, const struct dirent **@var{b})
778 @safety{@prelim{}@mtsafe{@mtslocale{}}@assafe{}@acsafe{}}
779 @c Calls strverscmp, which will accesses the locale object multiple
780 @c times.
781 The @code{versionsort} function is like @code{alphasort} except that it
782 uses the @code{strverscmp} function internally.
783 @end deftypefun
785 If the filesystem supports large files we cannot use the @code{scandir}
786 anymore since the @code{dirent} structure might not able to contain all
787 the information.  The LFS provides the new type @w{@code{struct
788 dirent64}}.  To use this we need a new function.
790 @comment dirent.h
791 @comment GNU
792 @deftypefun int scandir64 (const char *@var{dir}, struct dirent64 ***@var{namelist}, int (*@var{selector}) (const struct dirent64 *), int (*@var{cmp}) (const struct dirent64 **, const struct dirent64 **))
793 @safety{@prelim{}@mtsafe{}@asunsafe{@ascuheap{}}@acunsafe{@acsmem{} @acsfd{}}}
794 @c See scandir.
795 The @code{scandir64} function works like the @code{scandir} function
796 except that the directory entries it returns are described by elements
797 of type @w{@code{struct dirent64}}.  The function pointed to by
798 @var{selector} is again used to select the desired entries, except that
799 @var{selector} now must point to a function which takes a
800 @w{@code{struct dirent64 *}} parameter.
802 Similarly the @var{cmp} function should expect its two arguments to be
803 of type @code{struct dirent64 **}.
804 @end deftypefun
806 As @var{cmp} is now a function of a different type, the functions
807 @code{alphasort} and @code{versionsort} cannot be supplied for that
808 argument.  Instead we provide the two replacement functions below.
810 @comment dirent.h
811 @comment GNU
812 @deftypefun int alphasort64 (const struct dirent64 **@var{a}, const struct dirent **@var{b})
813 @safety{@prelim{}@mtsafe{@mtslocale{}}@asunsafe{@ascuheap{}}@acunsafe{@acsmem{}}}
814 @c See alphasort.
815 The @code{alphasort64} function behaves like the @code{strcoll} function
816 (@pxref{String/Array Comparison}).  The difference is that the arguments
817 are not string pointers but instead they are of type
818 @code{struct dirent64 **}.
820 Return value of @code{alphasort64} is less than, equal to, or greater
821 than zero depending on the order of the two entries @var{a} and @var{b}.
822 @end deftypefun
824 @comment dirent.h
825 @comment GNU
826 @deftypefun int versionsort64 (const struct dirent64 **@var{a}, const struct dirent64 **@var{b})
827 @safety{@prelim{}@mtsafe{@mtslocale{}}@assafe{}@acsafe{}}
828 @c See versionsort.
829 The @code{versionsort64} function is like @code{alphasort64}, excepted that it
830 uses the @code{strverscmp} function internally.
831 @end deftypefun
833 It is important not to mix the use of @code{scandir} and the 64-bit
834 comparison functions or vice versa.  There are systems on which this
835 works but on others it will fail miserably.
837 @node Simple Directory Lister Mark II
838 @subsection Simple Program to List a Directory, Mark II
840 Here is a revised version of the directory lister found above
841 (@pxref{Simple Directory Lister}).  Using the @code{scandir} function we
842 can avoid the functions which work directly with the directory contents.
843 After the call the returned entries are available for direct use.
845 @smallexample
846 @include dir2.c.texi
847 @end smallexample
849 Note the simple selector function in this example.  Since we want to see
850 all directory entries we always return @code{1}.
853 @node Working with Directory Trees
854 @section Working with Directory Trees
855 @cindex directory hierarchy
856 @cindex hierarchy, directory
857 @cindex tree, directory
859 The functions described so far for handling the files in a directory
860 have allowed you to either retrieve the information bit by bit, or to
861 process all the files as a group (see @code{scandir}).  Sometimes it is
862 useful to process whole hierarchies of directories and their contained
863 files.  The X/Open specification defines two functions to do this.  The
864 simpler form is derived from an early definition in @w{System V} systems
865 and therefore this function is available on SVID-derived systems.  The
866 prototypes and required definitions can be found in the @file{ftw.h}
867 header.
869 There are four functions in this family: @code{ftw}, @code{nftw} and
870 their 64-bit counterparts @code{ftw64} and @code{nftw64}.  These
871 functions take as one of their arguments a pointer to a callback
872 function of the appropriate type.
874 @comment ftw.h
875 @comment GNU
876 @deftp {Data Type} __ftw_func_t
878 @smallexample
879 int (*) (const char *, const struct stat *, int)
880 @end smallexample
882 The type of callback functions given to the @code{ftw} function.  The
883 first parameter points to the file name, the second parameter to an
884 object of type @code{struct stat} which is filled in for the file named
885 in the first parameter.
887 @noindent
888 The last parameter is a flag giving more information about the current
889 file.  It can have the following values:
891 @vtable @code
892 @item FTW_F
893 The item is either a normal file or a file which does not fit into one
894 of the following categories.  This could be special files, sockets etc.
895 @item FTW_D
896 The item is a directory.
897 @item FTW_NS
898 The @code{stat} call failed and so the information pointed to by the
899 second parameter is invalid.
900 @item FTW_DNR
901 The item is a directory which cannot be read.
902 @item FTW_SL
903 The item is a symbolic link.  Since symbolic links are normally followed
904 seeing this value in a @code{ftw} callback function means the referenced
905 file does not exist.  The situation for @code{nftw} is different.
907 This value is only available if the program is compiled with
908 @code{_XOPEN_EXTENDED} defined before including
909 the first header.  The original SVID systems do not have symbolic links.
910 @end vtable
912 If the sources are compiled with @code{_FILE_OFFSET_BITS == 64} this
913 type is in fact @code{__ftw64_func_t} since this mode changes
914 @code{struct stat} to be @code{struct stat64}.
915 @end deftp
917 For the LFS interface and for use in the function @code{ftw64}, the
918 header @file{ftw.h} defines another function type.
920 @comment ftw.h
921 @comment GNU
922 @deftp {Data Type} __ftw64_func_t
924 @smallexample
925 int (*) (const char *, const struct stat64 *, int)
926 @end smallexample
928 This type is used just like @code{__ftw_func_t} for the callback
929 function, but this time is called from @code{ftw64}.  The second
930 parameter to the function is a pointer to a variable of type
931 @code{struct stat64} which is able to represent the larger values.
932 @end deftp
934 @comment ftw.h
935 @comment GNU
936 @deftp {Data Type} __nftw_func_t
938 @smallexample
939 int (*) (const char *, const struct stat *, int, struct FTW *)
940 @end smallexample
942 The first three arguments are the same as for the @code{__ftw_func_t}
943 type.  However for the third argument some additional values are defined
944 to allow finer differentiation:
945 @vtable @code
946 @item FTW_DP
947 The current item is a directory and all subdirectories have already been
948 visited and reported.  This flag is returned instead of @code{FTW_D} if
949 the @code{FTW_DEPTH} flag is passed to @code{nftw} (see below).
950 @item FTW_SLN
951 The current item is a stale symbolic link.  The file it points to does
952 not exist.
953 @end vtable
955 The last parameter of the callback function is a pointer to a structure
956 with some extra information as described below.
958 If the sources are compiled with @code{_FILE_OFFSET_BITS == 64} this
959 type is in fact @code{__nftw64_func_t} since this mode changes
960 @code{struct stat} to be @code{struct stat64}.
961 @end deftp
963 For the LFS interface there is also a variant of this data type
964 available which has to be used with the @code{nftw64} function.
966 @comment ftw.h
967 @comment GNU
968 @deftp {Data Type} __nftw64_func_t
970 @smallexample
971 int (*) (const char *, const struct stat64 *, int, struct FTW *)
972 @end smallexample
974 This type is used just like @code{__nftw_func_t} for the callback
975 function, but this time is called from @code{nftw64}.  The second
976 parameter to the function is this time a pointer to a variable of type
977 @code{struct stat64} which is able to represent the larger values.
978 @end deftp
980 @comment ftw.h
981 @comment XPG4.2
982 @deftp {Data Type} {struct FTW}
983 The information contained in this structure helps in interpreting the
984 name parameter and gives some information about the current state of the
985 traversal of the directory hierarchy.
987 @table @code
988 @item int base
989 The value is the offset into the string passed in the first parameter to
990 the callback function of the beginning of the file name.  The rest of
991 the string is the path of the file.  This information is especially
992 important if the @code{FTW_CHDIR} flag was set in calling @code{nftw}
993 since then the current directory is the one the current item is found
995 @item int level
996 Whilst processing, the code tracks how many directories down it has gone
997 to find the current file.  This nesting level starts at @math{0} for
998 files in the initial directory (or is zero for the initial file if a
999 file was passed).
1000 @end table
1001 @end deftp
1004 @comment ftw.h
1005 @comment SVID
1006 @deftypefun int ftw (const char *@var{filename}, __ftw_func_t @var{func}, int @var{descriptors})
1007 @safety{@prelim{}@mtsafe{}@asunsafe{@ascuheap{}}@acunsafe{@acsmem{} @acsfd{}}}
1008 @c see nftw for safety details
1009 The @code{ftw} function calls the callback function given in the
1010 parameter @var{func} for every item which is found in the directory
1011 specified by @var{filename} and all directories below.  The function
1012 follows symbolic links if necessary but does not process an item twice.
1013 If @var{filename} is not a directory then it itself is the only object
1014 returned to the callback function.
1016 The file name passed to the callback function is constructed by taking
1017 the @var{filename} parameter and appending the names of all passed
1018 directories and then the local file name.  So the callback function can
1019 use this parameter to access the file.  @code{ftw} also calls
1020 @code{stat} for the file and passes that information on to the callback
1021 function.  If this @code{stat} call is not successful the failure is
1022 indicated by setting the third argument of the callback function to
1023 @code{FTW_NS}.  Otherwise it is set according to the description given
1024 in the account of @code{__ftw_func_t} above.
1026 The callback function is expected to return @math{0} to indicate that no
1027 error occurred and that processing should continue.  If an error
1028 occurred in the callback function or it wants @code{ftw} to return
1029 immediately, the callback function can return a value other than
1030 @math{0}.  This is the only correct way to stop the function.  The
1031 program must not use @code{setjmp} or similar techniques to continue
1032 from another place.  This would leave resources allocated by the
1033 @code{ftw} function unfreed.
1035 The @var{descriptors} parameter to @code{ftw} specifies how many file
1036 descriptors it is allowed to consume.  The function runs faster the more
1037 descriptors it can use.  For each level in the directory hierarchy at
1038 most one descriptor is used, but for very deep ones any limit on open
1039 file descriptors for the process or the system may be exceeded.
1040 Moreover, file descriptor limits in a multi-threaded program apply to
1041 all the threads as a group, and therefore it is a good idea to supply a
1042 reasonable limit to the number of open descriptors.
1044 The return value of the @code{ftw} function is @math{0} if all callback
1045 function calls returned @math{0} and all actions performed by the
1046 @code{ftw} succeeded.  If a function call failed (other than calling
1047 @code{stat} on an item) the function returns @math{-1}.  If a callback
1048 function returns a value other than @math{0} this value is returned as
1049 the return value of @code{ftw}.
1051 When the sources are compiled with @code{_FILE_OFFSET_BITS == 64} on a
1052 32-bit system this function is in fact @code{ftw64}, i.e., the LFS
1053 interface transparently replaces the old interface.
1054 @end deftypefun
1056 @comment ftw.h
1057 @comment Unix98
1058 @deftypefun int ftw64 (const char *@var{filename}, __ftw64_func_t @var{func}, int @var{descriptors})
1059 @safety{@prelim{}@mtsafe{}@asunsafe{@ascuheap{}}@acunsafe{@acsmem{} @acsfd{}}}
1060 This function is similar to @code{ftw} but it can work on filesystems
1061 with large files.  File information is reported using a variable of type
1062 @code{struct stat64} which is passed by reference to the callback
1063 function.
1065 When the sources are compiled with @code{_FILE_OFFSET_BITS == 64} on a
1066 32-bit system this function is available under the name @code{ftw} and
1067 transparently replaces the old implementation.
1068 @end deftypefun
1070 @comment ftw.h
1071 @comment XPG4.2
1072 @deftypefun int nftw (const char *@var{filename}, __nftw_func_t @var{func}, int @var{descriptors}, int @var{flag})
1073 @safety{@prelim{}@mtsafe{@mtasscwd{}}@asunsafe{@ascuheap{}}@acunsafe{@acsmem{} @acsfd{} @acscwd{}}}
1074 @c ftw_startup calls alloca, malloc, free, xstat/lxstat, tdestroy, and ftw_dir
1075 @c  if FTW_CHDIR, call open, and fchdir, or chdir and getcwd
1076 @c ftw_dir calls open_dir_stream, readdir64, process_entry, closedir
1077 @c  if FTW_CHDIR, also calls fchdir
1078 @c open_dir_stream calls malloc, realloc, readdir64, free, closedir,
1079 @c  then openat64_not_cancel_3 and fdopendir or opendir, then dirfd.
1080 @c process_entry may cal realloc, fxstatat/lxstat/xstat, ftw_dir, and
1081 @c  find_object (tsearch) and add_object (tfind).
1082 @c Since each invocation of *ftw uses its own private search tree, none
1083 @c  of the search tree concurrency issues apply.
1084 The @code{nftw} function works like the @code{ftw} functions.  They call
1085 the callback function @var{func} for all items found in the directory
1086 @var{filename} and below.  At most @var{descriptors} file descriptors
1087 are consumed during the @code{nftw} call.
1089 One difference is that the callback function is of a different type.  It
1090 is of type @w{@code{struct FTW *}} and provides the callback function
1091 with the extra information described above.
1093 A second difference is that @code{nftw} takes a fourth argument, which
1094 is @math{0} or a bitwise-OR combination of any of the following values.
1096 @vtable @code
1097 @item FTW_PHYS
1098 While traversing the directory symbolic links are not followed.  Instead
1099 symbolic links are reported using the @code{FTW_SL} value for the type
1100 parameter to the callback function.  If the file referenced by a
1101 symbolic link does not exist @code{FTW_SLN} is returned instead.
1102 @item FTW_MOUNT
1103 The callback function is only called for items which are on the same
1104 mounted filesystem as the directory given by the @var{filename}
1105 parameter to @code{nftw}.
1106 @item FTW_CHDIR
1107 If this flag is given the current working directory is changed to the
1108 directory of the reported object before the callback function is called.
1109 When @code{ntfw} finally returns the current directory is restored to
1110 its original value.
1111 @item FTW_DEPTH
1112 If this option is specified then all subdirectories and files within
1113 them are processed before processing the top directory itself
1114 (depth-first processing).  This also means the type flag given to the
1115 callback function is @code{FTW_DP} and not @code{FTW_D}.
1116 @item FTW_ACTIONRETVAL
1117 If this option is specified then return values from callbacks
1118 are handled differently.  If the callback returns @code{FTW_CONTINUE},
1119 walking continues normally.  @code{FTW_STOP} means walking stops
1120 and @code{FTW_STOP} is returned to the caller.  If @code{FTW_SKIP_SUBTREE}
1121 is returned by the callback with @code{FTW_D} argument, the subtree
1122 is skipped and walking continues with next sibling of the directory.
1123 If @code{FTW_SKIP_SIBLINGS} is returned by the callback, all siblings
1124 of the current entry are skipped and walking continues in its parent.
1125 No other return values should be returned from the callbacks if
1126 this option is set.  This option is a GNU extension.
1127 @end vtable
1129 The return value is computed in the same way as for @code{ftw}.
1130 @code{nftw} returns @math{0} if no failures occurred and all callback
1131 functions returned @math{0}.  In case of internal errors, such as memory
1132 problems, the return value is @math{-1} and @var{errno} is set
1133 accordingly.  If the return value of a callback invocation was non-zero
1134 then that value is returned.
1136 When the sources are compiled with @code{_FILE_OFFSET_BITS == 64} on a
1137 32-bit system this function is in fact @code{nftw64}, i.e., the LFS
1138 interface transparently replaces the old interface.
1139 @end deftypefun
1141 @comment ftw.h
1142 @comment Unix98
1143 @deftypefun int nftw64 (const char *@var{filename}, __nftw64_func_t @var{func}, int @var{descriptors}, int @var{flag})
1144 @safety{@prelim{}@mtsafe{@mtasscwd{}}@asunsafe{@ascuheap{}}@acunsafe{@acsmem{} @acsfd{} @acscwd{}}}
1145 This function is similar to @code{nftw} but it can work on filesystems
1146 with large files.  File information is reported using a variable of type
1147 @code{struct stat64} which is passed by reference to the callback
1148 function.
1150 When the sources are compiled with @code{_FILE_OFFSET_BITS == 64} on a
1151 32-bit system this function is available under the name @code{nftw} and
1152 transparently replaces the old implementation.
1153 @end deftypefun
1156 @node Hard Links
1157 @section Hard Links
1158 @cindex hard link
1159 @cindex link, hard
1160 @cindex multiple names for one file
1161 @cindex file names, multiple
1163 In POSIX systems, one file can have many names at the same time.  All of
1164 the names are equally real, and no one of them is preferred to the
1165 others.
1167 To add a name to a file, use the @code{link} function.  (The new name is
1168 also called a @dfn{hard link} to the file.)  Creating a new link to a
1169 file does not copy the contents of the file; it simply makes a new name
1170 by which the file can be known, in addition to the file's existing name
1171 or names.
1173 One file can have names in several directories, so the organization
1174 of the file system is not a strict hierarchy or tree.
1176 In most implementations, it is not possible to have hard links to the
1177 same file in multiple file systems.  @code{link} reports an error if you
1178 try to make a hard link to the file from another file system when this
1179 cannot be done.
1181 The prototype for the @code{link} function is declared in the header
1182 file @file{unistd.h}.
1183 @pindex unistd.h
1185 @comment unistd.h
1186 @comment POSIX.1
1187 @deftypefun int link (const char *@var{oldname}, const char *@var{newname})
1188 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
1189 The @code{link} function makes a new link to the existing file named by
1190 @var{oldname}, under the new name @var{newname}.
1192 This function returns a value of @code{0} if it is successful and
1193 @code{-1} on failure.  In addition to the usual file name errors
1194 (@pxref{File Name Errors}) for both @var{oldname} and @var{newname}, the
1195 following @code{errno} error conditions are defined for this function:
1197 @table @code
1198 @item EACCES
1199 You are not allowed to write to the directory in which the new link is
1200 to be written.
1201 @ignore
1202 Some implementations also require that the existing file be accessible
1203 by the caller, and use this error to report failure for that reason.
1204 @end ignore
1206 @item EEXIST
1207 There is already a file named @var{newname}.  If you want to replace
1208 this link with a new link, you must remove the old link explicitly first.
1210 @item EMLINK
1211 There are already too many links to the file named by @var{oldname}.
1212 (The maximum number of links to a file is @w{@code{LINK_MAX}}; see
1213 @ref{Limits for Files}.)
1215 @item ENOENT
1216 The file named by @var{oldname} doesn't exist.  You can't make a link to
1217 a file that doesn't exist.
1219 @item ENOSPC
1220 The directory or file system that would contain the new link is full
1221 and cannot be extended.
1223 @item EPERM
1224 On @gnulinuxhurdsystems{} and some others, you cannot make links to
1225 directories.
1226 Many systems allow only privileged users to do so.  This error
1227 is used to report the problem.
1229 @item EROFS
1230 The directory containing the new link can't be modified because it's on
1231 a read-only file system.
1233 @item EXDEV
1234 The directory specified in @var{newname} is on a different file system
1235 than the existing file.
1237 @item EIO
1238 A hardware error occurred while trying to read or write the to filesystem.
1239 @end table
1240 @end deftypefun
1242 @node Symbolic Links
1243 @section Symbolic Links
1244 @cindex soft link
1245 @cindex link, soft
1246 @cindex symbolic link
1247 @cindex link, symbolic
1249 @gnusystems{} support @dfn{soft links} or @dfn{symbolic links}.  This
1250 is a kind of ``file'' that is essentially a pointer to another file
1251 name.  Unlike hard links, symbolic links can be made to directories or
1252 across file systems with no restrictions.  You can also make a symbolic
1253 link to a name which is not the name of any file.  (Opening this link
1254 will fail until a file by that name is created.)  Likewise, if the
1255 symbolic link points to an existing file which is later deleted, the
1256 symbolic link continues to point to the same file name even though the
1257 name no longer names any file.
1259 The reason symbolic links work the way they do is that special things
1260 happen when you try to open the link.  The @code{open} function realizes
1261 you have specified the name of a link, reads the file name contained in
1262 the link, and opens that file name instead.  The @code{stat} function
1263 likewise operates on the file that the symbolic link points to, instead
1264 of on the link itself.
1266 By contrast, other operations such as deleting or renaming the file
1267 operate on the link itself.  The functions @code{readlink} and
1268 @code{lstat} also refrain from following symbolic links, because their
1269 purpose is to obtain information about the link.  @code{link}, the
1270 function that makes a hard link, does too.  It makes a hard link to the
1271 symbolic link, which one rarely wants.
1273 Some systems have, for some functions operating on files, a limit on
1274 how many symbolic links are followed when resolving a path name.  The
1275 limit if it exists is published in the @file{sys/param.h} header file.
1277 @comment sys/param.h
1278 @comment BSD
1279 @deftypevr Macro int MAXSYMLINKS
1281 The macro @code{MAXSYMLINKS} specifies how many symlinks some function
1282 will follow before returning @code{ELOOP}.  Not all functions behave the
1283 same and this value is not the same as that returned for
1284 @code{_SC_SYMLOOP} by @code{sysconf}.  In fact, the @code{sysconf}
1285 result can indicate that there is no fixed limit although
1286 @code{MAXSYMLINKS} exists and has a finite value.
1287 @end deftypevr
1289 Prototypes for most of the functions listed in this section are in
1290 @file{unistd.h}.
1291 @pindex unistd.h
1293 @comment unistd.h
1294 @comment BSD
1295 @deftypefun int symlink (const char *@var{oldname}, const char *@var{newname})
1296 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
1297 The @code{symlink} function makes a symbolic link to @var{oldname} named
1298 @var{newname}.
1300 The normal return value from @code{symlink} is @code{0}.  A return value
1301 of @code{-1} indicates an error.  In addition to the usual file name
1302 syntax errors (@pxref{File Name Errors}), the following @code{errno}
1303 error conditions are defined for this function:
1305 @table @code
1306 @item EEXIST
1307 There is already an existing file named @var{newname}.
1309 @item EROFS
1310 The file @var{newname} would exist on a read-only file system.
1312 @item ENOSPC
1313 The directory or file system cannot be extended to make the new link.
1315 @item EIO
1316 A hardware error occurred while reading or writing data on the disk.
1318 @ignore
1319 @comment not sure about these
1320 @item ELOOP
1321 There are too many levels of indirection.  This can be the result of
1322 circular symbolic links to directories.
1324 @item EDQUOT
1325 The new link can't be created because the user's disk quota has been
1326 exceeded.
1327 @end ignore
1328 @end table
1329 @end deftypefun
1331 @comment unistd.h
1332 @comment BSD
1333 @deftypefun ssize_t readlink (const char *@var{filename}, char *@var{buffer}, size_t @var{size})
1334 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
1335 The @code{readlink} function gets the value of the symbolic link
1336 @var{filename}.  The file name that the link points to is copied into
1337 @var{buffer}.  This file name string is @emph{not} null-terminated;
1338 @code{readlink} normally returns the number of characters copied.  The
1339 @var{size} argument specifies the maximum number of characters to copy,
1340 usually the allocation size of @var{buffer}.
1342 If the return value equals @var{size}, you cannot tell whether or not
1343 there was room to return the entire name.  So make a bigger buffer and
1344 call @code{readlink} again.  Here is an example:
1346 @smallexample
1347 char *
1348 readlink_malloc (const char *filename)
1350   int size = 100;
1351   char *buffer = NULL;
1353   while (1)
1354     @{
1355       buffer = (char *) xrealloc (buffer, size);
1356       int nchars = readlink (filename, buffer, size);
1357       if (nchars < 0)
1358         @{
1359           free (buffer);
1360           return NULL;
1361         @}
1362       if (nchars < size)
1363         return buffer;
1364       size *= 2;
1365     @}
1367 @end smallexample
1369 @c @group  Invalid outside example.
1370 A value of @code{-1} is returned in case of error.  In addition to the
1371 usual file name errors (@pxref{File Name Errors}), the following
1372 @code{errno} error conditions are defined for this function:
1374 @table @code
1375 @item EINVAL
1376 The named file is not a symbolic link.
1378 @item EIO
1379 A hardware error occurred while reading or writing data on the disk.
1380 @end table
1381 @c @end group
1382 @end deftypefun
1384 In some situations it is desirable to resolve all the
1385 symbolic links to get the real
1386 name of a file where no prefix names a symbolic link which is followed
1387 and no filename in the path is @code{.} or @code{..}.  This is for
1388 instance desirable if files have to be compared in which case different
1389 names can refer to the same inode.
1391 @comment stdlib.h
1392 @comment GNU
1393 @deftypefun {char *} canonicalize_file_name (const char *@var{name})
1394 @safety{@prelim{}@mtsafe{}@asunsafe{@ascuheap{}}@acunsafe{@acsmem{} @acsfd{}}}
1395 @c Calls realpath.
1397 The @code{canonicalize_file_name} function returns the absolute name of
1398 the file named by @var{name} which contains no @code{.}, @code{..}
1399 components nor any repeated path separators (@code{/}) or symlinks.  The
1400 result is passed back as the return value of the function in a block of
1401 memory allocated with @code{malloc}.  If the result is not used anymore
1402 the memory should be freed with a call to @code{free}.
1404 If any of the path components are missing the function returns a NULL
1405 pointer.  This is also what is returned if the length of the path
1406 reaches or exceeds @code{PATH_MAX} characters.  In any case
1407 @code{errno} is set accordingly.
1409 @table @code
1410 @item ENAMETOOLONG
1411 The resulting path is too long.  This error only occurs on systems which
1412 have a limit on the file name length.
1414 @item EACCES
1415 At least one of the path components is not readable.
1417 @item ENOENT
1418 The input file name is empty.
1420 @item ENOENT
1421 At least one of the path components does not exist.
1423 @item ELOOP
1424 More than @code{MAXSYMLINKS} many symlinks have been followed.
1425 @end table
1427 This function is a GNU extension and is declared in @file{stdlib.h}.
1428 @end deftypefun
1430 The Unix standard includes a similar function which differs from
1431 @code{canonicalize_file_name} in that the user has to provide the buffer
1432 where the result is placed in.
1434 @comment stdlib.h
1435 @comment XPG
1436 @deftypefun {char *} realpath (const char *restrict @var{name}, char *restrict @var{resolved})
1437 @safety{@prelim{}@mtsafe{}@asunsafe{@ascuheap{}}@acunsafe{@acsmem{} @acsfd{}}}
1438 @c Calls malloc, realloc, getcwd, lxstat64, readlink, alloca.
1440 A call to @code{realpath} where the @var{resolved} parameter is
1441 @code{NULL} behaves exactly like @code{canonicalize_file_name}.  The
1442 function allocates a buffer for the file name and returns a pointer to
1443 it.  If @var{resolved} is not @code{NULL} it points to a buffer into
1444 which the result is copied.  It is the callers responsibility to
1445 allocate a buffer which is large enough.  On systems which define
1446 @code{PATH_MAX} this means the buffer must be large enough for a
1447 pathname of this size.  For systems without limitations on the pathname
1448 length the requirement cannot be met and programs should not call
1449 @code{realpath} with anything but @code{NULL} for the second parameter.
1451 One other difference is that the buffer @var{resolved} (if nonzero) will
1452 contain the part of the path component which does not exist or is not
1453 readable if the function returns @code{NULL} and @code{errno} is set to
1454 @code{EACCES} or @code{ENOENT}.
1456 This function is declared in @file{stdlib.h}.
1457 @end deftypefun
1459 The advantage of using this function is that it is more widely
1460 available.  The drawback is that it reports failures for long paths on
1461 systems which have no limits on the file name length.
1463 @node Deleting Files
1464 @section Deleting Files
1465 @cindex deleting a file
1466 @cindex removing a file
1467 @cindex unlinking a file
1469 You can delete a file with @code{unlink} or @code{remove}.
1471 Deletion actually deletes a file name.  If this is the file's only name,
1472 then the file is deleted as well.  If the file has other remaining names
1473 (@pxref{Hard Links}), it remains accessible under those names.
1475 @comment unistd.h
1476 @comment POSIX.1
1477 @deftypefun int unlink (const char *@var{filename})
1478 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
1479 The @code{unlink} function deletes the file name @var{filename}.  If
1480 this is a file's sole name, the file itself is also deleted.  (Actually,
1481 if any process has the file open when this happens, deletion is
1482 postponed until all processes have closed the file.)
1484 @pindex unistd.h
1485 The function @code{unlink} is declared in the header file @file{unistd.h}.
1487 This function returns @code{0} on successful completion, and @code{-1}
1488 on error.  In addition to the usual file name errors
1489 (@pxref{File Name Errors}), the following @code{errno} error conditions are
1490 defined for this function:
1492 @table @code
1493 @item EACCES
1494 Write permission is denied for the directory from which the file is to be
1495 removed, or the directory has the sticky bit set and you do not own the file.
1497 @item EBUSY
1498 This error indicates that the file is being used by the system in such a
1499 way that it can't be unlinked.  For example, you might see this error if
1500 the file name specifies the root directory or a mount point for a file
1501 system.
1503 @item ENOENT
1504 The file name to be deleted doesn't exist.
1506 @item EPERM
1507 On some systems @code{unlink} cannot be used to delete the name of a
1508 directory, or at least can only be used this way by a privileged user.
1509 To avoid such problems, use @code{rmdir} to delete directories.  (On
1510 @gnulinuxhurdsystems{} @code{unlink} can never delete the name of a directory.)
1512 @item EROFS
1513 The directory containing the file name to be deleted is on a read-only
1514 file system and can't be modified.
1515 @end table
1516 @end deftypefun
1518 @comment unistd.h
1519 @comment POSIX.1
1520 @deftypefun int rmdir (const char *@var{filename})
1521 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
1522 @cindex directories, deleting
1523 @cindex deleting a directory
1524 The @code{rmdir} function deletes a directory.  The directory must be
1525 empty before it can be removed; in other words, it can only contain
1526 entries for @file{.} and @file{..}.
1528 In most other respects, @code{rmdir} behaves like @code{unlink}.  There
1529 are two additional @code{errno} error conditions defined for
1530 @code{rmdir}:
1532 @table @code
1533 @item ENOTEMPTY
1534 @itemx EEXIST
1535 The directory to be deleted is not empty.
1536 @end table
1538 These two error codes are synonymous; some systems use one, and some use
1539 the other.  @gnulinuxhurdsystems{} always use @code{ENOTEMPTY}.
1541 The prototype for this function is declared in the header file
1542 @file{unistd.h}.
1543 @pindex unistd.h
1544 @end deftypefun
1546 @comment stdio.h
1547 @comment ISO
1548 @deftypefun int remove (const char *@var{filename})
1549 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
1550 @c Calls unlink and rmdir.
1551 This is the @w{ISO C} function to remove a file.  It works like
1552 @code{unlink} for files and like @code{rmdir} for directories.
1553 @code{remove} is declared in @file{stdio.h}.
1554 @pindex stdio.h
1555 @end deftypefun
1557 @node Renaming Files
1558 @section Renaming Files
1560 The @code{rename} function is used to change a file's name.
1562 @cindex renaming a file
1563 @comment stdio.h
1564 @comment ISO
1565 @deftypefun int rename (const char *@var{oldname}, const char *@var{newname})
1566 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
1567 @c In the absence of a rename syscall, there's an emulation with link
1568 @c and unlink, but it's racy, even more so if newname exists and is
1569 @c unlinked first.
1570 The @code{rename} function renames the file @var{oldname} to
1571 @var{newname}.  The file formerly accessible under the name
1572 @var{oldname} is afterwards accessible as @var{newname} instead.  (If
1573 the file had any other names aside from @var{oldname}, it continues to
1574 have those names.)
1576 The directory containing the name @var{newname} must be on the same file
1577 system as the directory containing the name @var{oldname}.
1579 One special case for @code{rename} is when @var{oldname} and
1580 @var{newname} are two names for the same file.  The consistent way to
1581 handle this case is to delete @var{oldname}.  However, in this case
1582 POSIX requires that @code{rename} do nothing and report success---which
1583 is inconsistent.  We don't know what your operating system will do.
1585 If @var{oldname} is not a directory, then any existing file named
1586 @var{newname} is removed during the renaming operation.  However, if
1587 @var{newname} is the name of a directory, @code{rename} fails in this
1588 case.
1590 If @var{oldname} is a directory, then either @var{newname} must not
1591 exist or it must name a directory that is empty.  In the latter case,
1592 the existing directory named @var{newname} is deleted first.  The name
1593 @var{newname} must not specify a subdirectory of the directory
1594 @code{oldname} which is being renamed.
1596 One useful feature of @code{rename} is that the meaning of @var{newname}
1597 changes ``atomically'' from any previously existing file by that name to
1598 its new meaning (i.e., the file that was called @var{oldname}).  There is
1599 no instant at which @var{newname} is non-existent ``in between'' the old
1600 meaning and the new meaning.  If there is a system crash during the
1601 operation, it is possible for both names to still exist; but
1602 @var{newname} will always be intact if it exists at all.
1604 If @code{rename} fails, it returns @code{-1}.  In addition to the usual
1605 file name errors (@pxref{File Name Errors}), the following
1606 @code{errno} error conditions are defined for this function:
1608 @table @code
1609 @item EACCES
1610 One of the directories containing @var{newname} or @var{oldname}
1611 refuses write permission; or @var{newname} and @var{oldname} are
1612 directories and write permission is refused for one of them.
1614 @item EBUSY
1615 A directory named by @var{oldname} or @var{newname} is being used by
1616 the system in a way that prevents the renaming from working.  This includes
1617 directories that are mount points for filesystems, and directories
1618 that are the current working directories of processes.
1620 @item ENOTEMPTY
1621 @itemx EEXIST
1622 The directory @var{newname} isn't empty.  @gnulinuxhurdsystems{} always return
1623 @code{ENOTEMPTY} for this, but some other systems return @code{EEXIST}.
1625 @item EINVAL
1626 @var{oldname} is a directory that contains @var{newname}.
1628 @item EISDIR
1629 @var{newname} is a directory but the @var{oldname} isn't.
1631 @item EMLINK
1632 The parent directory of @var{newname} would have too many links
1633 (entries).
1635 @item ENOENT
1636 The file @var{oldname} doesn't exist.
1638 @item ENOSPC
1639 The directory that would contain @var{newname} has no room for another
1640 entry, and there is no space left in the file system to expand it.
1642 @item EROFS
1643 The operation would involve writing to a directory on a read-only file
1644 system.
1646 @item EXDEV
1647 The two file names @var{newname} and @var{oldname} are on different
1648 file systems.
1649 @end table
1650 @end deftypefun
1652 @node Creating Directories
1653 @section Creating Directories
1654 @cindex creating a directory
1655 @cindex directories, creating
1657 @pindex mkdir
1658 Directories are created with the @code{mkdir} function.  (There is also
1659 a shell command @code{mkdir} which does the same thing.)
1660 @c !!! umask
1662 @comment sys/stat.h
1663 @comment POSIX.1
1664 @deftypefun int mkdir (const char *@var{filename}, mode_t @var{mode})
1665 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
1666 The @code{mkdir} function creates a new, empty directory with name
1667 @var{filename}.
1669 The argument @var{mode} specifies the file permissions for the new
1670 directory file.  @xref{Permission Bits}, for more information about
1671 this.
1673 A return value of @code{0} indicates successful completion, and
1674 @code{-1} indicates failure.  In addition to the usual file name syntax
1675 errors (@pxref{File Name Errors}), the following @code{errno} error
1676 conditions are defined for this function:
1678 @table @code
1679 @item EACCES
1680 Write permission is denied for the parent directory in which the new
1681 directory is to be added.
1683 @item EEXIST
1684 A file named @var{filename} already exists.
1686 @item EMLINK
1687 The parent directory has too many links (entries).
1689 Well-designed file systems never report this error, because they permit
1690 more links than your disk could possibly hold.  However, you must still
1691 take account of the possibility of this error, as it could result from
1692 network access to a file system on another machine.
1694 @item ENOSPC
1695 The file system doesn't have enough room to create the new directory.
1697 @item EROFS
1698 The parent directory of the directory being created is on a read-only
1699 file system and cannot be modified.
1700 @end table
1702 To use this function, your program should include the header file
1703 @file{sys/stat.h}.
1704 @pindex sys/stat.h
1705 @end deftypefun
1707 @node File Attributes
1708 @section File Attributes
1710 @pindex ls
1711 When you issue an @samp{ls -l} shell command on a file, it gives you
1712 information about the size of the file, who owns it, when it was last
1713 modified, etc.  These are called the @dfn{file attributes}, and are
1714 associated with the file itself and not a particular one of its names.
1716 This section contains information about how you can inquire about and
1717 modify the attributes of a file.
1719 @menu
1720 * Attribute Meanings::          The names of the file attributes,
1721                                  and what their values mean.
1722 * Reading Attributes::          How to read the attributes of a file.
1723 * Testing File Type::           Distinguishing ordinary files,
1724                                  directories, links@dots{}
1725 * File Owner::                  How ownership for new files is determined,
1726                                  and how to change it.
1727 * Permission Bits::             How information about a file's access
1728                                  mode is stored.
1729 * Access Permission::           How the system decides who can access a file.
1730 * Setting Permissions::         How permissions for new files are assigned,
1731                                  and how to change them.
1732 * Testing File Access::         How to find out if your process can
1733                                  access a file.
1734 * File Times::                  About the time attributes of a file.
1735 * File Size::                   Manually changing the size of a file.
1736 * Storage Allocation::          Allocate backing storage for files.
1737 @end menu
1739 @node Attribute Meanings
1740 @subsection The meaning of the File Attributes
1741 @cindex status of a file
1742 @cindex attributes of a file
1743 @cindex file attributes
1745 When you read the attributes of a file, they come back in a structure
1746 called @code{struct stat}.  This section describes the names of the
1747 attributes, their data types, and what they mean.  For the functions
1748 to read the attributes of a file, see @ref{Reading Attributes}.
1750 The header file @file{sys/stat.h} declares all the symbols defined
1751 in this section.
1752 @pindex sys/stat.h
1754 @comment sys/stat.h
1755 @comment POSIX.1
1756 @deftp {Data Type} {struct stat}
1757 The @code{stat} structure type is used to return information about the
1758 attributes of a file.  It contains at least the following members:
1760 @table @code
1761 @item mode_t st_mode
1762 Specifies the mode of the file.  This includes file type information
1763 (@pxref{Testing File Type}) and the file permission bits
1764 (@pxref{Permission Bits}).
1766 @item ino_t st_ino
1767 The file serial number, which distinguishes this file from all other
1768 files on the same device.
1770 @item dev_t st_dev
1771 Identifies the device containing the file.  The @code{st_ino} and
1772 @code{st_dev}, taken together, uniquely identify the file.  The
1773 @code{st_dev} value is not necessarily consistent across reboots or
1774 system crashes, however.
1776 @item nlink_t st_nlink
1777 The number of hard links to the file.  This count keeps track of how
1778 many directories have entries for this file.  If the count is ever
1779 decremented to zero, then the file itself is discarded as soon as no
1780 process still holds it open.  Symbolic links are not counted in the
1781 total.
1783 @item uid_t st_uid
1784 The user ID of the file's owner.  @xref{File Owner}.
1786 @item gid_t st_gid
1787 The group ID of the file.  @xref{File Owner}.
1789 @item off_t st_size
1790 This specifies the size of a regular file in bytes.  For files that are
1791 really devices this field isn't usually meaningful.  For symbolic links
1792 this specifies the length of the file name the link refers to.
1794 @item time_t st_atime
1795 This is the last access time for the file.  @xref{File Times}.
1797 @item unsigned long int st_atime_usec
1798 This is the fractional part of the last access time for the file.
1799 @xref{File Times}.
1801 @item time_t st_mtime
1802 This is the time of the last modification to the contents of the file.
1803 @xref{File Times}.
1805 @item unsigned long int st_mtime_usec
1806 This is the fractional part of the time of the last modification to the
1807 contents of the file.  @xref{File Times}.
1809 @item time_t st_ctime
1810 This is the time of the last modification to the attributes of the file.
1811 @xref{File Times}.
1813 @item unsigned long int st_ctime_usec
1814 This is the fractional part of the time of the last modification to the
1815 attributes of the file.  @xref{File Times}.
1817 @c !!! st_rdev
1818 @item blkcnt_t st_blocks
1819 This is the amount of disk space that the file occupies, measured in
1820 units of 512-byte blocks.
1822 The number of disk blocks is not strictly proportional to the size of
1823 the file, for two reasons: the file system may use some blocks for
1824 internal record keeping; and the file may be sparse---it may have
1825 ``holes'' which contain zeros but do not actually take up space on the
1826 disk.
1828 You can tell (approximately) whether a file is sparse by comparing this
1829 value with @code{st_size}, like this:
1831 @smallexample
1832 (st.st_blocks * 512 < st.st_size)
1833 @end smallexample
1835 This test is not perfect because a file that is just slightly sparse
1836 might not be detected as sparse at all.  For practical applications,
1837 this is not a problem.
1839 @item unsigned int st_blksize
1840 The optimal block size for reading or writing this file, in bytes.  You
1841 might use this size for allocating the buffer space for reading or
1842 writing the file.  (This is unrelated to @code{st_blocks}.)
1843 @end table
1844 @end deftp
1846 The extensions for the Large File Support (LFS) require, even on 32-bit
1847 machines, types which can handle file sizes up to @twoexp{63}.
1848 Therefore a new definition of @code{struct stat} is necessary.
1850 @comment sys/stat.h
1851 @comment LFS
1852 @deftp {Data Type} {struct stat64}
1853 The members of this type are the same and have the same names as those
1854 in @code{struct stat}.  The only difference is that the members
1855 @code{st_ino}, @code{st_size}, and @code{st_blocks} have a different
1856 type to support larger values.
1858 @table @code
1859 @item mode_t st_mode
1860 Specifies the mode of the file.  This includes file type information
1861 (@pxref{Testing File Type}) and the file permission bits
1862 (@pxref{Permission Bits}).
1864 @item ino64_t st_ino
1865 The file serial number, which distinguishes this file from all other
1866 files on the same device.
1868 @item dev_t st_dev
1869 Identifies the device containing the file.  The @code{st_ino} and
1870 @code{st_dev}, taken together, uniquely identify the file.  The
1871 @code{st_dev} value is not necessarily consistent across reboots or
1872 system crashes, however.
1874 @item nlink_t st_nlink
1875 The number of hard links to the file.  This count keeps track of how
1876 many directories have entries for this file.  If the count is ever
1877 decremented to zero, then the file itself is discarded as soon as no
1878 process still holds it open.  Symbolic links are not counted in the
1879 total.
1881 @item uid_t st_uid
1882 The user ID of the file's owner.  @xref{File Owner}.
1884 @item gid_t st_gid
1885 The group ID of the file.  @xref{File Owner}.
1887 @item off64_t st_size
1888 This specifies the size of a regular file in bytes.  For files that are
1889 really devices this field isn't usually meaningful.  For symbolic links
1890 this specifies the length of the file name the link refers to.
1892 @item time_t st_atime
1893 This is the last access time for the file.  @xref{File Times}.
1895 @item unsigned long int st_atime_usec
1896 This is the fractional part of the last access time for the file.
1897 @xref{File Times}.
1899 @item time_t st_mtime
1900 This is the time of the last modification to the contents of the file.
1901 @xref{File Times}.
1903 @item unsigned long int st_mtime_usec
1904 This is the fractional part of the time of the last modification to the
1905 contents of the file.  @xref{File Times}.
1907 @item time_t st_ctime
1908 This is the time of the last modification to the attributes of the file.
1909 @xref{File Times}.
1911 @item unsigned long int st_ctime_usec
1912 This is the fractional part of the time of the last modification to the
1913 attributes of the file.  @xref{File Times}.
1915 @c !!! st_rdev
1916 @item blkcnt64_t st_blocks
1917 This is the amount of disk space that the file occupies, measured in
1918 units of 512-byte blocks.
1920 @item unsigned int st_blksize
1921 The optimal block size for reading of writing this file, in bytes.  You
1922 might use this size for allocating the buffer space for reading of
1923 writing the file.  (This is unrelated to @code{st_blocks}.)
1924 @end table
1925 @end deftp
1927 Some of the file attributes have special data type names which exist
1928 specifically for those attributes.  (They are all aliases for well-known
1929 integer types that you know and love.)  These typedef names are defined
1930 in the header file @file{sys/types.h} as well as in @file{sys/stat.h}.
1931 Here is a list of them.
1933 @comment sys/types.h
1934 @comment POSIX.1
1935 @deftp {Data Type} mode_t
1936 This is an integer data type used to represent file modes.  In
1937 @theglibc{}, this is an unsigned type no narrower than @code{unsigned
1938 int}.
1939 @end deftp
1941 @cindex inode number
1942 @comment sys/types.h
1943 @comment POSIX.1
1944 @deftp {Data Type} ino_t
1945 This is an unsigned integer type used to represent file serial numbers.
1946 (In Unix jargon, these are sometimes called @dfn{inode numbers}.)
1947 In @theglibc{}, this type is no narrower than @code{unsigned int}.
1949 If the source is compiled with @code{_FILE_OFFSET_BITS == 64} this type
1950 is transparently replaced by @code{ino64_t}.
1951 @end deftp
1953 @comment sys/types.h
1954 @comment Unix98
1955 @deftp {Data Type} ino64_t
1956 This is an unsigned integer type used to represent file serial numbers
1957 for the use in LFS.  In @theglibc{}, this type is no narrower than
1958 @code{unsigned int}.
1960 When compiling with @code{_FILE_OFFSET_BITS == 64} this type is
1961 available under the name @code{ino_t}.
1962 @end deftp
1964 @comment sys/types.h
1965 @comment POSIX.1
1966 @deftp {Data Type} dev_t
1967 This is an arithmetic data type used to represent file device numbers.
1968 In @theglibc{}, this is an integer type no narrower than @code{int}.
1969 @end deftp
1971 @comment sys/types.h
1972 @comment POSIX.1
1973 @deftp {Data Type} nlink_t
1974 This is an integer type used to represent file link counts.
1975 @end deftp
1977 @comment sys/types.h
1978 @comment Unix98
1979 @deftp {Data Type} blkcnt_t
1980 This is a signed integer type used to represent block counts.
1981 In @theglibc{}, this type is no narrower than @code{int}.
1983 If the source is compiled with @code{_FILE_OFFSET_BITS == 64} this type
1984 is transparently replaced by @code{blkcnt64_t}.
1985 @end deftp
1987 @comment sys/types.h
1988 @comment Unix98
1989 @deftp {Data Type} blkcnt64_t
1990 This is a signed integer type used to represent block counts for the
1991 use in LFS.  In @theglibc{}, this type is no narrower than @code{int}.
1993 When compiling with @code{_FILE_OFFSET_BITS == 64} this type is
1994 available under the name @code{blkcnt_t}.
1995 @end deftp
1997 @node Reading Attributes
1998 @subsection Reading the Attributes of a File
2000 To examine the attributes of files, use the functions @code{stat},
2001 @code{fstat} and @code{lstat}.  They return the attribute information in
2002 a @code{struct stat} object.  All three functions are declared in the
2003 header file @file{sys/stat.h}.
2005 @comment sys/stat.h
2006 @comment POSIX.1
2007 @deftypefun int stat (const char *@var{filename}, struct stat *@var{buf})
2008 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2009 The @code{stat} function returns information about the attributes of the
2010 file named by @w{@var{filename}} in the structure pointed to by @var{buf}.
2012 If @var{filename} is the name of a symbolic link, the attributes you get
2013 describe the file that the link points to.  If the link points to a
2014 nonexistent file name, then @code{stat} fails reporting a nonexistent
2015 file.
2017 The return value is @code{0} if the operation is successful, or
2018 @code{-1} on failure.  In addition to the usual file name errors
2019 (@pxref{File Name Errors}, the following @code{errno} error conditions
2020 are defined for this function:
2022 @table @code
2023 @item ENOENT
2024 The file named by @var{filename} doesn't exist.
2025 @end table
2027 When the sources are compiled with @code{_FILE_OFFSET_BITS == 64} this
2028 function is in fact @code{stat64} since the LFS interface transparently
2029 replaces the normal implementation.
2030 @end deftypefun
2032 @comment sys/stat.h
2033 @comment Unix98
2034 @deftypefun int stat64 (const char *@var{filename}, struct stat64 *@var{buf})
2035 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2036 This function is similar to @code{stat} but it is also able to work on
2037 files larger than @twoexp{31} bytes on 32-bit systems.  To be able to do
2038 this the result is stored in a variable of type @code{struct stat64} to
2039 which @var{buf} must point.
2041 When the sources are compiled with @code{_FILE_OFFSET_BITS == 64} this
2042 function is available under the name @code{stat} and so transparently
2043 replaces the interface for small files on 32-bit machines.
2044 @end deftypefun
2046 @comment sys/stat.h
2047 @comment POSIX.1
2048 @deftypefun int fstat (int @var{filedes}, struct stat *@var{buf})
2049 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2050 The @code{fstat} function is like @code{stat}, except that it takes an
2051 open file descriptor as an argument instead of a file name.
2052 @xref{Low-Level I/O}.
2054 Like @code{stat}, @code{fstat} returns @code{0} on success and @code{-1}
2055 on failure.  The following @code{errno} error conditions are defined for
2056 @code{fstat}:
2058 @table @code
2059 @item EBADF
2060 The @var{filedes} argument is not a valid file descriptor.
2061 @end table
2063 When the sources are compiled with @code{_FILE_OFFSET_BITS == 64} this
2064 function is in fact @code{fstat64} since the LFS interface transparently
2065 replaces the normal implementation.
2066 @end deftypefun
2068 @comment sys/stat.h
2069 @comment Unix98
2070 @deftypefun int fstat64 (int @var{filedes}, struct stat64 *@var{buf})
2071 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2072 This function is similar to @code{fstat} but is able to work on large
2073 files on 32-bit platforms.  For large files the file descriptor
2074 @var{filedes} should be obtained by @code{open64} or @code{creat64}.
2075 The @var{buf} pointer points to a variable of type @code{struct stat64}
2076 which is able to represent the larger values.
2078 When the sources are compiled with @code{_FILE_OFFSET_BITS == 64} this
2079 function is available under the name @code{fstat} and so transparently
2080 replaces the interface for small files on 32-bit machines.
2081 @end deftypefun
2083 @c fstatat will call alloca and snprintf if the syscall is not
2084 @c available.
2085 @c @safety{@mtsafe{}@asunsafe{@ascuheap{}}@acunsafe{@acsmem{}}}
2087 @comment sys/stat.h
2088 @comment BSD
2089 @deftypefun int lstat (const char *@var{filename}, struct stat *@var{buf})
2090 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2091 @c Direct system call through lxstat, sometimes with an xstat conv call
2092 @c afterwards.
2093 The @code{lstat} function is like @code{stat}, except that it does not
2094 follow symbolic links.  If @var{filename} is the name of a symbolic
2095 link, @code{lstat} returns information about the link itself; otherwise
2096 @code{lstat} works like @code{stat}.  @xref{Symbolic Links}.
2098 When the sources are compiled with @code{_FILE_OFFSET_BITS == 64} this
2099 function is in fact @code{lstat64} since the LFS interface transparently
2100 replaces the normal implementation.
2101 @end deftypefun
2103 @comment sys/stat.h
2104 @comment Unix98
2105 @deftypefun int lstat64 (const char *@var{filename}, struct stat64 *@var{buf})
2106 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2107 @c Direct system call through lxstat64, sometimes with an xstat conv
2108 @c call afterwards.
2109 This function is similar to @code{lstat} but it is also able to work on
2110 files larger than @twoexp{31} bytes on 32-bit systems.  To be able to do
2111 this the result is stored in a variable of type @code{struct stat64} to
2112 which @var{buf} must point.
2114 When the sources are compiled with @code{_FILE_OFFSET_BITS == 64} this
2115 function is available under the name @code{lstat} and so transparently
2116 replaces the interface for small files on 32-bit machines.
2117 @end deftypefun
2119 @node Testing File Type
2120 @subsection Testing the Type of a File
2122 The @dfn{file mode}, stored in the @code{st_mode} field of the file
2123 attributes, contains two kinds of information: the file type code, and
2124 the access permission bits.  This section discusses only the type code,
2125 which you can use to tell whether the file is a directory, socket,
2126 symbolic link, and so on.  For details about access permissions see
2127 @ref{Permission Bits}.
2129 There are two ways you can access the file type information in a file
2130 mode.  Firstly, for each file type there is a @dfn{predicate macro}
2131 which examines a given file mode and returns whether it is of that type
2132 or not.  Secondly, you can mask out the rest of the file mode to leave
2133 just the file type code, and compare this against constants for each of
2134 the supported file types.
2136 All of the symbols listed in this section are defined in the header file
2137 @file{sys/stat.h}.
2138 @pindex sys/stat.h
2140 The following predicate macros test the type of a file, given the value
2141 @var{m} which is the @code{st_mode} field returned by @code{stat} on
2142 that file:
2144 @comment sys/stat.h
2145 @comment POSIX
2146 @deftypefn Macro int S_ISDIR (mode_t @var{m})
2147 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2148 This macro returns non-zero if the file is a directory.
2149 @end deftypefn
2151 @comment sys/stat.h
2152 @comment POSIX
2153 @deftypefn Macro int S_ISCHR (mode_t @var{m})
2154 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2155 This macro returns non-zero if the file is a character special file (a
2156 device like a terminal).
2157 @end deftypefn
2159 @comment sys/stat.h
2160 @comment POSIX
2161 @deftypefn Macro int S_ISBLK (mode_t @var{m})
2162 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2163 This macro returns non-zero if the file is a block special file (a device
2164 like a disk).
2165 @end deftypefn
2167 @comment sys/stat.h
2168 @comment POSIX
2169 @deftypefn Macro int S_ISREG (mode_t @var{m})
2170 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2171 This macro returns non-zero if the file is a regular file.
2172 @end deftypefn
2174 @comment sys/stat.h
2175 @comment POSIX
2176 @deftypefn Macro int S_ISFIFO (mode_t @var{m})
2177 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2178 This macro returns non-zero if the file is a FIFO special file, or a
2179 pipe.  @xref{Pipes and FIFOs}.
2180 @end deftypefn
2182 @comment sys/stat.h
2183 @comment GNU
2184 @deftypefn Macro int S_ISLNK (mode_t @var{m})
2185 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2186 This macro returns non-zero if the file is a symbolic link.
2187 @xref{Symbolic Links}.
2188 @end deftypefn
2190 @comment sys/stat.h
2191 @comment GNU
2192 @deftypefn Macro int S_ISSOCK (mode_t @var{m})
2193 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2194 This macro returns non-zero if the file is a socket.  @xref{Sockets}.
2195 @end deftypefn
2197 An alternate non-POSIX method of testing the file type is supported for
2198 compatibility with BSD.  The mode can be bitwise AND-ed with
2199 @code{S_IFMT} to extract the file type code, and compared to the
2200 appropriate constant.  For example,
2202 @smallexample
2203 S_ISCHR (@var{mode})
2204 @end smallexample
2206 @noindent
2207 is equivalent to:
2209 @smallexample
2210 ((@var{mode} & S_IFMT) == S_IFCHR)
2211 @end smallexample
2213 @comment sys/stat.h
2214 @comment BSD
2215 @deftypevr Macro int S_IFMT
2216 This is a bit mask used to extract the file type code from a mode value.
2217 @end deftypevr
2219 These are the symbolic names for the different file type codes:
2221 @vtable @code
2222 @comment sys/stat.h
2223 @comment BSD
2224 @item S_IFDIR
2225 This is the file type constant of a directory file.
2227 @comment sys/stat.h
2228 @comment BSD
2229 @item S_IFCHR
2230 This is the file type constant of a character-oriented device file.
2232 @comment sys/stat.h
2233 @comment BSD
2234 @item S_IFBLK
2235 This is the file type constant of a block-oriented device file.
2237 @comment sys/stat.h
2238 @comment BSD
2239 @item S_IFREG
2240 This is the file type constant of a regular file.
2242 @comment sys/stat.h
2243 @comment BSD
2244 @item S_IFLNK
2245 This is the file type constant of a symbolic link.
2247 @comment sys/stat.h
2248 @comment BSD
2249 @item S_IFSOCK
2250 This is the file type constant of a socket.
2252 @comment sys/stat.h
2253 @comment BSD
2254 @item S_IFIFO
2255 This is the file type constant of a FIFO or pipe.
2256 @end vtable
2258 The POSIX.1b standard introduced a few more objects which possibly can
2259 be implemented as objects in the filesystem.  These are message queues,
2260 semaphores, and shared memory objects.  To allow differentiating these
2261 objects from other files the POSIX standard introduced three new test
2262 macros.  But unlike the other macros they do not take the value of the
2263 @code{st_mode} field as the parameter.  Instead they expect a pointer to
2264 the whole @code{struct stat} structure.
2266 @comment sys/stat.h
2267 @comment POSIX
2268 @deftypefn Macro int S_TYPEISMQ (struct stat *@var{s})
2269 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2270 If the system implements POSIX message queues as distinct objects and the
2271 file is a message queue object, this macro returns a non-zero value.
2272 In all other cases the result is zero.
2273 @end deftypefn
2275 @comment sys/stat.h
2276 @comment POSIX
2277 @deftypefn Macro int S_TYPEISSEM (struct stat *@var{s})
2278 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2279 If the system implements POSIX semaphores as distinct objects and the
2280 file is a semaphore object, this macro returns a non-zero value.
2281 In all other cases the result is zero.
2282 @end deftypefn
2284 @comment sys/stat.h
2285 @comment POSIX
2286 @deftypefn Macro int S_TYPEISSHM (struct stat *@var{s})
2287 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2288 If the system implements POSIX shared memory objects as distinct objects
2289 and the file is a shared memory object, this macro returns a non-zero
2290 value.  In all other cases the result is zero.
2291 @end deftypefn
2293 @node File Owner
2294 @subsection File Owner
2295 @cindex file owner
2296 @cindex owner of a file
2297 @cindex group owner of a file
2299 Every file has an @dfn{owner} which is one of the registered user names
2300 defined on the system.  Each file also has a @dfn{group} which is one of
2301 the defined groups.  The file owner can often be useful for showing you
2302 who edited the file (especially when you edit with GNU Emacs), but its
2303 main purpose is for access control.
2305 The file owner and group play a role in determining access because the
2306 file has one set of access permission bits for the owner, another set
2307 that applies to users who belong to the file's group, and a third set of
2308 bits that applies to everyone else.  @xref{Access Permission}, for the
2309 details of how access is decided based on this data.
2311 When a file is created, its owner is set to the effective user ID of the
2312 process that creates it (@pxref{Process Persona}).  The file's group ID
2313 may be set to either the effective group ID of the process, or the group
2314 ID of the directory that contains the file, depending on the system
2315 where the file is stored.  When you access a remote file system, it
2316 behaves according to its own rules, not according to the system your
2317 program is running on.  Thus, your program must be prepared to encounter
2318 either kind of behavior no matter what kind of system you run it on.
2320 @pindex chown
2321 @pindex chgrp
2322 You can change the owner and/or group owner of an existing file using
2323 the @code{chown} function.  This is the primitive for the @code{chown}
2324 and @code{chgrp} shell commands.
2326 @pindex unistd.h
2327 The prototype for this function is declared in @file{unistd.h}.
2329 @comment unistd.h
2330 @comment POSIX.1
2331 @deftypefun int chown (const char *@var{filename}, uid_t @var{owner}, gid_t @var{group})
2332 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2333 The @code{chown} function changes the owner of the file @var{filename} to
2334 @var{owner}, and its group owner to @var{group}.
2336 Changing the owner of the file on certain systems clears the set-user-ID
2337 and set-group-ID permission bits.  (This is because those bits may not
2338 be appropriate for the new owner.)  Other file permission bits are not
2339 changed.
2341 The return value is @code{0} on success and @code{-1} on failure.
2342 In addition to the usual file name errors (@pxref{File Name Errors}),
2343 the following @code{errno} error conditions are defined for this function:
2345 @table @code
2346 @item EPERM
2347 This process lacks permission to make the requested change.
2349 Only privileged users or the file's owner can change the file's group.
2350 On most file systems, only privileged users can change the file owner;
2351 some file systems allow you to change the owner if you are currently the
2352 owner.  When you access a remote file system, the behavior you encounter
2353 is determined by the system that actually holds the file, not by the
2354 system your program is running on.
2356 @xref{Options for Files}, for information about the
2357 @code{_POSIX_CHOWN_RESTRICTED} macro.
2359 @item EROFS
2360 The file is on a read-only file system.
2361 @end table
2362 @end deftypefun
2364 @comment unistd.h
2365 @comment BSD
2366 @deftypefun int fchown (int @var{filedes}, uid_t @var{owner}, gid_t @var{group})
2367 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2368 This is like @code{chown}, except that it changes the owner of the open
2369 file with descriptor @var{filedes}.
2371 The return value from @code{fchown} is @code{0} on success and @code{-1}
2372 on failure.  The following @code{errno} error codes are defined for this
2373 function:
2375 @table @code
2376 @item EBADF
2377 The @var{filedes} argument is not a valid file descriptor.
2379 @item EINVAL
2380 The @var{filedes} argument corresponds to a pipe or socket, not an ordinary
2381 file.
2383 @item EPERM
2384 This process lacks permission to make the requested change.  For details
2385 see @code{chmod} above.
2387 @item EROFS
2388 The file resides on a read-only file system.
2389 @end table
2390 @end deftypefun
2392 @node Permission Bits
2393 @subsection The Mode Bits for Access Permission
2395 The @dfn{file mode}, stored in the @code{st_mode} field of the file
2396 attributes, contains two kinds of information: the file type code, and
2397 the access permission bits.  This section discusses only the access
2398 permission bits, which control who can read or write the file.
2399 @xref{Testing File Type}, for information about the file type code.
2401 All of the symbols listed in this section are defined in the header file
2402 @file{sys/stat.h}.
2403 @pindex sys/stat.h
2405 @cindex file permission bits
2406 These symbolic constants are defined for the file mode bits that control
2407 access permission for the file:
2409 @vtable @code
2410 @comment sys/stat.h
2411 @comment POSIX.1
2412 @item S_IRUSR
2413 @comment sys/stat.h
2414 @comment BSD
2415 @itemx S_IREAD
2416 Read permission bit for the owner of the file.  On many systems this bit
2417 is 0400.  @code{S_IREAD} is an obsolete synonym provided for BSD
2418 compatibility.
2420 @comment sys/stat.h
2421 @comment POSIX.1
2422 @item S_IWUSR
2423 @comment sys/stat.h
2424 @comment BSD
2425 @itemx S_IWRITE
2426 Write permission bit for the owner of the file.  Usually 0200.
2427 @w{@code{S_IWRITE}} is an obsolete synonym provided for BSD compatibility.
2429 @comment sys/stat.h
2430 @comment POSIX.1
2431 @item S_IXUSR
2432 @comment sys/stat.h
2433 @comment BSD
2434 @itemx S_IEXEC
2435 Execute (for ordinary files) or search (for directories) permission bit
2436 for the owner of the file.  Usually 0100.  @code{S_IEXEC} is an obsolete
2437 synonym provided for BSD compatibility.
2439 @comment sys/stat.h
2440 @comment POSIX.1
2441 @item S_IRWXU
2442 This is equivalent to @samp{(S_IRUSR | S_IWUSR | S_IXUSR)}.
2444 @comment sys/stat.h
2445 @comment POSIX.1
2446 @item S_IRGRP
2447 Read permission bit for the group owner of the file.  Usually 040.
2449 @comment sys/stat.h
2450 @comment POSIX.1
2451 @item S_IWGRP
2452 Write permission bit for the group owner of the file.  Usually 020.
2454 @comment sys/stat.h
2455 @comment POSIX.1
2456 @item S_IXGRP
2457 Execute or search permission bit for the group owner of the file.
2458 Usually 010.
2460 @comment sys/stat.h
2461 @comment POSIX.1
2462 @item S_IRWXG
2463 This is equivalent to @samp{(S_IRGRP | S_IWGRP | S_IXGRP)}.
2465 @comment sys/stat.h
2466 @comment POSIX.1
2467 @item S_IROTH
2468 Read permission bit for other users.  Usually 04.
2470 @comment sys/stat.h
2471 @comment POSIX.1
2472 @item S_IWOTH
2473 Write permission bit for other users.  Usually 02.
2475 @comment sys/stat.h
2476 @comment POSIX.1
2477 @item S_IXOTH
2478 Execute or search permission bit for other users.  Usually 01.
2480 @comment sys/stat.h
2481 @comment POSIX.1
2482 @item S_IRWXO
2483 This is equivalent to @samp{(S_IROTH | S_IWOTH | S_IXOTH)}.
2485 @comment sys/stat.h
2486 @comment POSIX
2487 @item S_ISUID
2488 This is the set-user-ID on execute bit, usually 04000.
2489 @xref{How Change Persona}.
2491 @comment sys/stat.h
2492 @comment POSIX
2493 @item S_ISGID
2494 This is the set-group-ID on execute bit, usually 02000.
2495 @xref{How Change Persona}.
2497 @cindex sticky bit
2498 @comment sys/stat.h
2499 @comment BSD
2500 @item S_ISVTX
2501 This is the @dfn{sticky} bit, usually 01000.
2503 For a directory it gives permission to delete a file in that directory
2504 only if you own that file.  Ordinarily, a user can either delete all the
2505 files in a directory or cannot delete any of them (based on whether the
2506 user has write permission for the directory).  The same restriction
2507 applies---you must have both write permission for the directory and own
2508 the file you want to delete.  The one exception is that the owner of the
2509 directory can delete any file in the directory, no matter who owns it
2510 (provided the owner has given himself write permission for the
2511 directory).  This is commonly used for the @file{/tmp} directory, where
2512 anyone may create files but not delete files created by other users.
2514 Originally the sticky bit on an executable file modified the swapping
2515 policies of the system.  Normally, when a program terminated, its pages
2516 in core were immediately freed and reused.  If the sticky bit was set on
2517 the executable file, the system kept the pages in core for a while as if
2518 the program were still running.  This was advantageous for a program
2519 likely to be run many times in succession.  This usage is obsolete in
2520 modern systems.  When a program terminates, its pages always remain in
2521 core as long as there is no shortage of memory in the system.  When the
2522 program is next run, its pages will still be in core if no shortage
2523 arose since the last run.
2525 On some modern systems where the sticky bit has no useful meaning for an
2526 executable file, you cannot set the bit at all for a non-directory.
2527 If you try, @code{chmod} fails with @code{EFTYPE};
2528 @pxref{Setting Permissions}.
2530 Some systems (particularly SunOS) have yet another use for the sticky
2531 bit.  If the sticky bit is set on a file that is @emph{not} executable,
2532 it means the opposite: never cache the pages of this file at all.  The
2533 main use of this is for the files on an NFS server machine which are
2534 used as the swap area of diskless client machines.  The idea is that the
2535 pages of the file will be cached in the client's memory, so it is a
2536 waste of the server's memory to cache them a second time.  With this
2537 usage the sticky bit also implies that the filesystem may fail to record
2538 the file's modification time onto disk reliably (the idea being that
2539 no-one cares for a swap file).
2541 This bit is only available on BSD systems (and those derived from
2542 them).  Therefore one has to use the @code{_GNU_SOURCE} feature select
2543 macro, or not define any feature test macros, to get the definition
2544 (@pxref{Feature Test Macros}).
2545 @end vtable
2547 The actual bit values of the symbols are listed in the table above
2548 so you can decode file mode values when debugging your programs.
2549 These bit values are correct for most systems, but they are not
2550 guaranteed.
2552 @strong{Warning:} Writing explicit numbers for file permissions is bad
2553 practice.  Not only is it not portable, it also requires everyone who
2554 reads your program to remember what the bits mean.  To make your program
2555 clean use the symbolic names.
2557 @node Access Permission
2558 @subsection How Your Access to a File is Decided
2559 @cindex permission to access a file
2560 @cindex access permission for a file
2561 @cindex file access permission
2563 Recall that the operating system normally decides access permission for
2564 a file based on the effective user and group IDs of the process and its
2565 supplementary group IDs, together with the file's owner, group and
2566 permission bits.  These concepts are discussed in detail in @ref{Process
2567 Persona}.
2569 If the effective user ID of the process matches the owner user ID of the
2570 file, then permissions for read, write, and execute/search are
2571 controlled by the corresponding ``user'' (or ``owner'') bits.  Likewise,
2572 if any of the effective group ID or supplementary group IDs of the
2573 process matches the group owner ID of the file, then permissions are
2574 controlled by the ``group'' bits.  Otherwise, permissions are controlled
2575 by the ``other'' bits.
2577 Privileged users, like @samp{root}, can access any file regardless of
2578 its permission bits.  As a special case, for a file to be executable
2579 even by a privileged user, at least one of its execute bits must be set.
2581 @node Setting Permissions
2582 @subsection Assigning File Permissions
2584 @cindex file creation mask
2585 @cindex umask
2586 The primitive functions for creating files (for example, @code{open} or
2587 @code{mkdir}) take a @var{mode} argument, which specifies the file
2588 permissions to give the newly created file.  This mode is modified by
2589 the process's @dfn{file creation mask}, or @dfn{umask}, before it is
2590 used.
2592 The bits that are set in the file creation mask identify permissions
2593 that are always to be disabled for newly created files.  For example, if
2594 you set all the ``other'' access bits in the mask, then newly created
2595 files are not accessible at all to processes in the ``other'' category,
2596 even if the @var{mode} argument passed to the create function would
2597 permit such access.  In other words, the file creation mask is the
2598 complement of the ordinary access permissions you want to grant.
2600 Programs that create files typically specify a @var{mode} argument that
2601 includes all the permissions that make sense for the particular file.
2602 For an ordinary file, this is typically read and write permission for
2603 all classes of users.  These permissions are then restricted as
2604 specified by the individual user's own file creation mask.
2606 @findex chmod
2607 To change the permission of an existing file given its name, call
2608 @code{chmod}.  This function uses the specified permission bits and
2609 ignores the file creation mask.
2611 @pindex umask
2612 In normal use, the file creation mask is initialized by the user's login
2613 shell (using the @code{umask} shell command), and inherited by all
2614 subprocesses.  Application programs normally don't need to worry about
2615 the file creation mask.  It will automatically do what it is supposed to
2618 When your program needs to create a file and bypass the umask for its
2619 access permissions, the easiest way to do this is to use @code{fchmod}
2620 after opening the file, rather than changing the umask.  In fact,
2621 changing the umask is usually done only by shells.  They use the
2622 @code{umask} function.
2624 The functions in this section are declared in @file{sys/stat.h}.
2625 @pindex sys/stat.h
2627 @comment sys/stat.h
2628 @comment POSIX.1
2629 @deftypefun mode_t umask (mode_t @var{mask})
2630 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2631 The @code{umask} function sets the file creation mask of the current
2632 process to @var{mask}, and returns the previous value of the file
2633 creation mask.
2635 Here is an example showing how to read the mask with @code{umask}
2636 without changing it permanently:
2638 @smallexample
2639 mode_t
2640 read_umask (void)
2642   mode_t mask = umask (0);
2643   umask (mask);
2644   return mask;
2646 @end smallexample
2648 @noindent
2649 However, on @gnuhurdsystems{} it is better to use @code{getumask} if
2650 you just want to read the mask value, because it is reentrant.
2651 @end deftypefun
2653 @comment sys/stat.h
2654 @comment GNU
2655 @deftypefun mode_t getumask (void)
2656 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2657 Return the current value of the file creation mask for the current
2658 process.  This function is a GNU extension and is only available on
2659 @gnuhurdsystems{}.
2660 @end deftypefun
2662 @comment sys/stat.h
2663 @comment POSIX.1
2664 @deftypefun int chmod (const char *@var{filename}, mode_t @var{mode})
2665 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2666 The @code{chmod} function sets the access permission bits for the file
2667 named by @var{filename} to @var{mode}.
2669 If @var{filename} is a symbolic link, @code{chmod} changes the
2670 permissions of the file pointed to by the link, not those of the link
2671 itself.
2673 This function returns @code{0} if successful and @code{-1} if not.  In
2674 addition to the usual file name errors (@pxref{File Name
2675 Errors}), the following @code{errno} error conditions are defined for
2676 this function:
2678 @table @code
2679 @item ENOENT
2680 The named file doesn't exist.
2682 @item EPERM
2683 This process does not have permission to change the access permissions
2684 of this file.  Only the file's owner (as judged by the effective user ID
2685 of the process) or a privileged user can change them.
2687 @item EROFS
2688 The file resides on a read-only file system.
2690 @item EFTYPE
2691 @var{mode} has the @code{S_ISVTX} bit (the ``sticky bit'') set,
2692 and the named file is not a directory.  Some systems do not allow setting the
2693 sticky bit on non-directory files, and some do (and only some of those
2694 assign a useful meaning to the bit for non-directory files).
2696 You only get @code{EFTYPE} on systems where the sticky bit has no useful
2697 meaning for non-directory files, so it is always safe to just clear the
2698 bit in @var{mode} and call @code{chmod} again.  @xref{Permission Bits},
2699 for full details on the sticky bit.
2700 @end table
2701 @end deftypefun
2703 @comment sys/stat.h
2704 @comment BSD
2705 @deftypefun int fchmod (int @var{filedes}, mode_t @var{mode})
2706 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2707 This is like @code{chmod}, except that it changes the permissions of the
2708 currently open file given by @var{filedes}.
2710 The return value from @code{fchmod} is @code{0} on success and @code{-1}
2711 on failure.  The following @code{errno} error codes are defined for this
2712 function:
2714 @table @code
2715 @item EBADF
2716 The @var{filedes} argument is not a valid file descriptor.
2718 @item EINVAL
2719 The @var{filedes} argument corresponds to a pipe or socket, or something
2720 else that doesn't really have access permissions.
2722 @item EPERM
2723 This process does not have permission to change the access permissions
2724 of this file.  Only the file's owner (as judged by the effective user ID
2725 of the process) or a privileged user can change them.
2727 @item EROFS
2728 The file resides on a read-only file system.
2729 @end table
2730 @end deftypefun
2732 @node Testing File Access
2733 @subsection Testing Permission to Access a File
2734 @cindex testing access permission
2735 @cindex access, testing for
2736 @cindex setuid programs and file access
2738 In some situations it is desirable to allow programs to access files or
2739 devices even if this is not possible with the permissions granted to the
2740 user.  One possible solution is to set the setuid-bit of the program
2741 file.  If such a program is started the @emph{effective} user ID of the
2742 process is changed to that of the owner of the program file.  So to
2743 allow write access to files like @file{/etc/passwd}, which normally can
2744 be written only by the super-user, the modifying program will have to be
2745 owned by @code{root} and the setuid-bit must be set.
2747 But besides the files the program is intended to change the user should
2748 not be allowed to access any file to which s/he would not have access
2749 anyway.  The program therefore must explicitly check whether @emph{the
2750 user} would have the necessary access to a file, before it reads or
2751 writes the file.
2753 To do this, use the function @code{access}, which checks for access
2754 permission based on the process's @emph{real} user ID rather than the
2755 effective user ID.  (The setuid feature does not alter the real user ID,
2756 so it reflects the user who actually ran the program.)
2758 There is another way you could check this access, which is easy to
2759 describe, but very hard to use.  This is to examine the file mode bits
2760 and mimic the system's own access computation.  This method is
2761 undesirable because many systems have additional access control
2762 features; your program cannot portably mimic them, and you would not
2763 want to try to keep track of the diverse features that different systems
2764 have.  Using @code{access} is simple and automatically does whatever is
2765 appropriate for the system you are using.
2767 @code{access} is @emph{only} appropriate to use in setuid programs.
2768 A non-setuid program will always use the effective ID rather than the
2769 real ID.
2771 @pindex unistd.h
2772 The symbols in this section are declared in @file{unistd.h}.
2774 @comment unistd.h
2775 @comment POSIX.1
2776 @deftypefun int access (const char *@var{filename}, int @var{how})
2777 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2778 The @code{access} function checks to see whether the file named by
2779 @var{filename} can be accessed in the way specified by the @var{how}
2780 argument.  The @var{how} argument either can be the bitwise OR of the
2781 flags @code{R_OK}, @code{W_OK}, @code{X_OK}, or the existence test
2782 @code{F_OK}.
2784 This function uses the @emph{real} user and group IDs of the calling
2785 process, rather than the @emph{effective} IDs, to check for access
2786 permission.  As a result, if you use the function from a @code{setuid}
2787 or @code{setgid} program (@pxref{How Change Persona}), it gives
2788 information relative to the user who actually ran the program.
2790 The return value is @code{0} if the access is permitted, and @code{-1}
2791 otherwise.  (In other words, treated as a predicate function,
2792 @code{access} returns true if the requested access is @emph{denied}.)
2794 In addition to the usual file name errors (@pxref{File Name
2795 Errors}), the following @code{errno} error conditions are defined for
2796 this function:
2798 @table @code
2799 @item EACCES
2800 The access specified by @var{how} is denied.
2802 @item ENOENT
2803 The file doesn't exist.
2805 @item EROFS
2806 Write permission was requested for a file on a read-only file system.
2807 @end table
2808 @end deftypefun
2810 These macros are defined in the header file @file{unistd.h} for use
2811 as the @var{how} argument to the @code{access} function.  The values
2812 are integer constants.
2813 @pindex unistd.h
2815 @comment unistd.h
2816 @comment POSIX.1
2817 @deftypevr Macro int R_OK
2818 Flag meaning test for read permission.
2819 @end deftypevr
2821 @comment unistd.h
2822 @comment POSIX.1
2823 @deftypevr Macro int W_OK
2824 Flag meaning test for write permission.
2825 @end deftypevr
2827 @comment unistd.h
2828 @comment POSIX.1
2829 @deftypevr Macro int X_OK
2830 Flag meaning test for execute/search permission.
2831 @end deftypevr
2833 @comment unistd.h
2834 @comment POSIX.1
2835 @deftypevr Macro int F_OK
2836 Flag meaning test for existence of the file.
2837 @end deftypevr
2839 @node File Times
2840 @subsection File Times
2842 @cindex file access time
2843 @cindex file modification time
2844 @cindex file attribute modification time
2845 Each file has three time stamps associated with it:  its access time,
2846 its modification time, and its attribute modification time.  These
2847 correspond to the @code{st_atime}, @code{st_mtime}, and @code{st_ctime}
2848 members of the @code{stat} structure; see @ref{File Attributes}.
2850 All of these times are represented in calendar time format, as
2851 @code{time_t} objects.  This data type is defined in @file{time.h}.
2852 For more information about representation and manipulation of time
2853 values, see @ref{Calendar Time}.
2854 @pindex time.h
2856 Reading from a file updates its access time attribute, and writing
2857 updates its modification time.  When a file is created, all three
2858 time stamps for that file are set to the current time.  In addition, the
2859 attribute change time and modification time fields of the directory that
2860 contains the new entry are updated.
2862 Adding a new name for a file with the @code{link} function updates the
2863 attribute change time field of the file being linked, and both the
2864 attribute change time and modification time fields of the directory
2865 containing the new name.  These same fields are affected if a file name
2866 is deleted with @code{unlink}, @code{remove} or @code{rmdir}.  Renaming
2867 a file with @code{rename} affects only the attribute change time and
2868 modification time fields of the two parent directories involved, and not
2869 the times for the file being renamed.
2871 Changing the attributes of a file (for example, with @code{chmod})
2872 updates its attribute change time field.
2874 You can also change some of the time stamps of a file explicitly using
2875 the @code{utime} function---all except the attribute change time.  You
2876 need to include the header file @file{utime.h} to use this facility.
2877 @pindex utime.h
2879 @comment utime.h
2880 @comment POSIX.1
2881 @deftp {Data Type} {struct utimbuf}
2882 The @code{utimbuf} structure is used with the @code{utime} function to
2883 specify new access and modification times for a file.  It contains the
2884 following members:
2886 @table @code
2887 @item time_t actime
2888 This is the access time for the file.
2890 @item time_t modtime
2891 This is the modification time for the file.
2892 @end table
2893 @end deftp
2895 @comment utime.h
2896 @comment POSIX.1
2897 @deftypefun int utime (const char *@var{filename}, const struct utimbuf *@var{times})
2898 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2899 @c In the absence of a utime syscall, it non-atomically converts times
2900 @c to a struct timeval and calls utimes.
2901 This function is used to modify the file times associated with the file
2902 named @var{filename}.
2904 If @var{times} is a null pointer, then the access and modification times
2905 of the file are set to the current time.  Otherwise, they are set to the
2906 values from the @code{actime} and @code{modtime} members (respectively)
2907 of the @code{utimbuf} structure pointed to by @var{times}.
2909 The attribute modification time for the file is set to the current time
2910 in either case (since changing the time stamps is itself a modification
2911 of the file attributes).
2913 The @code{utime} function returns @code{0} if successful and @code{-1}
2914 on failure.  In addition to the usual file name errors
2915 (@pxref{File Name Errors}), the following @code{errno} error conditions
2916 are defined for this function:
2918 @table @code
2919 @item EACCES
2920 There is a permission problem in the case where a null pointer was
2921 passed as the @var{times} argument.  In order to update the time stamp on
2922 the file, you must either be the owner of the file, have write
2923 permission for the file, or be a privileged user.
2925 @item ENOENT
2926 The file doesn't exist.
2928 @item EPERM
2929 If the @var{times} argument is not a null pointer, you must either be
2930 the owner of the file or be a privileged user.
2932 @item EROFS
2933 The file lives on a read-only file system.
2934 @end table
2935 @end deftypefun
2937 Each of the three time stamps has a corresponding microsecond part,
2938 which extends its resolution.  These fields are called
2939 @code{st_atime_usec}, @code{st_mtime_usec}, and @code{st_ctime_usec};
2940 each has a value between 0 and 999,999, which indicates the time in
2941 microseconds.  They correspond to the @code{tv_usec} field of a
2942 @code{timeval} structure; see @ref{High-Resolution Calendar}.
2944 The @code{utimes} function is like @code{utime}, but also lets you specify
2945 the fractional part of the file times.  The prototype for this function is
2946 in the header file @file{sys/time.h}.
2947 @pindex sys/time.h
2949 @comment sys/time.h
2950 @comment BSD
2951 @deftypefun int utimes (const char *@var{filename}, const struct timeval @var{tvp}@t{[2]})
2952 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2953 @c In the absence of a utimes syscall, it non-atomically converts tvp
2954 @c to struct timespec array and issues a utimensat syscall, or to
2955 @c struct utimbuf and calls utime.
2956 This function sets the file access and modification times of the file
2957 @var{filename}.  The new file access time is specified by
2958 @code{@var{tvp}[0]}, and the new modification time by
2959 @code{@var{tvp}[1]}.  Similar to @code{utime}, if @var{tvp} is a null
2960 pointer then the access and modification times of the file are set to
2961 the current time.  This function comes from BSD.
2963 The return values and error conditions are the same as for the @code{utime}
2964 function.
2965 @end deftypefun
2967 @comment sys/time.h
2968 @comment BSD
2969 @deftypefun int lutimes (const char *@var{filename}, const struct timeval @var{tvp}@t{[2]})
2970 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2971 @c Since there's no lutimes syscall, it non-atomically converts tvp
2972 @c to struct timespec array and issues a utimensat syscall.
2973 This function is like @code{utimes}, except that it does not follow
2974 symbolic links.  If @var{filename} is the name of a symbolic link,
2975 @code{lutimes} sets the file access and modification times of the
2976 symbolic link special file itself (as seen by @code{lstat};
2977 @pxref{Symbolic Links}) while @code{utimes} sets the file access and
2978 modification times of the file the symbolic link refers to.  This
2979 function comes from FreeBSD, and is not available on all platforms (if
2980 not available, it will fail with @code{ENOSYS}).
2982 The return values and error conditions are the same as for the @code{utime}
2983 function.
2984 @end deftypefun
2986 @comment sys/time.h
2987 @comment BSD
2988 @deftypefun int futimes (int @var{fd}, const struct timeval @var{tvp}@t{[2]})
2989 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
2990 @c Since there's no futimes syscall, it non-atomically converts tvp
2991 @c to struct timespec array and issues a utimensat syscall, falling back
2992 @c to utimes on a /proc/self/fd symlink.
2993 This function is like @code{utimes}, except that it takes an open file
2994 descriptor as an argument instead of a file name.  @xref{Low-Level
2995 I/O}.  This function comes from FreeBSD, and is not available on all
2996 platforms (if not available, it will fail with @code{ENOSYS}).
2998 Like @code{utimes}, @code{futimes} returns @code{0} on success and @code{-1}
2999 on failure.  The following @code{errno} error conditions are defined for
3000 @code{futimes}:
3002 @table @code
3003 @item EACCES
3004 There is a permission problem in the case where a null pointer was
3005 passed as the @var{times} argument.  In order to update the time stamp on
3006 the file, you must either be the owner of the file, have write
3007 permission for the file, or be a privileged user.
3009 @item EBADF
3010 The @var{filedes} argument is not a valid file descriptor.
3012 @item EPERM
3013 If the @var{times} argument is not a null pointer, you must either be
3014 the owner of the file or be a privileged user.
3016 @item EROFS
3017 The file lives on a read-only file system.
3018 @end table
3019 @end deftypefun
3021 @node File Size
3022 @subsection File Size
3024 Normally file sizes are maintained automatically.  A file begins with a
3025 size of @math{0} and is automatically extended when data is written past
3026 its end.  It is also possible to empty a file completely by an
3027 @code{open} or @code{fopen} call.
3029 However, sometimes it is necessary to @emph{reduce} the size of a file.
3030 This can be done with the @code{truncate} and @code{ftruncate} functions.
3031 They were introduced in BSD Unix.  @code{ftruncate} was later added to
3032 POSIX.1.
3034 Some systems allow you to extend a file (creating holes) with these
3035 functions.  This is useful when using memory-mapped I/O
3036 (@pxref{Memory-mapped I/O}), where files are not automatically extended.
3037 However, it is not portable but must be implemented if @code{mmap}
3038 allows mapping of files (i.e., @code{_POSIX_MAPPED_FILES} is defined).
3040 Using these functions on anything other than a regular file gives
3041 @emph{undefined} results.  On many systems, such a call will appear to
3042 succeed, without actually accomplishing anything.
3044 @comment unistd.h
3045 @comment X/Open
3046 @deftypefun int truncate (const char *@var{filename}, off_t @var{length})
3047 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
3048 @c In the absence of a truncate syscall, we use open and ftruncate.
3050 The @code{truncate} function changes the size of @var{filename} to
3051 @var{length}.  If @var{length} is shorter than the previous length, data
3052 at the end will be lost.  The file must be writable by the user to
3053 perform this operation.
3055 If @var{length} is longer, holes will be added to the end.  However, some
3056 systems do not support this feature and will leave the file unchanged.
3058 When the source file is compiled with @code{_FILE_OFFSET_BITS == 64} the
3059 @code{truncate} function is in fact @code{truncate64} and the type
3060 @code{off_t} has 64 bits which makes it possible to handle files up to
3061 @twoexp{63} bytes in length.
3063 The return value is @math{0} for success, or @math{-1} for an error.  In
3064 addition to the usual file name errors, the following errors may occur:
3066 @table @code
3068 @item EACCES
3069 The file is a directory or not writable.
3071 @item EINVAL
3072 @var{length} is negative.
3074 @item EFBIG
3075 The operation would extend the file beyond the limits of the operating system.
3077 @item EIO
3078 A hardware I/O error occurred.
3080 @item EPERM
3081 The file is "append-only" or "immutable".
3083 @item EINTR
3084 The operation was interrupted by a signal.
3086 @end table
3088 @end deftypefun
3090 @comment unistd.h
3091 @comment Unix98
3092 @deftypefun int truncate64 (const char *@var{name}, off64_t @var{length})
3093 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
3094 @c In the absence of a syscall, try truncate if length fits.
3095 This function is similar to the @code{truncate} function.  The
3096 difference is that the @var{length} argument is 64 bits wide even on 32
3097 bits machines, which allows the handling of files with sizes up to
3098 @twoexp{63} bytes.
3100 When the source file is compiled with @code{_FILE_OFFSET_BITS == 64} on a
3101 32 bits machine this function is actually available under the name
3102 @code{truncate} and so transparently replaces the 32 bits interface.
3103 @end deftypefun
3105 @comment unistd.h
3106 @comment POSIX
3107 @deftypefun int ftruncate (int @var{fd}, off_t @var{length})
3108 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
3110 This is like @code{truncate}, but it works on a file descriptor @var{fd}
3111 for an opened file instead of a file name to identify the object.  The
3112 file must be opened for writing to successfully carry out the operation.
3114 The POSIX standard leaves it implementation defined what happens if the
3115 specified new @var{length} of the file is bigger than the original size.
3116 The @code{ftruncate} function might simply leave the file alone and do
3117 nothing or it can increase the size to the desired size.  In this later
3118 case the extended area should be zero-filled.  So using @code{ftruncate}
3119 is no reliable way to increase the file size but if it is possible it is
3120 probably the fastest way.  The function also operates on POSIX shared
3121 memory segments if these are implemented by the system.
3123 @code{ftruncate} is especially useful in combination with @code{mmap}.
3124 Since the mapped region must have a fixed size one cannot enlarge the
3125 file by writing something beyond the last mapped page.  Instead one has
3126 to enlarge the file itself and then remap the file with the new size.
3127 The example below shows how this works.
3129 When the source file is compiled with @code{_FILE_OFFSET_BITS == 64} the
3130 @code{ftruncate} function is in fact @code{ftruncate64} and the type
3131 @code{off_t} has 64 bits which makes it possible to handle files up to
3132 @twoexp{63} bytes in length.
3134 The return value is @math{0} for success, or @math{-1} for an error.  The
3135 following errors may occur:
3137 @table @code
3139 @item EBADF
3140 @var{fd} does not correspond to an open file.
3142 @item EACCES
3143 @var{fd} is a directory or not open for writing.
3145 @item EINVAL
3146 @var{length} is negative.
3148 @item EFBIG
3149 The operation would extend the file beyond the limits of the operating system.
3150 @c or the open() call -- with the not-yet-discussed feature of opening
3151 @c files with extra-large offsets.
3153 @item EIO
3154 A hardware I/O error occurred.
3156 @item EPERM
3157 The file is "append-only" or "immutable".
3159 @item EINTR
3160 The operation was interrupted by a signal.
3162 @c ENOENT is also possible on Linux --- however it only occurs if the file
3163 @c descriptor has a `file' structure but no `inode' structure.  I'm not
3164 @c sure how such an fd could be created.  Perhaps it's a bug.
3166 @end table
3168 @end deftypefun
3170 @comment unistd.h
3171 @comment Unix98
3172 @deftypefun int ftruncate64 (int @var{id}, off64_t @var{length})
3173 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
3174 @c In the absence of a syscall, try ftruncate if length fits.
3175 This function is similar to the @code{ftruncate} function.  The
3176 difference is that the @var{length} argument is 64 bits wide even on 32
3177 bits machines which allows the handling of files with sizes up to
3178 @twoexp{63} bytes.
3180 When the source file is compiled with @code{_FILE_OFFSET_BITS == 64} on a
3181 32 bits machine this function is actually available under the name
3182 @code{ftruncate} and so transparently replaces the 32 bits interface.
3183 @end deftypefun
3185 As announced here is a little example of how to use @code{ftruncate} in
3186 combination with @code{mmap}:
3188 @smallexample
3189 int fd;
3190 void *start;
3191 size_t len;
3194 add (off_t at, void *block, size_t size)
3196   if (at + size > len)
3197     @{
3198       /* Resize the file and remap.  */
3199       size_t ps = sysconf (_SC_PAGESIZE);
3200       size_t ns = (at + size + ps - 1) & ~(ps - 1);
3201       void *np;
3202       if (ftruncate (fd, ns) < 0)
3203         return -1;
3204       np = mmap (NULL, ns, PROT_READ|PROT_WRITE, MAP_SHARED, fd, 0);
3205       if (np == MAP_FAILED)
3206         return -1;
3207       start = np;
3208       len = ns;
3209     @}
3210   memcpy ((char *) start + at, block, size);
3211   return 0;
3213 @end smallexample
3215 The function @code{add} writes a block of memory at an arbitrary
3216 position in the file.  If the current size of the file is too small it
3217 is extended.  Note that it is extended by a whole number of pages.  This
3218 is a requirement of @code{mmap}.  The program has to keep track of the
3219 real size, and when it has finished a final @code{ftruncate} call should
3220 set the real size of the file.
3222 @node Storage Allocation
3223 @subsection Storage Allocation
3224 @cindex allocating file storage
3225 @cindex file allocation
3226 @cindex storage allocating
3228 @cindex file fragmentation
3229 @cindex fragmentation of files
3230 @cindex sparse files
3231 @cindex files, sparse
3232 Most file systems support allocating large files in a non-contiguous
3233 fashion: the file is split into @emph{fragments} which are allocated
3234 sequentially, but the fragments themselves can be scattered across the
3235 disk.  File systems generally try to avoid such fragmentation because it
3236 decreases performance, but if a file gradually increases in size, there
3237 might be no other option than to fragment it.  In addition, many file
3238 systems support @emph{sparse files} with @emph{holes}: regions of null
3239 bytes for which no backing storage has been allocated by the file
3240 system.  When the holes are finally overwritten with data, fragmentation
3241 can occur as well.
3243 Explicit allocation of storage for yet-unwritten parts of the file can
3244 help the system to avoid fragmentation.  Additionally, if storage
3245 pre-allocation fails, it is possible to report the out-of-disk error
3246 early, often without filling up the entire disk.  However, due to
3247 deduplication, copy-on-write semantics, and file compression, such
3248 pre-allocation may not reliably prevent the out-of-disk-space error from
3249 occurring later.  Checking for write errors is still required, and
3250 writes to memory-mapped regions created with @code{mmap} can still
3251 result in @code{SIGBUS}.
3253 @deftypefun int posix_fallocate (int @var{fd}, off_t @var{offset}, off_t @var{length})
3254 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
3255 @c If the file system does not support allocation,
3256 @c @code{posix_fallocate} has a race with file extension (if
3257 @c @var{length} is zero) or with concurrent writes of non-NUL bytes (if
3258 @c @var{length} is positive).
3260 Allocate backing store for the region of @var{length} bytes starting at
3261 byte @var{offset} in the file for the descriptor @var{fd}.  The file
3262 length is increased to @samp{@var{length} + @var{offset}} if necessary.
3264 @var{fd} must be a regular file opened for writing, or @code{EBADF} is
3265 returned.  If there is insufficient disk space to fulfill the allocation
3266 request, @code{ENOSPC} is returned.
3268 @strong{Note:} If @code{fallocate} is not available (because the file
3269 system does not support it), @code{posix_fallocate} is emulated, which
3270 has the following drawbacks:
3272 @itemize @bullet
3273 @item
3274 It is very inefficient because all file system blocks in the requested
3275 range need to be examined (even if they have been allocated before) and
3276 potentially rewritten.  In contrast, with proper @code{fallocate}
3277 support (see below), the file system can examine the internal file
3278 allocation data structures and eliminate holes directly, maybe even
3279 using unwritten extents (which are pre-allocated but uninitialized on
3280 disk).
3282 @item
3283 There is a race condition if another thread or process modifies the
3284 underlying file in the to-be-allocated area.  Non-null bytes could be
3285 overwritten with null bytes.
3287 @item
3288 If @var{fd} has been opened with the @code{O_WRONLY} flag, the function
3289 will fail with an @code{errno} value of @code{EBADF}.
3291 @item
3292 If @var{fd} has been opened with the @code{O_APPEND} flag, the function
3293 will fail with an @code{errno} value of @code{EBADF}.
3295 @item
3296 If @var{length} is zero, @code{ftruncate} is used to increase the file
3297 size as requested, without allocating file system blocks.  There is a
3298 race condition which means that @code{ftruncate} can accidentally
3299 truncate the file if it has been extended concurrently.
3300 @end itemize
3302 On Linux, if an application does not benefit from emulation or if the
3303 emulation is harmful due to its inherent race conditions, the
3304 application can use the Linux-specific @code{fallocate} function, with a
3305 zero flag argument.  For the @code{fallocate} function, @theglibc{} does
3306 not perform allocation emulation if the file system does not support
3307 allocation.  Instead, an @code{EOPNOTSUPP} is returned to the caller.
3309 @end deftypefun
3311 @deftypefun int posix_fallocate64 (int @var{fd}, off64_t @var{offset}, off64_t @var{length})
3312 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
3314 This function is a variant of @code{posix_fallocate64} which accepts
3315 64-bit file offsets on all platforms.
3317 @end deftypefun
3319 @node Making Special Files
3320 @section Making Special Files
3321 @cindex creating special files
3322 @cindex special files
3324 The @code{mknod} function is the primitive for making special files,
3325 such as files that correspond to devices.  @Theglibc{} includes
3326 this function for compatibility with BSD.
3328 The prototype for @code{mknod} is declared in @file{sys/stat.h}.
3329 @pindex sys/stat.h
3331 @comment sys/stat.h
3332 @comment BSD
3333 @deftypefun int mknod (const char *@var{filename}, mode_t @var{mode}, dev_t @var{dev})
3334 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
3335 @c Instead of issuing the syscall directly, we go through xmknod.
3336 @c Although the internal xmknod takes a dev_t*, that could lead to
3337 @c @mtsrace races, it's passed a pointer to mknod's dev.
3338 The @code{mknod} function makes a special file with name @var{filename}.
3339 The @var{mode} specifies the mode of the file, and may include the various
3340 special file bits, such as @code{S_IFCHR} (for a character special file)
3341 or @code{S_IFBLK} (for a block special file).  @xref{Testing File Type}.
3343 The @var{dev} argument specifies which device the special file refers to.
3344 Its exact interpretation depends on the kind of special file being created.
3346 The return value is @code{0} on success and @code{-1} on error.  In addition
3347 to the usual file name errors (@pxref{File Name Errors}), the
3348 following @code{errno} error conditions are defined for this function:
3350 @table @code
3351 @item EPERM
3352 The calling process is not privileged.  Only the superuser can create
3353 special files.
3355 @item ENOSPC
3356 The directory or file system that would contain the new file is full
3357 and cannot be extended.
3359 @item EROFS
3360 The directory containing the new file can't be modified because it's on
3361 a read-only file system.
3363 @item EEXIST
3364 There is already a file named @var{filename}.  If you want to replace
3365 this file, you must remove the old file explicitly first.
3366 @end table
3367 @end deftypefun
3369 @node Temporary Files
3370 @section Temporary Files
3372 If you need to use a temporary file in your program, you can use the
3373 @code{tmpfile} function to open it.  Or you can use the @code{tmpnam}
3374 (better: @code{tmpnam_r}) function to provide a name for a temporary
3375 file and then you can open it in the usual way with @code{fopen}.
3377 The @code{tempnam} function is like @code{tmpnam} but lets you choose
3378 what directory temporary files will go in, and something about what
3379 their file names will look like.  Important for multi-threaded programs
3380 is that @code{tempnam} is reentrant, while @code{tmpnam} is not since it
3381 returns a pointer to a static buffer.
3383 These facilities are declared in the header file @file{stdio.h}.
3384 @pindex stdio.h
3386 @comment stdio.h
3387 @comment ISO
3388 @deftypefun {FILE *} tmpfile (void)
3389 @safety{@prelim{}@mtsafe{}@asunsafe{@ascuheap{} @asulock{}}@acunsafe{@acsmem{} @acsfd{} @aculock{}}}
3390 @c The unsafety issues are those of fdopen, plus @acsfd because of the
3391 @c open.
3392 @c __path_search (internal buf, !dir, const pfx, !try_tmpdir) ok
3393 @c  libc_secure_genenv only if try_tmpdir
3394 @c  xstat64, strlen, strcmp, sprintf
3395 @c __gen_tempname (internal tmpl, __GT_FILE) ok
3396 @c  strlen, memcmp, getpid, open/mkdir/lxstat64 ok
3397 @c  HP_TIMING_NOW if available ok
3398 @c  gettimeofday (!tz) first time, or every time if no HP_TIMING_NOW ok
3399 @c  static value is used and modified without synchronization ok
3400 @c   but the use is as a source of non-cryptographic randomness
3401 @c   with retries in case of collision, so it should be safe
3402 @c unlink, fdopen
3403 This function creates a temporary binary file for update mode, as if by
3404 calling @code{fopen} with mode @code{"wb+"}.  The file is deleted
3405 automatically when it is closed or when the program terminates.  (On
3406 some other @w{ISO C} systems the file may fail to be deleted if the program
3407 terminates abnormally).
3409 This function is reentrant.
3411 When the sources are compiled with @code{_FILE_OFFSET_BITS == 64} on a
3412 32-bit system this function is in fact @code{tmpfile64}, i.e., the LFS
3413 interface transparently replaces the old interface.
3414 @end deftypefun
3416 @comment stdio.h
3417 @comment Unix98
3418 @deftypefun {FILE *} tmpfile64 (void)
3419 @safety{@prelim{}@mtsafe{}@asunsafe{@ascuheap{} @asulock{}}@acunsafe{@acsmem{} @acsfd{} @aculock{}}}
3420 This function is similar to @code{tmpfile}, but the stream it returns a
3421 pointer to was opened using @code{tmpfile64}.  Therefore this stream can
3422 be used for files larger than @twoexp{31} bytes on 32-bit machines.
3424 Please note that the return type is still @code{FILE *}.  There is no
3425 special @code{FILE} type for the LFS interface.
3427 If the sources are compiled with @code{_FILE_OFFSET_BITS == 64} on a 32
3428 bits machine this function is available under the name @code{tmpfile}
3429 and so transparently replaces the old interface.
3430 @end deftypefun
3432 @comment stdio.h
3433 @comment ISO
3434 @deftypefun {char *} tmpnam (char *@var{result})
3435 @safety{@prelim{}@mtunsafe{@mtasurace{:tmpnam/!result}}@asunsafe{}@acsafe{}}
3436 @c The passed-in buffer should not be modified concurrently with the
3437 @c call.
3438 @c __path_search (static or passed-in buf, !dir, !pfx, !try_tmpdir) ok
3439 @c __gen_tempname (internal tmpl, __GT_NOCREATE) ok
3440 This function constructs and returns a valid file name that does not
3441 refer to any existing file.  If the @var{result} argument is a null
3442 pointer, the return value is a pointer to an internal static string,
3443 which might be modified by subsequent calls and therefore makes this
3444 function non-reentrant.  Otherwise, the @var{result} argument should be
3445 a pointer to an array of at least @code{L_tmpnam} characters, and the
3446 result is written into that array.
3448 It is possible for @code{tmpnam} to fail if you call it too many times
3449 without removing previously-created files.  This is because the limited
3450 length of the temporary file names gives room for only a finite number
3451 of different names.  If @code{tmpnam} fails it returns a null pointer.
3453 @strong{Warning:} Between the time the pathname is constructed and the
3454 file is created another process might have created a file with the same
3455 name using @code{tmpnam}, leading to a possible security hole.  The
3456 implementation generates names which can hardly be predicted, but when
3457 opening the file you should use the @code{O_EXCL} flag.  Using
3458 @code{tmpfile} or @code{mkstemp} is a safe way to avoid this problem.
3459 @end deftypefun
3461 @comment stdio.h
3462 @comment GNU
3463 @deftypefun {char *} tmpnam_r (char *@var{result})
3464 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
3465 This function is nearly identical to the @code{tmpnam} function, except
3466 that if @var{result} is a null pointer it returns a null pointer.
3468 This guarantees reentrancy because the non-reentrant situation of
3469 @code{tmpnam} cannot happen here.
3471 @strong{Warning}: This function has the same security problems as
3472 @code{tmpnam}.
3473 @end deftypefun
3475 @comment stdio.h
3476 @comment ISO
3477 @deftypevr Macro int L_tmpnam
3478 The value of this macro is an integer constant expression that
3479 represents the minimum size of a string large enough to hold a file name
3480 generated by the @code{tmpnam} function.
3481 @end deftypevr
3483 @comment stdio.h
3484 @comment ISO
3485 @deftypevr Macro int TMP_MAX
3486 The macro @code{TMP_MAX} is a lower bound for how many temporary names
3487 you can create with @code{tmpnam}.  You can rely on being able to call
3488 @code{tmpnam} at least this many times before it might fail saying you
3489 have made too many temporary file names.
3491 With @theglibc{}, you can create a very large number of temporary
3492 file names.  If you actually created the files, you would probably run
3493 out of disk space before you ran out of names.  Some other systems have
3494 a fixed, small limit on the number of temporary files.  The limit is
3495 never less than @code{25}.
3496 @end deftypevr
3498 @comment stdio.h
3499 @comment SVID
3500 @deftypefun {char *} tempnam (const char *@var{dir}, const char *@var{prefix})
3501 @safety{@prelim{}@mtsafe{@mtsenv{}}@asunsafe{@ascuheap{}}@acunsafe{@acsmem{}}}
3502 @c There's no way (short of being setuid) to avoid getenv("TMPDIR"),
3503 @c even with a non-NULL dir.
3505 @c __path_search (internal buf, dir, pfx, try_tmpdir) unsafe getenv
3506 @c __gen_tempname (internal tmpl, __GT_NOCREATE) ok
3507 @c strdup
3508 This function generates a unique temporary file name.  If @var{prefix}
3509 is not a null pointer, up to five characters of this string are used as
3510 a prefix for the file name.  The return value is a string newly
3511 allocated with @code{malloc}, so you should release its storage with
3512 @code{free} when it is no longer needed.
3514 Because the string is dynamically allocated this function is reentrant.
3516 The directory prefix for the temporary file name is determined by
3517 testing each of the following in sequence.  The directory must exist and
3518 be writable.
3520 @itemize @bullet
3521 @item
3522 The environment variable @code{TMPDIR}, if it is defined.  For security
3523 reasons this only happens if the program is not SUID or SGID enabled.
3525 @item
3526 The @var{dir} argument, if it is not a null pointer.
3528 @item
3529 The value of the @code{P_tmpdir} macro.
3531 @item
3532 The directory @file{/tmp}.
3533 @end itemize
3535 This function is defined for SVID compatibility.
3537 @strong{Warning:} Between the time the pathname is constructed and the
3538 file is created another process might have created a file with the same
3539 name using @code{tempnam}, leading to a possible security hole.  The
3540 implementation generates names which can hardly be predicted, but when
3541 opening the file you should use the @code{O_EXCL} flag.  Using
3542 @code{tmpfile} or @code{mkstemp} is a safe way to avoid this problem.
3543 @end deftypefun
3544 @cindex TMPDIR environment variable
3546 @comment stdio.h
3547 @comment SVID
3548 @c !!! are we putting SVID/GNU/POSIX.1/BSD in here or not??
3549 @deftypevr {SVID Macro} {char *} P_tmpdir
3550 This macro is the name of the default directory for temporary files.
3551 @end deftypevr
3553 Older Unix systems did not have the functions just described.  Instead
3554 they used @code{mktemp} and @code{mkstemp}.  Both of these functions
3555 work by modifying a file name template string you pass.  The last six
3556 characters of this string must be @samp{XXXXXX}.  These six @samp{X}s
3557 are replaced with six characters which make the whole string a unique
3558 file name.  Usually the template string is something like
3559 @samp{/tmp/@var{prefix}XXXXXX}, and each program uses a unique @var{prefix}.
3561 @strong{NB:} Because @code{mktemp} and @code{mkstemp} modify the
3562 template string, you @emph{must not} pass string constants to them.
3563 String constants are normally in read-only storage, so your program
3564 would crash when @code{mktemp} or @code{mkstemp} tried to modify the
3565 string.  These functions are declared in the header file @file{stdlib.h}.
3566 @pindex stdlib.h
3568 @comment stdlib.h
3569 @comment Unix
3570 @deftypefun {char *} mktemp (char *@var{template})
3571 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
3572 @c __gen_tempname (caller tmpl, __GT_NOCREATE) ok
3573 The @code{mktemp} function generates a unique file name by modifying
3574 @var{template} as described above.  If successful, it returns
3575 @var{template} as modified.  If @code{mktemp} cannot find a unique file
3576 name, it makes @var{template} an empty string and returns that.  If
3577 @var{template} does not end with @samp{XXXXXX}, @code{mktemp} returns a
3578 null pointer.
3580 @strong{Warning:} Between the time the pathname is constructed and the
3581 file is created another process might have created a file with the same
3582 name using @code{mktemp}, leading to a possible security hole.  The
3583 implementation generates names which can hardly be predicted, but when
3584 opening the file you should use the @code{O_EXCL} flag.  Using
3585 @code{mkstemp} is a safe way to avoid this problem.
3586 @end deftypefun
3588 @comment stdlib.h
3589 @comment BSD
3590 @deftypefun int mkstemp (char *@var{template})
3591 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{@acsfd{}}}
3592 @c __gen_tempname (caller tmpl, __GT_FILE) ok
3593 The @code{mkstemp} function generates a unique file name just as
3594 @code{mktemp} does, but it also opens the file for you with @code{open}
3595 (@pxref{Opening and Closing Files}).  If successful, it modifies
3596 @var{template} in place and returns a file descriptor for that file open
3597 for reading and writing.  If @code{mkstemp} cannot create a
3598 uniquely-named file, it returns @code{-1}.  If @var{template} does not
3599 end with @samp{XXXXXX}, @code{mkstemp} returns @code{-1} and does not
3600 modify @var{template}.
3602 The file is opened using mode @code{0600}.  If the file is meant to be
3603 used by other users this mode must be changed explicitly.
3604 @end deftypefun
3606 Unlike @code{mktemp}, @code{mkstemp} is actually guaranteed to create a
3607 unique file that cannot possibly clash with any other program trying to
3608 create a temporary file.  This is because it works by calling
3609 @code{open} with the @code{O_EXCL} flag, which says you want to create a
3610 new file and get an error if the file already exists.
3612 @comment stdlib.h
3613 @comment BSD
3614 @deftypefun {char *} mkdtemp (char *@var{template})
3615 @safety{@prelim{}@mtsafe{}@assafe{}@acsafe{}}
3616 @c __gen_tempname (caller tmpl, __GT_DIR) ok
3617 The @code{mkdtemp} function creates a directory with a unique name.  If
3618 it succeeds, it overwrites @var{template} with the name of the
3619 directory, and returns @var{template}.  As with @code{mktemp} and
3620 @code{mkstemp}, @var{template} should be a string ending with
3621 @samp{XXXXXX}.
3623 If @code{mkdtemp} cannot create an uniquely named directory, it returns
3624 @code{NULL} and sets @var{errno} appropriately.  If @var{template} does
3625 not end with @samp{XXXXXX}, @code{mkdtemp} returns @code{NULL} and does
3626 not modify @var{template}.  @var{errno} will be set to @code{EINVAL} in
3627 this case.
3629 The directory is created using mode @code{0700}.
3630 @end deftypefun
3632 The directory created by @code{mkdtemp} cannot clash with temporary
3633 files or directories created by other users.  This is because directory
3634 creation always works like @code{open} with @code{O_EXCL}.
3635 @xref{Creating Directories}.
3637 The @code{mkdtemp} function comes from OpenBSD.
3639 @c FIXME these are undocumented:
3640 @c faccessat
3641 @c fchmodat
3642 @c fchownat
3643 @c futimesat
3644 @c fstatat (there's a commented-out safety assessment for this one)
3645 @c linkat
3646 @c mkdirat
3647 @c mkfifoat
3648 @c name_to_handle_at
3649 @c openat
3650 @c open_by_handle_at
3651 @c readlinkat
3652 @c renameat
3653 @c scandirat
3654 @c symlinkat
3655 @c unlinkat
3656 @c utimensat
3657 @c mknodat