MFC r1.9:
[dragonfly.git] / lib / libc / stdio / printf.3
blob835da148e53817deac47d72575afce684a771c21
1 .\" Copyright (c) 1990, 1991, 1993
2 .\"     The Regents of the University of California.  All rights reserved.
3 .\"
4 .\" This code is derived from software contributed to Berkeley by
5 .\" Chris Torek and the American National Standards Committee X3,
6 .\" on Information Processing Systems.
7 .\"
8 .\" Redistribution and use in source and binary forms, with or without
9 .\" modification, are permitted provided that the following conditions
10 .\" are met:
11 .\" 1. Redistributions of source code must retain the above copyright
12 .\"    notice, this list of conditions and the following disclaimer.
13 .\" 2. Redistributions in binary form must reproduce the above copyright
14 .\"    notice, this list of conditions and the following disclaimer in the
15 .\"    documentation and/or other materials provided with the distribution.
16 .\" 3. All advertising materials mentioning features or use of this software
17 .\"    must display the following acknowledgement:
18 .\"     This product includes software developed by the University of
19 .\"     California, Berkeley and its contributors.
20 .\" 4. Neither the name of the University nor the names of its contributors
21 .\"    may be used to endorse or promote products derived from this software
22 .\"    without specific prior written permission.
23 .\"
24 .\" THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
25 .\" ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
26 .\" IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
27 .\" ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
28 .\" FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
29 .\" DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
30 .\" OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
31 .\" HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
32 .\" LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
33 .\" OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
34 .\" SUCH DAMAGE.
35 .\"
36 .\"     @(#)printf.3    8.1 (Berkeley) 6/4/93
37 .\" $FreeBSD: src/lib/libc/stdio/printf.3,v 1.59 2005/09/05 09:49:33 tjr Exp $
38 .\" $DragonFly: src/lib/libc/stdio/printf.3,v 1.6 2006/08/26 10:27:55 swildner Exp $
39 .\"
40 .Dd August 26, 2006
41 .Dt PRINTF 3
42 .Os
43 .Sh NAME
44 .Nm printf ,
45 .Nm fprintf ,
46 .Nm sprintf ,
47 .Nm snprintf ,
48 .Nm asprintf ,
49 .Nm vprintf ,
50 .Nm vfprintf ,
51 .Nm vsprintf ,
52 .Nm vsnprintf ,
53 .Nm vasprintf
54 .Nd formatted output conversion
55 .Sh LIBRARY
56 .Lb libc
57 .Sh SYNOPSIS
58 .In stdio.h
59 .Ft int
60 .Fn printf "const char *format" ...
61 .Ft int
62 .Fn fprintf "FILE *stream" "const char *format" ...
63 .Ft int
64 .Fn sprintf "char *str" "const char *format" ...
65 .Ft int
66 .Fn snprintf "char *str" "size_t size" "const char *format" ...
67 .Ft int
68 .Fn asprintf "char **ret" "const char *format" ...
69 .In stdarg.h
70 .Ft int
71 .Fn vprintf "const char *format" "va_list ap"
72 .Ft int
73 .Fn vfprintf "FILE *stream" "const char *format" "va_list ap"
74 .Ft int
75 .Fn vsprintf "char *str" "const char *format" "va_list ap"
76 .Ft int
77 .Fn vsnprintf "char *str" "size_t size" "const char *format" "va_list ap"
78 .Ft int
79 .Fn vasprintf "char **ret" "const char *format" "va_list ap"
80 .Sh DESCRIPTION
81 The
82 .Fn printf
83 family of functions produces output according to a
84 .Fa format
85 as described below.
86 The
87 .Fn printf
88 and
89 .Fn vprintf
90 functions
91 write output to
92 .Dv stdout ,
93 the standard output stream;
94 .Fn fprintf
95 and
96 .Fn vfprintf
97 write output to the given output
98 .Fa stream ;
99 .Fn sprintf ,
100 .Fn snprintf ,
101 .Fn vsprintf ,
103 .Fn vsnprintf
104 write to the character string
105 .Fa str ;
107 .Fn asprintf
109 .Fn vasprintf
110 dynamically allocate a new string with
111 .Xr malloc 3 .
113 These functions write the output under the control of a
114 .Fa format
115 string that specifies how subsequent arguments
116 (or arguments accessed via the variable-length argument facilities of
117 .Xr stdarg 3 )
118 are converted for output.
120 These functions return the number of characters printed
121 (not including the trailing
122 .Ql \e0
123 used to end output to strings) or a negative value if an output error occurs,
124 except for
125 .Fn snprintf
127 .Fn vsnprintf ,
128 which return the number of characters that would have been printed if the
129 .Fa size
130 were unlimited
131 (again, not including the final
132 .Ql \e0 ) .
135 .Fn asprintf
137 .Fn vasprintf
138 functions
140 .Fa *ret
141 to be a pointer to a buffer sufficiently large to hold the formatted string.
142 This pointer should be passed to
143 .Xr free 3
144 to release the allocated storage when it is no longer needed.
145 If sufficient space cannot be allocated,
146 .Fn asprintf
148 .Fn vasprintf
149 will return \-1 and set
150 .Fa ret
151 to be a
152 .Dv NULL
153 pointer.
156 .Fn snprintf
158 .Fn vsnprintf
159 functions
160 will write at most
161 .Fa size Ns \-1
162 of the characters printed into the output string
163 (the
164 .Fa size Ns 'th
165 character then gets the terminating
166 .Ql \e0 ) ;
167 if the return value is greater than or equal to the
168 .Fa size
169 argument, the string was too short
170 and some of the printed characters were discarded.
171 The output is always null-terminated.
174 .Fn sprintf
176 .Fn vsprintf
177 functions
178 effectively assume an infinite
179 .Fa size .
181 The format string is composed of zero or more directives:
182 ordinary
183 .\" multibyte
184 characters (not
185 .Cm % ) ,
186 which are copied unchanged to the output stream;
187 and conversion specifications, each of which results
188 in fetching zero or more subsequent arguments.
189 Each conversion specification is introduced by
191 .Cm %
192 character.
193 The arguments must correspond properly (after type promotion)
194 with the conversion specifier.
195 After the
196 .Cm % ,
197 the following appear in sequence:
198 .Bl -bullet
200 An optional field, consisting of a decimal digit string followed by a
201 .Cm $ ,
202 specifying the next argument to access.
203 If this field is not provided, the argument following the last
204 argument accessed will be used.
205 Arguments are numbered starting at
206 .Cm 1 .
207 If unaccessed arguments in the format string are interspersed with ones that
208 are accessed the results will be indeterminate.
210 Zero or more of the following flags:
211 .Bl -tag -width ".So \  Sc (space)"
212 .It Sq Cm #
213 The value should be converted to an
214 .Dq alternate form .
216 .Cm c , d , i , n , p , s ,
218 .Cm u
219 conversions, this option has no effect.
221 .Cm o
222 conversions, the precision of the number is increased to force the first
223 character of the output string to a zero (except if a zero value is printed
224 with an explicit precision of zero).
226 .Cm x
228 .Cm X
229 conversions, a non-zero result has the string
230 .Ql 0x
232 .Ql 0X
234 .Cm X
235 conversions) prepended to it.
237 .Cm e , E , f , F , g ,
239 .Cm G
240 conversions, the result will always contain a decimal point, even if no
241 digits follow it (normally, a decimal point appears in the results of
242 those conversions only if a digit follows).
244 .Cm g
246 .Cm G
247 conversions, trailing zeros are not removed from the result as they
248 would otherwise be.
249 .It So Cm 0 Sc (zero)
250 Zero padding.
251 For all conversions except
252 .Cm n ,
253 the converted value is padded on the left with zeros rather than blanks.
254 If a precision is given with a numeric conversion
255 .Cm ( d , i , o , u , i , x ,
257 .Cm X ) ,
259 .Cm 0
260 flag is ignored.
261 .It Sq Cm \-
262 A negative field width flag;
263 the converted value is to be left adjusted on the field boundary.
264 Except for
265 .Cm n
266 conversions, the converted value is padded on the right with blanks,
267 rather than on the left with blanks or zeros.
269 .Cm \-
270 overrides a
271 .Cm 0
272 if both are given.
273 .It So "\ " Sc (space)
274 A blank should be left before a positive number
275 produced by a signed conversion
276 .Cm ( d , e , E , f , F , g , G ,
278 .Cm i ) .
279 .It Sq Cm +
280 A sign must always be placed before a
281 number produced by a signed conversion.
283 .Cm +
284 overrides a space if both are used.
287 An optional decimal digit string specifying a minimum field width.
288 If the converted value has fewer characters than the field width, it will
289 be padded with spaces on the left (or right, if the left-adjustment
290 flag has been given) to fill out
291 the field width.
293 An optional precision, in the form of a period
294 .Cm \&.
295 followed by an
296 optional digit string.
297 If the digit string is omitted, the precision is taken as zero.
298 This gives the minimum number of digits to appear for
299 .Cm d , i , o , u , x ,
301 .Cm X
302 conversions, the number of digits to appear after the decimal-point for
303 .Cm e , E , f ,
305 .Cm F
306 conversions, the maximum number of significant digits for
307 .Cm g
309 .Cm G
310 conversions, or the maximum number of characters to be printed from a
311 string for
312 .Cm s
313 conversions.
315 An optional length modifier, that specifies the size of the argument.
316 The following length modifiers are valid for the
317 .Cm d , i , n , o , u , x ,
319 .Cm X
320 conversion:
321 .Bl -column ".Cm q Em (deprecated)" ".Vt signed char" ".Vt unsigned long long" ".Vt long long *"
322 .It Sy Modifier Ta Cm d , i Ta Cm o , u , x , X Ta Cm n
323 .It Cm hh Ta Vt "signed char" Ta Vt "unsigned char" Ta Vt "signed char *"
324 .It Cm h Ta Vt short Ta Vt "unsigned short" Ta Vt "short *"
325 .It Cm l No (ell) Ta Vt long Ta Vt "unsigned long" Ta Vt "long *"
326 .It Cm ll No (ell ell) Ta Vt "long long" Ta Vt "unsigned long long" Ta Vt "long long *"
327 .It Cm j Ta Vt intmax_t Ta Vt uintmax_t Ta Vt "intmax_t *"
328 .It Cm t Ta Vt ptrdiff_t Ta (see note) Ta Vt "ptrdiff_t *"
329 .It Cm z Ta (see note) Ta Vt size_t Ta (see note)
330 .It Cm q Em (deprecated) Ta Vt quad_t Ta Vt u_quad_t Ta Vt "quad_t *"
333 Note:
335 .Cm t
336 modifier, when applied to a
337 .Cm o , u , x ,
339 .Cm X
340 conversion, indicates that the argument is of an unsigned type
341 equivalent in size to a
342 .Vt ptrdiff_t .
344 .Cm z
345 modifier, when applied to a
346 .Cm d
348 .Cm i
349 conversion, indicates that the argument is of a signed type equivalent in
350 size to a
351 .Vt size_t .
352 Similarly, when applied to an
353 .Cm n
354 conversion, it indicates that the argument is a pointer to a signed type
355 equivalent in size to a
356 .Vt size_t .
358 The following length modifier is valid for the
359 .Cm e , E , f , F , g ,
361 .Cm G
362 conversion:
363 .Bl -column ".Sy Modifier" ".Cm a , A , e , E , f , F , g , G"
364 .It Sy Modifier Ta Cm e , E , f , F , g , G
365 .It Cm l No (ell) Ta Vt double
366 (ignored, same behavior as without it)
367 .It Cm L Ta Vt "long double"
370 The following length modifier is valid for the
371 .Cm c
373 .Cm s
374 conversion:
375 .Bl -column ".Sy Modifier" ".Vt wint_t" ".Vt wchar_t *"
376 .It Sy Modifier Ta Cm c Ta Cm s
377 .It Cm l No (ell) Ta Vt wint_t Ta Vt "wchar_t *"
380 A character that specifies the type of conversion to be applied.
383 A field width or precision, or both, may be indicated by
384 an asterisk
385 .Ql *
386 or an asterisk followed by one or more decimal digits and a
387 .Ql $
388 instead of a
389 digit string.
390 In this case, an
391 .Vt int
392 argument supplies the field width or precision.
393 A negative field width is treated as a left adjustment flag followed by a
394 positive field width; a negative precision is treated as though it were
395 missing.
396 If a single format directive mixes positional
397 .Pq Li nn$
398 and non-positional arguments, the results are undefined.
400 The conversion specifiers and their meanings are:
401 .Bl -tag -width ".Cm diouxX"
402 .It Cm diouxX
404 .Vt int
405 (or appropriate variant) argument is converted to signed decimal
406 .Cm ( d
408 .Cm i ) ,
409 unsigned octal
410 .Pq Cm o ,
411 unsigned decimal
412 .Pq Cm u ,
413 or unsigned hexadecimal
414 .Cm ( x
416 .Cm X )
417 notation.
418 The letters
419 .Dq Li abcdef
420 are used for
421 .Cm x
422 conversions; the letters
423 .Dq Li ABCDEF
424 are used for
425 .Cm X
426 conversions.
427 The precision, if any, gives the minimum number of digits that must
428 appear; if the converted value requires fewer digits, it is padded on
429 the left with zeros.
430 .It Cm DOU
432 .Vt "long int"
433 argument is converted to signed decimal, unsigned octal, or unsigned
434 decimal, as if the format had been
435 .Cm ld , lo ,
437 .Cm lu
438 respectively.
439 These conversion characters are deprecated, and will eventually disappear.
440 .It Cm eE
442 .Vt double
443 argument is rounded and converted in the style
444 .Sm off
445 .Oo \- Oc Ar d Li \&. Ar ddd Li e \\*[Pm] Ar dd
446 .Sm on
447 where there is one digit before the
448 decimal-point character
449 and the number of digits after it is equal to the precision;
450 if the precision is missing,
451 it is taken as 6; if the precision is
452 zero, no decimal-point character appears.
454 .Cm E
455 conversion uses the letter
456 .Ql E
457 (rather than
458 .Ql e )
459 to introduce the exponent.
460 The exponent always contains at least two digits; if the value is zero,
461 the exponent is 00.
464 .Cm e , E , f , F , g ,
466 .Cm G
467 conversions, positive and negative infinity are represented as
468 .Li inf
470 .Li -inf
471 respectively when using the lowercase conversion character, and
472 .Li INF
474 .Li -INF
475 respectively when using the uppercase conversion character.
476 Similarly, NaN is represented as
477 .Li nan
478 when using the lowercase conversion, and
479 .Li NAN
480 when using the uppercase conversion.
481 .It Cm fF
483 .Vt double
484 argument is rounded and converted to decimal notation in the style
485 .Sm off
486 .Oo \- Oc Ar ddd Li \&. Ar ddd ,
487 .Sm on
488 where the number of digits after the decimal-point character
489 is equal to the precision specification.
490 If the precision is missing, it is taken as 6; if the precision is
491 explicitly zero, no decimal-point character appears.
492 If a decimal point appears, at least one digit appears before it.
493 .It Cm gG
495 .Vt double
496 argument is converted in style
497 .Cm f
499 .Cm e
501 .Cm F
503 .Cm E
505 .Cm G
506 conversions).
507 The precision specifies the number of significant digits.
508 If the precision is missing, 6 digits are given; if the precision is zero,
509 it is treated as 1.
510 Style
511 .Cm e
512 is used if the exponent from its conversion is less than \-4 or greater than
513 or equal to the precision.
514 Trailing zeros are removed from the fractional part of the result; a
515 decimal point appears only if it is followed by at least one digit.
516 .It Cm C
517 Treated as
518 .Cm c
519 with the
520 .Cm l
521 (ell) modifier.
522 .It Cm c
524 .Vt int
525 argument is converted to an
526 .Vt "unsigned char" ,
527 and the resulting character is written.
529 If the
530 .Cm l
531 (ell) modifier is used, the
532 .Vt wint_t
533 argument shall be converted to a
534 .Vt wchar_t ,
535 and the (potentially multi-byte) sequence representing the
536 single wide character is written, including any shift sequences.
537 If a shift sequence is used, the shift state is also restored
538 to the original state after the character.
539 .It Cm S
540 Treated as
541 .Cm s
542 with the
543 .Cm l
544 (ell) modifier.
545 .It Cm s
547 .Vt "char *"
548 argument is expected to be a pointer to an array of character type (pointer
549 to a string).
550 Characters from the array are written up to (but not including)
551 a terminating
552 .Dv NUL
553 character;
554 if a precision is specified, no more than the number specified are
555 written.
556 If a precision is given, no null character
557 need be present; if the precision is not specified, or is greater than
558 the size of the array, the array must contain a terminating
559 .Dv NUL
560 character.
562 If the
563 .Cm l
564 (ell) modifier is used, the
565 .Vt "wchar_t *"
566 argument is expected to be a pointer to an array of wide characters
567 (pointer to a wide string).
568 For each wide character in the string, the (potentially multi-byte)
569 sequence representing the
570 wide character is written, including any shift sequences.
571 If any shift sequence is used, the shift state is also restored
572 to the original state after the string.
573 Wide characters from the array are written up to (but not including)
574 a terminating wide
575 .Dv NUL
576 character;
577 if a precision is specified, no more than the number of bytes specified are
578 written (including shift sequences).
579 Partial characters are never written.
580 If a precision is given, no null character
581 need be present; if the precision is not specified, or is greater than
582 the number of bytes required to render the multibyte representation of
583 the string, the array must contain a terminating wide
584 .Dv NUL
585 character.
586 .It Cm p
588 .Vt "void *"
589 pointer argument is printed in hexadecimal (as if by
590 .Ql %#x
592 .Ql %#lx ) .
593 .It Cm n
594 The number of characters written so far is stored into the
595 integer indicated by the
596 .Vt "int *"
597 (or variant) pointer argument.
598 No argument is converted.
599 .It Cm %
601 .Ql %
602 is written.
603 No argument is converted.
604 The complete conversion specification
606 .Ql %% .
609 The decimal point
610 character is defined in the program's locale (category
611 .Dv LC_NUMERIC ) .
613 In no case does a non-existent or small field width cause truncation of
614 a numeric field; if the result of a conversion is wider than the field
615 width, the
616 field is expanded to contain the conversion result.
617 .Sh EXAMPLES
618 To print a date and time in the form
619 .Dq Li "Sunday, July 3, 10:02" ,
620 where
621 .Fa weekday
623 .Fa month
624 are pointers to strings:
625 .Bd -literal -offset indent
626 #include <stdio.h>
627 fprintf(stdout, "%s, %s %d, %.2d:%.2d\en",
628         weekday, month, day, hour, min);
631 To print \*(Pi
632 to five decimal places:
633 .Bd -literal -offset indent
634 #include <math.h>
635 #include <stdio.h>
636 fprintf(stdout, "pi = %.5f\en", 4 * atan(1.0));
639 To allocate a 128 byte string and print into it:
640 .Bd -literal -offset indent
641 #include <stdio.h>
642 #include <stdlib.h>
643 #include <stdarg.h>
644 char *newfmt(const char *fmt, ...)
646         char *p;
647         va_list ap;
648         if ((p = malloc(128)) == NULL)
649                 return (NULL);
650         va_start(ap, fmt);
651         (void) vsnprintf(p, 128, fmt, ap);
652         va_end(ap);
653         return (p);
656 .Sh SECURITY CONSIDERATIONS
658 .Fn sprintf
660 .Fn vsprintf
661 functions are easily misused in a manner which enables malicious users
662 to arbitrarily change a running program's functionality through
663 a buffer overflow attack.
664 Because
665 .Fn sprintf
667 .Fn vsprintf
668 assume an infinitely long string,
669 callers must be careful not to overflow the actual space;
670 this is often hard to assure.
671 For safety, programmers should use the
672 .Fn snprintf
673 interface instead.
674 For example:
675 .Bd -literal
676 void
677 foo(const char *arbitrary_string, const char *and_another)
679         char onstack[8];
681 #ifdef BAD
682         /*
683          * This first sprintf is bad behavior.  Do not use sprintf!
684          */
685         sprintf(onstack, "%s, %s", arbitrary_string, and_another);
686 #else
687         /*
688          * The following two lines demonstrate better use of
689          * snprintf().
690          */
691         snprintf(onstack, sizeof(onstack), "%s, %s", arbitrary_string,
692             and_another);
693 #endif
698 .Fn printf
700 .Fn sprintf
701 family of functions are also easily misused in a manner
702 allowing malicious users to arbitrarily change a running program's
703 functionality by either causing the program
704 to print potentially sensitive data
705 .Dq "left on the stack" ,
706 or causing it to generate a memory fault or bus error
707 by dereferencing an invalid pointer.
709 .Cm %n
710 can be used to write arbitrary data to potentially carefully-selected
711 addresses.
712 Programmers are therefore strongly advised to never pass untrusted strings
713 as the
714 .Fa format
715 argument, as an attacker can put format specifiers in the string
716 to mangle your stack,
717 leading to a possible security hole.
718 This holds true even if the string was built using a function like
719 .Fn snprintf ,
720 as the resulting string may still contain user-supplied conversion specifiers
721 for later interpolation by
722 .Fn printf .
724 Always use the proper secure idiom:
726 .Dl "snprintf(buffer, sizeof(buffer), \*q%s\*q, string);"
727 .Sh ERRORS
728 In addition to the errors documented for the
729 .Xr write 2
730 system call, the
731 .Fn printf
732 family of functions may fail if:
733 .Bl -tag -width Er
734 .It Bq Er EILSEQ
735 An invalid wide character code was encountered.
736 .It Bq Er ENOMEM
737 Insufficient storage space is available.
739 .Sh SEE ALSO
740 .Xr printf 1 ,
741 .Xr fmtcheck 3 ,
742 .Xr scanf 3 ,
743 .Xr setlocale 3 ,
744 .Xr wprintf 3
745 .Sh STANDARDS
746 Subject to the caveats noted in the
747 .Sx BUGS
748 section below, the
749 .Fn fprintf ,
750 .Fn printf ,
751 .Fn sprintf ,
752 .Fn vprintf ,
753 .Fn vfprintf ,
755 .Fn vsprintf
756 functions
757 conform to
758 .St -ansiC
760 .St -isoC-99 .
761 With the same reservation, the
762 .Fn snprintf
764 .Fn vsnprintf
765 functions conform to
766 .St -isoC-99 .
767 .Sh HISTORY
768 The functions
769 .Fn asprintf
771 .Fn vasprintf
772 first appeared in the
773 .Tn GNU C
774 library.
775 These were implemented by
776 .An Peter Wemm Aq peter@FreeBSD.org
778 .Fx 2.2 ,
779 but were later replaced with a different implementation
780 from
781 .An Todd C. Miller Aq Todd.Miller@courtesan.com
783 .Ox 2.3 .
784 .Sh BUGS
785 The conversion formats
786 .Cm \&%D , \&%O ,
788 .Cm %U
789 are not standard and
790 are provided only for backward compatibility.
791 The effect of padding the
792 .Cm %p
793 format with zeros (either by the
794 .Cm 0
795 flag or by specifying a precision), and the benign effect (i.e., none)
796 of the
797 .Cm #
798 flag on
799 .Cm %n
801 .Cm %p
802 conversions, as well as other
803 nonsensical combinations such as
804 .Cm %Ld ,
805 are not standard; such combinations
806 should be avoided.
810 family of functions do not correctly handle multibyte characters in the
811 .Fa format
812 argument.