I got the relative magnitudes of the timeout increases reversed, so
[python.git] / Doc / tutorial / inputoutput.rst
blob0259749ee21c4b50065edf48bd52a591fb1cf6d4
1 .. _tut-io:
3 ****************
4 Input and Output
5 ****************
7 There are several ways to present the output of a program; data can be printed
8 in a human-readable form, or written to a file for future use. This chapter will
9 discuss some of the possibilities.
12 .. _tut-formatting:
14 Fancier Output Formatting
15 =========================
17 So far we've encountered two ways of writing values: *expression statements* and
18 the :keyword:`print` statement.  (A third way is using the :meth:`write` method
19 of file objects; the standard output file can be referenced as ``sys.stdout``.
20 See the Library Reference for more information on this.)
22 .. index:: module: string
24 Often you'll want more control over the formatting of your output than simply
25 printing space-separated values.  There are two ways to format your output; the
26 first way is to do all the string handling yourself; using string slicing and
27 concatenation operations you can create any layout you can imagine.  The
28 standard module :mod:`string` contains some useful operations for padding
29 strings to a given column width; these will be discussed shortly.  The second
30 way is to use the :meth:`str.format` method.
32 One question remains, of course: how do you convert values to strings? Luckily,
33 Python has ways to convert any value to a string: pass it to the :func:`repr`
34 or :func:`str` functions.
36 The :func:`str` function is meant to return representations of values which are
37 fairly human-readable, while :func:`repr` is meant to generate representations
38 which can be read by the interpreter (or will force a :exc:`SyntaxError` if
39 there is not equivalent syntax).  For objects which don't have a particular
40 representation for human consumption, :func:`str` will return the same value as
41 :func:`repr`.  Many values, such as numbers or structures like lists and
42 dictionaries, have the same representation using either function.  Strings and
43 floating point numbers, in particular, have two distinct representations.
45 Some examples::
47    >>> s = 'Hello, world.'
48    >>> str(s)
49    'Hello, world.'
50    >>> repr(s)
51    "'Hello, world.'"
52    >>> str(0.1)
53    '0.1'
54    >>> repr(0.1)
55    '0.10000000000000001'
56    >>> x = 10 * 3.25
57    >>> y = 200 * 200
58    >>> s = 'The value of x is ' + repr(x) + ', and y is ' + repr(y) + '...'
59    >>> print s
60    The value of x is 32.5, and y is 40000...
61    >>> # The repr() of a string adds string quotes and backslashes:
62    ... hello = 'hello, world\n'
63    >>> hellos = repr(hello)
64    >>> print hellos
65    'hello, world\n'
66    >>> # The argument to repr() may be any Python object:
67    ... repr((x, y, ('spam', 'eggs')))
68    "(32.5, 40000, ('spam', 'eggs'))"
70 Here are two ways to write a table of squares and cubes::
72    >>> for x in range(1, 11):
73    ...     print repr(x).rjust(2), repr(x*x).rjust(3),
74    ...     # Note trailing comma on previous line
75    ...     print repr(x*x*x).rjust(4)
76    ...
77     1   1    1
78     2   4    8
79     3   9   27
80     4  16   64
81     5  25  125
82     6  36  216
83     7  49  343
84     8  64  512
85     9  81  729
86    10 100 1000
88    >>> for x in range(1,11):
89    ...     print '{0:2d} {1:3d} {2:4d}'.format(x, x*x, x*x*x)
90    ...
91     1   1    1
92     2   4    8
93     3   9   27
94     4  16   64
95     5  25  125
96     6  36  216
97     7  49  343
98     8  64  512
99     9  81  729
100    10 100 1000
102 (Note that in the first example, one space between each column was added by the
103 way :keyword:`print` works: it always adds spaces between its arguments.)
105 This example demonstrates the :meth:`rjust` method of string objects, which
106 right-justifies a string in a field of a given width by padding it with spaces
107 on the left.  There are similar methods :meth:`ljust` and :meth:`center`.  These
108 methods do not write anything, they just return a new string.  If the input
109 string is too long, they don't truncate it, but return it unchanged; this will
110 mess up your column lay-out but that's usually better than the alternative,
111 which would be lying about a value.  (If you really want truncation you can
112 always add a slice operation, as in ``x.ljust(n)[:n]``.)
114 There is another method, :meth:`zfill`, which pads a numeric string on the left
115 with zeros.  It understands about plus and minus signs::
117    >>> '12'.zfill(5)
118    '00012'
119    >>> '-3.14'.zfill(7)
120    '-003.14'
121    >>> '3.14159265359'.zfill(5)
122    '3.14159265359'
124 Basic usage of the :meth:`str.format` method looks like this::
126    >>> print 'We are the {} who say "{}!"'.format('knights', 'Ni')
127    We are the knights who say "Ni!"
129 The brackets and characters within them (called format fields) are replaced with
130 the objects passed into the :meth:`~str.format` method.  A number in the
131 brackets refers to the position of the object passed into the
132 :meth:`~str.format` method. ::
134    >>> print '{0} and {1}'.format('spam', 'eggs')
135    spam and eggs
136    >>> print '{1} and {0}'.format('spam', 'eggs')
137    eggs and spam
139 If keyword arguments are used in the :meth:`~str.format` method, their values
140 are referred to by using the name of the argument. ::
142    >>> print 'This {food} is {adjective}.'.format(
143    ...       food='spam', adjective='absolutely horrible')
144    This spam is absolutely horrible.
146 Positional and keyword arguments can be arbitrarily combined::
148    >>> print 'The story of {0}, {1}, and {other}.'.format('Bill', 'Manfred',
149    ...                                                    other='Georg')
150    The story of Bill, Manfred, and Georg.
152 ``'!s'`` (apply :func:`str`) and ``'!r'`` (apply :func:`repr`) can be used to
153 convert the value before it is formatted. ::
155    >>> import math
156    >>> print 'The value of PI is approximately {}.'.format(math.pi)
157    The value of PI is approximately 3.14159265359.
158    >>> print 'The value of PI is approximately {!r}.'.format(math.pi)
159    The value of PI is approximately 3.141592653589793.
161 An optional ``':'`` and format specifier can follow the field name. This allows
162 greater control over how the value is formatted.  The following example
163 truncates Pi to three places after the decimal.
165    >>> import math
166    >>> print 'The value of PI is approximately {0:.3f}.'.format(math.pi)
167    The value of PI is approximately 3.142.
169 Passing an integer after the ``':'`` will cause that field to be a minimum
170 number of characters wide.  This is useful for making tables pretty. ::
172    >>> table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 7678}
173    >>> for name, phone in table.items():
174    ...     print '{0:10} ==> {1:10d}'.format(name, phone)
175    ...
176    Jack       ==>       4098
177    Dcab       ==>       7678
178    Sjoerd     ==>       4127
180 If you have a really long format string that you don't want to split up, it
181 would be nice if you could reference the variables to be formatted by name
182 instead of by position.  This can be done by simply passing the dict and using
183 square brackets ``'[]'`` to access the keys ::
185    >>> table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 8637678}
186    >>> print ('Jack: {0[Jack]:d}; Sjoerd: {0[Sjoerd]:d}; '
187    ...        'Dcab: {0[Dcab]:d}'.format(table))
188    Jack: 4098; Sjoerd: 4127; Dcab: 8637678
190 This could also be done by passing the table as keyword arguments with the '**'
191 notation. ::
193    >>> table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 8637678}
194    >>> print 'Jack: {Jack:d}; Sjoerd: {Sjoerd:d}; Dcab: {Dcab:d}'.format(**table)
195    Jack: 4098; Sjoerd: 4127; Dcab: 8637678
197 This is particularly useful in combination with the new built-in :func:`vars`
198 function, which returns a dictionary containing all local variables.
200 For a complete overview of string formatting with :meth:`str.format`, see
201 :ref:`formatstrings`.
204 Old string formatting
205 ---------------------
207 The ``%`` operator can also be used for string formatting. It interprets the
208 left argument much like a :cfunc:`sprintf`\ -style format string to be applied
209 to the right argument, and returns the string resulting from this formatting
210 operation. For example::
212    >>> import math
213    >>> print 'The value of PI is approximately %5.3f.' % math.pi
214    The value of PI is approximately 3.142.
216 Since :meth:`str.format` is quite new, a lot of Python code still uses the ``%``
217 operator. However, because this old style of formatting will eventually be
218 removed from the language, :meth:`str.format` should generally be used.
220 More information can be found in the :ref:`string-formatting` section.
223 .. _tut-files:
225 Reading and Writing Files
226 =========================
228 .. index::
229    builtin: open
230    object: file
232 :func:`open` returns a file object, and is most commonly used with two
233 arguments: ``open(filename, mode)``.
237    >>> f = open('/tmp/workfile', 'w')
238    >>> print f
239    <open file '/tmp/workfile', mode 'w' at 80a0960>
241 The first argument is a string containing the filename.  The second argument is
242 another string containing a few characters describing the way in which the file
243 will be used.  *mode* can be ``'r'`` when the file will only be read, ``'w'``
244 for only writing (an existing file with the same name will be erased), and
245 ``'a'`` opens the file for appending; any data written to the file is
246 automatically added to the end.  ``'r+'`` opens the file for both reading and
247 writing. The *mode* argument is optional; ``'r'`` will be assumed if it's
248 omitted.
250 On Windows, ``'b'`` appended to the mode opens the file in binary mode, so there
251 are also modes like ``'rb'``, ``'wb'``, and ``'r+b'``.  Python on Windows makes
252 a distinction between text and binary files; the end-of-line characters in text
253 files are automatically altered slightly when data is read or written.  This
254 behind-the-scenes modification to file data is fine for ASCII text files, but
255 it'll corrupt binary data like that in :file:`JPEG` or :file:`EXE` files.  Be
256 very careful to use binary mode when reading and writing such files.  On Unix,
257 it doesn't hurt to append a ``'b'`` to the mode, so you can use it
258 platform-independently for all binary files.
261 .. _tut-filemethods:
263 Methods of File Objects
264 -----------------------
266 The rest of the examples in this section will assume that a file object called
267 ``f`` has already been created.
269 To read a file's contents, call ``f.read(size)``, which reads some quantity of
270 data and returns it as a string.  *size* is an optional numeric argument.  When
271 *size* is omitted or negative, the entire contents of the file will be read and
272 returned; it's your problem if the file is twice as large as your machine's
273 memory. Otherwise, at most *size* bytes are read and returned.  If the end of
274 the file has been reached, ``f.read()`` will return an empty string (``""``).
277    >>> f.read()
278    'This is the entire file.\n'
279    >>> f.read()
280    ''
282 ``f.readline()`` reads a single line from the file; a newline character (``\n``)
283 is left at the end of the string, and is only omitted on the last line of the
284 file if the file doesn't end in a newline.  This makes the return value
285 unambiguous; if ``f.readline()`` returns an empty string, the end of the file
286 has been reached, while a blank line is represented by ``'\n'``, a string
287 containing only a single newline.   ::
289    >>> f.readline()
290    'This is the first line of the file.\n'
291    >>> f.readline()
292    'Second line of the file\n'
293    >>> f.readline()
294    ''
296 ``f.readlines()`` returns a list containing all the lines of data in the file.
297 If given an optional parameter *sizehint*, it reads that many bytes from the
298 file and enough more to complete a line, and returns the lines from that.  This
299 is often used to allow efficient reading of a large file by lines, but without
300 having to load the entire file in memory.  Only complete lines will be returned.
303    >>> f.readlines()
304    ['This is the first line of the file.\n', 'Second line of the file\n']
306 An alternative approach to reading lines is to loop over the file object. This is
307 memory efficient, fast, and leads to simpler code::
309    >>> for line in f:
310            print line,
312    This is the first line of the file.
313    Second line of the file
315 The alternative approach is simpler but does not provide as fine-grained
316 control.  Since the two approaches manage line buffering differently, they
317 should not be mixed.
319 ``f.write(string)`` writes the contents of *string* to the file, returning
320 ``None``.   ::
322    >>> f.write('This is a test\n')
324 To write something other than a string, it needs to be converted to a string
325 first::
327    >>> value = ('the answer', 42)
328    >>> s = str(value)
329    >>> f.write(s)
331 ``f.tell()`` returns an integer giving the file object's current position in the
332 file, measured in bytes from the beginning of the file.  To change the file
333 object's position, use ``f.seek(offset, from_what)``.  The position is computed
334 from adding *offset* to a reference point; the reference point is selected by
335 the *from_what* argument.  A *from_what* value of 0 measures from the beginning
336 of the file, 1 uses the current file position, and 2 uses the end of the file as
337 the reference point.  *from_what* can be omitted and defaults to 0, using the
338 beginning of the file as the reference point. ::
340    >>> f = open('/tmp/workfile', 'r+')
341    >>> f.write('0123456789abcdef')
342    >>> f.seek(5)     # Go to the 6th byte in the file
343    >>> f.read(1)
344    '5'
345    >>> f.seek(-3, 2) # Go to the 3rd byte before the end
346    >>> f.read(1)
347    'd'
349 When you're done with a file, call ``f.close()`` to close it and free up any
350 system resources taken up by the open file.  After calling ``f.close()``,
351 attempts to use the file object will automatically fail. ::
353    >>> f.close()
354    >>> f.read()
355    Traceback (most recent call last):
356      File "<stdin>", line 1, in ?
357    ValueError: I/O operation on closed file
359 It is good practice to use the :keyword:`with` keyword when dealing with file
360 objects.  This has the advantage that the file is properly closed after its
361 suite finishes, even if an exception is raised on the way.  It is also much
362 shorter than writing equivalent :keyword:`try`\ -\ :keyword:`finally` blocks::
364     >>> with open('/tmp/workfile', 'r') as f:
365     ...     read_data = f.read()
366     >>> f.closed
367     True
369 File objects have some additional methods, such as :meth:`~file.isatty` and
370 :meth:`~file.truncate` which are less frequently used; consult the Library
371 Reference for a complete guide to file objects.
374 .. _tut-pickle:
376 The :mod:`pickle` Module
377 ------------------------
379 .. index:: module: pickle
381 Strings can easily be written to and read from a file. Numbers take a bit more
382 effort, since the :meth:`read` method only returns strings, which will have to
383 be passed to a function like :func:`int`, which takes a string like ``'123'``
384 and returns its numeric value 123.  However, when you want to save more complex
385 data types like lists, dictionaries, or class instances, things get a lot more
386 complicated.
388 Rather than have users be constantly writing and debugging code to save
389 complicated data types, Python provides a standard module called :mod:`pickle`.
390 This is an amazing module that can take almost any Python object (even some
391 forms of Python code!), and convert it to a string representation; this process
392 is called :dfn:`pickling`.  Reconstructing the object from the string
393 representation is called :dfn:`unpickling`.  Between pickling and unpickling,
394 the string representing the object may have been stored in a file or data, or
395 sent over a network connection to some distant machine.
397 If you have an object ``x``, and a file object ``f`` that's been opened for
398 writing, the simplest way to pickle the object takes only one line of code::
400    pickle.dump(x, f)
402 To unpickle the object again, if ``f`` is a file object which has been opened
403 for reading::
405    x = pickle.load(f)
407 (There are other variants of this, used when pickling many objects or when you
408 don't want to write the pickled data to a file; consult the complete
409 documentation for :mod:`pickle` in the Python Library Reference.)
411 :mod:`pickle` is the standard way to make Python objects which can be stored and
412 reused by other programs or by a future invocation of the same program; the
413 technical term for this is a :dfn:`persistent` object.  Because :mod:`pickle` is
414 so widely used, many authors who write Python extensions take care to ensure
415 that new data types such as matrices can be properly pickled and unpickled.