Add NEWS entry as per RDM's suggestion (the bug was actually present
[python.git] / Doc / library / socketserver.rst
blobfce216e88ad8d90fe5b1b43f9f43c06a08f92e0a
2 :mod:`SocketServer` --- A framework for network servers
3 =======================================================
5 .. module:: SocketServer
6    :synopsis: A framework for network servers.
8 .. note::
10    The :mod:`SocketServer` module has been renamed to :mod:`socketserver` in
11    Python 3.0.  The :term:`2to3` tool will automatically adapt imports when
12    converting your sources to 3.0.
15 The :mod:`SocketServer` module simplifies the task of writing network servers.
17 There are four basic server classes: :class:`TCPServer` uses the Internet TCP
18 protocol, which provides for continuous streams of data between the client and
19 server.  :class:`UDPServer` uses datagrams, which are discrete packets of
20 information that may arrive out of order or be lost while in transit.  The more
21 infrequently used :class:`UnixStreamServer` and :class:`UnixDatagramServer`
22 classes are similar, but use Unix domain sockets; they're not available on
23 non-Unix platforms.  For more details on network programming, consult a book
24 such as
25 W. Richard Steven's UNIX Network Programming or Ralph Davis's Win32 Network
26 Programming.
28 These four classes process requests :dfn:`synchronously`; each request must be
29 completed before the next request can be started.  This isn't suitable if each
30 request takes a long time to complete, because it requires a lot of computation,
31 or because it returns a lot of data which the client is slow to process.  The
32 solution is to create a separate process or thread to handle each request; the
33 :class:`ForkingMixIn` and :class:`ThreadingMixIn` mix-in classes can be used to
34 support asynchronous behaviour.
36 Creating a server requires several steps.  First, you must create a request
37 handler class by subclassing the :class:`BaseRequestHandler` class and
38 overriding its :meth:`handle` method; this method will process incoming
39 requests.  Second, you must instantiate one of the server classes, passing it
40 the server's address and the request handler class.  Finally, call the
41 :meth:`handle_request` or :meth:`serve_forever` method of the server object to
42 process one or many requests.
44 When inheriting from :class:`ThreadingMixIn` for threaded connection behavior,
45 you should explicitly declare how you want your threads to behave on an abrupt
46 shutdown. The :class:`ThreadingMixIn` class defines an attribute
47 *daemon_threads*, which indicates whether or not the server should wait for
48 thread termination. You should set the flag explicitly if you would like threads
49 to behave autonomously; the default is :const:`False`, meaning that Python will
50 not exit until all threads created by :class:`ThreadingMixIn` have exited.
52 Server classes have the same external methods and attributes, no matter what
53 network protocol they use.
56 Server Creation Notes
57 ---------------------
59 There are five classes in an inheritance diagram, four of which represent
60 synchronous servers of four types::
62    +------------+
63    | BaseServer |
64    +------------+
65          |
66          v
67    +-----------+        +------------------+
68    | TCPServer |------->| UnixStreamServer |
69    +-----------+        +------------------+
70          |
71          v
72    +-----------+        +--------------------+
73    | UDPServer |------->| UnixDatagramServer |
74    +-----------+        +--------------------+
76 Note that :class:`UnixDatagramServer` derives from :class:`UDPServer`, not from
77 :class:`UnixStreamServer` --- the only difference between an IP and a Unix
78 stream server is the address family, which is simply repeated in both Unix
79 server classes.
81 Forking and threading versions of each type of server can be created using the
82 :class:`ForkingMixIn` and :class:`ThreadingMixIn` mix-in classes.  For instance,
83 a threading UDP server class is created as follows::
85    class ThreadingUDPServer(ThreadingMixIn, UDPServer): pass
87 The mix-in class must come first, since it overrides a method defined in
88 :class:`UDPServer`.  Setting the various member variables also changes the
89 behavior of the underlying server mechanism.
91 To implement a service, you must derive a class from :class:`BaseRequestHandler`
92 and redefine its :meth:`handle` method.  You can then run various versions of
93 the service by combining one of the server classes with your request handler
94 class.  The request handler class must be different for datagram or stream
95 services.  This can be hidden by using the handler subclasses
96 :class:`StreamRequestHandler` or :class:`DatagramRequestHandler`.
98 Of course, you still have to use your head!  For instance, it makes no sense to
99 use a forking server if the service contains state in memory that can be
100 modified by different requests, since the modifications in the child process
101 would never reach the initial state kept in the parent process and passed to
102 each child.  In this case, you can use a threading server, but you will probably
103 have to use locks to protect the integrity of the shared data.
105 On the other hand, if you are building an HTTP server where all data is stored
106 externally (for instance, in the file system), a synchronous class will
107 essentially render the service "deaf" while one request is being handled --
108 which may be for a very long time if a client is slow to receive all the data it
109 has requested.  Here a threading or forking server is appropriate.
111 In some cases, it may be appropriate to process part of a request synchronously,
112 but to finish processing in a forked child depending on the request data.  This
113 can be implemented by using a synchronous server and doing an explicit fork in
114 the request handler class :meth:`handle` method.
116 Another approach to handling multiple simultaneous requests in an environment
117 that supports neither threads nor :func:`fork` (or where these are too expensive
118 or inappropriate for the service) is to maintain an explicit table of partially
119 finished requests and to use :func:`select` to decide which request to work on
120 next (or whether to handle a new incoming request).  This is particularly
121 important for stream services where each client can potentially be connected for
122 a long time (if threads or subprocesses cannot be used). See :mod:`asyncore` for
123 another way to manage this.
125 .. XXX should data and methods be intermingled, or separate?
126    how should the distinction between class and instance variables be drawn?
129 Server Objects
130 --------------
132 .. class:: BaseServer
134    This is the superclass of all Server objects in the module.  It defines the
135    interface, given below, but does not implement most of the methods, which is
136    done in subclasses.
139 .. method:: BaseServer.fileno()
141    Return an integer file descriptor for the socket on which the server is
142    listening.  This function is most commonly passed to :func:`select.select`, to
143    allow monitoring multiple servers in the same process.
146 .. method:: BaseServer.handle_request()
148    Process a single request.  This function calls the following methods in
149    order: :meth:`get_request`, :meth:`verify_request`, and
150    :meth:`process_request`.  If the user-provided :meth:`handle` method of the
151    handler class raises an exception, the server's :meth:`handle_error` method
152    will be called.  If no request is received within :attr:`self.timeout`
153    seconds, :meth:`handle_timeout` will be called and :meth:`handle_request`
154    will return.
157 .. method:: BaseServer.serve_forever(poll_interval=0.5)
159    Handle requests until an explicit :meth:`shutdown` request.  Polls for
160    shutdown every *poll_interval* seconds.
163 .. method:: BaseServer.shutdown()
165    Tells the :meth:`serve_forever` loop to stop and waits until it does.
167    .. versionadded:: 2.6
170 .. attribute:: BaseServer.address_family
172    The family of protocols to which the server's socket belongs.
173    Common examples are :const:`socket.AF_INET` and :const:`socket.AF_UNIX`.
176 .. attribute:: BaseServer.RequestHandlerClass
178    The user-provided request handler class; an instance of this class is created
179    for each request.
182 .. attribute:: BaseServer.server_address
184    The address on which the server is listening.  The format of addresses varies
185    depending on the protocol family; see the documentation for the socket module
186    for details.  For Internet protocols, this is a tuple containing a string giving
187    the address, and an integer port number: ``('127.0.0.1', 80)``, for example.
190 .. attribute:: BaseServer.socket
192    The socket object on which the server will listen for incoming requests.
195 The server classes support the following class variables:
197 .. XXX should class variables be covered before instance variables, or vice versa?
199 .. attribute:: BaseServer.allow_reuse_address
201    Whether the server will allow the reuse of an address. This defaults to
202    :const:`False`, and can be set in subclasses to change the policy.
205 .. attribute:: BaseServer.request_queue_size
207    The size of the request queue.  If it takes a long time to process a single
208    request, any requests that arrive while the server is busy are placed into a
209    queue, up to :attr:`request_queue_size` requests.  Once the queue is full,
210    further requests from clients will get a "Connection denied" error.  The default
211    value is usually 5, but this can be overridden by subclasses.
214 .. attribute:: BaseServer.socket_type
216    The type of socket used by the server; :const:`socket.SOCK_STREAM` and
217    :const:`socket.SOCK_DGRAM` are two common values.
220 .. attribute:: BaseServer.timeout
222    Timeout duration, measured in seconds, or :const:`None` if no timeout is
223    desired.  If :meth:`handle_request` receives no incoming requests within the
224    timeout period, the :meth:`handle_timeout` method is called.
226 There are various server methods that can be overridden by subclasses of base
227 server classes like :class:`TCPServer`; these methods aren't useful to external
228 users of the server object.
230 .. XXX should the default implementations of these be documented, or should
231    it be assumed that the user will look at SocketServer.py?
233 .. method:: BaseServer.finish_request()
235    Actually processes the request by instantiating :attr:`RequestHandlerClass` and
236    calling its :meth:`handle` method.
239 .. method:: BaseServer.get_request()
241    Must accept a request from the socket, and return a 2-tuple containing the *new*
242    socket object to be used to communicate with the client, and the client's
243    address.
246 .. method:: BaseServer.handle_error(request, client_address)
248    This function is called if the :attr:`RequestHandlerClass`'s :meth:`handle`
249    method raises an exception.  The default action is to print the traceback to
250    standard output and continue handling further requests.
253 .. method:: BaseServer.handle_timeout()
255    This function is called when the :attr:`timeout` attribute has been set to a
256    value other than :const:`None` and the timeout period has passed with no
257    requests being received.  The default action for forking servers is
258    to collect the status of any child processes that have exited, while
259    in threading servers this method does nothing.
262 .. method:: BaseServer.process_request(request, client_address)
264    Calls :meth:`finish_request` to create an instance of the
265    :attr:`RequestHandlerClass`.  If desired, this function can create a new process
266    or thread to handle the request; the :class:`ForkingMixIn` and
267    :class:`ThreadingMixIn` classes do this.
270 .. Is there any point in documenting the following two functions?
271    What would the purpose of overriding them be: initializing server
272    instance variables, adding new network families?
274 .. method:: BaseServer.server_activate()
276    Called by the server's constructor to activate the server.  The default behavior
277    just :meth:`listen`\ s to the server's socket. May be overridden.
280 .. method:: BaseServer.server_bind()
282    Called by the server's constructor to bind the socket to the desired address.
283    May be overridden.
286 .. method:: BaseServer.verify_request(request, client_address)
288    Must return a Boolean value; if the value is :const:`True`, the request will be
289    processed, and if it's :const:`False`, the request will be denied. This function
290    can be overridden to implement access controls for a server. The default
291    implementation always returns :const:`True`.
294 RequestHandler Objects
295 ----------------------
297 The request handler class must define a new :meth:`handle` method, and can
298 override any of the following methods.  A new instance is created for each
299 request.
302 .. method:: RequestHandler.finish()
304    Called after the :meth:`handle` method to perform any clean-up actions
305    required.  The default implementation does nothing.  If :meth:`setup` or
306    :meth:`handle` raise an exception, this function will not be called.
309 .. method:: RequestHandler.handle()
311    This function must do all the work required to service a request.  The
312    default implementation does nothing.  Several instance attributes are
313    available to it; the request is available as :attr:`self.request`; the client
314    address as :attr:`self.client_address`; and the server instance as
315    :attr:`self.server`, in case it needs access to per-server information.
317    The type of :attr:`self.request` is different for datagram or stream
318    services.  For stream services, :attr:`self.request` is a socket object; for
319    datagram services, :attr:`self.request` is a pair of string and socket.
320    However, this can be hidden by using the request handler subclasses
321    :class:`StreamRequestHandler` or :class:`DatagramRequestHandler`, which
322    override the :meth:`setup` and :meth:`finish` methods, and provide
323    :attr:`self.rfile` and :attr:`self.wfile` attributes.  :attr:`self.rfile` and
324    :attr:`self.wfile` can be read or written, respectively, to get the request
325    data or return data to the client.
328 .. method:: RequestHandler.setup()
330    Called before the :meth:`handle` method to perform any initialization actions
331    required.  The default implementation does nothing.
334 Examples
335 --------
337 :class:`SocketServer.TCPServer` Example
338 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
340 This is the server side::
342    import SocketServer
344    class MyTCPHandler(SocketServer.BaseRequestHandler):
345        """
346        The RequestHandler class for our server.
348        It is instantiated once per connection to the server, and must
349        override the handle() method to implement communication to the
350        client.
351        """
353        def handle(self):
354            # self.request is the TCP socket connected to the client
355            self.data = self.request.recv(1024).strip()
356            print "%s wrote:" % self.client_address[0]
357            print self.data
358            # just send back the same data, but upper-cased
359            self.request.send(self.data.upper())
361    if __name__ == "__main__":
362        HOST, PORT = "localhost", 9999
364        # Create the server, binding to localhost on port 9999
365        server = SocketServer.TCPServer((HOST, PORT), MyTCPHandler)
367        # Activate the server; this will keep running until you
368        # interrupt the program with Ctrl-C
369        server.serve_forever()
371 An alternative request handler class that makes use of streams (file-like
372 objects that simplify communication by providing the standard file interface)::
374    class MyTCPHandler(SocketServer.StreamRequestHandler):
376        def handle(self):
377            # self.rfile is a file-like object created by the handler;
378            # we can now use e.g. readline() instead of raw recv() calls
379            self.data = self.rfile.readline().strip()
380            print "%s wrote:" % self.client_address[0]
381            print self.data
382            # Likewise, self.wfile is a file-like object used to write back
383            # to the client
384            self.wfile.write(self.data.upper())
386 The difference is that the ``readline()`` call in the second handler will call
387 ``recv()`` multiple times until it encounters a newline character, while the
388 single ``recv()`` call in the first handler will just return what has been sent
389 from the client in one ``send()`` call.
392 This is the client side::
394    import socket
395    import sys
397    HOST, PORT = "localhost", 9999
398    data = " ".join(sys.argv[1:])
400    # Create a socket (SOCK_STREAM means a TCP socket)
401    sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
403    # Connect to server and send data
404    sock.connect((HOST, PORT))
405    sock.send(data + "\n")
407    # Receive data from the server and shut down
408    received = sock.recv(1024)
409    sock.close()
411    print "Sent:     %s" % data
412    print "Received: %s" % received
415 The output of the example should look something like this:
417 Server::
419    $ python TCPServer.py
420    127.0.0.1 wrote:
421    hello world with TCP
422    127.0.0.1 wrote:
423    python is nice
425 Client::
427    $ python TCPClient.py hello world with TCP
428    Sent:     hello world with TCP
429    Received: HELLO WORLD WITH TCP
430    $ python TCPClient.py python is nice
431    Sent:     python is nice
432    Received: PYTHON IS NICE
435 :class:`SocketServer.UDPServer` Example
436 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
438 This is the server side::
440    import SocketServer
442    class MyUDPHandler(SocketServer.BaseRequestHandler):
443        """
444        This class works similar to the TCP handler class, except that
445        self.request consists of a pair of data and client socket, and since
446        there is no connection the client address must be given explicitly
447        when sending data back via sendto().
448        """
450        def handle(self):
451            data = self.request[0].strip()
452            socket = self.request[1]
453            print "%s wrote:" % self.client_address[0]
454            print data
455            socket.sendto(data.upper(), self.client_address)
457    if __name__ == "__main__":
458        HOST, PORT = "localhost", 9999
459        server = SocketServer.UDPServer((HOST, PORT), MyUDPHandler)
460        server.serve_forever()
462 This is the client side::
464    import socket
465    import sys
467    HOST, PORT = "localhost", 9999
468    data = " ".join(sys.argv[1:])
470    # SOCK_DGRAM is the socket type to use for UDP sockets
471    sock = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
473    # As you can see, there is no connect() call; UDP has no connections.
474    # Instead, data is directly sent to the recipient via sendto().
475    sock.sendto(data + "\n", (HOST, PORT))
476    received = sock.recv(1024)
478    print "Sent:     %s" % data
479    print "Received: %s" % received
481 The output of the example should look exactly like for the TCP server example.
484 Asynchronous Mixins
485 ~~~~~~~~~~~~~~~~~~~
487 To build asynchronous handlers, use the :class:`ThreadingMixIn` and
488 :class:`ForkingMixIn` classes.
490 An example for the :class:`ThreadingMixIn` class::
492    import socket
493    import threading
494    import SocketServer
496    class ThreadedTCPRequestHandler(SocketServer.BaseRequestHandler):
498        def handle(self):
499            data = self.request.recv(1024)
500            cur_thread = threading.currentThread()
501            response = "%s: %s" % (cur_thread.getName(), data)
502            self.request.send(response)
504    class ThreadedTCPServer(SocketServer.ThreadingMixIn, SocketServer.TCPServer):
505        pass
507    def client(ip, port, message):
508        sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
509        sock.connect((ip, port))
510        sock.send(message)
511        response = sock.recv(1024)
512        print "Received: %s" % response
513        sock.close()
515    if __name__ == "__main__":
516        # Port 0 means to select an arbitrary unused port
517        HOST, PORT = "localhost", 0
519        server = ThreadedTCPServer((HOST, PORT), ThreadedTCPRequestHandler)
520        ip, port = server.server_address
522        # Start a thread with the server -- that thread will then start one
523        # more thread for each request
524        server_thread = threading.Thread(target=server.serve_forever)
525        # Exit the server thread when the main thread terminates
526        server_thread.setDaemon(True)
527        server_thread.start()
528        print "Server loop running in thread:", server_thread.getName()
530        client(ip, port, "Hello World 1")
531        client(ip, port, "Hello World 2")
532        client(ip, port, "Hello World 3")
534        server.shutdown()
536 The output of the example should look something like this::
538    $ python ThreadedTCPServer.py
539    Server loop running in thread: Thread-1
540    Received: Thread-2: Hello World 1
541    Received: Thread-3: Hello World 2
542    Received: Thread-4: Hello World 3
545 The :class:`ForkingMixIn` class is used in the same way, except that the server
546 will spawn a new process for each request.