~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/tests/http_server.py

  • Committer: John Arbash Meinel
  • Author(s): Mark Hammond
  • Date: 2008-09-09 17:02:21 UTC
  • mto: This revision was merged to the branch mainline in revision 3697.
  • Revision ID: john@arbash-meinel.com-20080909170221-svim3jw2mrz0amp3
An updated transparent icon for bzr.

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2006 Canonical Ltd
 
1
# Copyright (C) 2006, 2007 Canonical Ltd
2
2
#
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
14
14
# along with this program; if not, write to the Free Software
15
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
16
 
17
 
import BaseHTTPServer
18
17
import errno
 
18
import httplib
19
19
import os
20
 
from SimpleHTTPServer import SimpleHTTPRequestHandler
21
 
import socket
22
20
import posixpath
23
21
import random
24
22
import re
 
23
import SimpleHTTPServer
 
24
import socket
 
25
import SocketServer
25
26
import sys
26
27
import threading
27
28
import time
28
29
import urllib
29
30
import urlparse
30
31
 
31
 
from bzrlib.transport import Server
32
 
from bzrlib.transport.local import LocalURLServer
 
32
from bzrlib import transport
 
33
from bzrlib.transport import local
33
34
 
34
35
 
35
36
class WebserverNotAvailable(Exception):
41
42
        return 'path %s is not in %s' % self.args
42
43
 
43
44
 
44
 
class TestingHTTPRequestHandler(SimpleHTTPRequestHandler):
 
45
class TestingHTTPRequestHandler(SimpleHTTPServer.SimpleHTTPRequestHandler):
45
46
    """Handles one request.
46
47
 
47
 
    A TestingHTTPRequestHandler is instantiated for every request
48
 
    received by the associated server.
 
48
    A TestingHTTPRequestHandler is instantiated for every request received by
 
49
    the associated server. Note that 'request' here is inherited from the base
 
50
    TCPServer class, for the HTTP server it is really a connection which itself
 
51
    will handle one or several HTTP requests.
49
52
    """
 
53
    # Default protocol version
 
54
    protocol_version = 'HTTP/1.1'
 
55
 
 
56
    # The Message-like class used to parse the request headers
 
57
    MessageClass = httplib.HTTPMessage
 
58
 
 
59
    def setup(self):
 
60
        SimpleHTTPServer.SimpleHTTPRequestHandler.setup(self)
 
61
        self._cwd = self.server._home_dir
 
62
        tcs = self.server.test_case_server
 
63
        if tcs.protocol_version is not None:
 
64
            # If the test server forced a protocol version, use it
 
65
            self.protocol_version = tcs.protocol_version
50
66
 
51
67
    def log_message(self, format, *args):
52
68
        tcs = self.server.test_case_server
64
80
        connection early to avoid polluting the test results.
65
81
        """
66
82
        try:
67
 
            SimpleHTTPRequestHandler.handle_one_request(self)
 
83
            SimpleHTTPServer.SimpleHTTPRequestHandler.handle_one_request(self)
68
84
        except socket.error, e:
69
 
            if (len(e.args) > 0
70
 
                and e.args[0] in (errno.EPIPE, errno.ECONNRESET,
71
 
                                  errno.ECONNABORTED,)):
72
 
                self.close_connection = 1
73
 
                pass
74
 
            else:
 
85
            # Any socket error should close the connection, but some errors are
 
86
            # due to the client closing early and we don't want to pollute test
 
87
            # results, so we raise only the others.
 
88
            self.close_connection = 1
 
89
            if (len(e.args) == 0
 
90
                or e.args[0] not in (errno.EPIPE, errno.ECONNRESET,
 
91
                                     errno.ECONNABORTED, errno.EBADF)):
75
92
                raise
76
93
 
77
94
    _range_regexp = re.compile(r'^(?P<start>\d+)-(?P<end>\d+)$')
110
127
                    return 0, []
111
128
        return tail, ranges
112
129
 
 
130
    def _header_line_length(self, keyword, value):
 
131
        header_line = '%s: %s\r\n' % (keyword, value)
 
132
        return len(header_line)
 
133
 
 
134
    def send_head(self):
 
135
        """Overrides base implementation to work around a bug in python2.5."""
 
136
        path = self.translate_path(self.path)
 
137
        if os.path.isdir(path) and not self.path.endswith('/'):
 
138
            # redirect browser - doing basically what apache does when
 
139
            # DirectorySlash option is On which is quite common (braindead, but
 
140
            # common)
 
141
            self.send_response(301)
 
142
            self.send_header("Location", self.path + "/")
 
143
            # Indicates that the body is empty for HTTP/1.1 clients 
 
144
            self.send_header('Content-Length', '0')
 
145
            self.end_headers()
 
146
            return None
 
147
 
 
148
        return SimpleHTTPServer.SimpleHTTPRequestHandler.send_head(self)
 
149
 
113
150
    def send_range_content(self, file, start, length):
114
151
        file.seek(start)
115
152
        self.wfile.write(file.read(length))
130
167
    def get_multiple_ranges(self, file, file_size, ranges):
131
168
        self.send_response(206)
132
169
        self.send_header('Accept-Ranges', 'bytes')
133
 
        boundary = "%d" % random.randint(0,0x7FFFFFFF)
134
 
        self.send_header("Content-Type",
135
 
                         "multipart/byteranges; boundary=%s" % boundary)
 
170
        boundary = '%d' % random.randint(0,0x7FFFFFFF)
 
171
        self.send_header('Content-Type',
 
172
                         'multipart/byteranges; boundary=%s' % boundary)
 
173
        boundary_line = '--%s\r\n' % boundary
 
174
        # Calculate the Content-Length
 
175
        content_length = 0
 
176
        for (start, end) in ranges:
 
177
            content_length += len(boundary_line)
 
178
            content_length += self._header_line_length(
 
179
                'Content-type', 'application/octet-stream')
 
180
            content_length += self._header_line_length(
 
181
                'Content-Range', 'bytes %d-%d/%d' % (start, end, file_size))
 
182
            content_length += len('\r\n') # end headers
 
183
            content_length += end - start # + 1
 
184
        content_length += len(boundary_line)
 
185
        self.send_header('Content-length', content_length)
136
186
        self.end_headers()
 
187
 
 
188
        # Send the multipart body
137
189
        for (start, end) in ranges:
138
 
            self.wfile.write("--%s\r\n" % boundary)
139
 
            self.send_header("Content-type", 'application/octet-stream')
140
 
            self.send_header("Content-Range", "bytes %d-%d/%d" % (start,
141
 
                                                                  end,
142
 
                                                                  file_size))
 
190
            self.wfile.write(boundary_line)
 
191
            self.send_header('Content-type', 'application/octet-stream')
 
192
            self.send_header('Content-Range', 'bytes %d-%d/%d'
 
193
                             % (start, end, file_size))
143
194
            self.end_headers()
144
195
            self.send_range_content(file, start, end - start + 1)
145
 
            self.wfile.write("--%s\r\n" % boundary)
 
196
        # Final boundary
 
197
        self.wfile.write(boundary_line)
146
198
 
147
199
    def do_GET(self):
148
200
        """Serve a GET request.
149
201
 
150
202
        Handles the Range header.
151
203
        """
 
204
        # Update statistics
 
205
        self.server.test_case_server.GET_request_nb += 1
152
206
 
153
207
        path = self.translate_path(self.path)
154
208
        ranges_header_value = self.headers.get('Range')
155
209
        if ranges_header_value is None or os.path.isdir(path):
156
210
            # Let the mother class handle most cases
157
 
            return SimpleHTTPRequestHandler.do_GET(self)
 
211
            return SimpleHTTPServer.SimpleHTTPRequestHandler.do_GET(self)
158
212
 
159
213
        try:
160
214
            # Always read in binary mode. Opening files in text
231
285
        return self._translate_path(path)
232
286
 
233
287
    def _translate_path(self, path):
234
 
        return SimpleHTTPRequestHandler.translate_path(self, path)
235
 
 
236
 
    if sys.platform == 'win32':
237
 
        # On win32 you cannot access non-ascii filenames without
238
 
        # decoding them into unicode first.
239
 
        # However, under Linux, you can access bytestream paths
240
 
        # without any problems. If this function was always active
241
 
        # it would probably break tests when LANG=C was set
242
 
        def _translate_path(self, path):
243
 
            """Translate a /-separated PATH to the local filename syntax.
244
 
 
245
 
            For bzr, all url paths are considered to be utf8 paths.
246
 
            On Linux, you can access these paths directly over the bytestream
247
 
            request, but on win32, you must decode them, and access them
248
 
            as Unicode files.
249
 
            """
250
 
            # abandon query parameters
251
 
            path = urlparse.urlparse(path)[2]
252
 
            path = posixpath.normpath(urllib.unquote(path))
253
 
            path = path.decode('utf-8')
254
 
            words = path.split('/')
255
 
            words = filter(None, words)
256
 
            path = os.getcwdu()
257
 
            for word in words:
 
288
        """Translate a /-separated PATH to the local filename syntax.
 
289
 
 
290
        Note that we're translating http URLs here, not file URLs.
 
291
        The URL root location is the server's startup directory.
 
292
        Components that mean special things to the local file system
 
293
        (e.g. drive or directory names) are ignored.  (XXX They should
 
294
        probably be diagnosed.)
 
295
 
 
296
        Override from python standard library to stop it calling os.getcwd()
 
297
        """
 
298
        # abandon query parameters
 
299
        path = urlparse.urlparse(path)[2]
 
300
        path = posixpath.normpath(urllib.unquote(path))
 
301
        path = path.decode('utf-8')
 
302
        words = path.split('/')
 
303
        words = filter(None, words)
 
304
        path = self._cwd
 
305
        for num, word in enumerate(words):
 
306
            if num == 0:
258
307
                drive, word = os.path.splitdrive(word)
259
 
                head, word = os.path.split(word)
260
 
                if word in (os.curdir, os.pardir): continue
261
 
                path = os.path.join(path, word)
262
 
            return path
263
 
 
264
 
 
265
 
class TestingHTTPServer(BaseHTTPServer.HTTPServer):
266
 
 
267
 
    def __init__(self, server_address, RequestHandlerClass,
268
 
                 test_case_server):
269
 
        BaseHTTPServer.HTTPServer.__init__(self, server_address,
270
 
                                           RequestHandlerClass)
 
308
            head, word = os.path.split(word)
 
309
            if word in (os.curdir, os.pardir): continue
 
310
            path = os.path.join(path, word)
 
311
        return path
 
312
 
 
313
 
 
314
class TestingHTTPServerMixin:
 
315
 
 
316
    def __init__(self, test_case_server):
271
317
        # test_case_server can be used to communicate between the
272
318
        # tests and the server (or the request handler and the
273
319
        # server), allowing dynamic behaviors to be defined from
274
320
        # the tests cases.
275
321
        self.test_case_server = test_case_server
276
 
 
277
 
    def server_close(self):
278
 
        """Called to clean-up the server.
279
 
 
280
 
        Since the server may be in a blocking read, we shutdown the socket
281
 
        before closing it.
282
 
        """
283
 
        self.socket.shutdown(socket.SHUT_RDWR)
284
 
        BaseHTTPServer.HTTPServer.server_close(self)
285
 
 
286
 
 
287
 
class HttpServer(Server):
 
322
        self._home_dir = test_case_server._home_dir
 
323
 
 
324
    def tearDown(self):
 
325
         """Called to clean-up the server.
 
326
 
 
327
         Since the server may be (surely is, even) in a blocking listen, we
 
328
         shutdown its socket before closing it.
 
329
         """
 
330
         # Note that is this executed as part of the implicit tear down in the
 
331
         # main thread while the server runs in its own thread. The clean way
 
332
         # to tear down the server is to instruct him to stop accepting
 
333
         # connections and wait for the current connection(s) to end
 
334
         # naturally. To end the connection naturally, the http transports
 
335
         # should close their socket when they do not need to talk to the
 
336
         # server anymore. This happens naturally during the garbage collection
 
337
         # phase of the test transport objetcs (the server clients), so we
 
338
         # don't have to worry about them.  So, for the server, we must tear
 
339
         # down here, from the main thread, when the test have ended.  Note
 
340
         # that since the server is in a blocking operation and since python
 
341
         # use select internally, shutting down the socket is reliable and
 
342
         # relatively clean.
 
343
         try:
 
344
             self.socket.shutdown(socket.SHUT_RDWR)
 
345
         except socket.error, e:
 
346
             # WSAENOTCONN (10057) 'Socket is not connected' is harmless on
 
347
             # windows (occurs before the first connection attempt
 
348
             # vila--20071230)
 
349
             if not len(e.args) or e.args[0] != 10057:
 
350
                 raise
 
351
         # Let the server properly close the socket
 
352
         self.server_close()
 
353
 
 
354
 
 
355
class TestingHTTPServer(SocketServer.TCPServer, TestingHTTPServerMixin):
 
356
 
 
357
    def __init__(self, server_address, request_handler_class,
 
358
                 test_case_server):
 
359
        TestingHTTPServerMixin.__init__(self, test_case_server)
 
360
        SocketServer.TCPServer.__init__(self, server_address,
 
361
                                        request_handler_class)
 
362
 
 
363
 
 
364
class TestingThreadingHTTPServer(SocketServer.ThreadingTCPServer,
 
365
                                 TestingHTTPServerMixin):
 
366
    """A threading HTTP test server for HTTP 1.1.
 
367
 
 
368
    Since tests can initiate several concurrent connections to the same http
 
369
    server, we need an independent connection for each of them. We achieve that
 
370
    by spawning a new thread for each connection.
 
371
    """
 
372
 
 
373
    def __init__(self, server_address, request_handler_class,
 
374
                 test_case_server):
 
375
        TestingHTTPServerMixin.__init__(self, test_case_server)
 
376
        SocketServer.ThreadingTCPServer.__init__(self, server_address,
 
377
                                                 request_handler_class)
 
378
        # Decides how threads will act upon termination of the main
 
379
        # process. This is prophylactic as we should not leave the threads
 
380
        # lying around.
 
381
        self.daemon_threads = True
 
382
 
 
383
 
 
384
class HttpServer(transport.Server):
288
385
    """A test server for http transports.
289
386
 
290
387
    Subclasses can provide a specific request handler.
291
388
    """
292
389
 
 
390
    # The real servers depending on the protocol
 
391
    http_server_class = {'HTTP/1.0': TestingHTTPServer,
 
392
                         'HTTP/1.1': TestingThreadingHTTPServer,
 
393
                         }
 
394
 
293
395
    # Whether or not we proxy the requests (see
294
396
    # TestingHTTPRequestHandler.translate_path).
295
397
    proxy_requests = False
297
399
    # used to form the url that connects to this server
298
400
    _url_protocol = 'http'
299
401
 
300
 
    # Subclasses can provide a specific request handler
301
 
    def __init__(self, request_handler=TestingHTTPRequestHandler):
302
 
        Server.__init__(self)
 
402
    def __init__(self, request_handler=TestingHTTPRequestHandler,
 
403
                 protocol_version=None):
 
404
        """Constructor.
 
405
 
 
406
        :param request_handler: a class that will be instantiated to handle an
 
407
            http connection (one or several requests).
 
408
 
 
409
        :param protocol_version: if specified, will override the protocol
 
410
            version of the request handler.
 
411
        """
 
412
        transport.Server.__init__(self)
303
413
        self.request_handler = request_handler
304
414
        self.host = 'localhost'
305
415
        self.port = 0
306
416
        self._httpd = None
 
417
        self.protocol_version = protocol_version
 
418
        # Allows tests to verify number of GET requests issued
 
419
        self.GET_request_nb = 0
307
420
 
308
421
    def _get_httpd(self):
309
422
        if self._httpd is None:
310
 
            self._httpd = TestingHTTPServer((self.host, self.port),
311
 
                                            self.request_handler,
312
 
                                            self)
 
423
            rhandler = self.request_handler
 
424
            # Depending on the protocol version, we will create the approriate
 
425
            # server
 
426
            if self.protocol_version is None:
 
427
                # Use the request handler one
 
428
                proto_vers = rhandler.protocol_version
 
429
            else:
 
430
                # Use our own, it will be used to override the request handler
 
431
                # one too.
 
432
                proto_vers = self.protocol_version
 
433
            # Create the appropriate server for the required protocol
 
434
            serv_cls = self.http_server_class.get(proto_vers, None)
 
435
            if serv_cls is None:
 
436
                raise httplib.UnknownProtocol(proto_vers)
 
437
            else:
 
438
                self._httpd = serv_cls((self.host, self.port), rhandler, self)
313
439
            host, self.port = self._httpd.socket.getsockname()
314
440
        return self._httpd
315
441
 
316
442
    def _http_start(self):
317
 
        httpd = self._get_httpd()
318
 
        self._http_base_url = '%s://%s:%s/' % (self._url_protocol,
319
 
                                               self.host,
320
 
                                               self.port)
321
 
        self._http_starting.release()
 
443
        """Server thread main entry point. """
 
444
        self._http_running = False
 
445
        try:
 
446
            try:
 
447
                httpd = self._get_httpd()
 
448
                self._http_base_url = '%s://%s:%s/' % (self._url_protocol,
 
449
                                                       self.host, self.port)
 
450
                self._http_running = True
 
451
            except:
 
452
                # Whatever goes wrong, we save the exception for the main
 
453
                # thread. Note that since we are running in a thread, no signal
 
454
                # can be received, so we don't care about KeyboardInterrupt.
 
455
                self._http_exception = sys.exc_info()
 
456
        finally:
 
457
            # Release the lock or the main thread will block and the whole
 
458
            # process will hang.
 
459
            self._http_starting.release()
322
460
 
 
461
        # From now on, exceptions are taken care of by the
 
462
        # SocketServer.BaseServer or the request handler.
323
463
        while self._http_running:
324
464
            try:
 
465
                # Really an HTTP connection but the python framework is generic
 
466
                # and call them requests
325
467
                httpd.handle_request()
326
468
            except socket.timeout:
327
469
                pass
351
493
        """
352
494
        # XXX: TODO: make the server back onto vfs_server rather than local
353
495
        # disk.
354
 
        assert backing_transport_server is None or \
355
 
            isinstance(backing_transport_server, LocalURLServer), \
356
 
            "HTTPServer currently assumes local transport, got %s" % \
357
 
            backing_transport_server
 
496
        if not (backing_transport_server is None or \
 
497
                isinstance(backing_transport_server, local.LocalURLServer)):
 
498
            raise AssertionError(
 
499
                "HTTPServer currently assumes local transport, got %s" % \
 
500
                backing_transport_server)
358
501
        self._home_dir = os.getcwdu()
359
502
        self._local_path_parts = self._home_dir.split(os.path.sep)
 
503
        self._http_base_url = None
 
504
 
 
505
        # Create the server thread
360
506
        self._http_starting = threading.Lock()
361
507
        self._http_starting.acquire()
362
 
        self._http_running = True
363
 
        self._http_base_url = None
364
508
        self._http_thread = threading.Thread(target=self._http_start)
365
509
        self._http_thread.setDaemon(True)
 
510
        self._http_exception = None
366
511
        self._http_thread.start()
 
512
 
367
513
        # Wait for the server thread to start (i.e release the lock)
368
514
        self._http_starting.acquire()
 
515
 
 
516
        if self._http_exception is not None:
 
517
            # Something went wrong during server start
 
518
            exc_class, exc_value, exc_tb = self._http_exception
 
519
            raise exc_class, exc_value, exc_tb
369
520
        self._http_starting.release()
370
521
        self.logs = []
371
522
 
372
523
    def tearDown(self):
373
524
        """See bzrlib.transport.Server.tearDown."""
374
 
        self._httpd.server_close()
 
525
        self._httpd.tearDown()
375
526
        self._http_running = False
376
 
        self._http_thread.join()
 
527
        # We don't need to 'self._http_thread.join()' here since the thread is
 
528
        # a daemonic one and will be garbage collected anyway. Joining just
 
529
        # slows us down for no added benefit.
377
530
 
378
531
    def get_url(self):
379
532
        """See bzrlib.transport.Server.get_url."""
383
536
        """See bzrlib.transport.Server.get_bogus_url."""
384
537
        # this is chosen to try to prevent trouble with proxies, weird dns,
385
538
        # etc
386
 
        return 'http://127.0.0.1:1/'
 
539
        return self._url_protocol + '://127.0.0.1:1/'
387
540
 
388
541
 
389
542
class HttpServer_urllib(HttpServer):