~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/tests/HTTPTestUtil.py

  • Committer: Martin Pool
  • Date: 2007-08-06 22:22:58 UTC
  • mto: This revision was merged to the branch mainline in revision 2728.
  • Revision ID: mbp@sourcefrog.net-20070806222258-d999nnmt5fl74o0t
Add notes on file and directory last modified (with John)

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# Copyright (C) 2005 Canonical Ltd
 
2
#
 
3
# This program is free software; you can redistribute it and/or modify
 
4
# it under the terms of the GNU General Public License as published by
 
5
# the Free Software Foundation; either version 2 of the License, or
 
6
# (at your option) any later version.
 
7
#
 
8
# This program is distributed in the hope that it will be useful,
 
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
11
# GNU General Public License for more details.
 
12
#
 
13
# You should have received a copy of the GNU General Public License
 
14
# along with this program; if not, write to the Free Software
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
16
 
 
17
from cStringIO import StringIO
 
18
import errno
 
19
import md5
 
20
from SimpleHTTPServer import SimpleHTTPRequestHandler
 
21
import re
 
22
import sha
 
23
import socket
 
24
import time
 
25
import urllib2
 
26
import urlparse
 
27
 
 
28
from bzrlib.smart import protocol
 
29
from bzrlib.tests import TestCaseWithTransport
 
30
from bzrlib.tests.HttpServer import (
 
31
    HttpServer,
 
32
    TestingHTTPRequestHandler,
 
33
    )
 
34
from bzrlib.transport import (
 
35
    get_transport,
 
36
    )
 
37
 
 
38
 
 
39
class WallRequestHandler(TestingHTTPRequestHandler):
 
40
    """Whatever request comes in, close the connection"""
 
41
 
 
42
    def handle_one_request(self):
 
43
        """Handle a single HTTP request, by abruptly closing the connection"""
 
44
        self.close_connection = 1
 
45
 
 
46
 
 
47
class BadStatusRequestHandler(TestingHTTPRequestHandler):
 
48
    """Whatever request comes in, returns a bad status"""
 
49
 
 
50
    def parse_request(self):
 
51
        """Fakes handling a single HTTP request, returns a bad status"""
 
52
        ignored = TestingHTTPRequestHandler.parse_request(self)
 
53
        try:
 
54
            self.send_response(0, "Bad status")
 
55
            self.end_headers()
 
56
        except socket.error, e:
 
57
            # We don't want to pollute the test results with
 
58
            # spurious server errors while test succeed. In our
 
59
            # case, it may occur that the test has already read
 
60
            # the 'Bad Status' and closed the socket while we are
 
61
            # still trying to send some headers... So the test is
 
62
            # ok, but if we raise the exception, the output is
 
63
            # dirty. So we don't raise, but we close the
 
64
            # connection, just to be safe :)
 
65
            spurious = [errno.EPIPE,
 
66
                        errno.ECONNRESET,
 
67
                        errno.ECONNABORTED,
 
68
                        ]
 
69
            if (len(e.args) > 0) and (e.args[0] in spurious):
 
70
                self.close_connection = 1
 
71
                pass
 
72
            else:
 
73
                raise
 
74
        return False
 
75
 
 
76
 
 
77
class InvalidStatusRequestHandler(TestingHTTPRequestHandler):
 
78
    """Whatever request comes in, returns am invalid status"""
 
79
 
 
80
    def parse_request(self):
 
81
        """Fakes handling a single HTTP request, returns a bad status"""
 
82
        ignored = TestingHTTPRequestHandler.parse_request(self)
 
83
        self.wfile.write("Invalid status line\r\n")
 
84
        return False
 
85
 
 
86
 
 
87
class BadProtocolRequestHandler(TestingHTTPRequestHandler):
 
88
    """Whatever request comes in, returns a bad protocol version"""
 
89
 
 
90
    def parse_request(self):
 
91
        """Fakes handling a single HTTP request, returns a bad status"""
 
92
        ignored = TestingHTTPRequestHandler.parse_request(self)
 
93
        # Returns an invalid protocol version, but curl just
 
94
        # ignores it and those cannot be tested.
 
95
        self.wfile.write("%s %d %s\r\n" % ('HTTP/0.0',
 
96
                                           404,
 
97
                                           'Look at my protocol version'))
 
98
        return False
 
99
 
 
100
 
 
101
class ForbiddenRequestHandler(TestingHTTPRequestHandler):
 
102
    """Whatever request comes in, returns a 403 code"""
 
103
 
 
104
    def parse_request(self):
 
105
        """Handle a single HTTP request, by replying we cannot handle it"""
 
106
        ignored = TestingHTTPRequestHandler.parse_request(self)
 
107
        self.send_error(403)
 
108
        return False
 
109
 
 
110
 
 
111
class HTTPServerWithSmarts(HttpServer):
 
112
    """HTTPServerWithSmarts extends the HttpServer with POST methods that will
 
113
    trigger a smart server to execute with a transport rooted at the rootdir of
 
114
    the HTTP server.
 
115
    """
 
116
 
 
117
    def __init__(self):
 
118
        HttpServer.__init__(self, SmartRequestHandler)
 
119
 
 
120
 
 
121
class SmartRequestHandler(TestingHTTPRequestHandler):
 
122
    """Extend TestingHTTPRequestHandler to support smart client POSTs."""
 
123
 
 
124
    def do_POST(self):
 
125
        """Hand the request off to a smart server instance."""
 
126
        self.send_response(200)
 
127
        self.send_header("Content-type", "application/octet-stream")
 
128
        transport = get_transport(self.server.test_case_server._home_dir)
 
129
        # TODO: We might like to support streaming responses.  1.0 allows no
 
130
        # Content-length in this case, so for integrity we should perform our
 
131
        # own chunking within the stream.
 
132
        # 1.1 allows chunked responses, and in this case we could chunk using
 
133
        # the HTTP chunking as this will allow HTTP persistence safely, even if
 
134
        # we have to stop early due to error, but we would also have to use the
 
135
        # HTTP trailer facility which may not be widely available.
 
136
        out_buffer = StringIO()
 
137
        smart_protocol_request = protocol.SmartServerRequestProtocolOne(
 
138
                transport, out_buffer.write)
 
139
        # if this fails, we should return 400 bad request, but failure is
 
140
        # failure for now - RBC 20060919
 
141
        data_length = int(self.headers['Content-Length'])
 
142
        # Perhaps there should be a SmartServerHTTPMedium that takes care of
 
143
        # feeding the bytes in the http request to the smart_protocol_request,
 
144
        # but for now it's simpler to just feed the bytes directly.
 
145
        smart_protocol_request.accept_bytes(self.rfile.read(data_length))
 
146
        assert smart_protocol_request.next_read_size() == 0, (
 
147
            "not finished reading, but all data sent to protocol.")
 
148
        self.send_header("Content-Length", str(len(out_buffer.getvalue())))
 
149
        self.end_headers()
 
150
        self.wfile.write(out_buffer.getvalue())
 
151
 
 
152
 
 
153
class LimitedRangeRequestHandler(TestingHTTPRequestHandler):
 
154
    """Errors out when range specifiers exceed the limit"""
 
155
 
 
156
    def get_multiple_ranges(self, file, file_size, ranges):
 
157
        """Refuses the multiple ranges request"""
 
158
        tcs = self.server.test_case_server
 
159
        if tcs.range_limit is not None and len(ranges) > tcs.range_limit:
 
160
            file.close()
 
161
            # Emulate apache behavior
 
162
            self.send_error(400, "Bad Request")
 
163
            return
 
164
        return TestingHTTPRequestHandler.get_multiple_ranges(self, file,
 
165
                                                             file_size, ranges)
 
166
 
 
167
    def do_GET(self):
 
168
        tcs = self.server.test_case_server
 
169
        tcs.GET_request_nb += 1
 
170
        return TestingHTTPRequestHandler.do_GET(self)
 
171
 
 
172
 
 
173
class LimitedRangeHTTPServer(HttpServer):
 
174
    """An HttpServer erroring out on requests with too much range specifiers"""
 
175
 
 
176
    def __init__(self, request_handler=LimitedRangeRequestHandler,
 
177
                 range_limit=None):
 
178
        HttpServer.__init__(self, request_handler)
 
179
        self.range_limit = range_limit
 
180
        self.GET_request_nb = 0
 
181
 
 
182
 
 
183
class SingleRangeRequestHandler(TestingHTTPRequestHandler):
 
184
    """Always reply to range request as if they were single.
 
185
 
 
186
    Don't be explicit about it, just to annoy the clients.
 
187
    """
 
188
 
 
189
    def get_multiple_ranges(self, file, file_size, ranges):
 
190
        """Answer as if it was a single range request and ignores the rest"""
 
191
        (start, end) = ranges[0]
 
192
        return self.get_single_range(file, file_size, start, end)
 
193
 
 
194
 
 
195
class SingleOnlyRangeRequestHandler(TestingHTTPRequestHandler):
 
196
    """Only reply to simple range requests, errors out on multiple"""
 
197
 
 
198
    def get_multiple_ranges(self, file, file_size, ranges):
 
199
        """Refuses the multiple ranges request"""
 
200
        if len(ranges) > 1:
 
201
            file.close()
 
202
            self.send_error(416, "Requested range not satisfiable")
 
203
            return
 
204
        (start, end) = ranges[0]
 
205
        return self.get_single_range(file, file_size, start, end)
 
206
 
 
207
 
 
208
class NoRangeRequestHandler(TestingHTTPRequestHandler):
 
209
    """Ignore range requests without notice"""
 
210
 
 
211
    # Just bypass the range handling done by TestingHTTPRequestHandler
 
212
    do_GET = SimpleHTTPRequestHandler.do_GET
 
213
 
 
214
 
 
215
class TestCaseWithWebserver(TestCaseWithTransport):
 
216
    """A support class that provides readonly urls that are http://.
 
217
 
 
218
    This is done by forcing the readonly server to be an http
 
219
    one. This will currently fail if the primary transport is not
 
220
    backed by regular disk files.
 
221
    """
 
222
    def setUp(self):
 
223
        super(TestCaseWithWebserver, self).setUp()
 
224
        self.transport_readonly_server = HttpServer
 
225
 
 
226
 
 
227
class TestCaseWithTwoWebservers(TestCaseWithWebserver):
 
228
    """A support class providing readonly urls on two servers that are http://.
 
229
 
 
230
    We set up two webservers to allows various tests involving
 
231
    proxies or redirections from one server to the other.
 
232
    """
 
233
    def setUp(self):
 
234
        super(TestCaseWithTwoWebservers, self).setUp()
 
235
        self.transport_secondary_server = HttpServer
 
236
        self.__secondary_server = None
 
237
 
 
238
    def create_transport_secondary_server(self):
 
239
        """Create a transport server from class defined at init.
 
240
 
 
241
        This is mostly a hook for daughter classes.
 
242
        """
 
243
        return self.transport_secondary_server()
 
244
 
 
245
    def get_secondary_server(self):
 
246
        """Get the server instance for the secondary transport."""
 
247
        if self.__secondary_server is None:
 
248
            self.__secondary_server = self.create_transport_secondary_server()
 
249
            self.__secondary_server.setUp()
 
250
            self.addCleanup(self.__secondary_server.tearDown)
 
251
        return self.__secondary_server
 
252
 
 
253
 
 
254
class ProxyServer(HttpServer):
 
255
    """A proxy test server for http transports."""
 
256
 
 
257
    proxy_requests = True
 
258
 
 
259
 
 
260
class RedirectRequestHandler(TestingHTTPRequestHandler):
 
261
    """Redirect all request to the specified server"""
 
262
 
 
263
    def parse_request(self):
 
264
        """Redirect a single HTTP request to another host"""
 
265
        valid = TestingHTTPRequestHandler.parse_request(self)
 
266
        if valid:
 
267
            tcs = self.server.test_case_server
 
268
            code, target = tcs.is_redirected(self.path)
 
269
            if code is not None and target is not None:
 
270
                # Redirect as instructed
 
271
                self.send_response(code)
 
272
                self.send_header('Location', target)
 
273
                self.end_headers()
 
274
                return False # The job is done
 
275
            else:
 
276
                # We leave the parent class serve the request
 
277
                pass
 
278
        return valid
 
279
 
 
280
 
 
281
class HTTPServerRedirecting(HttpServer):
 
282
    """An HttpServer redirecting to another server """
 
283
 
 
284
    def __init__(self, request_handler=RedirectRequestHandler):
 
285
        HttpServer.__init__(self, request_handler)
 
286
        # redirections is a list of tuples (source, target, code)
 
287
        # - source is a regexp for the paths requested
 
288
        # - target is a replacement for re.sub describing where
 
289
        #   the request will be redirected
 
290
        # - code is the http error code associated to the
 
291
        #   redirection (301 permanent, 302 temporarry, etc
 
292
        self.redirections = []
 
293
 
 
294
    def redirect_to(self, host, port):
 
295
        """Redirect all requests to a specific host:port"""
 
296
        self.redirections = [('(.*)',
 
297
                              r'http://%s:%s\1' % (host, port) ,
 
298
                              301)]
 
299
 
 
300
    def is_redirected(self, path):
 
301
        """Is the path redirected by this server.
 
302
 
 
303
        :param path: the requested relative path
 
304
 
 
305
        :returns: a tuple (code, target) if a matching
 
306
             redirection is found, (None, None) otherwise.
 
307
        """
 
308
        code = None
 
309
        target = None
 
310
        for (rsource, rtarget, rcode) in self.redirections:
 
311
            target, match = re.subn(rsource, rtarget, path)
 
312
            if match:
 
313
                code = rcode
 
314
                break # The first match wins
 
315
            else:
 
316
                target = None
 
317
        return code, target
 
318
 
 
319
 
 
320
class TestCaseWithRedirectedWebserver(TestCaseWithTwoWebservers):
 
321
   """A support class providing redirections from one server to another.
 
322
 
 
323
   We set up two webservers to allows various tests involving
 
324
   redirections.
 
325
   The 'old' server is redirected to the 'new' server.
 
326
   """
 
327
 
 
328
   def create_transport_secondary_server(self):
 
329
       """Create the secondary server redirecting to the primary server"""
 
330
       new = self.get_readonly_server()
 
331
       redirecting = HTTPServerRedirecting()
 
332
       redirecting.redirect_to(new.host, new.port)
 
333
       return redirecting
 
334
 
 
335
   def setUp(self):
 
336
       super(TestCaseWithRedirectedWebserver, self).setUp()
 
337
       # The redirections will point to the new server
 
338
       self.new_server = self.get_readonly_server()
 
339
       # The requests to the old server will be redirected
 
340
       self.old_server = self.get_secondary_server()
 
341
 
 
342
 
 
343
class AuthRequestHandler(TestingHTTPRequestHandler):
 
344
    """Requires an authentication to process requests.
 
345
 
 
346
    This is intended to be used with a server that always and
 
347
    only use one authentication scheme (implemented by daughter
 
348
    classes).
 
349
    """
 
350
 
 
351
    # The following attributes should be defined in the server
 
352
    # - auth_header_sent: the header name sent to require auth
 
353
    # - auth_header_recv: the header received containing auth
 
354
    # - auth_error_code: the error code to indicate auth required
 
355
 
 
356
    def do_GET(self):
 
357
        if self.authorized():
 
358
            return TestingHTTPRequestHandler.do_GET(self)
 
359
        else:
 
360
            # Note that we must update test_case_server *before*
 
361
            # sending the error or the client may try to read it
 
362
            # before we have sent the whole error back.
 
363
            tcs = self.server.test_case_server
 
364
            tcs.auth_required_errors += 1
 
365
            self.send_response(tcs.auth_error_code)
 
366
            self.send_header_auth_reqed()
 
367
            self.end_headers()
 
368
            return
 
369
 
 
370
 
 
371
class BasicAuthRequestHandler(AuthRequestHandler):
 
372
    """Implements the basic authentication of a request"""
 
373
 
 
374
    def authorized(self):
 
375
        tcs = self.server.test_case_server
 
376
        if tcs.auth_scheme != 'basic':
 
377
            return False
 
378
 
 
379
        auth_header = self.headers.get(tcs.auth_header_recv, None)
 
380
        if auth_header:
 
381
            scheme, raw_auth = auth_header.split(' ', 1)
 
382
            if scheme.lower() == tcs.auth_scheme:
 
383
                user, password = raw_auth.decode('base64').split(':')
 
384
                return tcs.authorized(user, password)
 
385
 
 
386
        return False
 
387
 
 
388
    def send_header_auth_reqed(self):
 
389
        tcs = self.server.test_case_server
 
390
        self.send_header(tcs.auth_header_sent,
 
391
                         'Basic realm="%s"' % tcs.auth_realm)
 
392
 
 
393
 
 
394
# FIXME: We could send an Authentication-Info header too when
 
395
# the authentication is succesful
 
396
 
 
397
class DigestAuthRequestHandler(AuthRequestHandler):
 
398
    """Implements the digest authentication of a request.
 
399
 
 
400
    We need persistence for some attributes and that can't be
 
401
    achieved here since we get instantiated for each request. We
 
402
    rely on the DigestAuthServer to take care of them.
 
403
    """
 
404
 
 
405
    def authorized(self):
 
406
        tcs = self.server.test_case_server
 
407
        if tcs.auth_scheme != 'digest':
 
408
            return False
 
409
 
 
410
        auth_header = self.headers.get(tcs.auth_header_recv, None)
 
411
        if auth_header is None:
 
412
            return False
 
413
        scheme, auth = auth_header.split(None, 1)
 
414
        if scheme.lower() == tcs.auth_scheme:
 
415
            auth_dict = urllib2.parse_keqv_list(urllib2.parse_http_list(auth))
 
416
 
 
417
            return tcs.digest_authorized(auth_dict, self.command)
 
418
 
 
419
        return False
 
420
 
 
421
    def send_header_auth_reqed(self):
 
422
        tcs = self.server.test_case_server
 
423
        header = 'Digest realm="%s", ' % tcs.auth_realm
 
424
        header += 'nonce="%s", algorithm="%s", qop="auth"' % (tcs.auth_nonce,
 
425
                                                              'MD5')
 
426
        self.send_header(tcs.auth_header_sent,header)
 
427
 
 
428
 
 
429
class AuthServer(HttpServer):
 
430
    """Extends HttpServer with a dictionary of passwords.
 
431
 
 
432
    This is used as a base class for various schemes which should
 
433
    all use or redefined the associated AuthRequestHandler.
 
434
 
 
435
    Note that no users are defined by default, so add_user should
 
436
    be called before issuing the first request.
 
437
    """
 
438
 
 
439
    # The following attributes should be set dy daughter classes
 
440
    # and are used by AuthRequestHandler.
 
441
    auth_header_sent = None
 
442
    auth_header_recv = None
 
443
    auth_error_code = None
 
444
    auth_realm = "Thou should not pass"
 
445
 
 
446
    def __init__(self, request_handler, auth_scheme):
 
447
        HttpServer.__init__(self, request_handler)
 
448
        self.auth_scheme = auth_scheme
 
449
        self.password_of = {}
 
450
        self.auth_required_errors = 0
 
451
 
 
452
    def add_user(self, user, password):
 
453
        """Declare a user with an associated password.
 
454
 
 
455
        password can be empty, use an empty string ('') in that
 
456
        case, not None.
 
457
        """
 
458
        self.password_of[user] = password
 
459
 
 
460
    def authorized(self, user, password):
 
461
        """Check that the given user provided the right password"""
 
462
        expected_password = self.password_of.get(user, None)
 
463
        return expected_password is not None and password == expected_password
 
464
 
 
465
 
 
466
# FIXME: There is some code duplication with
 
467
# _urllib2_wrappers.py.DigestAuthHandler. If that duplciation
 
468
# grows, it may require a refactoring. Also, we don't implement
 
469
# SHA algorithm nor MD5-sess here, but that does not seem worth
 
470
# it.
 
471
class DigestAuthServer(AuthServer):
 
472
    """A digest authentication server"""
 
473
 
 
474
    auth_nonce = 'now!'
 
475
 
 
476
    def __init__(self, request_handler, auth_scheme):
 
477
        AuthServer.__init__(self, request_handler, auth_scheme)
 
478
 
 
479
    def digest_authorized(self, auth, command):
 
480
        nonce = auth['nonce']
 
481
        if nonce != self.auth_nonce:
 
482
            return False
 
483
        realm = auth['realm']
 
484
        if realm != self.auth_realm:
 
485
            return False
 
486
        user = auth['username']
 
487
        if not self.password_of.has_key(user):
 
488
            return False
 
489
        algorithm= auth['algorithm']
 
490
        if algorithm != 'MD5':
 
491
            return False
 
492
        qop = auth['qop']
 
493
        if qop != 'auth':
 
494
            return False
 
495
 
 
496
        password = self.password_of[user]
 
497
 
 
498
        # Recalculate the response_digest to compare with the one
 
499
        # sent by the client
 
500
        A1 = '%s:%s:%s' % (user, realm, password)
 
501
        A2 = '%s:%s' % (command, auth['uri'])
 
502
 
 
503
        H = lambda x: md5.new(x).hexdigest()
 
504
        KD = lambda secret, data: H("%s:%s" % (secret, data))
 
505
 
 
506
        nonce_count = int(auth['nc'], 16)
 
507
 
 
508
        ncvalue = '%08x' % nonce_count
 
509
 
 
510
        cnonce = auth['cnonce']
 
511
        noncebit = '%s:%s:%s:%s:%s' % (nonce, ncvalue, cnonce, qop, H(A2))
 
512
        response_digest = KD(H(A1), noncebit)
 
513
 
 
514
        return response_digest == auth['response']
 
515
 
 
516
class HTTPAuthServer(AuthServer):
 
517
    """An HTTP server requiring authentication"""
 
518
 
 
519
    def init_http_auth(self):
 
520
        self.auth_header_sent = 'WWW-Authenticate'
 
521
        self.auth_header_recv = 'Authorization'
 
522
        self.auth_error_code = 401
 
523
 
 
524
 
 
525
class ProxyAuthServer(AuthServer):
 
526
    """A proxy server requiring authentication"""
 
527
 
 
528
    def init_proxy_auth(self):
 
529
        self.proxy_requests = True
 
530
        self.auth_header_sent = 'Proxy-Authenticate'
 
531
        self.auth_header_recv = 'Proxy-Authorization'
 
532
        self.auth_error_code = 407
 
533
 
 
534
 
 
535
class HTTPBasicAuthServer(HTTPAuthServer):
 
536
    """An HTTP server requiring basic authentication"""
 
537
 
 
538
    def __init__(self):
 
539
        HTTPAuthServer.__init__(self, BasicAuthRequestHandler, 'basic')
 
540
        self.init_http_auth()
 
541
 
 
542
 
 
543
class HTTPDigestAuthServer(DigestAuthServer, HTTPAuthServer):
 
544
    """An HTTP server requiring digest authentication"""
 
545
 
 
546
    def __init__(self):
 
547
        DigestAuthServer.__init__(self, DigestAuthRequestHandler, 'digest')
 
548
        self.init_http_auth()
 
549
 
 
550
 
 
551
class ProxyBasicAuthServer(ProxyAuthServer):
 
552
    """A proxy server requiring basic authentication"""
 
553
 
 
554
    def __init__(self):
 
555
        ProxyAuthServer.__init__(self, BasicAuthRequestHandler, 'basic')
 
556
        self.init_proxy_auth()
 
557
 
 
558
 
 
559
class ProxyDigestAuthServer(DigestAuthServer, ProxyAuthServer):
 
560
    """A proxy server requiring basic authentication"""
 
561
 
 
562
    def __init__(self):
 
563
        ProxyAuthServer.__init__(self, DigestAuthRequestHandler, 'digest')
 
564
        self.init_proxy_auth()
 
565
 
 
566