~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/transport/smart.py

  • Committer: John Arbash Meinel
  • Date: 2006-09-20 23:43:18 UTC
  • mto: This revision was merged to the branch mainline in revision 2027.
  • Revision ID: john@arbash-meinel.com-20060920234318-05de23e98f7e7876
Move out export tests from test_too_much, refactor
and re-enable doc tests for export.get_root_name()

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# Copyright (C) 2006 Canonical Ltd
 
2
#
 
3
# This program is free software; you can redistribute it and/or modify
 
4
# it under the terms of the GNU General Public License as published by
 
5
# the Free Software Foundation; either version 2 of the License, or
 
6
# (at your option) any later version.
 
7
#
 
8
# This program is distributed in the hope that it will be useful,
 
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
11
# GNU General Public License for more details.
 
12
#
 
13
# You should have received a copy of the GNU General Public License
 
14
# along with this program; if not, write to the Free Software
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
16
 
 
17
"""Smart-server protocol, client and server.
 
18
 
 
19
Requests are sent as a command and list of arguments, followed by optional
 
20
bulk body data.  Responses are similarly a response and list of arguments,
 
21
followed by bulk body data. ::
 
22
 
 
23
  SEP := '\001'
 
24
    Fields are separated by Ctrl-A.
 
25
  BULK_DATA := CHUNK+ TRAILER
 
26
    Chunks can be repeated as many times as necessary.
 
27
  CHUNK := CHUNK_LEN CHUNK_BODY
 
28
  CHUNK_LEN := DIGIT+ NEWLINE
 
29
    Gives the number of bytes in the following chunk.
 
30
  CHUNK_BODY := BYTE[chunk_len]
 
31
  TRAILER := SUCCESS_TRAILER | ERROR_TRAILER
 
32
  SUCCESS_TRAILER := 'done' NEWLINE
 
33
  ERROR_TRAILER := 
 
34
 
 
35
Paths are passed across the network.  The client needs to see a namespace that
 
36
includes any repository that might need to be referenced, and the client needs
 
37
to know about a root directory beyond which it cannot ascend.
 
38
 
 
39
Servers run over ssh will typically want to be able to access any path the user 
 
40
can access.  Public servers on the other hand (which might be over http, ssh
 
41
or tcp) will typically want to restrict access to only a particular directory 
 
42
and its children, so will want to do a software virtual root at that level.
 
43
In other words they'll want to rewrite incoming paths to be under that level
 
44
(and prevent escaping using ../ tricks.)
 
45
 
 
46
URLs that include ~ should probably be passed across to the server verbatim
 
47
and the server can expand them.  This will proably not be meaningful when 
 
48
limited to a directory?
 
49
"""
 
50
 
 
51
 
 
52
# TODO: _translate_error should be on the client, not the transport because
 
53
#     error coding is wire protocol specific.
 
54
 
 
55
# TODO: A plain integer from query_version is too simple; should give some
 
56
# capabilities too?
 
57
 
 
58
# TODO: Server should probably catch exceptions within itself and send them
 
59
# back across the network.  (But shouldn't catch KeyboardInterrupt etc)
 
60
# Also needs to somehow report protocol errors like bad requests.  Need to
 
61
# consider how we'll handle error reporting, e.g. if we get halfway through a
 
62
# bulk transfer and then something goes wrong.
 
63
 
 
64
# TODO: Standard marker at start of request/response lines?
 
65
 
 
66
# TODO: Make each request and response self-validatable, e.g. with checksums.
 
67
#
 
68
# TODO: get/put objects could be changed to gradually read back the data as it
 
69
# comes across the network
 
70
#
 
71
# TODO: What should the server do if it hits an error and has to terminate?
 
72
#
 
73
# TODO: is it useful to allow multiple chunks in the bulk data?
 
74
#
 
75
# TODO: If we get an exception during transmission of bulk data we can't just
 
76
# emit the exception because it won't be seen.
 
77
#   John proposes:  I think it would be worthwhile to have a header on each
 
78
#   chunk, that indicates it is another chunk. Then you can send an 'error'
 
79
#   chunk as long as you finish the previous chunk.
 
80
#
 
81
# TODO: Clone method on Transport; should work up towards parent directory;
 
82
# unclear how this should be stored or communicated to the server... maybe
 
83
# just pass it on all relevant requests?
 
84
#
 
85
# TODO: Better name than clone() for changing between directories.  How about
 
86
# open_dir or change_dir or chdir?
 
87
#
 
88
# TODO: Is it really good to have the notion of current directory within the
 
89
# connection?  Perhaps all Transports should factor out a common connection
 
90
# from the thing that has the directory context?
 
91
#
 
92
# TODO: Pull more things common to sftp and ssh to a higher level.
 
93
#
 
94
# TODO: The server that manages a connection should be quite small and retain
 
95
# minimum state because each of the requests are supposed to be stateless.
 
96
# Then we can write another implementation that maps to http.
 
97
#
 
98
# TODO: What to do when a client connection is garbage collected?  Maybe just
 
99
# abruptly drop the connection?
 
100
#
 
101
# TODO: Server in some cases will need to restrict access to files outside of
 
102
# a particular root directory.  LocalTransport doesn't do anything to stop you
 
103
# ascending above the base directory, so we need to prevent paths
 
104
# containing '..' in either the server or transport layers.  (Also need to
 
105
# consider what happens if someone creates a symlink pointing outside the 
 
106
# directory tree...)
 
107
#
 
108
# TODO: Server should rebase absolute paths coming across the network to put
 
109
# them under the virtual root, if one is in use.  LocalTransport currently
 
110
# doesn't do that; if you give it an absolute path it just uses it.
 
111
 
112
# XXX: Arguments can't contain newlines or ascii; possibly we should e.g.
 
113
# urlescape them instead.  Indeed possibly this should just literally be
 
114
# http-over-ssh.
 
115
#
 
116
# FIXME: This transport, with several others, has imperfect handling of paths
 
117
# within urls.  It'd probably be better for ".." from a root to raise an error
 
118
# rather than return the same directory as we do at present.
 
119
#
 
120
# TODO: Rather than working at the Transport layer we want a Branch,
 
121
# Repository or BzrDir objects that talk to a server.
 
122
#
 
123
# TODO: Probably want some way for server commands to gradually produce body
 
124
# data rather than passing it as a string; they could perhaps pass an
 
125
# iterator-like callback that will gradually yield data; it probably needs a
 
126
# close() method that will always be closed to do any necessary cleanup.
 
127
#
 
128
# TODO: Split the actual smart server from the ssh encoding of it.
 
129
#
 
130
# TODO: Perhaps support file-level readwrite operations over the transport
 
131
# too.
 
132
#
 
133
# TODO: SmartBzrDir class, proxying all Branch etc methods across to another
 
134
# branch doing file-level operations.
 
135
#
 
136
# TODO: jam 20060915 _decode_tuple is acting directly on input over
 
137
#       the socket, and it assumes everything is UTF8 sections separated
 
138
#       by \001. Which means a request like '\002' Will abort the connection
 
139
#       because of a UnicodeDecodeError. It does look like invalid data will
 
140
#       kill the SmartStreamServer, but only with an abort + exception, and 
 
141
#       the overall server shouldn't die.
 
142
 
 
143
from cStringIO import StringIO
 
144
import errno
 
145
import os
 
146
import socket
 
147
import sys
 
148
import tempfile
 
149
import threading
 
150
import urllib
 
151
import urlparse
 
152
 
 
153
from bzrlib import (
 
154
    bzrdir,
 
155
    errors,
 
156
    revision,
 
157
    transport,
 
158
    trace,
 
159
    urlutils,
 
160
    )
 
161
from bzrlib.bundle.serializer import write_bundle
 
162
from bzrlib.trace import mutter
 
163
from bzrlib.transport import local
 
164
 
 
165
# must do this otherwise urllib can't parse the urls properly :(
 
166
for scheme in ['ssh', 'bzr', 'bzr+loopback', 'bzr+ssh']:
 
167
    transport.register_urlparse_netloc_protocol(scheme)
 
168
del scheme
 
169
 
 
170
 
 
171
def _recv_tuple(from_file):
 
172
    req_line = from_file.readline()
 
173
    return _decode_tuple(req_line)
 
174
 
 
175
 
 
176
def _decode_tuple(req_line):
 
177
    if req_line == None or req_line == '':
 
178
        return None
 
179
    if req_line[-1] != '\n':
 
180
        raise errors.SmartProtocolError("request %r not terminated" % req_line)
 
181
    return tuple((a.decode('utf-8') for a in req_line[:-1].split('\x01')))
 
182
 
 
183
 
 
184
def _encode_tuple(args):
 
185
    """Encode the tuple args to a bytestream."""
 
186
    return '\x01'.join((a.encode('utf-8') for a in args)) + '\n'
 
187
 
 
188
 
 
189
class SmartProtocolBase(object):
 
190
    """Methods common to client and server"""
 
191
 
 
192
    def _send_bulk_data(self, body):
 
193
        """Send chunked body data"""
 
194
        assert isinstance(body, str)
 
195
        bytes = ''.join(('%d\n' % len(body), body, 'done\n'))
 
196
        self._write_and_flush(bytes)
 
197
 
 
198
    # TODO: this only actually accomodates a single block; possibly should support
 
199
    # multiple chunks?
 
200
    def _recv_bulk(self):
 
201
        chunk_len = self._in.readline()
 
202
        try:
 
203
            chunk_len = int(chunk_len)
 
204
        except ValueError:
 
205
            raise errors.SmartProtocolError("bad chunk length line %r" % chunk_len)
 
206
        bulk = self._in.read(chunk_len)
 
207
        if len(bulk) != chunk_len:
 
208
            raise errors.SmartProtocolError("short read fetching bulk data chunk")
 
209
        self._recv_trailer()
 
210
        return bulk
 
211
 
 
212
    def _recv_tuple(self):
 
213
        return _recv_tuple(self._in)
 
214
 
 
215
    def _recv_trailer(self):
 
216
        resp = self._recv_tuple()
 
217
        if resp == ('done', ):
 
218
            return
 
219
        else:
 
220
            self._translate_error(resp)
 
221
 
 
222
    def _serialise_offsets(self, offsets):
 
223
        """Serialise a readv offset list."""
 
224
        txt = []
 
225
        for start, length in offsets:
 
226
            txt.append('%d,%d' % (start, length))
 
227
        return '\n'.join(txt)
 
228
 
 
229
    def _write_and_flush(self, bytes):
 
230
        """Write bytes to self._out and flush it."""
 
231
        # XXX: this will be inefficient.  Just ask Robert.
 
232
        self._out.write(bytes)
 
233
        self._out.flush()
 
234
 
 
235
 
 
236
class SmartStreamServer(SmartProtocolBase):
 
237
    """Handles smart commands coming over a stream.
 
238
 
 
239
    The stream may be a pipe connected to sshd, or a tcp socket, or an
 
240
    in-process fifo for testing.
 
241
 
 
242
    One instance is created for each connected client; it can serve multiple
 
243
    requests in the lifetime of the connection.
 
244
 
 
245
    The server passes requests through to an underlying backing transport, 
 
246
    which will typically be a LocalTransport looking at the server's filesystem.
 
247
    """
 
248
 
 
249
    def __init__(self, in_file, out_file, backing_transport):
 
250
        """Construct new server.
 
251
 
 
252
        :param in_file: Python file from which requests can be read.
 
253
        :param out_file: Python file to write responses.
 
254
        :param backing_transport: Transport for the directory served.
 
255
        """
 
256
        self._in = in_file
 
257
        self._out = out_file
 
258
        self.smart_server = SmartServer(backing_transport)
 
259
        # server can call back to us to get bulk data - this is not really
 
260
        # ideal, they should get it per request instead
 
261
        self.smart_server._recv_body = self._recv_bulk
 
262
 
 
263
    def _recv_tuple(self):
 
264
        """Read a request from the client and return as a tuple.
 
265
        
 
266
        Returns None at end of file (if the client closed the connection.)
 
267
        """
 
268
        return _recv_tuple(self._in)
 
269
 
 
270
    def _send_tuple(self, args):
 
271
        """Send response header"""
 
272
        return self._write_and_flush(_encode_tuple(args))
 
273
 
 
274
    def _send_error_and_disconnect(self, exception):
 
275
        self._send_tuple(('error', str(exception)))
 
276
        ## self._out.close()
 
277
        ## self._in.close()
 
278
 
 
279
    def _serve_one_request(self):
 
280
        """Read one request from input, process, send back a response.
 
281
        
 
282
        :return: False if the server should terminate, otherwise None.
 
283
        """
 
284
        req_args = self._recv_tuple()
 
285
        if req_args == None:
 
286
            # client closed connection
 
287
            return False  # shutdown server
 
288
        try:
 
289
            response = self.smart_server.dispatch_command(req_args[0], req_args[1:])
 
290
            self._send_tuple(response.args)
 
291
            if response.body is not None:
 
292
                self._send_bulk_data(response.body)
 
293
        except KeyboardInterrupt:
 
294
            raise
 
295
        except Exception, e:
 
296
            # everything else: pass to client, flush, and quit
 
297
            self._send_error_and_disconnect(e)
 
298
            return False
 
299
 
 
300
    def serve(self):
 
301
        """Serve requests until the client disconnects."""
 
302
        # Keep a reference to stderr because the sys module's globals get set to
 
303
        # None during interpreter shutdown.
 
304
        from sys import stderr
 
305
        try:
 
306
            while self._serve_one_request() != False:
 
307
                pass
 
308
        except Exception, e:
 
309
            stderr.write("%s terminating on exception %s\n" % (self, e))
 
310
            raise
 
311
 
 
312
 
 
313
class SmartServerResponse(object):
 
314
    """Response generated by SmartServer."""
 
315
 
 
316
    def __init__(self, args, body=None):
 
317
        self.args = args
 
318
        self.body = body
 
319
 
 
320
# XXX: TODO: Create a SmartServerRequest which will take the responsibility
 
321
# for delivering the data for a request. This could be done with as the
 
322
# StreamServer, though that would create conflation between request and response
 
323
# which may be undesirable.
 
324
 
 
325
 
 
326
class SmartServer(object):
 
327
    """Protocol logic for smart server.
 
328
    
 
329
    This doesn't handle serialization at all, it just processes requests and
 
330
    creates responses.
 
331
    """
 
332
 
 
333
    # IMPORTANT FOR IMPLEMENTORS: It is important that SmartServer not contain
 
334
    # encoding or decoding logic to allow the wire protocol to vary from the
 
335
    # object protocol: we will want to tweak the wire protocol separate from
 
336
    # the object model, and ideally we will be able to do that without having
 
337
    # a SmartServer subclass for each wire protocol, rather just a Protocol
 
338
    # subclass.
 
339
 
 
340
    # TODO: Better way of representing the body for commands that take it,
 
341
    # and allow it to be streamed into the server.
 
342
    
 
343
    def __init__(self, backing_transport):
 
344
        self._backing_transport = backing_transport
 
345
        
 
346
    def do_hello(self):
 
347
        """Answer a version request with my version."""
 
348
        return SmartServerResponse(('ok', '1'))
 
349
 
 
350
    def do_has(self, relpath):
 
351
        r = self._backing_transport.has(relpath) and 'yes' or 'no'
 
352
        return SmartServerResponse((r,))
 
353
 
 
354
    def do_get(self, relpath):
 
355
        backing_bytes = self._backing_transport.get_bytes(relpath)
 
356
        return SmartServerResponse(('ok',), backing_bytes)
 
357
 
 
358
    def _deserialise_optional_mode(self, mode):
 
359
        # XXX: FIXME this should be on the protocol object.
 
360
        if mode == '':
 
361
            return None
 
362
        else:
 
363
            return int(mode)
 
364
 
 
365
    def do_append(self, relpath, mode):
 
366
        old_length = self._backing_transport.append_bytes(
 
367
            relpath, self._recv_body(), self._deserialise_optional_mode(mode))
 
368
        return SmartServerResponse(('appended', '%d' % old_length))
 
369
 
 
370
    def do_delete(self, relpath):
 
371
        self._backing_transport.delete(relpath)
 
372
 
 
373
    def do_iter_files_recursive(self, abspath):
 
374
        # XXX: the path handling needs some thought.
 
375
        #relpath = self._backing_transport.relpath(abspath)
 
376
        transport = self._backing_transport.clone(abspath)
 
377
        filenames = transport.iter_files_recursive()
 
378
        return SmartServerResponse(('names',) + tuple(filenames))
 
379
 
 
380
    def do_list_dir(self, relpath):
 
381
        filenames = self._backing_transport.list_dir(relpath)
 
382
        return SmartServerResponse(('names',) + tuple(filenames))
 
383
 
 
384
    def do_mkdir(self, relpath, mode):
 
385
        self._backing_transport.mkdir(relpath,
 
386
                                      self._deserialise_optional_mode(mode))
 
387
 
 
388
    def do_move(self, rel_from, rel_to):
 
389
        self._backing_transport.move(rel_from, rel_to)
 
390
 
 
391
    def do_put(self, relpath, mode):
 
392
        self._backing_transport.put_bytes(relpath,
 
393
                self._recv_body(),
 
394
                self._deserialise_optional_mode(mode))
 
395
 
 
396
    def _deserialise_offsets(self, text):
 
397
        # XXX: FIXME this should be on the protocol object.
 
398
        offsets = []
 
399
        for line in text.split('\n'):
 
400
            if not line:
 
401
                continue
 
402
            start, length = line.split(',')
 
403
            offsets.append((int(start), int(length)))
 
404
        return offsets
 
405
 
 
406
    def do_put_non_atomic(self, relpath, mode, create_parent, dir_mode):
 
407
        create_parent_dir = (create_parent == 'T')
 
408
        self._backing_transport.put_bytes_non_atomic(relpath,
 
409
                self._recv_body(),
 
410
                mode=self._deserialise_optional_mode(mode),
 
411
                create_parent_dir=create_parent_dir,
 
412
                dir_mode=self._deserialise_optional_mode(dir_mode))
 
413
 
 
414
    def do_readv(self, relpath):
 
415
        offsets = self._deserialise_offsets(self._recv_body())
 
416
        backing_bytes = ''.join(bytes for offset, bytes in
 
417
                             self._backing_transport.readv(relpath, offsets))
 
418
        return SmartServerResponse(('readv',), backing_bytes)
 
419
        
 
420
    def do_rename(self, rel_from, rel_to):
 
421
        self._backing_transport.rename(rel_from, rel_to)
 
422
 
 
423
    def do_rmdir(self, relpath):
 
424
        self._backing_transport.rmdir(relpath)
 
425
 
 
426
    def do_stat(self, relpath):
 
427
        stat = self._backing_transport.stat(relpath)
 
428
        return SmartServerResponse(('stat', str(stat.st_size), oct(stat.st_mode)))
 
429
        
 
430
    def do_get_bundle(self, path, revision_id):
 
431
        # open transport relative to our base
 
432
        t = self._backing_transport.clone(path)
 
433
        control, extra_path = bzrdir.BzrDir.open_containing_from_transport(t)
 
434
        repo = control.open_repository()
 
435
        tmpf = tempfile.TemporaryFile()
 
436
        base_revision = revision.NULL_REVISION
 
437
        write_bundle(repo, revision_id, base_revision, tmpf)
 
438
        tmpf.seek(0)
 
439
        return SmartServerResponse((), tmpf.read())
 
440
 
 
441
    def dispatch_command(self, cmd, args):
 
442
        func = getattr(self, 'do_' + cmd, None)
 
443
        if func is None:
 
444
            raise errors.SmartProtocolError("bad request %r" % (cmd,))
 
445
        try:
 
446
            result = func(*args)
 
447
            if result is None: 
 
448
                result = SmartServerResponse(('ok',))
 
449
            return result
 
450
        except errors.NoSuchFile, e:
 
451
            return SmartServerResponse(('NoSuchFile', e.path))
 
452
        except errors.FileExists, e:
 
453
            return SmartServerResponse(('FileExists', e.path))
 
454
        except errors.DirectoryNotEmpty, e:
 
455
            return SmartServerResponse(('DirectoryNotEmpty', e.path))
 
456
        except errors.ShortReadvError, e:
 
457
            return SmartServerResponse(('ShortReadvError',
 
458
                e.path, str(e.offset), str(e.length), str(e.actual)))
 
459
        except UnicodeError, e:
 
460
            # If it is a DecodeError, than most likely we are starting
 
461
            # with a plain string
 
462
            str_or_unicode = e.object
 
463
            if isinstance(str_or_unicode, unicode):
 
464
                val = u'u:' + str_or_unicode
 
465
            else:
 
466
                val = u's:' + str_or_unicode.encode('base64')
 
467
            # This handles UnicodeEncodeError or UnicodeDecodeError
 
468
            return SmartServerResponse((e.__class__.__name__,
 
469
                    e.encoding, val, str(e.start), str(e.end), e.reason))
 
470
        except errors.TransportNotPossible, e:
 
471
            if e.msg == "readonly transport":
 
472
                return SmartServerResponse(('ReadOnlyError', ))
 
473
            else:
 
474
                raise
 
475
 
 
476
 
 
477
class SmartTCPServer(object):
 
478
    """Listens on a TCP socket and accepts connections from smart clients"""
 
479
 
 
480
    def __init__(self, backing_transport=None, host='127.0.0.1', port=0):
 
481
        """Construct a new server.
 
482
 
 
483
        To actually start it running, call either start_background_thread or
 
484
        serve.
 
485
 
 
486
        :param host: Name of the interface to listen on.
 
487
        :param port: TCP port to listen on, or 0 to allocate a transient port.
 
488
        """
 
489
        if backing_transport is None:
 
490
            backing_transport = memory.MemoryTransport()
 
491
        self._server_socket = socket.socket()
 
492
        self._server_socket.bind((host, port))
 
493
        self.port = self._server_socket.getsockname()[1]
 
494
        self._server_socket.listen(1)
 
495
        self._server_socket.settimeout(1)
 
496
        self.backing_transport = backing_transport
 
497
 
 
498
    def serve(self):
 
499
        # let connections timeout so that we get a chance to terminate
 
500
        # Keep a reference to the exceptions we want to catch because the socket
 
501
        # module's globals get set to None during interpreter shutdown.
 
502
        from socket import timeout as socket_timeout
 
503
        from socket import error as socket_error
 
504
        self._should_terminate = False
 
505
        while not self._should_terminate:
 
506
            try:
 
507
                self.accept_and_serve()
 
508
            except socket_timeout:
 
509
                # just check if we're asked to stop
 
510
                pass
 
511
            except socket_error, e:
 
512
                trace.warning("client disconnected: %s", e)
 
513
                pass
 
514
 
 
515
    def get_url(self):
 
516
        """Return the url of the server"""
 
517
        return "bzr://%s:%d/" % self._server_socket.getsockname()
 
518
 
 
519
    def accept_and_serve(self):
 
520
        conn, client_addr = self._server_socket.accept()
 
521
        conn.setsockopt(socket.IPPROTO_TCP, socket.TCP_NODELAY, 1)
 
522
        from_client = conn.makefile('r')
 
523
        to_client = conn.makefile('w')
 
524
        handler = SmartStreamServer(from_client, to_client,
 
525
                self.backing_transport)
 
526
        connection_thread = threading.Thread(None, handler.serve, name='smart-server-child')
 
527
        connection_thread.setDaemon(True)
 
528
        connection_thread.start()
 
529
 
 
530
    def start_background_thread(self):
 
531
        self._server_thread = threading.Thread(None,
 
532
                self.serve,
 
533
                name='server-' + self.get_url())
 
534
        self._server_thread.setDaemon(True)
 
535
        self._server_thread.start()
 
536
 
 
537
    def stop_background_thread(self):
 
538
        self._should_terminate = True
 
539
        # self._server_socket.close()
 
540
        # we used to join the thread, but it's not really necessary; it will
 
541
        # terminate in time
 
542
        ## self._server_thread.join()
 
543
 
 
544
 
 
545
class SmartTCPServer_for_testing(SmartTCPServer):
 
546
    """Server suitable for use by transport tests.
 
547
    
 
548
    This server is backed by the process's cwd.
 
549
    """
 
550
 
 
551
    def __init__(self):
 
552
        self._homedir = os.getcwd()
 
553
        # The server is set up by default like for ssh access: the client
 
554
        # passes filesystem-absolute paths; therefore the server must look
 
555
        # them up relative to the root directory.  it might be better to act
 
556
        # a public server and have the server rewrite paths into the test
 
557
        # directory.
 
558
        SmartTCPServer.__init__(self, transport.get_transport("file:///"))
 
559
        
 
560
    def setUp(self):
 
561
        """Set up server for testing"""
 
562
        self.start_background_thread()
 
563
 
 
564
    def tearDown(self):
 
565
        self.stop_background_thread()
 
566
 
 
567
    def get_url(self):
 
568
        """Return the url of the server"""
 
569
        host, port = self._server_socket.getsockname()
 
570
        # XXX: I think this is likely to break on windows -- self._homedir will
 
571
        # have backslashes (and maybe a drive letter?).
 
572
        #  -- Andrew Bennetts, 2006-08-29
 
573
        return "bzr://%s:%d%s" % (host, port, urlutils.escape(self._homedir))
 
574
 
 
575
    def get_bogus_url(self):
 
576
        """Return a URL which will fail to connect"""
 
577
        return 'bzr://127.0.0.1:1/'
 
578
 
 
579
 
 
580
class SmartStat(object):
 
581
 
 
582
    def __init__(self, size, mode):
 
583
        self.st_size = size
 
584
        self.st_mode = mode
 
585
 
 
586
 
 
587
class SmartTransport(transport.Transport):
 
588
    """Connection to a smart server.
 
589
 
 
590
    The connection holds references to pipes that can be used to send requests
 
591
    to the server.
 
592
 
 
593
    The connection has a notion of the current directory to which it's
 
594
    connected; this is incorporated in filenames passed to the server.
 
595
    
 
596
    This supports some higher-level RPC operations and can also be treated 
 
597
    like a Transport to do file-like operations.
 
598
 
 
599
    The connection can be made over a tcp socket, or (in future) an ssh pipe
 
600
    or a series of http requests.  There are concrete subclasses for each
 
601
    type: SmartTCPTransport, etc.
 
602
    """
 
603
 
 
604
    # IMPORTANT FOR IMPLEMENTORS: SmartTransport MUST NOT be given encoding
 
605
    # responsibilities: Put those on SmartClient or similar. This is vital for
 
606
    # the ability to support multiple versions of the smart protocol over time:
 
607
    # SmartTransport is an adapter from the Transport object model to the 
 
608
    # SmartClient model, not an encoder.
 
609
 
 
610
    def __init__(self, url, clone_from=None, client=None):
 
611
        """Constructor.
 
612
 
 
613
        :param client: ignored when clone_from is not None.
 
614
        """
 
615
        ### Technically super() here is faulty because Transport's __init__
 
616
        ### fails to take 2 parameters, and if super were to choose a silly
 
617
        ### initialisation order things would blow up. 
 
618
        if not url.endswith('/'):
 
619
            url += '/'
 
620
        super(SmartTransport, self).__init__(url)
 
621
        self._scheme, self._username, self._password, self._host, self._port, self._path = \
 
622
                transport.split_url(url)
 
623
        if clone_from is None:
 
624
            if client is None:
 
625
                self._client = SmartStreamClient(self._connect_to_server)
 
626
            else:
 
627
                self._client = client
 
628
        else:
 
629
            # credentials may be stripped from the base in some circumstances
 
630
            # as yet to be clearly defined or documented, so copy them.
 
631
            self._username = clone_from._username
 
632
            # reuse same connection
 
633
            self._client = clone_from._client
 
634
 
 
635
    def abspath(self, relpath):
 
636
        """Return the full url to the given relative path.
 
637
        
 
638
        @param relpath: the relative path or path components
 
639
        @type relpath: str or list
 
640
        """
 
641
        return self._unparse_url(self._remote_path(relpath))
 
642
    
 
643
    def clone(self, relative_url):
 
644
        """Make a new SmartTransport related to me, sharing the same connection.
 
645
 
 
646
        This essentially opens a handle on a different remote directory.
 
647
        """
 
648
        if relative_url is None:
 
649
            return self.__class__(self.base, self)
 
650
        else:
 
651
            return self.__class__(self.abspath(relative_url), self)
 
652
 
 
653
    def is_readonly(self):
 
654
        """Smart server transport can do read/write file operations."""
 
655
        return False
 
656
                                                   
 
657
    def get_smart_client(self):
 
658
        return self._client
 
659
                                                   
 
660
    def _unparse_url(self, path):
 
661
        """Return URL for a path.
 
662
 
 
663
        :see: SFTPUrlHandling._unparse_url
 
664
        """
 
665
        # TODO: Eventually it should be possible to unify this with
 
666
        # SFTPUrlHandling._unparse_url?
 
667
        if path == '':
 
668
            path = '/'
 
669
        path = urllib.quote(path)
 
670
        netloc = urllib.quote(self._host)
 
671
        if self._username is not None:
 
672
            netloc = '%s@%s' % (urllib.quote(self._username), netloc)
 
673
        if self._port is not None:
 
674
            netloc = '%s:%d' % (netloc, self._port)
 
675
        return urlparse.urlunparse((self._scheme, netloc, path, '', '', ''))
 
676
 
 
677
    def _remote_path(self, relpath):
 
678
        """Returns the Unicode version of the absolute path for relpath."""
 
679
        return self._combine_paths(self._path, relpath)
 
680
 
 
681
    def has(self, relpath):
 
682
        """Indicate whether a remote file of the given name exists or not.
 
683
 
 
684
        :see: Transport.has()
 
685
        """
 
686
        resp = self._client._call('has', self._remote_path(relpath))
 
687
        if resp == ('yes', ):
 
688
            return True
 
689
        elif resp == ('no', ):
 
690
            return False
 
691
        else:
 
692
            self._translate_error(resp)
 
693
 
 
694
    def get(self, relpath):
 
695
        """Return file-like object reading the contents of a remote file.
 
696
        
 
697
        :see: Transport.get_bytes()/get_file()
 
698
        """
 
699
        remote = self._remote_path(relpath)
 
700
        resp = self._client._call('get', remote)
 
701
        if resp != ('ok', ):
 
702
            self._translate_error(resp, relpath)
 
703
        return StringIO(self._client._recv_bulk())
 
704
 
 
705
    def _serialise_optional_mode(self, mode):
 
706
        if mode is None:
 
707
            return ''
 
708
        else:
 
709
            return '%d' % mode
 
710
 
 
711
    def mkdir(self, relpath, mode=None):
 
712
        resp = self._client._call('mkdir', 
 
713
                                  self._remote_path(relpath), 
 
714
                                  self._serialise_optional_mode(mode))
 
715
        self._translate_error(resp)
 
716
 
 
717
    def put_bytes(self, relpath, upload_contents, mode=None):
 
718
        # FIXME: upload_file is probably not safe for non-ascii characters -
 
719
        # should probably just pass all parameters as length-delimited
 
720
        # strings?
 
721
        resp = self._client._call_with_upload(
 
722
            'put',
 
723
            (self._remote_path(relpath), self._serialise_optional_mode(mode)),
 
724
            upload_contents)
 
725
        self._translate_error(resp)
 
726
 
 
727
    def put_bytes_non_atomic(self, relpath, bytes, mode=None,
 
728
                             create_parent_dir=False,
 
729
                             dir_mode=None):
 
730
        """See Transport.put_bytes_non_atomic."""
 
731
        # FIXME: no encoding in the transport!
 
732
        create_parent_str = 'F'
 
733
        if create_parent_dir:
 
734
            create_parent_str = 'T'
 
735
 
 
736
        resp = self._client._call_with_upload(
 
737
            'put_non_atomic',
 
738
            (self._remote_path(relpath), self._serialise_optional_mode(mode),
 
739
             create_parent_str, self._serialise_optional_mode(dir_mode)),
 
740
            bytes)
 
741
        self._translate_error(resp)
 
742
 
 
743
    def put_file(self, relpath, upload_file, mode=None):
 
744
        # its not ideal to seek back, but currently put_non_atomic_file depends
 
745
        # on transports not reading before failing - which is a faulty
 
746
        # assumption I think - RBC 20060915
 
747
        pos = upload_file.tell()
 
748
        try:
 
749
            return self.put_bytes(relpath, upload_file.read(), mode)
 
750
        except:
 
751
            upload_file.seek(pos)
 
752
            raise
 
753
 
 
754
    def put_file_non_atomic(self, relpath, f, mode=None,
 
755
                            create_parent_dir=False,
 
756
                            dir_mode=None):
 
757
        return self.put_bytes_non_atomic(relpath, f.read(), mode=mode,
 
758
                                         create_parent_dir=create_parent_dir,
 
759
                                         dir_mode=dir_mode)
 
760
 
 
761
    def append_file(self, relpath, from_file, mode=None):
 
762
        return self.append_bytes(relpath, from_file.read(), mode)
 
763
        
 
764
    def append_bytes(self, relpath, bytes, mode=None):
 
765
        resp = self._client._call_with_upload(
 
766
            'append',
 
767
            (self._remote_path(relpath), self._serialise_optional_mode(mode)),
 
768
            bytes)
 
769
        if resp[0] == 'appended':
 
770
            return int(resp[1])
 
771
        self._translate_error(resp)
 
772
 
 
773
    def delete(self, relpath):
 
774
        resp = self._client._call('delete', self._remote_path(relpath))
 
775
        self._translate_error(resp)
 
776
 
 
777
    def readv(self, relpath, offsets):
 
778
        if not offsets:
 
779
            return
 
780
 
 
781
        offsets = list(offsets)
 
782
 
 
783
        sorted_offsets = sorted(offsets)
 
784
        # turn the list of offsets into a stack
 
785
        offset_stack = iter(offsets)
 
786
        cur_offset_and_size = offset_stack.next()
 
787
        coalesced = list(self._coalesce_offsets(sorted_offsets,
 
788
                               limit=self._max_readv_combine,
 
789
                               fudge_factor=self._bytes_to_read_before_seek))
 
790
 
 
791
 
 
792
        resp = self._client._call_with_upload(
 
793
            'readv',
 
794
            (self._remote_path(relpath),),
 
795
            self._client._serialise_offsets((c.start, c.length) for c in coalesced))
 
796
 
 
797
        if resp[0] != 'readv':
 
798
            # This should raise an exception
 
799
            self._translate_error(resp)
 
800
            return
 
801
 
 
802
        data = self._client._recv_bulk()
 
803
        # Cache the results, but only until they have been fulfilled
 
804
        data_map = {}
 
805
        for c_offset in coalesced:
 
806
            if len(data) < c_offset.length:
 
807
                raise errors.ShortReadvError(relpath, c_offset.start,
 
808
                            c_offset.length, actual=len(data))
 
809
            for suboffset, subsize in c_offset.ranges:
 
810
                key = (c_offset.start+suboffset, subsize)
 
811
                data_map[key] = data[suboffset:suboffset+subsize]
 
812
            data = data[c_offset.length:]
 
813
 
 
814
            # Now that we've read some data, see if we can yield anything back
 
815
            while cur_offset_and_size in data_map:
 
816
                this_data = data_map.pop(cur_offset_and_size)
 
817
                yield cur_offset_and_size[0], this_data
 
818
                cur_offset_and_size = offset_stack.next()
 
819
 
 
820
    def rename(self, rel_from, rel_to):
 
821
        self._call('rename', 
 
822
                   self._remote_path(rel_from),
 
823
                   self._remote_path(rel_to))
 
824
 
 
825
    def move(self, rel_from, rel_to):
 
826
        self._call('move', 
 
827
                   self._remote_path(rel_from),
 
828
                   self._remote_path(rel_to))
 
829
 
 
830
    def rmdir(self, relpath):
 
831
        resp = self._call('rmdir', self._remote_path(relpath))
 
832
 
 
833
    def _call(self, method, *args):
 
834
        resp = self._client._call(method, *args)
 
835
        self._translate_error(resp)
 
836
 
 
837
    def _translate_error(self, resp, orig_path=None):
 
838
        """Raise an exception from a response"""
 
839
        if resp is None:
 
840
            what = None
 
841
        else:
 
842
            what = resp[0]
 
843
        if what == 'ok':
 
844
            return
 
845
        elif what == 'NoSuchFile':
 
846
            if orig_path is not None:
 
847
                error_path = orig_path
 
848
            else:
 
849
                error_path = resp[1]
 
850
            raise errors.NoSuchFile(error_path)
 
851
        elif what == 'error':
 
852
            raise errors.SmartProtocolError(unicode(resp[1]))
 
853
        elif what == 'FileExists':
 
854
            raise errors.FileExists(resp[1])
 
855
        elif what == 'DirectoryNotEmpty':
 
856
            raise errors.DirectoryNotEmpty(resp[1])
 
857
        elif what == 'ShortReadvError':
 
858
            raise errors.ShortReadvError(resp[1], int(resp[2]),
 
859
                                         int(resp[3]), int(resp[4]))
 
860
        elif what in ('UnicodeEncodeError', 'UnicodeDecodeError'):
 
861
            encoding = str(resp[1]) # encoding must always be a string
 
862
            val = resp[2]
 
863
            start = int(resp[3])
 
864
            end = int(resp[4])
 
865
            reason = str(resp[5]) # reason must always be a string
 
866
            if val.startswith('u:'):
 
867
                val = val[2:]
 
868
            elif val.startswith('s:'):
 
869
                val = val[2:].decode('base64')
 
870
            if what == 'UnicodeDecodeError':
 
871
                raise UnicodeDecodeError(encoding, val, start, end, reason)
 
872
            elif what == 'UnicodeEncodeError':
 
873
                raise UnicodeEncodeError(encoding, val, start, end, reason)
 
874
        elif what == "ReadOnlyError":
 
875
            raise errors.TransportNotPossible('readonly transport')
 
876
        else:
 
877
            raise errors.SmartProtocolError('unexpected smart server error: %r' % (resp,))
 
878
 
 
879
    def _send_tuple(self, args):
 
880
        self._client._send_tuple(args)
 
881
 
 
882
    def _recv_tuple(self):
 
883
        return self._client._recv_tuple()
 
884
 
 
885
    def disconnect(self):
 
886
        self._client.disconnect()
 
887
 
 
888
    def delete_tree(self, relpath):
 
889
        raise errors.TransportNotPossible('readonly transport')
 
890
 
 
891
    def stat(self, relpath):
 
892
        resp = self._client._call('stat', self._remote_path(relpath))
 
893
        if resp[0] == 'stat':
 
894
            return SmartStat(int(resp[1]), int(resp[2], 8))
 
895
        else:
 
896
            self._translate_error(resp)
 
897
 
 
898
    ## def lock_read(self, relpath):
 
899
    ##     """Lock the given file for shared (read) access.
 
900
    ##     :return: A lock object, which should be passed to Transport.unlock()
 
901
    ##     """
 
902
    ##     # The old RemoteBranch ignore lock for reading, so we will
 
903
    ##     # continue that tradition and return a bogus lock object.
 
904
    ##     class BogusLock(object):
 
905
    ##         def __init__(self, path):
 
906
    ##             self.path = path
 
907
    ##         def unlock(self):
 
908
    ##             pass
 
909
    ##     return BogusLock(relpath)
 
910
 
 
911
    def listable(self):
 
912
        return True
 
913
 
 
914
    def list_dir(self, relpath):
 
915
        resp = self._client._call('list_dir',
 
916
                                  self._remote_path(relpath))
 
917
        if resp[0] == 'names':
 
918
            return [name.encode('ascii') for name in resp[1:]]
 
919
        else:
 
920
            self._translate_error(resp)
 
921
 
 
922
    def iter_files_recursive(self):
 
923
        resp = self._client._call('iter_files_recursive',
 
924
                                  self._remote_path(''))
 
925
        if resp[0] == 'names':
 
926
            return resp[1:]
 
927
        else:
 
928
            self._translate_error(resp)
 
929
 
 
930
 
 
931
class SmartStreamClient(SmartProtocolBase):
 
932
    """Connection to smart server over two streams"""
 
933
 
 
934
    def __init__(self, connect_func):
 
935
        self._connect_func = connect_func
 
936
        self._connected = False
 
937
 
 
938
    def __del__(self):
 
939
        self.disconnect()
 
940
 
 
941
    def _ensure_connection(self):
 
942
        if not self._connected:
 
943
            self._in, self._out = self._connect_func()
 
944
            self._connected = True
 
945
 
 
946
    def _send_tuple(self, args):
 
947
        self._ensure_connection()
 
948
        return self._write_and_flush(_encode_tuple(args))
 
949
 
 
950
    def _send_bulk_data(self, body):
 
951
        self._ensure_connection()
 
952
        SmartProtocolBase._send_bulk_data(self, body)
 
953
        
 
954
    def _recv_bulk(self):
 
955
        self._ensure_connection()
 
956
        return SmartProtocolBase._recv_bulk(self)
 
957
 
 
958
    def _recv_tuple(self):
 
959
        self._ensure_connection()
 
960
        return SmartProtocolBase._recv_tuple(self)
 
961
 
 
962
    def _recv_trailer(self):
 
963
        self._ensure_connection()
 
964
        return SmartProtocolBase._recv_trailer(self)
 
965
 
 
966
    def disconnect(self):
 
967
        """Close connection to the server"""
 
968
        if self._connected:
 
969
            self._out.close()
 
970
            self._in.close()
 
971
 
 
972
    def _call(self, *args):
 
973
        self._send_tuple(args)
 
974
        return self._recv_tuple()
 
975
 
 
976
    def _call_with_upload(self, method, args, body):
 
977
        """Call an rpc, supplying bulk upload data.
 
978
 
 
979
        :param method: method name to call
 
980
        :param args: parameter args tuple
 
981
        :param body: upload body as a byte string
 
982
        """
 
983
        self._send_tuple((method,) + args)
 
984
        self._send_bulk_data(body)
 
985
        return self._recv_tuple()
 
986
 
 
987
    def query_version(self):
 
988
        """Return protocol version number of the server."""
 
989
        # XXX: should make sure it's empty
 
990
        self._send_tuple(('hello',))
 
991
        resp = self._recv_tuple()
 
992
        if resp == ('ok', '1'):
 
993
            return 1
 
994
        else:
 
995
            raise errors.SmartProtocolError("bad response %r" % (resp,))
 
996
 
 
997
 
 
998
class SmartTCPTransport(SmartTransport):
 
999
    """Connection to smart server over plain tcp"""
 
1000
 
 
1001
    def __init__(self, url, clone_from=None):
 
1002
        super(SmartTCPTransport, self).__init__(url, clone_from)
 
1003
        try:
 
1004
            self._port = int(self._port)
 
1005
        except (ValueError, TypeError), e:
 
1006
            raise errors.InvalidURL(path=url, extra="invalid port %s" % self._port)
 
1007
        self._socket = None
 
1008
 
 
1009
    def _connect_to_server(self):
 
1010
        self._socket = socket.socket()
 
1011
        self._socket.setsockopt(socket.IPPROTO_TCP, socket.TCP_NODELAY, 1)
 
1012
        result = self._socket.connect_ex((self._host, int(self._port)))
 
1013
        if result:
 
1014
            raise errors.ConnectionError("failed to connect to %s:%d: %s" %
 
1015
                    (self._host, self._port, os.strerror(result)))
 
1016
        # TODO: May be more efficient to just treat them as sockets
 
1017
        # throughout?  But what about pipes to ssh?...
 
1018
        to_server = self._socket.makefile('w')
 
1019
        from_server = self._socket.makefile('r')
 
1020
        return from_server, to_server
 
1021
 
 
1022
    def disconnect(self):
 
1023
        super(SmartTCPTransport, self).disconnect()
 
1024
        # XXX: Is closing the socket as well as closing the files really
 
1025
        # necessary?
 
1026
        if self._socket is not None:
 
1027
            self._socket.close()
 
1028
 
 
1029
try:
 
1030
    from bzrlib.transport import sftp, ssh
 
1031
except errors.ParamikoNotPresent:
 
1032
    # no paramiko, no SSHTransport.
 
1033
    pass
 
1034
else:
 
1035
    class SmartSSHTransport(SmartTransport):
 
1036
        """Connection to smart server over SSH."""
 
1037
 
 
1038
        def __init__(self, url, clone_from=None):
 
1039
            # TODO: all this probably belongs in the parent class.
 
1040
            super(SmartSSHTransport, self).__init__(url, clone_from)
 
1041
            try:
 
1042
                if self._port is not None:
 
1043
                    self._port = int(self._port)
 
1044
            except (ValueError, TypeError), e:
 
1045
                raise errors.InvalidURL(path=url, extra="invalid port %s" % self._port)
 
1046
 
 
1047
        def _connect_to_server(self):
 
1048
            executable = os.environ.get('BZR_REMOTE_PATH', 'bzr')
 
1049
            vendor = ssh._get_ssh_vendor()
 
1050
            self._ssh_connection = vendor.connect_ssh(self._username,
 
1051
                    self._password, self._host, self._port,
 
1052
                    command=[executable, 'serve', '--inet', '--directory=/',
 
1053
                             '--allow-writes'])
 
1054
            return self._ssh_connection.get_filelike_channels()
 
1055
 
 
1056
        def disconnect(self):
 
1057
            super(SmartSSHTransport, self).disconnect()
 
1058
            self._ssh_connection.close()
 
1059
 
 
1060
 
 
1061
def get_test_permutations():
 
1062
    """Return (transport, server) permutations for testing"""
 
1063
    return [(SmartTCPTransport, SmartTCPServer_for_testing)]