~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/transport/remote.py

Merge bzr.dev.

Show diffs side-by-side

added added

removed removed

Lines of Context:
14
14
# along with this program; if not, write to the Free Software
15
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
16
 
17
 
"""Smart-server protocol, client and server.
18
 
 
19
 
Requests are sent as a command and list of arguments, followed by optional
20
 
bulk body data.  Responses are similarly a response and list of arguments,
21
 
followed by bulk body data. ::
22
 
 
23
 
  SEP := '\001'
24
 
    Fields are separated by Ctrl-A.
25
 
  BULK_DATA := CHUNK TRAILER
26
 
    Chunks can be repeated as many times as necessary.
27
 
  CHUNK := CHUNK_LEN CHUNK_BODY
28
 
  CHUNK_LEN := DIGIT+ NEWLINE
29
 
    Gives the number of bytes in the following chunk.
30
 
  CHUNK_BODY := BYTE[chunk_len]
31
 
  TRAILER := SUCCESS_TRAILER | ERROR_TRAILER
32
 
  SUCCESS_TRAILER := 'done' NEWLINE
33
 
  ERROR_TRAILER := 
34
 
 
35
 
Paths are passed across the network.  The client needs to see a namespace that
36
 
includes any repository that might need to be referenced, and the client needs
37
 
to know about a root directory beyond which it cannot ascend.
38
 
 
39
 
Servers run over ssh will typically want to be able to access any path the user 
40
 
can access.  Public servers on the other hand (which might be over http, ssh
41
 
or tcp) will typically want to restrict access to only a particular directory 
42
 
and its children, so will want to do a software virtual root at that level.
43
 
In other words they'll want to rewrite incoming paths to be under that level
44
 
(and prevent escaping using ../ tricks.)
45
 
 
46
 
URLs that include ~ should probably be passed across to the server verbatim
47
 
and the server can expand them.  This will proably not be meaningful when 
48
 
limited to a directory?
49
 
 
50
 
At the bottom level socket, pipes, HTTP server.  For sockets, we have the idea
51
 
that you have multiple requests and get a read error because the other side did
52
 
shutdown.  For pipes we have read pipe which will have a zero read which marks
53
 
end-of-file.  For HTTP server environment there is not end-of-stream because
54
 
each request coming into the server is independent.
55
 
 
56
 
So we need a wrapper around pipes and sockets to seperate out requests from
57
 
substrate and this will give us a single model which is consist for HTTP,
58
 
sockets and pipes.
59
 
 
60
 
Server-side
61
 
-----------
62
 
 
63
 
 MEDIUM  (factory for protocol, reads bytes & pushes to protocol,
64
 
          uses protocol to detect end-of-request, sends written
65
 
          bytes to client) e.g. socket, pipe, HTTP request handler.
66
 
  ^
67
 
  | bytes.
68
 
  v
69
 
 
70
 
PROTOCOL  (serialization, deserialization)  accepts bytes for one
71
 
          request, decodes according to internal state, pushes
72
 
          structured data to handler.  accepts structured data from
73
 
          handler and encodes and writes to the medium.  factory for
74
 
          handler.
75
 
  ^
76
 
  | structured data
77
 
  v
78
 
 
79
 
HANDLER   (domain logic) accepts structured data, operates state
80
 
          machine until the request can be satisfied,
81
 
          sends structured data to the protocol.
82
 
 
83
 
 
84
 
Client-side
85
 
-----------
86
 
 
87
 
 CLIENT             domain logic, accepts domain requests, generated structured
88
 
                    data, reads structured data from responses and turns into
89
 
                    domain data.  Sends structured data to the protocol.
90
 
                    Operates state machines until the request can be delivered
91
 
                    (e.g. reading from a bundle generated in bzrlib to deliver a
92
 
                    complete request).
93
 
 
94
 
                    Possibly this should just be RemoteBzrDir, RemoteTransport,
95
 
                    ...
96
 
  ^
97
 
  | structured data
98
 
  v
99
 
 
100
 
PROTOCOL  (serialization, deserialization)  accepts structured data for one
101
 
          request, encodes and writes to the medium.  Reads bytes from the
102
 
          medium, decodes and allows the client to read structured data.
103
 
  ^
104
 
  | bytes.
105
 
  v
106
 
 
107
 
 MEDIUM  (accepts bytes from the protocol & delivers to the remote server.
108
 
          Allows the potocol to read bytes e.g. socket, pipe, HTTP request.
 
17
"""RemoteTransport client for the smart-server.
 
18
 
 
19
This module shouldn't be accessed directly.  The classes defined here should be
 
20
imported from bzrlib.smart.
109
21
"""
110
22
 
111
 
 
112
 
# TODO: _translate_error should be on the client, not the transport because
113
 
#     error coding is wire protocol specific.
114
 
 
115
 
# TODO: A plain integer from query_version is too simple; should give some
116
 
# capabilities too?
117
 
 
118
 
# TODO: Server should probably catch exceptions within itself and send them
119
 
# back across the network.  (But shouldn't catch KeyboardInterrupt etc)
120
 
# Also needs to somehow report protocol errors like bad requests.  Need to
121
 
# consider how we'll handle error reporting, e.g. if we get halfway through a
122
 
# bulk transfer and then something goes wrong.
123
 
 
124
 
# TODO: Standard marker at start of request/response lines?
125
 
 
126
 
# TODO: Make each request and response self-validatable, e.g. with checksums.
127
 
#
128
 
# TODO: get/put objects could be changed to gradually read back the data as it
129
 
# comes across the network
130
 
#
131
 
# TODO: What should the server do if it hits an error and has to terminate?
132
 
#
133
 
# TODO: is it useful to allow multiple chunks in the bulk data?
134
 
#
135
 
# TODO: If we get an exception during transmission of bulk data we can't just
136
 
# emit the exception because it won't be seen.
137
 
#   John proposes:  I think it would be worthwhile to have a header on each
138
 
#   chunk, that indicates it is another chunk. Then you can send an 'error'
139
 
#   chunk as long as you finish the previous chunk.
140
 
#
141
 
# TODO: Clone method on Transport; should work up towards parent directory;
142
 
# unclear how this should be stored or communicated to the server... maybe
143
 
# just pass it on all relevant requests?
144
 
#
145
 
# TODO: Better name than clone() for changing between directories.  How about
146
 
# open_dir or change_dir or chdir?
147
 
#
148
 
# TODO: Is it really good to have the notion of current directory within the
149
 
# connection?  Perhaps all Transports should factor out a common connection
150
 
# from the thing that has the directory context?
151
 
#
152
 
# TODO: Pull more things common to sftp and ssh to a higher level.
153
 
#
154
 
# TODO: The server that manages a connection should be quite small and retain
155
 
# minimum state because each of the requests are supposed to be stateless.
156
 
# Then we can write another implementation that maps to http.
157
 
#
158
 
# TODO: What to do when a client connection is garbage collected?  Maybe just
159
 
# abruptly drop the connection?
160
 
#
161
 
# TODO: Server in some cases will need to restrict access to files outside of
162
 
# a particular root directory.  LocalTransport doesn't do anything to stop you
163
 
# ascending above the base directory, so we need to prevent paths
164
 
# containing '..' in either the server or transport layers.  (Also need to
165
 
# consider what happens if someone creates a symlink pointing outside the 
166
 
# directory tree...)
167
 
#
168
 
# TODO: Server should rebase absolute paths coming across the network to put
169
 
# them under the virtual root, if one is in use.  LocalTransport currently
170
 
# doesn't do that; if you give it an absolute path it just uses it.
171
 
172
 
# XXX: Arguments can't contain newlines or ascii; possibly we should e.g.
173
 
# urlescape them instead.  Indeed possibly this should just literally be
174
 
# http-over-ssh.
175
 
#
176
 
# FIXME: This transport, with several others, has imperfect handling of paths
177
 
# within urls.  It'd probably be better for ".." from a root to raise an error
178
 
# rather than return the same directory as we do at present.
179
 
#
180
 
# TODO: Rather than working at the Transport layer we want a Branch,
181
 
# Repository or BzrDir objects that talk to a server.
182
 
#
183
 
# TODO: Probably want some way for server commands to gradually produce body
184
 
# data rather than passing it as a string; they could perhaps pass an
185
 
# iterator-like callback that will gradually yield data; it probably needs a
186
 
# close() method that will always be closed to do any necessary cleanup.
187
 
#
188
 
# TODO: Split the actual smart server from the ssh encoding of it.
189
 
#
190
 
# TODO: Perhaps support file-level readwrite operations over the transport
191
 
# too.
192
 
#
193
 
# TODO: SmartBzrDir class, proxying all Branch etc methods across to another
194
 
# branch doing file-level operations.
195
 
#
 
23
__all__ = ['RemoteTransport', 'RemoteTCPTransport', 'RemoteSSHTransport']
196
24
 
197
25
from cStringIO import StringIO
198
 
import os
199
 
import socket
200
 
import tempfile
201
 
import threading
202
26
import urllib
203
27
import urlparse
204
28
 
205
29
from bzrlib import (
206
 
    bzrdir,
207
30
    errors,
208
 
    revision,
209
31
    transport,
210
 
    trace,
211
32
    urlutils,
212
33
    )
213
 
from bzrlib.bundle.serializer import write_bundle
214
 
try:
215
 
    from bzrlib.transport import ssh
216
 
except errors.ParamikoNotPresent:
217
 
    # no paramiko.  SmartSSHClientMedium will break.
218
 
    pass
 
34
from bzrlib.smart import client, medium, protocol
219
35
 
220
36
# must do this otherwise urllib can't parse the urls properly :(
221
37
for scheme in ['ssh', 'bzr', 'bzr+loopback', 'bzr+ssh', 'bzr+http']:
223
39
del scheme
224
40
 
225
41
 
226
 
def _recv_tuple(from_file):
227
 
    req_line = from_file.readline()
228
 
    return _decode_tuple(req_line)
229
 
 
230
 
 
231
 
def _decode_tuple(req_line):
232
 
    if req_line == None or req_line == '':
233
 
        return None
234
 
    if req_line[-1] != '\n':
235
 
        raise errors.SmartProtocolError("request %r not terminated" % req_line)
236
 
    return tuple(req_line[:-1].split('\x01'))
237
 
 
238
 
 
239
 
def _encode_tuple(args):
240
 
    """Encode the tuple args to a bytestream."""
241
 
    return '\x01'.join(args) + '\n'
242
 
 
243
 
 
244
 
class SmartProtocolBase(object):
245
 
    """Methods common to client and server"""
246
 
 
247
 
    # TODO: this only actually accomodates a single block; possibly should
248
 
    # support multiple chunks?
249
 
    def _encode_bulk_data(self, body):
250
 
        """Encode body as a bulk data chunk."""
251
 
        return ''.join(('%d\n' % len(body), body, 'done\n'))
252
 
 
253
 
    def _serialise_offsets(self, offsets):
254
 
        """Serialise a readv offset list."""
255
 
        txt = []
256
 
        for start, length in offsets:
257
 
            txt.append('%d,%d' % (start, length))
258
 
        return '\n'.join(txt)
259
 
        
260
 
 
261
 
class SmartServerRequestProtocolOne(SmartProtocolBase):
262
 
    """Server-side encoding and decoding logic for smart version 1."""
263
 
    
264
 
    def __init__(self, backing_transport, write_func):
265
 
        self._backing_transport = backing_transport
266
 
        self.excess_buffer = ''
267
 
        self._finished = False
268
 
        self.in_buffer = ''
269
 
        self.has_dispatched = False
270
 
        self.request = None
271
 
        self._body_decoder = None
272
 
        self._write_func = write_func
273
 
 
274
 
    def accept_bytes(self, bytes):
275
 
        """Take bytes, and advance the internal state machine appropriately.
276
 
        
277
 
        :param bytes: must be a byte string
278
 
        """
279
 
        assert isinstance(bytes, str)
280
 
        self.in_buffer += bytes
281
 
        if not self.has_dispatched:
282
 
            if '\n' not in self.in_buffer:
283
 
                # no command line yet
284
 
                return
285
 
            self.has_dispatched = True
286
 
            try:
287
 
                first_line, self.in_buffer = self.in_buffer.split('\n', 1)
288
 
                first_line += '\n'
289
 
                req_args = _decode_tuple(first_line)
290
 
                self.request = SmartServerRequestHandler(
291
 
                    self._backing_transport)
292
 
                self.request.dispatch_command(req_args[0], req_args[1:])
293
 
                if self.request.finished_reading:
294
 
                    # trivial request
295
 
                    self.excess_buffer = self.in_buffer
296
 
                    self.in_buffer = ''
297
 
                    self._send_response(self.request.response.args,
298
 
                        self.request.response.body)
299
 
            except KeyboardInterrupt:
300
 
                raise
301
 
            except Exception, exception:
302
 
                # everything else: pass to client, flush, and quit
303
 
                self._send_response(('error', str(exception)))
304
 
                return
305
 
 
306
 
        if self.has_dispatched:
307
 
            if self._finished:
308
 
                # nothing to do.XXX: this routine should be a single state 
309
 
                # machine too.
310
 
                self.excess_buffer += self.in_buffer
311
 
                self.in_buffer = ''
312
 
                return
313
 
            if self._body_decoder is None:
314
 
                self._body_decoder = LengthPrefixedBodyDecoder()
315
 
            self._body_decoder.accept_bytes(self.in_buffer)
316
 
            self.in_buffer = self._body_decoder.unused_data
317
 
            body_data = self._body_decoder.read_pending_data()
318
 
            self.request.accept_body(body_data)
319
 
            if self._body_decoder.finished_reading:
320
 
                self.request.end_of_body()
321
 
                assert self.request.finished_reading, \
322
 
                    "no more body, request not finished"
323
 
            if self.request.response is not None:
324
 
                self._send_response(self.request.response.args,
325
 
                    self.request.response.body)
326
 
                self.excess_buffer = self.in_buffer
327
 
                self.in_buffer = ''
328
 
            else:
329
 
                assert not self.request.finished_reading, \
330
 
                    "no response and we have finished reading."
331
 
 
332
 
    def _send_response(self, args, body=None):
333
 
        """Send a smart server response down the output stream."""
334
 
        assert not self._finished, 'response already sent'
335
 
        self._finished = True
336
 
        self._write_func(_encode_tuple(args))
337
 
        if body is not None:
338
 
            assert isinstance(body, str), 'body must be a str'
339
 
            bytes = self._encode_bulk_data(body)
340
 
            self._write_func(bytes)
341
 
 
342
 
    def next_read_size(self):
343
 
        if self._finished:
344
 
            return 0
345
 
        if self._body_decoder is None:
346
 
            return 1
347
 
        else:
348
 
            return self._body_decoder.next_read_size()
349
 
 
350
 
 
351
 
class LengthPrefixedBodyDecoder(object):
352
 
    """Decodes the length-prefixed bulk data."""
353
 
    
354
 
    def __init__(self):
355
 
        self.bytes_left = None
356
 
        self.finished_reading = False
357
 
        self.unused_data = ''
358
 
        self.state_accept = self._state_accept_expecting_length
359
 
        self.state_read = self._state_read_no_data
360
 
        self._in_buffer = ''
361
 
        self._trailer_buffer = ''
362
 
    
363
 
    def accept_bytes(self, bytes):
364
 
        """Decode as much of bytes as possible.
365
 
 
366
 
        If 'bytes' contains too much data it will be appended to
367
 
        self.unused_data.
368
 
 
369
 
        finished_reading will be set when no more data is required.  Further
370
 
        data will be appended to self.unused_data.
371
 
        """
372
 
        # accept_bytes is allowed to change the state
373
 
        current_state = self.state_accept
374
 
        self.state_accept(bytes)
375
 
        while current_state != self.state_accept:
376
 
            current_state = self.state_accept
377
 
            self.state_accept('')
378
 
 
379
 
    def next_read_size(self):
380
 
        if self.bytes_left is not None:
381
 
            # Ideally we want to read all the remainder of the body and the
382
 
            # trailer in one go.
383
 
            return self.bytes_left + 5
384
 
        elif self.state_accept == self._state_accept_reading_trailer:
385
 
            # Just the trailer left
386
 
            return 5 - len(self._trailer_buffer)
387
 
        elif self.state_accept == self._state_accept_expecting_length:
388
 
            # There's still at least 6 bytes left ('\n' to end the length, plus
389
 
            # 'done\n').
390
 
            return 6
391
 
        else:
392
 
            # Reading excess data.  Either way, 1 byte at a time is fine.
393
 
            return 1
394
 
        
395
 
    def read_pending_data(self):
396
 
        """Return any pending data that has been decoded."""
397
 
        return self.state_read()
398
 
 
399
 
    def _state_accept_expecting_length(self, bytes):
400
 
        self._in_buffer += bytes
401
 
        pos = self._in_buffer.find('\n')
402
 
        if pos == -1:
403
 
            return
404
 
        self.bytes_left = int(self._in_buffer[:pos])
405
 
        self._in_buffer = self._in_buffer[pos+1:]
406
 
        self.bytes_left -= len(self._in_buffer)
407
 
        self.state_accept = self._state_accept_reading_body
408
 
        self.state_read = self._state_read_in_buffer
409
 
 
410
 
    def _state_accept_reading_body(self, bytes):
411
 
        self._in_buffer += bytes
412
 
        self.bytes_left -= len(bytes)
413
 
        if self.bytes_left <= 0:
414
 
            # Finished with body
415
 
            if self.bytes_left != 0:
416
 
                self._trailer_buffer = self._in_buffer[self.bytes_left:]
417
 
                self._in_buffer = self._in_buffer[:self.bytes_left]
418
 
            self.bytes_left = None
419
 
            self.state_accept = self._state_accept_reading_trailer
420
 
        
421
 
    def _state_accept_reading_trailer(self, bytes):
422
 
        self._trailer_buffer += bytes
423
 
        # TODO: what if the trailer does not match "done\n"?  Should this raise
424
 
        # a ProtocolViolation exception?
425
 
        if self._trailer_buffer.startswith('done\n'):
426
 
            self.unused_data = self._trailer_buffer[len('done\n'):]
427
 
            self.state_accept = self._state_accept_reading_unused
428
 
            self.finished_reading = True
429
 
    
430
 
    def _state_accept_reading_unused(self, bytes):
431
 
        self.unused_data += bytes
432
 
 
433
 
    def _state_read_no_data(self):
434
 
        return ''
435
 
 
436
 
    def _state_read_in_buffer(self):
437
 
        result = self._in_buffer
438
 
        self._in_buffer = ''
439
 
        return result
440
 
 
441
 
 
442
 
class SmartServerStreamMedium(object):
443
 
    """Handles smart commands coming over a stream.
444
 
 
445
 
    The stream may be a pipe connected to sshd, or a tcp socket, or an
446
 
    in-process fifo for testing.
447
 
 
448
 
    One instance is created for each connected client; it can serve multiple
449
 
    requests in the lifetime of the connection.
450
 
 
451
 
    The server passes requests through to an underlying backing transport, 
452
 
    which will typically be a LocalTransport looking at the server's filesystem.
453
 
    """
454
 
 
455
 
    def __init__(self, backing_transport):
456
 
        """Construct new server.
457
 
 
458
 
        :param backing_transport: Transport for the directory served.
459
 
        """
460
 
        # backing_transport could be passed to serve instead of __init__
461
 
        self.backing_transport = backing_transport
462
 
        self.finished = False
463
 
 
464
 
    def serve(self):
465
 
        """Serve requests until the client disconnects."""
466
 
        # Keep a reference to stderr because the sys module's globals get set to
467
 
        # None during interpreter shutdown.
468
 
        from sys import stderr
469
 
        try:
470
 
            while not self.finished:
471
 
                protocol = SmartServerRequestProtocolOne(self.backing_transport,
472
 
                                                         self._write_out)
473
 
                self._serve_one_request(protocol)
474
 
        except Exception, e:
475
 
            stderr.write("%s terminating on exception %s\n" % (self, e))
476
 
            raise
477
 
 
478
 
    def _serve_one_request(self, protocol):
479
 
        """Read one request from input, process, send back a response.
480
 
        
481
 
        :param protocol: a SmartServerRequestProtocol.
482
 
        """
483
 
        try:
484
 
            self._serve_one_request_unguarded(protocol)
485
 
        except KeyboardInterrupt:
486
 
            raise
487
 
        except Exception, e:
488
 
            self.terminate_due_to_error()
489
 
 
490
 
    def terminate_due_to_error(self):
491
 
        """Called when an unhandled exception from the protocol occurs."""
492
 
        raise NotImplementedError(self.terminate_due_to_error)
493
 
 
494
 
 
495
 
class SmartServerSocketStreamMedium(SmartServerStreamMedium):
496
 
 
497
 
    def __init__(self, sock, backing_transport):
498
 
        """Constructor.
499
 
 
500
 
        :param sock: the socket the server will read from.  It will be put
501
 
            into blocking mode.
502
 
        """
503
 
        SmartServerStreamMedium.__init__(self, backing_transport)
504
 
        self.push_back = ''
505
 
        sock.setblocking(True)
506
 
        self.socket = sock
507
 
 
508
 
    def _serve_one_request_unguarded(self, protocol):
509
 
        while protocol.next_read_size():
510
 
            if self.push_back:
511
 
                protocol.accept_bytes(self.push_back)
512
 
                self.push_back = ''
513
 
            else:
514
 
                bytes = self.socket.recv(4096)
515
 
                if bytes == '':
516
 
                    self.finished = True
517
 
                    return
518
 
                protocol.accept_bytes(bytes)
519
 
        
520
 
        self.push_back = protocol.excess_buffer
521
 
    
522
 
    def terminate_due_to_error(self):
523
 
        """Called when an unhandled exception from the protocol occurs."""
524
 
        # TODO: This should log to a server log file, but no such thing
525
 
        # exists yet.  Andrew Bennetts 2006-09-29.
526
 
        self.socket.close()
527
 
        self.finished = True
528
 
 
529
 
    def _write_out(self, bytes):
530
 
        self.socket.sendall(bytes)
531
 
 
532
 
 
533
 
class SmartServerPipeStreamMedium(SmartServerStreamMedium):
534
 
 
535
 
    def __init__(self, in_file, out_file, backing_transport):
536
 
        """Construct new server.
537
 
 
538
 
        :param in_file: Python file from which requests can be read.
539
 
        :param out_file: Python file to write responses.
540
 
        :param backing_transport: Transport for the directory served.
541
 
        """
542
 
        SmartServerStreamMedium.__init__(self, backing_transport)
543
 
        self._in = in_file
544
 
        self._out = out_file
545
 
 
546
 
    def _serve_one_request_unguarded(self, protocol):
547
 
        while True:
548
 
            bytes_to_read = protocol.next_read_size()
549
 
            if bytes_to_read == 0:
550
 
                # Finished serving this request.
551
 
                self._out.flush()
552
 
                return
553
 
            bytes = self._in.read(bytes_to_read)
554
 
            if bytes == '':
555
 
                # Connection has been closed.
556
 
                self.finished = True
557
 
                self._out.flush()
558
 
                return
559
 
            protocol.accept_bytes(bytes)
560
 
 
561
 
    def terminate_due_to_error(self):
562
 
        # TODO: This should log to a server log file, but no such thing
563
 
        # exists yet.  Andrew Bennetts 2006-09-29.
564
 
        self._out.close()
565
 
        self.finished = True
566
 
 
567
 
    def _write_out(self, bytes):
568
 
        self._out.write(bytes)
569
 
 
570
 
 
571
 
class SmartServerResponse(object):
572
 
    """Response generated by SmartServerRequestHandler."""
573
 
 
574
 
    def __init__(self, args, body=None):
575
 
        self.args = args
576
 
        self.body = body
577
 
 
578
 
# XXX: TODO: Create a SmartServerRequestHandler which will take the responsibility
579
 
# for delivering the data for a request. This could be done with as the
580
 
# StreamServer, though that would create conflation between request and response
581
 
# which may be undesirable.
582
 
 
583
 
 
584
 
class SmartServerRequestHandler(object):
585
 
    """Protocol logic for smart server.
586
 
    
587
 
    This doesn't handle serialization at all, it just processes requests and
588
 
    creates responses.
589
 
    """
590
 
 
591
 
    # IMPORTANT FOR IMPLEMENTORS: It is important that SmartServerRequestHandler
592
 
    # not contain encoding or decoding logic to allow the wire protocol to vary
593
 
    # from the object protocol: we will want to tweak the wire protocol separate
594
 
    # from the object model, and ideally we will be able to do that without
595
 
    # having a SmartServerRequestHandler subclass for each wire protocol, rather
596
 
    # just a Protocol subclass.
597
 
 
598
 
    # TODO: Better way of representing the body for commands that take it,
599
 
    # and allow it to be streamed into the server.
600
 
    
601
 
    def __init__(self, backing_transport):
602
 
        self._backing_transport = backing_transport
603
 
        self._converted_command = False
604
 
        self.finished_reading = False
605
 
        self._body_bytes = ''
606
 
        self.response = None
607
 
 
608
 
    def accept_body(self, bytes):
609
 
        """Accept body data.
610
 
 
611
 
        This should be overriden for each command that desired body data to
612
 
        handle the right format of that data. I.e. plain bytes, a bundle etc.
613
 
 
614
 
        The deserialisation into that format should be done in the Protocol
615
 
        object. Set self.desired_body_format to the format your method will
616
 
        handle.
617
 
        """
618
 
        # default fallback is to accumulate bytes.
619
 
        self._body_bytes += bytes
620
 
        
621
 
    def _end_of_body_handler(self):
622
 
        """An unimplemented end of body handler."""
623
 
        raise NotImplementedError(self._end_of_body_handler)
624
 
        
625
 
    def do_hello(self):
626
 
        """Answer a version request with my version."""
627
 
        return SmartServerResponse(('ok', '1'))
628
 
 
629
 
    def do_has(self, relpath):
630
 
        r = self._backing_transport.has(relpath) and 'yes' or 'no'
631
 
        return SmartServerResponse((r,))
632
 
 
633
 
    def do_get(self, relpath):
634
 
        backing_bytes = self._backing_transport.get_bytes(relpath)
635
 
        return SmartServerResponse(('ok',), backing_bytes)
636
 
 
637
 
    def _deserialise_optional_mode(self, mode):
638
 
        # XXX: FIXME this should be on the protocol object.
639
 
        if mode == '':
640
 
            return None
641
 
        else:
642
 
            return int(mode)
643
 
 
644
 
    def do_append(self, relpath, mode):
645
 
        self._converted_command = True
646
 
        self._relpath = relpath
647
 
        self._mode = self._deserialise_optional_mode(mode)
648
 
        self._end_of_body_handler = self._handle_do_append_end
649
 
    
650
 
    def _handle_do_append_end(self):
651
 
        old_length = self._backing_transport.append_bytes(
652
 
            self._relpath, self._body_bytes, self._mode)
653
 
        self.response = SmartServerResponse(('appended', '%d' % old_length))
654
 
 
655
 
    def do_delete(self, relpath):
656
 
        self._backing_transport.delete(relpath)
657
 
 
658
 
    def do_iter_files_recursive(self, relpath):
659
 
        transport = self._backing_transport.clone(relpath)
660
 
        filenames = transport.iter_files_recursive()
661
 
        return SmartServerResponse(('names',) + tuple(filenames))
662
 
 
663
 
    def do_list_dir(self, relpath):
664
 
        filenames = self._backing_transport.list_dir(relpath)
665
 
        return SmartServerResponse(('names',) + tuple(filenames))
666
 
 
667
 
    def do_mkdir(self, relpath, mode):
668
 
        self._backing_transport.mkdir(relpath,
669
 
                                      self._deserialise_optional_mode(mode))
670
 
 
671
 
    def do_move(self, rel_from, rel_to):
672
 
        self._backing_transport.move(rel_from, rel_to)
673
 
 
674
 
    def do_put(self, relpath, mode):
675
 
        self._converted_command = True
676
 
        self._relpath = relpath
677
 
        self._mode = self._deserialise_optional_mode(mode)
678
 
        self._end_of_body_handler = self._handle_do_put
679
 
 
680
 
    def _handle_do_put(self):
681
 
        self._backing_transport.put_bytes(self._relpath,
682
 
                self._body_bytes, self._mode)
683
 
        self.response = SmartServerResponse(('ok',))
684
 
 
685
 
    def _deserialise_offsets(self, text):
686
 
        # XXX: FIXME this should be on the protocol object.
687
 
        offsets = []
688
 
        for line in text.split('\n'):
689
 
            if not line:
690
 
                continue
691
 
            start, length = line.split(',')
692
 
            offsets.append((int(start), int(length)))
693
 
        return offsets
694
 
 
695
 
    def do_put_non_atomic(self, relpath, mode, create_parent, dir_mode):
696
 
        self._converted_command = True
697
 
        self._end_of_body_handler = self._handle_put_non_atomic
698
 
        self._relpath = relpath
699
 
        self._dir_mode = self._deserialise_optional_mode(dir_mode)
700
 
        self._mode = self._deserialise_optional_mode(mode)
701
 
        # a boolean would be nicer XXX
702
 
        self._create_parent = (create_parent == 'T')
703
 
 
704
 
    def _handle_put_non_atomic(self):
705
 
        self._backing_transport.put_bytes_non_atomic(self._relpath,
706
 
                self._body_bytes,
707
 
                mode=self._mode,
708
 
                create_parent_dir=self._create_parent,
709
 
                dir_mode=self._dir_mode)
710
 
        self.response = SmartServerResponse(('ok',))
711
 
 
712
 
    def do_readv(self, relpath):
713
 
        self._converted_command = True
714
 
        self._end_of_body_handler = self._handle_readv_offsets
715
 
        self._relpath = relpath
716
 
 
717
 
    def end_of_body(self):
718
 
        """No more body data will be received."""
719
 
        self._run_handler_code(self._end_of_body_handler, (), {})
720
 
        # cannot read after this.
721
 
        self.finished_reading = True
722
 
 
723
 
    def _handle_readv_offsets(self):
724
 
        """accept offsets for a readv request."""
725
 
        offsets = self._deserialise_offsets(self._body_bytes)
726
 
        backing_bytes = ''.join(bytes for offset, bytes in
727
 
            self._backing_transport.readv(self._relpath, offsets))
728
 
        self.response = SmartServerResponse(('readv',), backing_bytes)
729
 
        
730
 
    def do_rename(self, rel_from, rel_to):
731
 
        self._backing_transport.rename(rel_from, rel_to)
732
 
 
733
 
    def do_rmdir(self, relpath):
734
 
        self._backing_transport.rmdir(relpath)
735
 
 
736
 
    def do_stat(self, relpath):
737
 
        stat = self._backing_transport.stat(relpath)
738
 
        return SmartServerResponse(('stat', str(stat.st_size), oct(stat.st_mode)))
739
 
        
740
 
    def do_get_bundle(self, path, revision_id):
741
 
        # open transport relative to our base
742
 
        t = self._backing_transport.clone(path)
743
 
        control, extra_path = bzrdir.BzrDir.open_containing_from_transport(t)
744
 
        repo = control.open_repository()
745
 
        tmpf = tempfile.TemporaryFile()
746
 
        base_revision = revision.NULL_REVISION
747
 
        write_bundle(repo, revision_id, base_revision, tmpf)
748
 
        tmpf.seek(0)
749
 
        return SmartServerResponse((), tmpf.read())
750
 
 
751
 
    def dispatch_command(self, cmd, args):
752
 
        """Deprecated compatibility method.""" # XXX XXX
753
 
        func = getattr(self, 'do_' + cmd, None)
754
 
        if func is None:
755
 
            raise errors.SmartProtocolError("bad request %r" % (cmd,))
756
 
        self._run_handler_code(func, args, {})
757
 
 
758
 
    def _run_handler_code(self, callable, args, kwargs):
759
 
        """Run some handler specific code 'callable'.
760
 
 
761
 
        If a result is returned, it is considered to be the commands response,
762
 
        and finished_reading is set true, and its assigned to self.response.
763
 
 
764
 
        Any exceptions caught are translated and a response object created
765
 
        from them.
766
 
        """
767
 
        result = self._call_converting_errors(callable, args, kwargs)
768
 
        if result is not None:
769
 
            self.response = result
770
 
            self.finished_reading = True
771
 
        # handle unconverted commands
772
 
        if not self._converted_command:
773
 
            self.finished_reading = True
774
 
            if result is None:
775
 
                self.response = SmartServerResponse(('ok',))
776
 
 
777
 
    def _call_converting_errors(self, callable, args, kwargs):
778
 
        """Call callable converting errors to Response objects."""
779
 
        try:
780
 
            return callable(*args, **kwargs)
781
 
        except errors.NoSuchFile, e:
782
 
            return SmartServerResponse(('NoSuchFile', e.path))
783
 
        except errors.FileExists, e:
784
 
            return SmartServerResponse(('FileExists', e.path))
785
 
        except errors.DirectoryNotEmpty, e:
786
 
            return SmartServerResponse(('DirectoryNotEmpty', e.path))
787
 
        except errors.ShortReadvError, e:
788
 
            return SmartServerResponse(('ShortReadvError',
789
 
                e.path, str(e.offset), str(e.length), str(e.actual)))
790
 
        except UnicodeError, e:
791
 
            # If it is a DecodeError, than most likely we are starting
792
 
            # with a plain string
793
 
            str_or_unicode = e.object
794
 
            if isinstance(str_or_unicode, unicode):
795
 
                # XXX: UTF-8 might have \x01 (our seperator byte) in it.  We
796
 
                # should escape it somehow.
797
 
                val = 'u:' + str_or_unicode.encode('utf-8')
798
 
            else:
799
 
                val = 's:' + str_or_unicode.encode('base64')
800
 
            # This handles UnicodeEncodeError or UnicodeDecodeError
801
 
            return SmartServerResponse((e.__class__.__name__,
802
 
                    e.encoding, val, str(e.start), str(e.end), e.reason))
803
 
        except errors.TransportNotPossible, e:
804
 
            if e.msg == "readonly transport":
805
 
                return SmartServerResponse(('ReadOnlyError', ))
806
 
            else:
807
 
                raise
808
 
 
809
 
 
810
 
class SmartTCPServer(object):
811
 
    """Listens on a TCP socket and accepts connections from smart clients"""
812
 
 
813
 
    def __init__(self, backing_transport, host='127.0.0.1', port=0):
814
 
        """Construct a new server.
815
 
 
816
 
        To actually start it running, call either start_background_thread or
817
 
        serve.
818
 
 
819
 
        :param host: Name of the interface to listen on.
820
 
        :param port: TCP port to listen on, or 0 to allocate a transient port.
821
 
        """
822
 
        self._server_socket = socket.socket()
823
 
        self._server_socket.bind((host, port))
824
 
        self.port = self._server_socket.getsockname()[1]
825
 
        self._server_socket.listen(1)
826
 
        self._server_socket.settimeout(1)
827
 
        self.backing_transport = backing_transport
828
 
 
829
 
    def serve(self):
830
 
        # let connections timeout so that we get a chance to terminate
831
 
        # Keep a reference to the exceptions we want to catch because the socket
832
 
        # module's globals get set to None during interpreter shutdown.
833
 
        from socket import timeout as socket_timeout
834
 
        from socket import error as socket_error
835
 
        self._should_terminate = False
836
 
        while not self._should_terminate:
837
 
            try:
838
 
                self.accept_and_serve()
839
 
            except socket_timeout:
840
 
                # just check if we're asked to stop
841
 
                pass
842
 
            except socket_error, e:
843
 
                trace.warning("client disconnected: %s", e)
844
 
                pass
845
 
 
846
 
    def get_url(self):
847
 
        """Return the url of the server"""
848
 
        return "bzr://%s:%d/" % self._server_socket.getsockname()
849
 
 
850
 
    def accept_and_serve(self):
851
 
        conn, client_addr = self._server_socket.accept()
852
 
        # For WIN32, where the timeout value from the listening socket
853
 
        # propogates to the newly accepted socket.
854
 
        conn.setblocking(True)
855
 
        conn.setsockopt(socket.IPPROTO_TCP, socket.TCP_NODELAY, 1)
856
 
        handler = SmartServerSocketStreamMedium(conn, self.backing_transport)
857
 
        connection_thread = threading.Thread(None, handler.serve, name='smart-server-child')
858
 
        connection_thread.setDaemon(True)
859
 
        connection_thread.start()
860
 
 
861
 
    def start_background_thread(self):
862
 
        self._server_thread = threading.Thread(None,
863
 
                self.serve,
864
 
                name='server-' + self.get_url())
865
 
        self._server_thread.setDaemon(True)
866
 
        self._server_thread.start()
867
 
 
868
 
    def stop_background_thread(self):
869
 
        self._should_terminate = True
870
 
        # self._server_socket.close()
871
 
        # we used to join the thread, but it's not really necessary; it will
872
 
        # terminate in time
873
 
        ## self._server_thread.join()
874
 
 
875
 
 
876
 
class SmartTCPServer_for_testing(SmartTCPServer):
877
 
    """Server suitable for use by transport tests.
878
 
    
879
 
    This server is backed by the process's cwd.
880
 
    """
881
 
 
882
 
    def __init__(self):
883
 
        self._homedir = urlutils.local_path_to_url(os.getcwd())[7:]
884
 
        # The server is set up by default like for ssh access: the client
885
 
        # passes filesystem-absolute paths; therefore the server must look
886
 
        # them up relative to the root directory.  it might be better to act
887
 
        # a public server and have the server rewrite paths into the test
888
 
        # directory.
889
 
        SmartTCPServer.__init__(self,
890
 
            transport.get_transport(urlutils.local_path_to_url('/')))
891
 
        
892
 
    def setUp(self):
893
 
        """Set up server for testing"""
894
 
        self.start_background_thread()
895
 
 
896
 
    def tearDown(self):
897
 
        self.stop_background_thread()
898
 
 
899
 
    def get_url(self):
900
 
        """Return the url of the server"""
901
 
        host, port = self._server_socket.getsockname()
902
 
        return "bzr://%s:%d%s" % (host, port, urlutils.escape(self._homedir))
903
 
 
904
 
    def get_bogus_url(self):
905
 
        """Return a URL which will fail to connect"""
906
 
        return 'bzr://127.0.0.1:1/'
907
 
 
908
 
 
909
 
class SmartStat(object):
 
42
# Port 4155 is the default port for bzr://, registered with IANA.
 
43
BZR_DEFAULT_INTERFACE = '0.0.0.0'
 
44
BZR_DEFAULT_PORT = 4155
 
45
 
 
46
 
 
47
class _SmartStat(object):
910
48
 
911
49
    def __init__(self, size, mode):
912
50
        self.st_size = size
913
51
        self.st_mode = mode
914
52
 
915
53
 
916
 
class SmartTransport(transport.Transport):
 
54
class RemoteTransport(transport.Transport):
917
55
    """Connection to a smart server.
918
56
 
919
 
    The connection holds references to pipes that can be used to send requests
920
 
    to the server.
 
57
    The connection holds references to the medium that can be used to send
 
58
    requests to the server.
921
59
 
922
60
    The connection has a notion of the current directory to which it's
923
61
    connected; this is incorporated in filenames passed to the server.
925
63
    This supports some higher-level RPC operations and can also be treated 
926
64
    like a Transport to do file-like operations.
927
65
 
928
 
    The connection can be made over a tcp socket, or (in future) an ssh pipe
929
 
    or a series of http requests.  There are concrete subclasses for each
930
 
    type: SmartTCPTransport, etc.
 
66
    The connection can be made over a tcp socket, an ssh pipe or a series of
 
67
    http requests.  There are concrete subclasses for each type:
 
68
    RemoteTCPTransport, etc.
931
69
    """
932
70
 
933
 
    # IMPORTANT FOR IMPLEMENTORS: SmartTransport MUST NOT be given encoding
 
71
    # IMPORTANT FOR IMPLEMENTORS: RemoteTransport MUST NOT be given encoding
934
72
    # responsibilities: Put those on SmartClient or similar. This is vital for
935
73
    # the ability to support multiple versions of the smart protocol over time:
936
 
    # SmartTransport is an adapter from the Transport object model to the 
 
74
    # RemoteTransport is an adapter from the Transport object model to the 
937
75
    # SmartClient model, not an encoder.
938
76
 
939
77
    def __init__(self, url, clone_from=None, medium=None):
947
85
        ### initialisation order things would blow up. 
948
86
        if not url.endswith('/'):
949
87
            url += '/'
950
 
        super(SmartTransport, self).__init__(url)
 
88
        super(RemoteTransport, self).__init__(url)
951
89
        self._scheme, self._username, self._password, self._host, self._port, self._path = \
952
90
                transport.split_url(url)
953
91
        if clone_from is None:
969
107
        return self._unparse_url(self._remote_path(relpath))
970
108
    
971
109
    def clone(self, relative_url):
972
 
        """Make a new SmartTransport related to me, sharing the same connection.
 
110
        """Make a new RemoteTransport related to me, sharing the same connection.
973
111
 
974
112
        This essentially opens a handle on a different remote directory.
975
113
        """
976
114
        if relative_url is None:
977
 
            return SmartTransport(self.base, self)
 
115
            return RemoteTransport(self.base, self)
978
116
        else:
979
 
            return SmartTransport(self.abspath(relative_url), self)
 
117
            return RemoteTransport(self.abspath(relative_url), self)
980
118
 
981
119
    def is_readonly(self):
982
120
        """Smart server transport can do read/write file operations."""
983
 
        return False
984
 
                                                   
 
121
        resp = self._call2('Transport.is_readonly')
 
122
        if resp == ('yes', ):
 
123
            return True
 
124
        elif resp == ('no', ):
 
125
            return False
 
126
        else:
 
127
            self._translate_error(resp)
 
128
        assert False, 'weird response %r' % (resp,)
 
129
 
985
130
    def get_smart_client(self):
986
131
        return self._medium
987
132
 
1015
160
 
1016
161
    def _call2(self, method, *args):
1017
162
        """Call a method on the remote server."""
1018
 
        protocol = SmartClientRequestProtocolOne(self._medium.get_request())
1019
 
        protocol.call(method, *args)
1020
 
        return protocol.read_response_tuple()
 
163
        return client._SmartClient(self._medium).call(method, *args)
1021
164
 
1022
165
    def _call_with_body_bytes(self, method, args, body):
1023
166
        """Call a method on the remote server with body bytes."""
1024
 
        protocol = SmartClientRequestProtocolOne(self._medium.get_request())
1025
 
        protocol.call_with_body_bytes((method, ) + args, body)
1026
 
        return protocol.read_response_tuple()
 
167
        smart_client = client._SmartClient(self._medium)
 
168
        return smart_client.call_with_body_bytes(method, args, body)
1027
169
 
1028
170
    def has(self, relpath):
1029
171
        """Indicate whether a remote file of the given name exists or not.
1047
189
 
1048
190
    def get_bytes(self, relpath):
1049
191
        remote = self._remote_path(relpath)
1050
 
        protocol = SmartClientRequestProtocolOne(self._medium.get_request())
1051
 
        protocol.call('get', remote)
1052
 
        resp = protocol.read_response_tuple(True)
 
192
        request = self._medium.get_request()
 
193
        smart_protocol = protocol.SmartClientRequestProtocolOne(request)
 
194
        smart_protocol.call('get', remote)
 
195
        resp = smart_protocol.read_response_tuple(True)
1053
196
        if resp != ('ok', ):
1054
 
            protocol.cancel_read_body()
 
197
            smart_protocol.cancel_read_body()
1055
198
            self._translate_error(resp, relpath)
1056
 
        return protocol.read_body_bytes()
 
199
        return smart_protocol.read_body_bytes()
1057
200
 
1058
201
    def _serialise_optional_mode(self, mode):
1059
202
        if mode is None:
1070
213
        # FIXME: upload_file is probably not safe for non-ascii characters -
1071
214
        # should probably just pass all parameters as length-delimited
1072
215
        # strings?
 
216
        if type(upload_contents) is unicode:
 
217
            # Although not strictly correct, we raise UnicodeEncodeError to be
 
218
            # compatible with other transports.
 
219
            raise UnicodeEncodeError(
 
220
                'undefined', upload_contents, 0, 1,
 
221
                'put_bytes must be given bytes, not unicode.')
1073
222
        resp = self._call_with_body_bytes('put',
1074
223
            (self._remote_path(relpath), self._serialise_optional_mode(mode)),
1075
224
            upload_contents)
1139
288
                               limit=self._max_readv_combine,
1140
289
                               fudge_factor=self._bytes_to_read_before_seek))
1141
290
 
1142
 
        protocol = SmartClientRequestProtocolOne(self._medium.get_request())
1143
 
        protocol.call_with_body_readv_array(
 
291
        request = self._medium.get_request()
 
292
        smart_protocol = protocol.SmartClientRequestProtocolOne(request)
 
293
        smart_protocol.call_with_body_readv_array(
1144
294
            ('readv', self._remote_path(relpath)),
1145
295
            [(c.start, c.length) for c in coalesced])
1146
 
        resp = protocol.read_response_tuple(True)
 
296
        resp = smart_protocol.read_response_tuple(True)
1147
297
 
1148
298
        if resp[0] != 'readv':
1149
299
            # This should raise an exception
1150
 
            protocol.cancel_read_body()
 
300
            smart_protocol.cancel_read_body()
1151
301
            self._translate_error(resp)
1152
302
            return
1153
303
 
1154
304
        # FIXME: this should know how many bytes are needed, for clarity.
1155
 
        data = protocol.read_body_bytes()
 
305
        data = smart_protocol.read_body_bytes()
1156
306
        # Cache the results, but only until they have been fulfilled
1157
307
        data_map = {}
1158
308
        for c_offset in coalesced:
1234
384
    def stat(self, relpath):
1235
385
        resp = self._call2('stat', self._remote_path(relpath))
1236
386
        if resp[0] == 'stat':
1237
 
            return SmartStat(int(resp[1]), int(resp[2], 8))
 
387
            return _SmartStat(int(resp[1]), int(resp[2], 8))
1238
388
        else:
1239
389
            self._translate_error(resp)
1240
390
 
1269
419
            self._translate_error(resp)
1270
420
 
1271
421
 
1272
 
class SmartClientMediumRequest(object):
1273
 
    """A request on a SmartClientMedium.
1274
 
 
1275
 
    Each request allows bytes to be provided to it via accept_bytes, and then
1276
 
    the response bytes to be read via read_bytes.
1277
 
 
1278
 
    For instance:
1279
 
    request.accept_bytes('123')
1280
 
    request.finished_writing()
1281
 
    result = request.read_bytes(3)
1282
 
    request.finished_reading()
1283
 
 
1284
 
    It is up to the individual SmartClientMedium whether multiple concurrent
1285
 
    requests can exist. See SmartClientMedium.get_request to obtain instances 
1286
 
    of SmartClientMediumRequest, and the concrete Medium you are using for 
1287
 
    details on concurrency and pipelining.
1288
 
    """
1289
 
 
1290
 
    def __init__(self, medium):
1291
 
        """Construct a SmartClientMediumRequest for the medium medium."""
1292
 
        self._medium = medium
1293
 
        # we track state by constants - we may want to use the same
1294
 
        # pattern as BodyReader if it gets more complex.
1295
 
        # valid states are: "writing", "reading", "done"
1296
 
        self._state = "writing"
1297
 
 
1298
 
    def accept_bytes(self, bytes):
1299
 
        """Accept bytes for inclusion in this request.
1300
 
 
1301
 
        This method may not be be called after finished_writing() has been
1302
 
        called.  It depends upon the Medium whether or not the bytes will be
1303
 
        immediately transmitted. Message based Mediums will tend to buffer the
1304
 
        bytes until finished_writing() is called.
1305
 
 
1306
 
        :param bytes: A bytestring.
1307
 
        """
1308
 
        if self._state != "writing":
1309
 
            raise errors.WritingCompleted(self)
1310
 
        self._accept_bytes(bytes)
1311
 
 
1312
 
    def _accept_bytes(self, bytes):
1313
 
        """Helper for accept_bytes.
1314
 
 
1315
 
        Accept_bytes checks the state of the request to determing if bytes
1316
 
        should be accepted. After that it hands off to _accept_bytes to do the
1317
 
        actual acceptance.
1318
 
        """
1319
 
        raise NotImplementedError(self._accept_bytes)
1320
 
 
1321
 
    def finished_reading(self):
1322
 
        """Inform the request that all desired data has been read.
1323
 
 
1324
 
        This will remove the request from the pipeline for its medium (if the
1325
 
        medium supports pipelining) and any further calls to methods on the
1326
 
        request will raise ReadingCompleted.
1327
 
        """
1328
 
        if self._state == "writing":
1329
 
            raise errors.WritingNotComplete(self)
1330
 
        if self._state != "reading":
1331
 
            raise errors.ReadingCompleted(self)
1332
 
        self._state = "done"
1333
 
        self._finished_reading()
1334
 
 
1335
 
    def _finished_reading(self):
1336
 
        """Helper for finished_reading.
1337
 
 
1338
 
        finished_reading checks the state of the request to determine if 
1339
 
        finished_reading is allowed, and if it is hands off to _finished_reading
1340
 
        to perform the action.
1341
 
        """
1342
 
        raise NotImplementedError(self._finished_reading)
1343
 
 
1344
 
    def finished_writing(self):
1345
 
        """Finish the writing phase of this request.
1346
 
 
1347
 
        This will flush all pending data for this request along the medium.
1348
 
        After calling finished_writing, you may not call accept_bytes anymore.
1349
 
        """
1350
 
        if self._state != "writing":
1351
 
            raise errors.WritingCompleted(self)
1352
 
        self._state = "reading"
1353
 
        self._finished_writing()
1354
 
 
1355
 
    def _finished_writing(self):
1356
 
        """Helper for finished_writing.
1357
 
 
1358
 
        finished_writing checks the state of the request to determine if 
1359
 
        finished_writing is allowed, and if it is hands off to _finished_writing
1360
 
        to perform the action.
1361
 
        """
1362
 
        raise NotImplementedError(self._finished_writing)
1363
 
 
1364
 
    def read_bytes(self, count):
1365
 
        """Read bytes from this requests response.
1366
 
 
1367
 
        This method will block and wait for count bytes to be read. It may not
1368
 
        be invoked until finished_writing() has been called - this is to ensure
1369
 
        a message-based approach to requests, for compatability with message
1370
 
        based mediums like HTTP.
1371
 
        """
1372
 
        if self._state == "writing":
1373
 
            raise errors.WritingNotComplete(self)
1374
 
        if self._state != "reading":
1375
 
            raise errors.ReadingCompleted(self)
1376
 
        return self._read_bytes(count)
1377
 
 
1378
 
    def _read_bytes(self, count):
1379
 
        """Helper for read_bytes.
1380
 
 
1381
 
        read_bytes checks the state of the request to determing if bytes
1382
 
        should be read. After that it hands off to _read_bytes to do the
1383
 
        actual read.
1384
 
        """
1385
 
        raise NotImplementedError(self._read_bytes)
1386
 
 
1387
 
 
1388
 
class SmartClientStreamMediumRequest(SmartClientMediumRequest):
1389
 
    """A SmartClientMediumRequest that works with an SmartClientStreamMedium."""
1390
 
 
1391
 
    def __init__(self, medium):
1392
 
        SmartClientMediumRequest.__init__(self, medium)
1393
 
        # check that we are safe concurrency wise. If some streams start
1394
 
        # allowing concurrent requests - i.e. via multiplexing - then this
1395
 
        # assert should be moved to SmartClientStreamMedium.get_request,
1396
 
        # and the setting/unsetting of _current_request likewise moved into
1397
 
        # that class : but its unneeded overhead for now. RBC 20060922
1398
 
        if self._medium._current_request is not None:
1399
 
            raise errors.TooManyConcurrentRequests(self._medium)
1400
 
        self._medium._current_request = self
1401
 
 
1402
 
    def _accept_bytes(self, bytes):
1403
 
        """See SmartClientMediumRequest._accept_bytes.
1404
 
        
1405
 
        This forwards to self._medium._accept_bytes because we are operating
1406
 
        on the mediums stream.
1407
 
        """
1408
 
        self._medium._accept_bytes(bytes)
1409
 
 
1410
 
    def _finished_reading(self):
1411
 
        """See SmartClientMediumRequest._finished_reading.
1412
 
 
1413
 
        This clears the _current_request on self._medium to allow a new 
1414
 
        request to be created.
1415
 
        """
1416
 
        assert self._medium._current_request is self
1417
 
        self._medium._current_request = None
1418
 
        
1419
 
    def _finished_writing(self):
1420
 
        """See SmartClientMediumRequest._finished_writing.
1421
 
 
1422
 
        This invokes self._medium._flush to ensure all bytes are transmitted.
1423
 
        """
1424
 
        self._medium._flush()
1425
 
 
1426
 
    def _read_bytes(self, count):
1427
 
        """See SmartClientMediumRequest._read_bytes.
1428
 
        
1429
 
        This forwards to self._medium._read_bytes because we are operating
1430
 
        on the mediums stream.
1431
 
        """
1432
 
        return self._medium._read_bytes(count)
1433
 
 
1434
 
 
1435
 
class SmartClientRequestProtocolOne(SmartProtocolBase):
1436
 
    """The client-side protocol for smart version 1."""
1437
 
 
1438
 
    def __init__(self, request):
1439
 
        """Construct a SmartClientRequestProtocolOne.
1440
 
 
1441
 
        :param request: A SmartClientMediumRequest to serialise onto and
1442
 
            deserialise from.
1443
 
        """
1444
 
        self._request = request
1445
 
        self._body_buffer = None
1446
 
 
1447
 
    def call(self, *args):
1448
 
        bytes = _encode_tuple(args)
1449
 
        self._request.accept_bytes(bytes)
1450
 
        self._request.finished_writing()
1451
 
 
1452
 
    def call_with_body_bytes(self, args, body):
1453
 
        """Make a remote call of args with body bytes 'body'.
1454
 
 
1455
 
        After calling this, call read_response_tuple to find the result out.
1456
 
        """
1457
 
        bytes = _encode_tuple(args)
1458
 
        self._request.accept_bytes(bytes)
1459
 
        bytes = self._encode_bulk_data(body)
1460
 
        self._request.accept_bytes(bytes)
1461
 
        self._request.finished_writing()
1462
 
 
1463
 
    def call_with_body_readv_array(self, args, body):
1464
 
        """Make a remote call with a readv array.
1465
 
 
1466
 
        The body is encoded with one line per readv offset pair. The numbers in
1467
 
        each pair are separated by a comma, and no trailing \n is emitted.
1468
 
        """
1469
 
        bytes = _encode_tuple(args)
1470
 
        self._request.accept_bytes(bytes)
1471
 
        readv_bytes = self._serialise_offsets(body)
1472
 
        bytes = self._encode_bulk_data(readv_bytes)
1473
 
        self._request.accept_bytes(bytes)
1474
 
        self._request.finished_writing()
1475
 
 
1476
 
    def cancel_read_body(self):
1477
 
        """After expecting a body, a response code may indicate one otherwise.
1478
 
 
1479
 
        This method lets the domain client inform the protocol that no body
1480
 
        will be transmitted. This is a terminal method: after calling it the
1481
 
        protocol is not able to be used further.
1482
 
        """
1483
 
        self._request.finished_reading()
1484
 
 
1485
 
    def read_response_tuple(self, expect_body=False):
1486
 
        """Read a response tuple from the wire.
1487
 
 
1488
 
        This should only be called once.
1489
 
        """
1490
 
        result = self._recv_tuple()
1491
 
        if not expect_body:
1492
 
            self._request.finished_reading()
1493
 
        return result
1494
 
 
1495
 
    def read_body_bytes(self, count=-1):
1496
 
        """Read bytes from the body, decoding into a byte stream.
1497
 
        
1498
 
        We read all bytes at once to ensure we've checked the trailer for 
1499
 
        errors, and then feed the buffer back as read_body_bytes is called.
1500
 
        """
1501
 
        if self._body_buffer is not None:
1502
 
            return self._body_buffer.read(count)
1503
 
        _body_decoder = LengthPrefixedBodyDecoder()
1504
 
 
1505
 
        while not _body_decoder.finished_reading:
1506
 
            bytes_wanted = _body_decoder.next_read_size()
1507
 
            bytes = self._request.read_bytes(bytes_wanted)
1508
 
            _body_decoder.accept_bytes(bytes)
1509
 
        self._request.finished_reading()
1510
 
        self._body_buffer = StringIO(_body_decoder.read_pending_data())
1511
 
        # XXX: TODO check the trailer result.
1512
 
        return self._body_buffer.read(count)
1513
 
 
1514
 
    def _recv_tuple(self):
1515
 
        """Receive a tuple from the medium request."""
1516
 
        line = ''
1517
 
        while not line or line[-1] != '\n':
1518
 
            # TODO: this is inefficient - but tuples are short.
1519
 
            new_char = self._request.read_bytes(1)
1520
 
            line += new_char
1521
 
            assert new_char != '', "end of file reading from server."
1522
 
        return _decode_tuple(line)
1523
 
 
1524
 
    def query_version(self):
1525
 
        """Return protocol version number of the server."""
1526
 
        self.call('hello')
1527
 
        resp = self.read_response_tuple()
1528
 
        if resp == ('ok', '1'):
1529
 
            return 1
1530
 
        else:
1531
 
            raise errors.SmartProtocolError("bad response %r" % (resp,))
1532
 
 
1533
 
 
1534
 
class SmartClientMedium(object):
1535
 
    """Smart client is a medium for sending smart protocol requests over."""
1536
 
 
1537
 
    def disconnect(self):
1538
 
        """If this medium maintains a persistent connection, close it.
1539
 
        
1540
 
        The default implementation does nothing.
1541
 
        """
1542
 
        
1543
 
 
1544
 
class SmartClientStreamMedium(SmartClientMedium):
1545
 
    """Stream based medium common class.
1546
 
 
1547
 
    SmartClientStreamMediums operate on a stream. All subclasses use a common
1548
 
    SmartClientStreamMediumRequest for their requests, and should implement
1549
 
    _accept_bytes and _read_bytes to allow the request objects to send and
1550
 
    receive bytes.
1551
 
    """
1552
 
 
1553
 
    def __init__(self):
1554
 
        self._current_request = None
1555
 
 
1556
 
    def accept_bytes(self, bytes):
1557
 
        self._accept_bytes(bytes)
1558
 
 
1559
 
    def __del__(self):
1560
 
        """The SmartClientStreamMedium knows how to close the stream when it is
1561
 
        finished with it.
1562
 
        """
1563
 
        self.disconnect()
1564
 
 
1565
 
    def _flush(self):
1566
 
        """Flush the output stream.
1567
 
        
1568
 
        This method is used by the SmartClientStreamMediumRequest to ensure that
1569
 
        all data for a request is sent, to avoid long timeouts or deadlocks.
1570
 
        """
1571
 
        raise NotImplementedError(self._flush)
1572
 
 
1573
 
    def get_request(self):
1574
 
        """See SmartClientMedium.get_request().
1575
 
 
1576
 
        SmartClientStreamMedium always returns a SmartClientStreamMediumRequest
1577
 
        for get_request.
1578
 
        """
1579
 
        return SmartClientStreamMediumRequest(self)
1580
 
 
1581
 
    def read_bytes(self, count):
1582
 
        return self._read_bytes(count)
1583
 
 
1584
 
 
1585
 
class SmartSimplePipesClientMedium(SmartClientStreamMedium):
1586
 
    """A client medium using simple pipes.
1587
 
    
1588
 
    This client does not manage the pipes: it assumes they will always be open.
1589
 
    """
1590
 
 
1591
 
    def __init__(self, readable_pipe, writeable_pipe):
1592
 
        SmartClientStreamMedium.__init__(self)
1593
 
        self._readable_pipe = readable_pipe
1594
 
        self._writeable_pipe = writeable_pipe
1595
 
 
1596
 
    def _accept_bytes(self, bytes):
1597
 
        """See SmartClientStreamMedium.accept_bytes."""
1598
 
        self._writeable_pipe.write(bytes)
1599
 
 
1600
 
    def _flush(self):
1601
 
        """See SmartClientStreamMedium._flush()."""
1602
 
        self._writeable_pipe.flush()
1603
 
 
1604
 
    def _read_bytes(self, count):
1605
 
        """See SmartClientStreamMedium._read_bytes."""
1606
 
        return self._readable_pipe.read(count)
1607
 
 
1608
 
 
1609
 
class SmartSSHClientMedium(SmartClientStreamMedium):
1610
 
    """A client medium using SSH."""
1611
 
    
1612
 
    def __init__(self, host, port=None, username=None, password=None,
1613
 
            vendor=None):
1614
 
        """Creates a client that will connect on the first use.
1615
 
        
1616
 
        :param vendor: An optional override for the ssh vendor to use. See
1617
 
            bzrlib.transport.ssh for details on ssh vendors.
1618
 
        """
1619
 
        SmartClientStreamMedium.__init__(self)
1620
 
        self._connected = False
1621
 
        self._host = host
1622
 
        self._password = password
1623
 
        self._port = port
1624
 
        self._username = username
1625
 
        self._read_from = None
1626
 
        self._ssh_connection = None
1627
 
        self._vendor = vendor
1628
 
        self._write_to = None
1629
 
 
1630
 
    def _accept_bytes(self, bytes):
1631
 
        """See SmartClientStreamMedium.accept_bytes."""
1632
 
        self._ensure_connection()
1633
 
        self._write_to.write(bytes)
1634
 
 
1635
 
    def disconnect(self):
1636
 
        """See SmartClientMedium.disconnect()."""
1637
 
        if not self._connected:
1638
 
            return
1639
 
        self._read_from.close()
1640
 
        self._write_to.close()
1641
 
        self._ssh_connection.close()
1642
 
        self._connected = False
1643
 
 
1644
 
    def _ensure_connection(self):
1645
 
        """Connect this medium if not already connected."""
1646
 
        if self._connected:
1647
 
            return
1648
 
        executable = os.environ.get('BZR_REMOTE_PATH', 'bzr')
1649
 
        if self._vendor is None:
1650
 
            vendor = ssh._get_ssh_vendor()
1651
 
        else:
1652
 
            vendor = self._vendor
1653
 
        self._ssh_connection = vendor.connect_ssh(self._username,
1654
 
                self._password, self._host, self._port,
1655
 
                command=[executable, 'serve', '--inet', '--directory=/',
1656
 
                         '--allow-writes'])
1657
 
        self._read_from, self._write_to = \
1658
 
            self._ssh_connection.get_filelike_channels()
1659
 
        self._connected = True
1660
 
 
1661
 
    def _flush(self):
1662
 
        """See SmartClientStreamMedium._flush()."""
1663
 
        self._write_to.flush()
1664
 
 
1665
 
    def _read_bytes(self, count):
1666
 
        """See SmartClientStreamMedium.read_bytes."""
1667
 
        if not self._connected:
1668
 
            raise errors.MediumNotConnected(self)
1669
 
        return self._read_from.read(count)
1670
 
 
1671
 
 
1672
 
class SmartTCPClientMedium(SmartClientStreamMedium):
1673
 
    """A client medium using TCP."""
1674
 
    
1675
 
    def __init__(self, host, port):
1676
 
        """Creates a client that will connect on the first use."""
1677
 
        SmartClientStreamMedium.__init__(self)
1678
 
        self._connected = False
1679
 
        self._host = host
1680
 
        self._port = port
1681
 
        self._socket = None
1682
 
 
1683
 
    def _accept_bytes(self, bytes):
1684
 
        """See SmartClientMedium.accept_bytes."""
1685
 
        self._ensure_connection()
1686
 
        self._socket.sendall(bytes)
1687
 
 
1688
 
    def disconnect(self):
1689
 
        """See SmartClientMedium.disconnect()."""
1690
 
        if not self._connected:
1691
 
            return
1692
 
        self._socket.close()
1693
 
        self._socket = None
1694
 
        self._connected = False
1695
 
 
1696
 
    def _ensure_connection(self):
1697
 
        """Connect this medium if not already connected."""
1698
 
        if self._connected:
1699
 
            return
1700
 
        self._socket = socket.socket()
1701
 
        self._socket.setsockopt(socket.IPPROTO_TCP, socket.TCP_NODELAY, 1)
1702
 
        result = self._socket.connect_ex((self._host, int(self._port)))
1703
 
        if result:
1704
 
            raise errors.ConnectionError("failed to connect to %s:%d: %s" %
1705
 
                    (self._host, self._port, os.strerror(result)))
1706
 
        self._connected = True
1707
 
 
1708
 
    def _flush(self):
1709
 
        """See SmartClientStreamMedium._flush().
1710
 
        
1711
 
        For TCP we do no flushing. We may want to turn off TCP_NODELAY and 
1712
 
        add a means to do a flush, but that can be done in the future.
1713
 
        """
1714
 
 
1715
 
    def _read_bytes(self, count):
1716
 
        """See SmartClientMedium.read_bytes."""
1717
 
        if not self._connected:
1718
 
            raise errors.MediumNotConnected(self)
1719
 
        return self._socket.recv(count)
1720
 
 
1721
 
 
1722
 
class SmartTCPTransport(SmartTransport):
 
422
class RemoteTCPTransport(RemoteTransport):
1723
423
    """Connection to smart server over plain tcp.
1724
424
    
1725
425
    This is essentially just a factory to get 'RemoteTransport(url,
1729
429
    def __init__(self, url):
1730
430
        _scheme, _username, _password, _host, _port, _path = \
1731
431
            transport.split_url(url)
1732
 
        try:
1733
 
            _port = int(_port)
1734
 
        except (ValueError, TypeError), e:
1735
 
            raise errors.InvalidURL(path=url, extra="invalid port %s" % _port)
1736
 
        medium = SmartTCPClientMedium(_host, _port)
1737
 
        super(SmartTCPTransport, self).__init__(url, medium=medium)
1738
 
 
1739
 
 
1740
 
class SmartSSHTransport(SmartTransport):
 
432
        if _port is None:
 
433
            _port = BZR_DEFAULT_PORT
 
434
        else:
 
435
            try:
 
436
                _port = int(_port)
 
437
            except (ValueError, TypeError), e:
 
438
                raise errors.InvalidURL(
 
439
                    path=url, extra="invalid port %s" % _port)
 
440
        client_medium = medium.SmartTCPClientMedium(_host, _port)
 
441
        super(RemoteTCPTransport, self).__init__(url, medium=client_medium)
 
442
 
 
443
 
 
444
class RemoteSSHTransport(RemoteTransport):
1741
445
    """Connection to smart server over SSH.
1742
446
 
1743
447
    This is essentially just a factory to get 'RemoteTransport(url,
1753
457
        except (ValueError, TypeError), e:
1754
458
            raise errors.InvalidURL(path=url, extra="invalid port %s" % 
1755
459
                _port)
1756
 
        medium = SmartSSHClientMedium(_host, _port, _username, _password)
1757
 
        super(SmartSSHTransport, self).__init__(url, medium=medium)
1758
 
 
1759
 
 
1760
 
class SmartHTTPTransport(SmartTransport):
 
460
        client_medium = medium.SmartSSHClientMedium(_host, _port,
 
461
                                                    _username, _password)
 
462
        super(RemoteSSHTransport, self).__init__(url, medium=client_medium)
 
463
 
 
464
 
 
465
class RemoteHTTPTransport(RemoteTransport):
1761
466
    """Just a way to connect between a bzr+http:// url and http://.
1762
467
    
1763
 
    This connection operates slightly differently than the SmartSSHTransport.
 
468
    This connection operates slightly differently than the RemoteSSHTransport.
1764
469
    It uses a plain http:// transport underneath, which defines what remote
1765
470
    .bzr/smart URL we are connected to. From there, all paths that are sent are
1766
471
    sent as relative paths, this way, the remote side can properly
1777
482
        else:
1778
483
            self._http_transport = http_transport
1779
484
        http_medium = self._http_transport.get_smart_medium()
1780
 
        super(SmartHTTPTransport, self).__init__(url, medium=http_medium)
 
485
        super(RemoteHTTPTransport, self).__init__(url, medium=http_medium)
1781
486
 
1782
487
    def _remote_path(self, relpath):
1783
488
        """After connecting HTTP Transport only deals in relative URLs."""
1797
502
        return self._unparse_url(self._combine_paths(self._path, relpath))
1798
503
 
1799
504
    def clone(self, relative_url):
1800
 
        """Make a new SmartHTTPTransport related to me.
 
505
        """Make a new RemoteHTTPTransport related to me.
1801
506
 
1802
507
        This is re-implemented rather than using the default
1803
 
        SmartTransport.clone() because we must be careful about the underlying
 
508
        RemoteTransport.clone() because we must be careful about the underlying
1804
509
        http transport.
1805
510
 
1806
511
        Also, the cloned smart transport will POST to the same .bzr/smart
1823
528
            http_transport = self._http_transport.clone(normalized_rel_url)
1824
529
        else:
1825
530
            http_transport = self._http_transport
1826
 
        return SmartHTTPTransport(abs_url, http_transport=http_transport)
 
531
        return RemoteHTTPTransport(abs_url, http_transport=http_transport)
1827
532
 
1828
533
 
1829
534
def get_test_permutations():
1830
535
    """Return (transport, server) permutations for testing."""
1831
536
    ### We may need a little more test framework support to construct an
1832
537
    ### appropriate RemoteTransport in the future.
1833
 
    return [(SmartTCPTransport, SmartTCPServer_for_testing)]
 
538
    from bzrlib.smart import server
 
539
    return [(RemoteTCPTransport, server.SmartTCPServer_for_testing)]