~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/transport/remote.py

Merged bzr.dev and updated NEWS with a better description of changes

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# Copyright (C) 2006 Canonical Ltd
 
2
#
 
3
# This program is free software; you can redistribute it and/or modify
 
4
# it under the terms of the GNU General Public License as published by
 
5
# the Free Software Foundation; either version 2 of the License, or
 
6
# (at your option) any later version.
 
7
#
 
8
# This program is distributed in the hope that it will be useful,
 
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
11
# GNU General Public License for more details.
 
12
#
 
13
# You should have received a copy of the GNU General Public License
 
14
# along with this program; if not, write to the Free Software
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
16
 
 
17
"""RemoteTransport client for the smart-server.
 
18
 
 
19
This module shouldn't be accessed directly.  The classes defined here should be
 
20
imported from bzrlib.smart.
 
21
"""
 
22
 
 
23
__all__ = ['RemoteTransport', 'RemoteTCPTransport', 'RemoteSSHTransport']
 
24
 
 
25
from cStringIO import StringIO
 
26
import urllib
 
27
import urlparse
 
28
 
 
29
from bzrlib import (
 
30
    debug,
 
31
    errors,
 
32
    trace,
 
33
    transport,
 
34
    urlutils,
 
35
    )
 
36
from bzrlib.smart import client, medium, protocol
 
37
 
 
38
# must do this otherwise urllib can't parse the urls properly :(
 
39
for scheme in ['ssh', 'bzr', 'bzr+loopback', 'bzr+ssh', 'bzr+http']:
 
40
    transport.register_urlparse_netloc_protocol(scheme)
 
41
del scheme
 
42
 
 
43
 
 
44
# Port 4155 is the default port for bzr://, registered with IANA.
 
45
BZR_DEFAULT_INTERFACE = '0.0.0.0'
 
46
BZR_DEFAULT_PORT = 4155
 
47
 
 
48
 
 
49
class _SmartStat(object):
 
50
 
 
51
    def __init__(self, size, mode):
 
52
        self.st_size = size
 
53
        self.st_mode = mode
 
54
 
 
55
 
 
56
class RemoteTransport(transport.ConnectedTransport):
 
57
    """Connection to a smart server.
 
58
 
 
59
    The connection holds references to the medium that can be used to send
 
60
    requests to the server.
 
61
 
 
62
    The connection has a notion of the current directory to which it's
 
63
    connected; this is incorporated in filenames passed to the server.
 
64
    
 
65
    This supports some higher-level RPC operations and can also be treated 
 
66
    like a Transport to do file-like operations.
 
67
 
 
68
    The connection can be made over a tcp socket, an ssh pipe or a series of
 
69
    http requests.  There are concrete subclasses for each type:
 
70
    RemoteTCPTransport, etc.
 
71
    """
 
72
 
 
73
    # IMPORTANT FOR IMPLEMENTORS: RemoteTransport MUST NOT be given encoding
 
74
    # responsibilities: Put those on SmartClient or similar. This is vital for
 
75
    # the ability to support multiple versions of the smart protocol over time:
 
76
    # RemoteTransport is an adapter from the Transport object model to the 
 
77
    # SmartClient model, not an encoder.
 
78
 
 
79
    # FIXME: the medium parameter should be private, only the tests requires
 
80
    # it. It may be even clearer to define a TestRemoteTransport that handles
 
81
    # the specific cases of providing a _client and/or a _medium, and leave
 
82
    # RemoteTransport as an abstract class.
 
83
    def __init__(self, url, _from_transport=None, medium=None, _client=None):
 
84
        """Constructor.
 
85
 
 
86
        :param _from_transport: Another RemoteTransport instance that this
 
87
            one is being cloned from.  Attributes such as the medium will
 
88
            be reused.
 
89
 
 
90
        :param medium: The medium to use for this RemoteTransport. This must be
 
91
            supplied if _from_transport is None.
 
92
 
 
93
        :param _client: Override the _SmartClient used by this transport.  This
 
94
            should only be used for testing purposes; normally this is
 
95
            determined from the medium.
 
96
        """
 
97
        super(RemoteTransport, self).__init__(url,
 
98
                                              _from_transport=_from_transport)
 
99
 
 
100
        # The medium is the connection, except when we need to share it with
 
101
        # other objects (RemoteBzrDir, RemoteRepository etc). In these cases
 
102
        # what we want to share is really the shared connection.
 
103
 
 
104
        if _from_transport is None:
 
105
            # If no _from_transport is specified, we need to intialize the
 
106
            # shared medium.
 
107
            credentials = None
 
108
            if medium is None:
 
109
                medium, credentials = self._build_medium()
 
110
                if 'hpss' in debug.debug_flags:
 
111
                    trace.mutter('hpss: Built a new medium: %s',
 
112
                                 medium.__class__.__name__)
 
113
            self._shared_connection = transport._SharedConnection(medium,
 
114
                                                                  credentials)
 
115
 
 
116
        if _client is None:
 
117
            self._client = client._SmartClient(self.get_shared_medium())
 
118
        else:
 
119
            self._client = _client
 
120
 
 
121
    def _build_medium(self):
 
122
        """Create the medium if _from_transport does not provide one.
 
123
 
 
124
        The medium is analogous to the connection for ConnectedTransport: it
 
125
        allows connection sharing.
 
126
        """
 
127
        # No credentials
 
128
        return None, None
 
129
 
 
130
    def is_readonly(self):
 
131
        """Smart server transport can do read/write file operations."""
 
132
        resp = self._call2('Transport.is_readonly')
 
133
        if resp == ('yes', ):
 
134
            return True
 
135
        elif resp == ('no', ):
 
136
            return False
 
137
        elif (resp == ('error', "Generic bzr smart protocol error: "
 
138
                                "bad request 'Transport.is_readonly'") or
 
139
              resp == ('error', "Generic bzr smart protocol error: "
 
140
                                "bad request u'Transport.is_readonly'")):
 
141
            # XXX: nasty hack: servers before 0.16 don't have a
 
142
            # 'Transport.is_readonly' verb, so we do what clients before 0.16
 
143
            # did: assume False.
 
144
            return False
 
145
        else:
 
146
            self._translate_error(resp)
 
147
        raise errors.UnexpectedSmartServerResponse(resp)
 
148
 
 
149
    def get_smart_client(self):
 
150
        return self._get_connection()
 
151
 
 
152
    def get_smart_medium(self):
 
153
        return self._get_connection()
 
154
 
 
155
    def get_shared_medium(self):
 
156
        return self._get_shared_connection()
 
157
 
 
158
    def _remote_path(self, relpath):
 
159
        """Returns the Unicode version of the absolute path for relpath."""
 
160
        return self._combine_paths(self._path, relpath)
 
161
 
 
162
    def _call(self, method, *args):
 
163
        resp = self._call2(method, *args)
 
164
        self._translate_error(resp)
 
165
 
 
166
    def _call2(self, method, *args):
 
167
        """Call a method on the remote server."""
 
168
        return self._client.call(method, *args)
 
169
 
 
170
    def _call_with_body_bytes(self, method, args, body):
 
171
        """Call a method on the remote server with body bytes."""
 
172
        return self._client.call_with_body_bytes(method, args, body)
 
173
 
 
174
    def has(self, relpath):
 
175
        """Indicate whether a remote file of the given name exists or not.
 
176
 
 
177
        :see: Transport.has()
 
178
        """
 
179
        resp = self._call2('has', self._remote_path(relpath))
 
180
        if resp == ('yes', ):
 
181
            return True
 
182
        elif resp == ('no', ):
 
183
            return False
 
184
        else:
 
185
            self._translate_error(resp)
 
186
 
 
187
    def get(self, relpath):
 
188
        """Return file-like object reading the contents of a remote file.
 
189
        
 
190
        :see: Transport.get_bytes()/get_file()
 
191
        """
 
192
        return StringIO(self.get_bytes(relpath))
 
193
 
 
194
    def get_bytes(self, relpath):
 
195
        remote = self._remote_path(relpath)
 
196
        request = self.get_smart_medium().get_request()
 
197
        smart_protocol = protocol.SmartClientRequestProtocolOne(request)
 
198
        smart_protocol.call('get', remote)
 
199
        resp = smart_protocol.read_response_tuple(True)
 
200
        if resp != ('ok', ):
 
201
            smart_protocol.cancel_read_body()
 
202
            self._translate_error(resp, relpath)
 
203
        return smart_protocol.read_body_bytes()
 
204
 
 
205
    def _serialise_optional_mode(self, mode):
 
206
        if mode is None:
 
207
            return ''
 
208
        else:
 
209
            return '%d' % mode
 
210
 
 
211
    def mkdir(self, relpath, mode=None):
 
212
        resp = self._call2('mkdir', self._remote_path(relpath),
 
213
            self._serialise_optional_mode(mode))
 
214
        self._translate_error(resp)
 
215
 
 
216
    def put_bytes(self, relpath, upload_contents, mode=None):
 
217
        # FIXME: upload_file is probably not safe for non-ascii characters -
 
218
        # should probably just pass all parameters as length-delimited
 
219
        # strings?
 
220
        if type(upload_contents) is unicode:
 
221
            # Although not strictly correct, we raise UnicodeEncodeError to be
 
222
            # compatible with other transports.
 
223
            raise UnicodeEncodeError(
 
224
                'undefined', upload_contents, 0, 1,
 
225
                'put_bytes must be given bytes, not unicode.')
 
226
        resp = self._call_with_body_bytes('put',
 
227
            (self._remote_path(relpath), self._serialise_optional_mode(mode)),
 
228
            upload_contents)
 
229
        self._translate_error(resp)
 
230
 
 
231
    def put_bytes_non_atomic(self, relpath, bytes, mode=None,
 
232
                             create_parent_dir=False,
 
233
                             dir_mode=None):
 
234
        """See Transport.put_bytes_non_atomic."""
 
235
        # FIXME: no encoding in the transport!
 
236
        create_parent_str = 'F'
 
237
        if create_parent_dir:
 
238
            create_parent_str = 'T'
 
239
 
 
240
        resp = self._call_with_body_bytes(
 
241
            'put_non_atomic',
 
242
            (self._remote_path(relpath), self._serialise_optional_mode(mode),
 
243
             create_parent_str, self._serialise_optional_mode(dir_mode)),
 
244
            bytes)
 
245
        self._translate_error(resp)
 
246
 
 
247
    def put_file(self, relpath, upload_file, mode=None):
 
248
        # its not ideal to seek back, but currently put_non_atomic_file depends
 
249
        # on transports not reading before failing - which is a faulty
 
250
        # assumption I think - RBC 20060915
 
251
        pos = upload_file.tell()
 
252
        try:
 
253
            return self.put_bytes(relpath, upload_file.read(), mode)
 
254
        except:
 
255
            upload_file.seek(pos)
 
256
            raise
 
257
 
 
258
    def put_file_non_atomic(self, relpath, f, mode=None,
 
259
                            create_parent_dir=False,
 
260
                            dir_mode=None):
 
261
        return self.put_bytes_non_atomic(relpath, f.read(), mode=mode,
 
262
                                         create_parent_dir=create_parent_dir,
 
263
                                         dir_mode=dir_mode)
 
264
 
 
265
    def append_file(self, relpath, from_file, mode=None):
 
266
        return self.append_bytes(relpath, from_file.read(), mode)
 
267
        
 
268
    def append_bytes(self, relpath, bytes, mode=None):
 
269
        resp = self._call_with_body_bytes(
 
270
            'append',
 
271
            (self._remote_path(relpath), self._serialise_optional_mode(mode)),
 
272
            bytes)
 
273
        if resp[0] == 'appended':
 
274
            return int(resp[1])
 
275
        self._translate_error(resp)
 
276
 
 
277
    def delete(self, relpath):
 
278
        resp = self._call2('delete', self._remote_path(relpath))
 
279
        self._translate_error(resp)
 
280
 
 
281
    def external_url(self):
 
282
        """See bzrlib.transport.Transport.external_url."""
 
283
        # the external path for RemoteTransports is the base
 
284
        return self.base
 
285
 
 
286
    def readv(self, relpath, offsets):
 
287
        if not offsets:
 
288
            return
 
289
 
 
290
        offsets = list(offsets)
 
291
 
 
292
        sorted_offsets = sorted(offsets)
 
293
        # turn the list of offsets into a stack
 
294
        offset_stack = iter(offsets)
 
295
        cur_offset_and_size = offset_stack.next()
 
296
        coalesced = list(self._coalesce_offsets(sorted_offsets,
 
297
                               limit=self._max_readv_combine,
 
298
                               fudge_factor=self._bytes_to_read_before_seek))
 
299
 
 
300
        request = self.get_smart_medium().get_request()
 
301
        smart_protocol = protocol.SmartClientRequestProtocolOne(request)
 
302
        smart_protocol.call_with_body_readv_array(
 
303
            ('readv', self._remote_path(relpath)),
 
304
            [(c.start, c.length) for c in coalesced])
 
305
        resp = smart_protocol.read_response_tuple(True)
 
306
 
 
307
        if resp[0] != 'readv':
 
308
            # This should raise an exception
 
309
            smart_protocol.cancel_read_body()
 
310
            self._translate_error(resp)
 
311
            return
 
312
 
 
313
        # FIXME: this should know how many bytes are needed, for clarity.
 
314
        data = smart_protocol.read_body_bytes()
 
315
        # Cache the results, but only until they have been fulfilled
 
316
        data_map = {}
 
317
        for c_offset in coalesced:
 
318
            if len(data) < c_offset.length:
 
319
                raise errors.ShortReadvError(relpath, c_offset.start,
 
320
                            c_offset.length, actual=len(data))
 
321
            for suboffset, subsize in c_offset.ranges:
 
322
                key = (c_offset.start+suboffset, subsize)
 
323
                data_map[key] = data[suboffset:suboffset+subsize]
 
324
            data = data[c_offset.length:]
 
325
 
 
326
            # Now that we've read some data, see if we can yield anything back
 
327
            while cur_offset_and_size in data_map:
 
328
                this_data = data_map.pop(cur_offset_and_size)
 
329
                yield cur_offset_and_size[0], this_data
 
330
                cur_offset_and_size = offset_stack.next()
 
331
 
 
332
    def rename(self, rel_from, rel_to):
 
333
        self._call('rename',
 
334
                   self._remote_path(rel_from),
 
335
                   self._remote_path(rel_to))
 
336
 
 
337
    def move(self, rel_from, rel_to):
 
338
        self._call('move',
 
339
                   self._remote_path(rel_from),
 
340
                   self._remote_path(rel_to))
 
341
 
 
342
    def rmdir(self, relpath):
 
343
        resp = self._call('rmdir', self._remote_path(relpath))
 
344
 
 
345
    def _translate_error(self, resp, orig_path=None):
 
346
        """Raise an exception from a response"""
 
347
        if resp is None:
 
348
            what = None
 
349
        else:
 
350
            what = resp[0]
 
351
        if what == 'ok':
 
352
            return
 
353
        elif what == 'NoSuchFile':
 
354
            if orig_path is not None:
 
355
                error_path = orig_path
 
356
            else:
 
357
                error_path = resp[1]
 
358
            raise errors.NoSuchFile(error_path)
 
359
        elif what == 'error':
 
360
            raise errors.SmartProtocolError(unicode(resp[1]))
 
361
        elif what == 'FileExists':
 
362
            raise errors.FileExists(resp[1])
 
363
        elif what == 'DirectoryNotEmpty':
 
364
            raise errors.DirectoryNotEmpty(resp[1])
 
365
        elif what == 'ShortReadvError':
 
366
            raise errors.ShortReadvError(resp[1], int(resp[2]),
 
367
                                         int(resp[3]), int(resp[4]))
 
368
        elif what in ('UnicodeEncodeError', 'UnicodeDecodeError'):
 
369
            encoding = str(resp[1]) # encoding must always be a string
 
370
            val = resp[2]
 
371
            start = int(resp[3])
 
372
            end = int(resp[4])
 
373
            reason = str(resp[5]) # reason must always be a string
 
374
            if val.startswith('u:'):
 
375
                val = val[2:].decode('utf-8')
 
376
            elif val.startswith('s:'):
 
377
                val = val[2:].decode('base64')
 
378
            if what == 'UnicodeDecodeError':
 
379
                raise UnicodeDecodeError(encoding, val, start, end, reason)
 
380
            elif what == 'UnicodeEncodeError':
 
381
                raise UnicodeEncodeError(encoding, val, start, end, reason)
 
382
        elif what == "ReadOnlyError":
 
383
            raise errors.TransportNotPossible('readonly transport')
 
384
        elif what == "ReadError":
 
385
            if orig_path is not None:
 
386
                error_path = orig_path
 
387
            else:
 
388
                error_path = resp[1]
 
389
            raise errors.ReadError(error_path)
 
390
        else:
 
391
            raise errors.SmartProtocolError('unexpected smart server error: %r' % (resp,))
 
392
 
 
393
    def disconnect(self):
 
394
        self.get_smart_medium().disconnect()
 
395
 
 
396
    def delete_tree(self, relpath):
 
397
        raise errors.TransportNotPossible('readonly transport')
 
398
 
 
399
    def stat(self, relpath):
 
400
        resp = self._call2('stat', self._remote_path(relpath))
 
401
        if resp[0] == 'stat':
 
402
            return _SmartStat(int(resp[1]), int(resp[2], 8))
 
403
        else:
 
404
            self._translate_error(resp)
 
405
 
 
406
    ## def lock_read(self, relpath):
 
407
    ##     """Lock the given file for shared (read) access.
 
408
    ##     :return: A lock object, which should be passed to Transport.unlock()
 
409
    ##     """
 
410
    ##     # The old RemoteBranch ignore lock for reading, so we will
 
411
    ##     # continue that tradition and return a bogus lock object.
 
412
    ##     class BogusLock(object):
 
413
    ##         def __init__(self, path):
 
414
    ##             self.path = path
 
415
    ##         def unlock(self):
 
416
    ##             pass
 
417
    ##     return BogusLock(relpath)
 
418
 
 
419
    def listable(self):
 
420
        return True
 
421
 
 
422
    def list_dir(self, relpath):
 
423
        resp = self._call2('list_dir', self._remote_path(relpath))
 
424
        if resp[0] == 'names':
 
425
            return [name.encode('ascii') for name in resp[1:]]
 
426
        else:
 
427
            self._translate_error(resp)
 
428
 
 
429
    def iter_files_recursive(self):
 
430
        resp = self._call2('iter_files_recursive', self._remote_path(''))
 
431
        if resp[0] == 'names':
 
432
            return resp[1:]
 
433
        else:
 
434
            self._translate_error(resp)
 
435
 
 
436
 
 
437
class RemoteTCPTransport(RemoteTransport):
 
438
    """Connection to smart server over plain tcp.
 
439
    
 
440
    This is essentially just a factory to get 'RemoteTransport(url,
 
441
        SmartTCPClientMedium).
 
442
    """
 
443
 
 
444
    def _build_medium(self):
 
445
        assert self.base.startswith('bzr://')
 
446
        if self._port is None:
 
447
            self._port = BZR_DEFAULT_PORT
 
448
        return medium.SmartTCPClientMedium(self._host, self._port), None
 
449
 
 
450
 
 
451
class RemoteSSHTransport(RemoteTransport):
 
452
    """Connection to smart server over SSH.
 
453
 
 
454
    This is essentially just a factory to get 'RemoteTransport(url,
 
455
        SmartSSHClientMedium).
 
456
    """
 
457
 
 
458
    def _build_medium(self):
 
459
        assert self.base.startswith('bzr+ssh://')
 
460
        # ssh will prompt the user for a password if needed and if none is
 
461
        # provided but it will not give it back, so no credentials can be
 
462
        # stored.
 
463
        return medium.SmartSSHClientMedium(self._host, self._port,
 
464
                                           self._user, self._password), None
 
465
 
 
466
 
 
467
class RemoteHTTPTransport(RemoteTransport):
 
468
    """Just a way to connect between a bzr+http:// url and http://.
 
469
    
 
470
    This connection operates slightly differently than the RemoteSSHTransport.
 
471
    It uses a plain http:// transport underneath, which defines what remote
 
472
    .bzr/smart URL we are connected to. From there, all paths that are sent are
 
473
    sent as relative paths, this way, the remote side can properly
 
474
    de-reference them, since it is likely doing rewrite rules to translate an
 
475
    HTTP path into a local path.
 
476
    """
 
477
 
 
478
    def __init__(self, base, _from_transport=None, http_transport=None):
 
479
        assert base.startswith('bzr+http://')
 
480
 
 
481
        if http_transport is None:
 
482
            # FIXME: the password may be lost here because it appears in the
 
483
            # url only for an intial construction (when the url came from the
 
484
            # command-line).
 
485
            http_url = base[len('bzr+'):]
 
486
            self._http_transport = transport.get_transport(http_url)
 
487
        else:
 
488
            self._http_transport = http_transport
 
489
        super(RemoteHTTPTransport, self).__init__(
 
490
            base, _from_transport=_from_transport)
 
491
 
 
492
    def _build_medium(self):
 
493
        # We let http_transport take care of the credentials
 
494
        return self._http_transport.get_smart_medium(), None
 
495
 
 
496
    def _remote_path(self, relpath):
 
497
        """After connecting, HTTP Transport only deals in relative URLs."""
 
498
        # Adjust the relpath based on which URL this smart transport is
 
499
        # connected to.
 
500
        http_base = urlutils.normalize_url(self._http_transport.base)
 
501
        url = urlutils.join(self.base[len('bzr+'):], relpath)
 
502
        url = urlutils.normalize_url(url)
 
503
        return urlutils.relative_url(http_base, url)
 
504
 
 
505
    def clone(self, relative_url):
 
506
        """Make a new RemoteHTTPTransport related to me.
 
507
 
 
508
        This is re-implemented rather than using the default
 
509
        RemoteTransport.clone() because we must be careful about the underlying
 
510
        http transport.
 
511
 
 
512
        Also, the cloned smart transport will POST to the same .bzr/smart
 
513
        location as this transport (although obviously the relative paths in the
 
514
        smart requests may be different).  This is so that the server doesn't
 
515
        have to handle .bzr/smart requests at arbitrary places inside .bzr
 
516
        directories, just at the initial URL the user uses.
 
517
 
 
518
        The exception is parent paths (i.e. relative_url of "..").
 
519
        """
 
520
        if relative_url:
 
521
            abs_url = self.abspath(relative_url)
 
522
        else:
 
523
            abs_url = self.base
 
524
        # We either use the exact same http_transport (for child locations), or
 
525
        # a clone of the underlying http_transport (for parent locations).  This
 
526
        # means we share the connection.
 
527
        norm_base = urlutils.normalize_url(self.base)
 
528
        norm_abs_url = urlutils.normalize_url(abs_url)
 
529
        normalized_rel_url = urlutils.relative_url(norm_base, norm_abs_url)
 
530
        if normalized_rel_url == ".." or normalized_rel_url.startswith("../"):
 
531
            http_transport = self._http_transport.clone(normalized_rel_url)
 
532
        else:
 
533
            http_transport = self._http_transport
 
534
        return RemoteHTTPTransport(abs_url,
 
535
                                   _from_transport=self,
 
536
                                   http_transport=http_transport)
 
537
 
 
538
 
 
539
def get_test_permutations():
 
540
    """Return (transport, server) permutations for testing."""
 
541
    ### We may need a little more test framework support to construct an
 
542
    ### appropriate RemoteTransport in the future.
 
543
    from bzrlib.smart import server
 
544
    return [(RemoteTCPTransport, server.SmartTCPServer_for_testing)]