~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/transport/remote.py

  • Committer: Martin Pool
  • Date: 2005-07-23 13:59:30 UTC
  • Revision ID: mbp@sourcefrog.net-20050723135930-d81530c82c925cb0
- less dodgy is_inside function

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2006 Canonical Ltd
2
 
#
3
 
# This program is free software; you can redistribute it and/or modify
4
 
# it under the terms of the GNU General Public License as published by
5
 
# the Free Software Foundation; either version 2 of the License, or
6
 
# (at your option) any later version.
7
 
#
8
 
# This program is distributed in the hope that it will be useful,
9
 
# but WITHOUT ANY WARRANTY; without even the implied warranty of
10
 
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
11
 
# GNU General Public License for more details.
12
 
#
13
 
# You should have received a copy of the GNU General Public License
14
 
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
 
 
17
 
"""RemoteTransport client for the smart-server.
18
 
 
19
 
This module shouldn't be accessed directly.  The classes defined here should be
20
 
imported from bzrlib.smart.
21
 
"""
22
 
 
23
 
__all__ = ['RemoteTransport', 'RemoteTCPTransport', 'RemoteSSHTransport']
24
 
 
25
 
from cStringIO import StringIO
26
 
import urllib
27
 
import urlparse
28
 
 
29
 
from bzrlib import (
30
 
    debug,
31
 
    errors,
32
 
    trace,
33
 
    transport,
34
 
    urlutils,
35
 
    )
36
 
from bzrlib.smart import client, medium, protocol
37
 
 
38
 
# must do this otherwise urllib can't parse the urls properly :(
39
 
for scheme in ['ssh', 'bzr', 'bzr+loopback', 'bzr+ssh', 'bzr+http']:
40
 
    transport.register_urlparse_netloc_protocol(scheme)
41
 
del scheme
42
 
 
43
 
 
44
 
# Port 4155 is the default port for bzr://, registered with IANA.
45
 
BZR_DEFAULT_INTERFACE = '0.0.0.0'
46
 
BZR_DEFAULT_PORT = 4155
47
 
 
48
 
 
49
 
class _SmartStat(object):
50
 
 
51
 
    def __init__(self, size, mode):
52
 
        self.st_size = size
53
 
        self.st_mode = mode
54
 
 
55
 
 
56
 
class RemoteTransport(transport.ConnectedTransport):
57
 
    """Connection to a smart server.
58
 
 
59
 
    The connection holds references to the medium that can be used to send
60
 
    requests to the server.
61
 
 
62
 
    The connection has a notion of the current directory to which it's
63
 
    connected; this is incorporated in filenames passed to the server.
64
 
    
65
 
    This supports some higher-level RPC operations and can also be treated 
66
 
    like a Transport to do file-like operations.
67
 
 
68
 
    The connection can be made over a tcp socket, an ssh pipe or a series of
69
 
    http requests.  There are concrete subclasses for each type:
70
 
    RemoteTCPTransport, etc.
71
 
    """
72
 
 
73
 
    # IMPORTANT FOR IMPLEMENTORS: RemoteTransport MUST NOT be given encoding
74
 
    # responsibilities: Put those on SmartClient or similar. This is vital for
75
 
    # the ability to support multiple versions of the smart protocol over time:
76
 
    # RemoteTransport is an adapter from the Transport object model to the 
77
 
    # SmartClient model, not an encoder.
78
 
 
79
 
    # FIXME: the medium parameter should be private, only the tests requires
80
 
    # it. It may be even clearer to define a TestRemoteTransport that handles
81
 
    # the specific cases of providing a _client and/or a _medium, and leave
82
 
    # RemoteTransport as an abstract class.
83
 
    def __init__(self, url, _from_transport=None, medium=None, _client=None):
84
 
        """Constructor.
85
 
 
86
 
        :param _from_transport: Another RemoteTransport instance that this
87
 
            one is being cloned from.  Attributes such as the medium will
88
 
            be reused.
89
 
 
90
 
        :param medium: The medium to use for this RemoteTransport. This must be
91
 
            supplied if _from_transport is None.
92
 
 
93
 
        :param _client: Override the _SmartClient used by this transport.  This
94
 
            should only be used for testing purposes; normally this is
95
 
            determined from the medium.
96
 
        """
97
 
        super(RemoteTransport, self).__init__(url,
98
 
                                              _from_transport=_from_transport)
99
 
 
100
 
        # The medium is the connection, except when we need to share it with
101
 
        # other objects (RemoteBzrDir, RemoteRepository etc). In these cases
102
 
        # what we want to share is really the shared connection.
103
 
 
104
 
        if _from_transport is None:
105
 
            # If no _from_transport is specified, we need to intialize the
106
 
            # shared medium.
107
 
            credentials = None
108
 
            if medium is None:
109
 
                medium, credentials = self._build_medium()
110
 
                if 'hpss' in debug.debug_flags:
111
 
                    trace.mutter('hpss: Built a new medium: %s',
112
 
                                 medium.__class__.__name__)
113
 
            self._shared_connection = transport._SharedConnection(medium,
114
 
                                                                  credentials)
115
 
 
116
 
        if _client is None:
117
 
            self._client = client._SmartClient(self.get_shared_medium())
118
 
        else:
119
 
            self._client = _client
120
 
 
121
 
    def _build_medium(self):
122
 
        """Create the medium if _from_transport does not provide one.
123
 
 
124
 
        The medium is analogous to the connection for ConnectedTransport: it
125
 
        allows connection sharing.
126
 
        """
127
 
        # No credentials
128
 
        return None, None
129
 
 
130
 
    def is_readonly(self):
131
 
        """Smart server transport can do read/write file operations."""
132
 
        resp = self._call2('Transport.is_readonly')
133
 
        if resp == ('yes', ):
134
 
            return True
135
 
        elif resp == ('no', ):
136
 
            return False
137
 
        elif (resp == ('error', "Generic bzr smart protocol error: "
138
 
                                "bad request 'Transport.is_readonly'") or
139
 
              resp == ('error', "Generic bzr smart protocol error: "
140
 
                                "bad request u'Transport.is_readonly'")):
141
 
            # XXX: nasty hack: servers before 0.16 don't have a
142
 
            # 'Transport.is_readonly' verb, so we do what clients before 0.16
143
 
            # did: assume False.
144
 
            return False
145
 
        else:
146
 
            self._translate_error(resp)
147
 
        raise errors.UnexpectedSmartServerResponse(resp)
148
 
 
149
 
    def get_smart_client(self):
150
 
        return self._get_connection()
151
 
 
152
 
    def get_smart_medium(self):
153
 
        return self._get_connection()
154
 
 
155
 
    def get_shared_medium(self):
156
 
        return self._get_shared_connection()
157
 
 
158
 
    def _remote_path(self, relpath):
159
 
        """Returns the Unicode version of the absolute path for relpath."""
160
 
        return self._combine_paths(self._path, relpath)
161
 
 
162
 
    def _call(self, method, *args):
163
 
        resp = self._call2(method, *args)
164
 
        self._translate_error(resp)
165
 
 
166
 
    def _call2(self, method, *args):
167
 
        """Call a method on the remote server."""
168
 
        return self._client.call(method, *args)
169
 
 
170
 
    def _call_with_body_bytes(self, method, args, body):
171
 
        """Call a method on the remote server with body bytes."""
172
 
        return self._client.call_with_body_bytes(method, args, body)
173
 
 
174
 
    def has(self, relpath):
175
 
        """Indicate whether a remote file of the given name exists or not.
176
 
 
177
 
        :see: Transport.has()
178
 
        """
179
 
        resp = self._call2('has', self._remote_path(relpath))
180
 
        if resp == ('yes', ):
181
 
            return True
182
 
        elif resp == ('no', ):
183
 
            return False
184
 
        else:
185
 
            self._translate_error(resp)
186
 
 
187
 
    def get(self, relpath):
188
 
        """Return file-like object reading the contents of a remote file.
189
 
        
190
 
        :see: Transport.get_bytes()/get_file()
191
 
        """
192
 
        return StringIO(self.get_bytes(relpath))
193
 
 
194
 
    def get_bytes(self, relpath):
195
 
        remote = self._remote_path(relpath)
196
 
        request = self.get_smart_medium().get_request()
197
 
        smart_protocol = protocol.SmartClientRequestProtocolOne(request)
198
 
        smart_protocol.call('get', remote)
199
 
        resp = smart_protocol.read_response_tuple(True)
200
 
        if resp != ('ok', ):
201
 
            smart_protocol.cancel_read_body()
202
 
            self._translate_error(resp, relpath)
203
 
        return smart_protocol.read_body_bytes()
204
 
 
205
 
    def _serialise_optional_mode(self, mode):
206
 
        if mode is None:
207
 
            return ''
208
 
        else:
209
 
            return '%d' % mode
210
 
 
211
 
    def mkdir(self, relpath, mode=None):
212
 
        resp = self._call2('mkdir', self._remote_path(relpath),
213
 
            self._serialise_optional_mode(mode))
214
 
        self._translate_error(resp)
215
 
 
216
 
    def put_bytes(self, relpath, upload_contents, mode=None):
217
 
        # FIXME: upload_file is probably not safe for non-ascii characters -
218
 
        # should probably just pass all parameters as length-delimited
219
 
        # strings?
220
 
        if type(upload_contents) is unicode:
221
 
            # Although not strictly correct, we raise UnicodeEncodeError to be
222
 
            # compatible with other transports.
223
 
            raise UnicodeEncodeError(
224
 
                'undefined', upload_contents, 0, 1,
225
 
                'put_bytes must be given bytes, not unicode.')
226
 
        resp = self._call_with_body_bytes('put',
227
 
            (self._remote_path(relpath), self._serialise_optional_mode(mode)),
228
 
            upload_contents)
229
 
        self._translate_error(resp)
230
 
 
231
 
    def put_bytes_non_atomic(self, relpath, bytes, mode=None,
232
 
                             create_parent_dir=False,
233
 
                             dir_mode=None):
234
 
        """See Transport.put_bytes_non_atomic."""
235
 
        # FIXME: no encoding in the transport!
236
 
        create_parent_str = 'F'
237
 
        if create_parent_dir:
238
 
            create_parent_str = 'T'
239
 
 
240
 
        resp = self._call_with_body_bytes(
241
 
            'put_non_atomic',
242
 
            (self._remote_path(relpath), self._serialise_optional_mode(mode),
243
 
             create_parent_str, self._serialise_optional_mode(dir_mode)),
244
 
            bytes)
245
 
        self._translate_error(resp)
246
 
 
247
 
    def put_file(self, relpath, upload_file, mode=None):
248
 
        # its not ideal to seek back, but currently put_non_atomic_file depends
249
 
        # on transports not reading before failing - which is a faulty
250
 
        # assumption I think - RBC 20060915
251
 
        pos = upload_file.tell()
252
 
        try:
253
 
            return self.put_bytes(relpath, upload_file.read(), mode)
254
 
        except:
255
 
            upload_file.seek(pos)
256
 
            raise
257
 
 
258
 
    def put_file_non_atomic(self, relpath, f, mode=None,
259
 
                            create_parent_dir=False,
260
 
                            dir_mode=None):
261
 
        return self.put_bytes_non_atomic(relpath, f.read(), mode=mode,
262
 
                                         create_parent_dir=create_parent_dir,
263
 
                                         dir_mode=dir_mode)
264
 
 
265
 
    def append_file(self, relpath, from_file, mode=None):
266
 
        return self.append_bytes(relpath, from_file.read(), mode)
267
 
        
268
 
    def append_bytes(self, relpath, bytes, mode=None):
269
 
        resp = self._call_with_body_bytes(
270
 
            'append',
271
 
            (self._remote_path(relpath), self._serialise_optional_mode(mode)),
272
 
            bytes)
273
 
        if resp[0] == 'appended':
274
 
            return int(resp[1])
275
 
        self._translate_error(resp)
276
 
 
277
 
    def delete(self, relpath):
278
 
        resp = self._call2('delete', self._remote_path(relpath))
279
 
        self._translate_error(resp)
280
 
 
281
 
    def external_url(self):
282
 
        """See bzrlib.transport.Transport.external_url."""
283
 
        # the external path for RemoteTransports is the base
284
 
        return self.base
285
 
 
286
 
    def readv(self, relpath, offsets):
287
 
        if not offsets:
288
 
            return
289
 
 
290
 
        offsets = list(offsets)
291
 
 
292
 
        sorted_offsets = sorted(offsets)
293
 
        # turn the list of offsets into a stack
294
 
        offset_stack = iter(offsets)
295
 
        cur_offset_and_size = offset_stack.next()
296
 
        coalesced = list(self._coalesce_offsets(sorted_offsets,
297
 
                               limit=self._max_readv_combine,
298
 
                               fudge_factor=self._bytes_to_read_before_seek))
299
 
 
300
 
        request = self.get_smart_medium().get_request()
301
 
        smart_protocol = protocol.SmartClientRequestProtocolOne(request)
302
 
        smart_protocol.call_with_body_readv_array(
303
 
            ('readv', self._remote_path(relpath)),
304
 
            [(c.start, c.length) for c in coalesced])
305
 
        resp = smart_protocol.read_response_tuple(True)
306
 
 
307
 
        if resp[0] != 'readv':
308
 
            # This should raise an exception
309
 
            smart_protocol.cancel_read_body()
310
 
            self._translate_error(resp)
311
 
            return
312
 
 
313
 
        # FIXME: this should know how many bytes are needed, for clarity.
314
 
        data = smart_protocol.read_body_bytes()
315
 
        # Cache the results, but only until they have been fulfilled
316
 
        data_map = {}
317
 
        for c_offset in coalesced:
318
 
            if len(data) < c_offset.length:
319
 
                raise errors.ShortReadvError(relpath, c_offset.start,
320
 
                            c_offset.length, actual=len(data))
321
 
            for suboffset, subsize in c_offset.ranges:
322
 
                key = (c_offset.start+suboffset, subsize)
323
 
                data_map[key] = data[suboffset:suboffset+subsize]
324
 
            data = data[c_offset.length:]
325
 
 
326
 
            # Now that we've read some data, see if we can yield anything back
327
 
            while cur_offset_and_size in data_map:
328
 
                this_data = data_map.pop(cur_offset_and_size)
329
 
                yield cur_offset_and_size[0], this_data
330
 
                cur_offset_and_size = offset_stack.next()
331
 
 
332
 
    def rename(self, rel_from, rel_to):
333
 
        self._call('rename',
334
 
                   self._remote_path(rel_from),
335
 
                   self._remote_path(rel_to))
336
 
 
337
 
    def move(self, rel_from, rel_to):
338
 
        self._call('move',
339
 
                   self._remote_path(rel_from),
340
 
                   self._remote_path(rel_to))
341
 
 
342
 
    def rmdir(self, relpath):
343
 
        resp = self._call('rmdir', self._remote_path(relpath))
344
 
 
345
 
    def _translate_error(self, resp, orig_path=None):
346
 
        """Raise an exception from a response"""
347
 
        if resp is None:
348
 
            what = None
349
 
        else:
350
 
            what = resp[0]
351
 
        if what == 'ok':
352
 
            return
353
 
        elif what == 'NoSuchFile':
354
 
            if orig_path is not None:
355
 
                error_path = orig_path
356
 
            else:
357
 
                error_path = resp[1]
358
 
            raise errors.NoSuchFile(error_path)
359
 
        elif what == 'error':
360
 
            raise errors.SmartProtocolError(unicode(resp[1]))
361
 
        elif what == 'FileExists':
362
 
            raise errors.FileExists(resp[1])
363
 
        elif what == 'DirectoryNotEmpty':
364
 
            raise errors.DirectoryNotEmpty(resp[1])
365
 
        elif what == 'ShortReadvError':
366
 
            raise errors.ShortReadvError(resp[1], int(resp[2]),
367
 
                                         int(resp[3]), int(resp[4]))
368
 
        elif what in ('UnicodeEncodeError', 'UnicodeDecodeError'):
369
 
            encoding = str(resp[1]) # encoding must always be a string
370
 
            val = resp[2]
371
 
            start = int(resp[3])
372
 
            end = int(resp[4])
373
 
            reason = str(resp[5]) # reason must always be a string
374
 
            if val.startswith('u:'):
375
 
                val = val[2:].decode('utf-8')
376
 
            elif val.startswith('s:'):
377
 
                val = val[2:].decode('base64')
378
 
            if what == 'UnicodeDecodeError':
379
 
                raise UnicodeDecodeError(encoding, val, start, end, reason)
380
 
            elif what == 'UnicodeEncodeError':
381
 
                raise UnicodeEncodeError(encoding, val, start, end, reason)
382
 
        elif what == "ReadOnlyError":
383
 
            raise errors.TransportNotPossible('readonly transport')
384
 
        elif what == "ReadError":
385
 
            if orig_path is not None:
386
 
                error_path = orig_path
387
 
            else:
388
 
                error_path = resp[1]
389
 
            raise errors.ReadError(error_path)
390
 
        else:
391
 
            raise errors.SmartProtocolError('unexpected smart server error: %r' % (resp,))
392
 
 
393
 
    def disconnect(self):
394
 
        self.get_smart_medium().disconnect()
395
 
 
396
 
    def delete_tree(self, relpath):
397
 
        raise errors.TransportNotPossible('readonly transport')
398
 
 
399
 
    def stat(self, relpath):
400
 
        resp = self._call2('stat', self._remote_path(relpath))
401
 
        if resp[0] == 'stat':
402
 
            return _SmartStat(int(resp[1]), int(resp[2], 8))
403
 
        else:
404
 
            self._translate_error(resp)
405
 
 
406
 
    ## def lock_read(self, relpath):
407
 
    ##     """Lock the given file for shared (read) access.
408
 
    ##     :return: A lock object, which should be passed to Transport.unlock()
409
 
    ##     """
410
 
    ##     # The old RemoteBranch ignore lock for reading, so we will
411
 
    ##     # continue that tradition and return a bogus lock object.
412
 
    ##     class BogusLock(object):
413
 
    ##         def __init__(self, path):
414
 
    ##             self.path = path
415
 
    ##         def unlock(self):
416
 
    ##             pass
417
 
    ##     return BogusLock(relpath)
418
 
 
419
 
    def listable(self):
420
 
        return True
421
 
 
422
 
    def list_dir(self, relpath):
423
 
        resp = self._call2('list_dir', self._remote_path(relpath))
424
 
        if resp[0] == 'names':
425
 
            return [name.encode('ascii') for name in resp[1:]]
426
 
        else:
427
 
            self._translate_error(resp)
428
 
 
429
 
    def iter_files_recursive(self):
430
 
        resp = self._call2('iter_files_recursive', self._remote_path(''))
431
 
        if resp[0] == 'names':
432
 
            return resp[1:]
433
 
        else:
434
 
            self._translate_error(resp)
435
 
 
436
 
 
437
 
class RemoteTCPTransport(RemoteTransport):
438
 
    """Connection to smart server over plain tcp.
439
 
    
440
 
    This is essentially just a factory to get 'RemoteTransport(url,
441
 
        SmartTCPClientMedium).
442
 
    """
443
 
 
444
 
    def _build_medium(self):
445
 
        assert self.base.startswith('bzr://')
446
 
        if self._port is None:
447
 
            self._port = BZR_DEFAULT_PORT
448
 
        return medium.SmartTCPClientMedium(self._host, self._port), None
449
 
 
450
 
 
451
 
class RemoteSSHTransport(RemoteTransport):
452
 
    """Connection to smart server over SSH.
453
 
 
454
 
    This is essentially just a factory to get 'RemoteTransport(url,
455
 
        SmartSSHClientMedium).
456
 
    """
457
 
 
458
 
    def _build_medium(self):
459
 
        assert self.base.startswith('bzr+ssh://')
460
 
        # ssh will prompt the user for a password if needed and if none is
461
 
        # provided but it will not give it back, so no credentials can be
462
 
        # stored.
463
 
        return medium.SmartSSHClientMedium(self._host, self._port,
464
 
                                           self._user, self._password), None
465
 
 
466
 
 
467
 
class RemoteHTTPTransport(RemoteTransport):
468
 
    """Just a way to connect between a bzr+http:// url and http://.
469
 
    
470
 
    This connection operates slightly differently than the RemoteSSHTransport.
471
 
    It uses a plain http:// transport underneath, which defines what remote
472
 
    .bzr/smart URL we are connected to. From there, all paths that are sent are
473
 
    sent as relative paths, this way, the remote side can properly
474
 
    de-reference them, since it is likely doing rewrite rules to translate an
475
 
    HTTP path into a local path.
476
 
    """
477
 
 
478
 
    def __init__(self, base, _from_transport=None, http_transport=None):
479
 
        assert base.startswith('bzr+http://')
480
 
 
481
 
        if http_transport is None:
482
 
            # FIXME: the password may be lost here because it appears in the
483
 
            # url only for an intial construction (when the url came from the
484
 
            # command-line).
485
 
            http_url = base[len('bzr+'):]
486
 
            self._http_transport = transport.get_transport(http_url)
487
 
        else:
488
 
            self._http_transport = http_transport
489
 
        super(RemoteHTTPTransport, self).__init__(
490
 
            base, _from_transport=_from_transport)
491
 
 
492
 
    def _build_medium(self):
493
 
        # We let http_transport take care of the credentials
494
 
        return self._http_transport.get_smart_medium(), None
495
 
 
496
 
    def _remote_path(self, relpath):
497
 
        """After connecting, HTTP Transport only deals in relative URLs."""
498
 
        # Adjust the relpath based on which URL this smart transport is
499
 
        # connected to.
500
 
        http_base = urlutils.normalize_url(self._http_transport.base)
501
 
        url = urlutils.join(self.base[len('bzr+'):], relpath)
502
 
        url = urlutils.normalize_url(url)
503
 
        return urlutils.relative_url(http_base, url)
504
 
 
505
 
    def clone(self, relative_url):
506
 
        """Make a new RemoteHTTPTransport related to me.
507
 
 
508
 
        This is re-implemented rather than using the default
509
 
        RemoteTransport.clone() because we must be careful about the underlying
510
 
        http transport.
511
 
 
512
 
        Also, the cloned smart transport will POST to the same .bzr/smart
513
 
        location as this transport (although obviously the relative paths in the
514
 
        smart requests may be different).  This is so that the server doesn't
515
 
        have to handle .bzr/smart requests at arbitrary places inside .bzr
516
 
        directories, just at the initial URL the user uses.
517
 
 
518
 
        The exception is parent paths (i.e. relative_url of "..").
519
 
        """
520
 
        if relative_url:
521
 
            abs_url = self.abspath(relative_url)
522
 
        else:
523
 
            abs_url = self.base
524
 
        # We either use the exact same http_transport (for child locations), or
525
 
        # a clone of the underlying http_transport (for parent locations).  This
526
 
        # means we share the connection.
527
 
        norm_base = urlutils.normalize_url(self.base)
528
 
        norm_abs_url = urlutils.normalize_url(abs_url)
529
 
        normalized_rel_url = urlutils.relative_url(norm_base, norm_abs_url)
530
 
        if normalized_rel_url == ".." or normalized_rel_url.startswith("../"):
531
 
            http_transport = self._http_transport.clone(normalized_rel_url)
532
 
        else:
533
 
            http_transport = self._http_transport
534
 
        return RemoteHTTPTransport(abs_url,
535
 
                                   _from_transport=self,
536
 
                                   http_transport=http_transport)
537
 
 
538
 
 
539
 
def get_test_permutations():
540
 
    """Return (transport, server) permutations for testing."""
541
 
    ### We may need a little more test framework support to construct an
542
 
    ### appropriate RemoteTransport in the future.
543
 
    from bzrlib.smart import server
544
 
    return [(RemoteTCPTransport, server.SmartTCPServer_for_testing)]