~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/transport/remote.py

  • Committer: mbp at sourcefrog
  • Date: 2005-04-11 02:53:57 UTC
  • Revision ID: mbp@sourcefrog.net-20050411025357-af577721308648ae
- remove profiler temporary file when done

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2006 Canonical Ltd
2
 
#
3
 
# This program is free software; you can redistribute it and/or modify
4
 
# it under the terms of the GNU General Public License as published by
5
 
# the Free Software Foundation; either version 2 of the License, or
6
 
# (at your option) any later version.
7
 
#
8
 
# This program is distributed in the hope that it will be useful,
9
 
# but WITHOUT ANY WARRANTY; without even the implied warranty of
10
 
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
11
 
# GNU General Public License for more details.
12
 
#
13
 
# You should have received a copy of the GNU General Public License
14
 
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
 
 
17
 
"""RemoteTransport client for the smart-server.
18
 
 
19
 
This module shouldn't be accessed directly.  The classes defined here should be
20
 
imported from bzrlib.smart.
21
 
"""
22
 
 
23
 
__all__ = ['RemoteTransport', 'RemoteTCPTransport', 'RemoteSSHTransport']
24
 
 
25
 
from cStringIO import StringIO
26
 
import urllib
27
 
import urlparse
28
 
 
29
 
from bzrlib import (
30
 
    config,
31
 
    debug,
32
 
    errors,
33
 
    trace,
34
 
    transport,
35
 
    urlutils,
36
 
    )
37
 
from bzrlib.smart import client, medium, protocol
38
 
 
39
 
 
40
 
# Port 4155 is the default port for bzr://, registered with IANA.
41
 
BZR_DEFAULT_INTERFACE = '0.0.0.0'
42
 
BZR_DEFAULT_PORT = 4155
43
 
 
44
 
 
45
 
class _SmartStat(object):
46
 
 
47
 
    def __init__(self, size, mode):
48
 
        self.st_size = size
49
 
        self.st_mode = mode
50
 
 
51
 
 
52
 
class RemoteTransport(transport.ConnectedTransport):
53
 
    """Connection to a smart server.
54
 
 
55
 
    The connection holds references to the medium that can be used to send
56
 
    requests to the server.
57
 
 
58
 
    The connection has a notion of the current directory to which it's
59
 
    connected; this is incorporated in filenames passed to the server.
60
 
    
61
 
    This supports some higher-level RPC operations and can also be treated 
62
 
    like a Transport to do file-like operations.
63
 
 
64
 
    The connection can be made over a tcp socket, an ssh pipe or a series of
65
 
    http requests.  There are concrete subclasses for each type:
66
 
    RemoteTCPTransport, etc.
67
 
    """
68
 
 
69
 
    # IMPORTANT FOR IMPLEMENTORS: RemoteTransport MUST NOT be given encoding
70
 
    # responsibilities: Put those on SmartClient or similar. This is vital for
71
 
    # the ability to support multiple versions of the smart protocol over time:
72
 
    # RemoteTransport is an adapter from the Transport object model to the 
73
 
    # SmartClient model, not an encoder.
74
 
 
75
 
    # FIXME: the medium parameter should be private, only the tests requires
76
 
    # it. It may be even clearer to define a TestRemoteTransport that handles
77
 
    # the specific cases of providing a _client and/or a _medium, and leave
78
 
    # RemoteTransport as an abstract class.
79
 
    def __init__(self, url, _from_transport=None, medium=None, _client=None):
80
 
        """Constructor.
81
 
 
82
 
        :param _from_transport: Another RemoteTransport instance that this
83
 
            one is being cloned from.  Attributes such as the medium will
84
 
            be reused.
85
 
 
86
 
        :param medium: The medium to use for this RemoteTransport. This must be
87
 
            supplied if _from_transport is None.
88
 
 
89
 
        :param _client: Override the _SmartClient used by this transport.  This
90
 
            should only be used for testing purposes; normally this is
91
 
            determined from the medium.
92
 
        """
93
 
        super(RemoteTransport, self).__init__(url,
94
 
                                              _from_transport=_from_transport)
95
 
 
96
 
        # The medium is the connection, except when we need to share it with
97
 
        # other objects (RemoteBzrDir, RemoteRepository etc). In these cases
98
 
        # what we want to share is really the shared connection.
99
 
 
100
 
        if _from_transport is None:
101
 
            # If no _from_transport is specified, we need to intialize the
102
 
            # shared medium.
103
 
            credentials = None
104
 
            if medium is None:
105
 
                medium, credentials = self._build_medium()
106
 
                if 'hpss' in debug.debug_flags:
107
 
                    trace.mutter('hpss: Built a new medium: %s',
108
 
                                 medium.__class__.__name__)
109
 
            self._shared_connection = transport._SharedConnection(medium,
110
 
                                                                  credentials)
111
 
 
112
 
        if _client is None:
113
 
            self._client = client._SmartClient(self.get_shared_medium())
114
 
        else:
115
 
            self._client = _client
116
 
 
117
 
    def _build_medium(self):
118
 
        """Create the medium if _from_transport does not provide one.
119
 
 
120
 
        The medium is analogous to the connection for ConnectedTransport: it
121
 
        allows connection sharing.
122
 
        """
123
 
        # No credentials
124
 
        return None, None
125
 
 
126
 
    def is_readonly(self):
127
 
        """Smart server transport can do read/write file operations."""
128
 
        resp = self._call2('Transport.is_readonly')
129
 
        if resp == ('yes', ):
130
 
            return True
131
 
        elif resp == ('no', ):
132
 
            return False
133
 
        elif (resp == ('error', "Generic bzr smart protocol error: "
134
 
                                "bad request 'Transport.is_readonly'") or
135
 
              resp == ('error', "Generic bzr smart protocol error: "
136
 
                                "bad request u'Transport.is_readonly'")):
137
 
            # XXX: nasty hack: servers before 0.16 don't have a
138
 
            # 'Transport.is_readonly' verb, so we do what clients before 0.16
139
 
            # did: assume False.
140
 
            return False
141
 
        else:
142
 
            self._translate_error(resp)
143
 
        raise errors.UnexpectedSmartServerResponse(resp)
144
 
 
145
 
    def get_smart_client(self):
146
 
        return self._get_connection()
147
 
 
148
 
    def get_smart_medium(self):
149
 
        return self._get_connection()
150
 
 
151
 
    def get_shared_medium(self):
152
 
        return self._get_shared_connection()
153
 
 
154
 
    def _remote_path(self, relpath):
155
 
        """Returns the Unicode version of the absolute path for relpath."""
156
 
        return self._combine_paths(self._path, relpath)
157
 
 
158
 
    def _call(self, method, *args):
159
 
        resp = self._call2(method, *args)
160
 
        self._translate_error(resp)
161
 
 
162
 
    def _call2(self, method, *args):
163
 
        """Call a method on the remote server."""
164
 
        return self._client.call(method, *args)
165
 
 
166
 
    def _call_with_body_bytes(self, method, args, body):
167
 
        """Call a method on the remote server with body bytes."""
168
 
        return self._client.call_with_body_bytes(method, args, body)
169
 
 
170
 
    def has(self, relpath):
171
 
        """Indicate whether a remote file of the given name exists or not.
172
 
 
173
 
        :see: Transport.has()
174
 
        """
175
 
        resp = self._call2('has', self._remote_path(relpath))
176
 
        if resp == ('yes', ):
177
 
            return True
178
 
        elif resp == ('no', ):
179
 
            return False
180
 
        else:
181
 
            self._translate_error(resp)
182
 
 
183
 
    def get(self, relpath):
184
 
        """Return file-like object reading the contents of a remote file.
185
 
        
186
 
        :see: Transport.get_bytes()/get_file()
187
 
        """
188
 
        return StringIO(self.get_bytes(relpath))
189
 
 
190
 
    def get_bytes(self, relpath):
191
 
        remote = self._remote_path(relpath)
192
 
        request = self.get_smart_medium().get_request()
193
 
        smart_protocol = protocol.SmartClientRequestProtocolOne(request)
194
 
        smart_protocol.call('get', remote)
195
 
        resp = smart_protocol.read_response_tuple(True)
196
 
        if resp != ('ok', ):
197
 
            smart_protocol.cancel_read_body()
198
 
            self._translate_error(resp, relpath)
199
 
        return smart_protocol.read_body_bytes()
200
 
 
201
 
    def _serialise_optional_mode(self, mode):
202
 
        if mode is None:
203
 
            return ''
204
 
        else:
205
 
            return '%d' % mode
206
 
 
207
 
    def mkdir(self, relpath, mode=None):
208
 
        resp = self._call2('mkdir', self._remote_path(relpath),
209
 
            self._serialise_optional_mode(mode))
210
 
        self._translate_error(resp)
211
 
 
212
 
    def open_write_stream(self, relpath, mode=None):
213
 
        """See Transport.open_write_stream."""
214
 
        self.put_bytes(relpath, "", mode)
215
 
        result = transport.AppendBasedFileStream(self, relpath)
216
 
        transport._file_streams[self.abspath(relpath)] = result
217
 
        return result
218
 
 
219
 
    def put_bytes(self, relpath, upload_contents, mode=None):
220
 
        # FIXME: upload_file is probably not safe for non-ascii characters -
221
 
        # should probably just pass all parameters as length-delimited
222
 
        # strings?
223
 
        if type(upload_contents) is unicode:
224
 
            # Although not strictly correct, we raise UnicodeEncodeError to be
225
 
            # compatible with other transports.
226
 
            raise UnicodeEncodeError(
227
 
                'undefined', upload_contents, 0, 1,
228
 
                'put_bytes must be given bytes, not unicode.')
229
 
        resp = self._call_with_body_bytes('put',
230
 
            (self._remote_path(relpath), self._serialise_optional_mode(mode)),
231
 
            upload_contents)
232
 
        self._translate_error(resp)
233
 
        return len(upload_contents)
234
 
 
235
 
    def put_bytes_non_atomic(self, relpath, bytes, mode=None,
236
 
                             create_parent_dir=False,
237
 
                             dir_mode=None):
238
 
        """See Transport.put_bytes_non_atomic."""
239
 
        # FIXME: no encoding in the transport!
240
 
        create_parent_str = 'F'
241
 
        if create_parent_dir:
242
 
            create_parent_str = 'T'
243
 
 
244
 
        resp = self._call_with_body_bytes(
245
 
            'put_non_atomic',
246
 
            (self._remote_path(relpath), self._serialise_optional_mode(mode),
247
 
             create_parent_str, self._serialise_optional_mode(dir_mode)),
248
 
            bytes)
249
 
        self._translate_error(resp)
250
 
 
251
 
    def put_file(self, relpath, upload_file, mode=None):
252
 
        # its not ideal to seek back, but currently put_non_atomic_file depends
253
 
        # on transports not reading before failing - which is a faulty
254
 
        # assumption I think - RBC 20060915
255
 
        pos = upload_file.tell()
256
 
        try:
257
 
            return self.put_bytes(relpath, upload_file.read(), mode)
258
 
        except:
259
 
            upload_file.seek(pos)
260
 
            raise
261
 
 
262
 
    def put_file_non_atomic(self, relpath, f, mode=None,
263
 
                            create_parent_dir=False,
264
 
                            dir_mode=None):
265
 
        return self.put_bytes_non_atomic(relpath, f.read(), mode=mode,
266
 
                                         create_parent_dir=create_parent_dir,
267
 
                                         dir_mode=dir_mode)
268
 
 
269
 
    def append_file(self, relpath, from_file, mode=None):
270
 
        return self.append_bytes(relpath, from_file.read(), mode)
271
 
        
272
 
    def append_bytes(self, relpath, bytes, mode=None):
273
 
        resp = self._call_with_body_bytes(
274
 
            'append',
275
 
            (self._remote_path(relpath), self._serialise_optional_mode(mode)),
276
 
            bytes)
277
 
        if resp[0] == 'appended':
278
 
            return int(resp[1])
279
 
        self._translate_error(resp)
280
 
 
281
 
    def delete(self, relpath):
282
 
        resp = self._call2('delete', self._remote_path(relpath))
283
 
        self._translate_error(resp)
284
 
 
285
 
    def external_url(self):
286
 
        """See bzrlib.transport.Transport.external_url."""
287
 
        # the external path for RemoteTransports is the base
288
 
        return self.base
289
 
 
290
 
    def _readv(self, relpath, offsets):
291
 
        if not offsets:
292
 
            return
293
 
 
294
 
        offsets = list(offsets)
295
 
 
296
 
        sorted_offsets = sorted(offsets)
297
 
        # turn the list of offsets into a stack
298
 
        offset_stack = iter(offsets)
299
 
        cur_offset_and_size = offset_stack.next()
300
 
        coalesced = list(self._coalesce_offsets(sorted_offsets,
301
 
                               limit=self._max_readv_combine,
302
 
                               fudge_factor=self._bytes_to_read_before_seek))
303
 
 
304
 
        request = self.get_smart_medium().get_request()
305
 
        smart_protocol = protocol.SmartClientRequestProtocolOne(request)
306
 
        smart_protocol.call_with_body_readv_array(
307
 
            ('readv', self._remote_path(relpath)),
308
 
            [(c.start, c.length) for c in coalesced])
309
 
        resp = smart_protocol.read_response_tuple(True)
310
 
 
311
 
        if resp[0] != 'readv':
312
 
            # This should raise an exception
313
 
            smart_protocol.cancel_read_body()
314
 
            self._translate_error(resp)
315
 
            return
316
 
 
317
 
        # FIXME: this should know how many bytes are needed, for clarity.
318
 
        data = smart_protocol.read_body_bytes()
319
 
        # Cache the results, but only until they have been fulfilled
320
 
        data_map = {}
321
 
        for c_offset in coalesced:
322
 
            if len(data) < c_offset.length:
323
 
                raise errors.ShortReadvError(relpath, c_offset.start,
324
 
                            c_offset.length, actual=len(data))
325
 
            for suboffset, subsize in c_offset.ranges:
326
 
                key = (c_offset.start+suboffset, subsize)
327
 
                data_map[key] = data[suboffset:suboffset+subsize]
328
 
            data = data[c_offset.length:]
329
 
 
330
 
            # Now that we've read some data, see if we can yield anything back
331
 
            while cur_offset_and_size in data_map:
332
 
                this_data = data_map.pop(cur_offset_and_size)
333
 
                yield cur_offset_and_size[0], this_data
334
 
                cur_offset_and_size = offset_stack.next()
335
 
 
336
 
    def rename(self, rel_from, rel_to):
337
 
        self._call('rename',
338
 
                   self._remote_path(rel_from),
339
 
                   self._remote_path(rel_to))
340
 
 
341
 
    def move(self, rel_from, rel_to):
342
 
        self._call('move',
343
 
                   self._remote_path(rel_from),
344
 
                   self._remote_path(rel_to))
345
 
 
346
 
    def rmdir(self, relpath):
347
 
        resp = self._call('rmdir', self._remote_path(relpath))
348
 
 
349
 
    def _translate_error(self, resp, orig_path=None):
350
 
        """Raise an exception from a response"""
351
 
        if resp is None:
352
 
            what = None
353
 
        else:
354
 
            what = resp[0]
355
 
        if what == 'ok':
356
 
            return
357
 
        elif what == 'NoSuchFile':
358
 
            if orig_path is not None:
359
 
                error_path = orig_path
360
 
            else:
361
 
                error_path = resp[1]
362
 
            raise errors.NoSuchFile(error_path)
363
 
        elif what == 'error':
364
 
            raise errors.SmartProtocolError(unicode(resp[1]))
365
 
        elif what == 'FileExists':
366
 
            raise errors.FileExists(resp[1])
367
 
        elif what == 'DirectoryNotEmpty':
368
 
            raise errors.DirectoryNotEmpty(resp[1])
369
 
        elif what == 'ShortReadvError':
370
 
            raise errors.ShortReadvError(resp[1], int(resp[2]),
371
 
                                         int(resp[3]), int(resp[4]))
372
 
        elif what in ('UnicodeEncodeError', 'UnicodeDecodeError'):
373
 
            encoding = str(resp[1]) # encoding must always be a string
374
 
            val = resp[2]
375
 
            start = int(resp[3])
376
 
            end = int(resp[4])
377
 
            reason = str(resp[5]) # reason must always be a string
378
 
            if val.startswith('u:'):
379
 
                val = val[2:].decode('utf-8')
380
 
            elif val.startswith('s:'):
381
 
                val = val[2:].decode('base64')
382
 
            if what == 'UnicodeDecodeError':
383
 
                raise UnicodeDecodeError(encoding, val, start, end, reason)
384
 
            elif what == 'UnicodeEncodeError':
385
 
                raise UnicodeEncodeError(encoding, val, start, end, reason)
386
 
        elif what == "ReadOnlyError":
387
 
            raise errors.TransportNotPossible('readonly transport')
388
 
        elif what == "ReadError":
389
 
            if orig_path is not None:
390
 
                error_path = orig_path
391
 
            else:
392
 
                error_path = resp[1]
393
 
            raise errors.ReadError(error_path)
394
 
        else:
395
 
            raise errors.SmartProtocolError('unexpected smart server error: %r' % (resp,))
396
 
 
397
 
    def disconnect(self):
398
 
        self.get_smart_medium().disconnect()
399
 
 
400
 
    def delete_tree(self, relpath):
401
 
        raise errors.TransportNotPossible('readonly transport')
402
 
 
403
 
    def stat(self, relpath):
404
 
        resp = self._call2('stat', self._remote_path(relpath))
405
 
        if resp[0] == 'stat':
406
 
            return _SmartStat(int(resp[1]), int(resp[2], 8))
407
 
        else:
408
 
            self._translate_error(resp)
409
 
 
410
 
    ## def lock_read(self, relpath):
411
 
    ##     """Lock the given file for shared (read) access.
412
 
    ##     :return: A lock object, which should be passed to Transport.unlock()
413
 
    ##     """
414
 
    ##     # The old RemoteBranch ignore lock for reading, so we will
415
 
    ##     # continue that tradition and return a bogus lock object.
416
 
    ##     class BogusLock(object):
417
 
    ##         def __init__(self, path):
418
 
    ##             self.path = path
419
 
    ##         def unlock(self):
420
 
    ##             pass
421
 
    ##     return BogusLock(relpath)
422
 
 
423
 
    def listable(self):
424
 
        return True
425
 
 
426
 
    def list_dir(self, relpath):
427
 
        resp = self._call2('list_dir', self._remote_path(relpath))
428
 
        if resp[0] == 'names':
429
 
            return [name.encode('ascii') for name in resp[1:]]
430
 
        else:
431
 
            self._translate_error(resp)
432
 
 
433
 
    def iter_files_recursive(self):
434
 
        resp = self._call2('iter_files_recursive', self._remote_path(''))
435
 
        if resp[0] == 'names':
436
 
            return resp[1:]
437
 
        else:
438
 
            self._translate_error(resp)
439
 
 
440
 
 
441
 
class RemoteTCPTransport(RemoteTransport):
442
 
    """Connection to smart server over plain tcp.
443
 
    
444
 
    This is essentially just a factory to get 'RemoteTransport(url,
445
 
        SmartTCPClientMedium).
446
 
    """
447
 
 
448
 
    def _build_medium(self):
449
 
        assert self.base.startswith('bzr://')
450
 
        return medium.SmartTCPClientMedium(self._host, self._port), None
451
 
 
452
 
 
453
 
class RemoteSSHTransport(RemoteTransport):
454
 
    """Connection to smart server over SSH.
455
 
 
456
 
    This is essentially just a factory to get 'RemoteTransport(url,
457
 
        SmartSSHClientMedium).
458
 
    """
459
 
 
460
 
    def _build_medium(self):
461
 
        assert self.base.startswith('bzr+ssh://')
462
 
        # ssh will prompt the user for a password if needed and if none is
463
 
        # provided but it will not give it back, so no credentials can be
464
 
        # stored.
465
 
        location_config = config.LocationConfig(self.base)
466
 
        bzr_remote_path = location_config.get_bzr_remote_path()
467
 
        return medium.SmartSSHClientMedium(self._host, self._port,
468
 
            self._user, self._password, bzr_remote_path=bzr_remote_path), None
469
 
 
470
 
 
471
 
class RemoteHTTPTransport(RemoteTransport):
472
 
    """Just a way to connect between a bzr+http:// url and http://.
473
 
    
474
 
    This connection operates slightly differently than the RemoteSSHTransport.
475
 
    It uses a plain http:// transport underneath, which defines what remote
476
 
    .bzr/smart URL we are connected to. From there, all paths that are sent are
477
 
    sent as relative paths, this way, the remote side can properly
478
 
    de-reference them, since it is likely doing rewrite rules to translate an
479
 
    HTTP path into a local path.
480
 
    """
481
 
 
482
 
    def __init__(self, base, _from_transport=None, http_transport=None):
483
 
        assert ( base.startswith('bzr+http://') or base.startswith('bzr+https://') )
484
 
 
485
 
        if http_transport is None:
486
 
            # FIXME: the password may be lost here because it appears in the
487
 
            # url only for an intial construction (when the url came from the
488
 
            # command-line).
489
 
            http_url = base[len('bzr+'):]
490
 
            self._http_transport = transport.get_transport(http_url)
491
 
        else:
492
 
            self._http_transport = http_transport
493
 
        super(RemoteHTTPTransport, self).__init__(
494
 
            base, _from_transport=_from_transport)
495
 
 
496
 
    def _build_medium(self):
497
 
        # We let http_transport take care of the credentials
498
 
        return self._http_transport.get_smart_medium(), None
499
 
 
500
 
    def _remote_path(self, relpath):
501
 
        """After connecting, HTTP Transport only deals in relative URLs."""
502
 
        # Adjust the relpath based on which URL this smart transport is
503
 
        # connected to.
504
 
        http_base = urlutils.normalize_url(self._http_transport.base)
505
 
        url = urlutils.join(self.base[len('bzr+'):], relpath)
506
 
        url = urlutils.normalize_url(url)
507
 
        return urlutils.relative_url(http_base, url)
508
 
 
509
 
    def clone(self, relative_url):
510
 
        """Make a new RemoteHTTPTransport related to me.
511
 
 
512
 
        This is re-implemented rather than using the default
513
 
        RemoteTransport.clone() because we must be careful about the underlying
514
 
        http transport.
515
 
 
516
 
        Also, the cloned smart transport will POST to the same .bzr/smart
517
 
        location as this transport (although obviously the relative paths in the
518
 
        smart requests may be different).  This is so that the server doesn't
519
 
        have to handle .bzr/smart requests at arbitrary places inside .bzr
520
 
        directories, just at the initial URL the user uses.
521
 
 
522
 
        The exception is parent paths (i.e. relative_url of "..").
523
 
        """
524
 
        if relative_url:
525
 
            abs_url = self.abspath(relative_url)
526
 
        else:
527
 
            abs_url = self.base
528
 
        # We either use the exact same http_transport (for child locations), or
529
 
        # a clone of the underlying http_transport (for parent locations).  This
530
 
        # means we share the connection.
531
 
        norm_base = urlutils.normalize_url(self.base)
532
 
        norm_abs_url = urlutils.normalize_url(abs_url)
533
 
        normalized_rel_url = urlutils.relative_url(norm_base, norm_abs_url)
534
 
        if normalized_rel_url == ".." or normalized_rel_url.startswith("../"):
535
 
            http_transport = self._http_transport.clone(normalized_rel_url)
536
 
        else:
537
 
            http_transport = self._http_transport
538
 
        return RemoteHTTPTransport(abs_url,
539
 
                                   _from_transport=self,
540
 
                                   http_transport=http_transport)
541
 
 
542
 
 
543
 
def get_test_permutations():
544
 
    """Return (transport, server) permutations for testing."""
545
 
    ### We may need a little more test framework support to construct an
546
 
    ### appropriate RemoteTransport in the future.
547
 
    from bzrlib.smart import server
548
 
    return [(RemoteTCPTransport, server.SmartTCPServer_for_testing)]