~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/transport/sftp.py

  • Committer: Canonical.com Patch Queue Manager
  • Date: 2010-04-08 06:17:41 UTC
  • mfrom: (4797.33.16 apport)
  • Revision ID: pqm@pqm.ubuntu.com-20100408061741-m7vl6z97vu33riv7
(robertc) Make sure ExecutablePath and InterpreterPath are set in
        Apport. (Martin Pool, James Westby, lp:528114)

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2005 Robey Pointer <robey@lag.net>
2
 
# Copyright (C) 2005, 2006, 2007 Canonical Ltd
 
1
# Copyright (C) 2005-2010 Canonical Ltd
3
2
#
4
3
# This program is free software; you can redistribute it and/or modify
5
4
# it under the terms of the GNU General Public License as published by
13
12
#
14
13
# You should have received a copy of the GNU General Public License
15
14
# along with this program; if not, write to the Free Software
16
 
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
15
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
17
16
 
18
17
"""Implementation of Transport over SFTP, using paramiko."""
19
18
 
24
23
# suite.  Those formats all date back to 0.7; so we should be able to remove
25
24
# these methods when we officially drop support for those formats.
26
25
 
 
26
import bisect
27
27
import errno
 
28
import itertools
28
29
import os
29
30
import random
30
 
import select
31
 
import socket
32
31
import stat
33
32
import sys
34
33
import time
37
36
import warnings
38
37
 
39
38
from bzrlib import (
 
39
    config,
 
40
    debug,
40
41
    errors,
41
42
    urlutils,
42
43
    )
81
82
else:
82
83
    from paramiko.sftp import (SFTP_FLAG_WRITE, SFTP_FLAG_CREATE,
83
84
                               SFTP_FLAG_EXCL, SFTP_FLAG_TRUNC,
84
 
                               CMD_HANDLE, CMD_OPEN)
 
85
                               SFTP_OK, CMD_HANDLE, CMD_OPEN)
85
86
    from paramiko.sftp_attr import SFTPAttributes
86
87
    from paramiko.sftp_file import SFTPFile
87
88
 
93
94
 
94
95
class SFTPLock(object):
95
96
    """This fakes a lock in a remote location.
96
 
    
 
97
 
97
98
    A present lock is indicated just by the existence of a file.  This
98
 
    doesn't work well on all transports and they are only used in 
 
99
    doesn't work well on all transports and they are only used in
99
100
    deprecated storage formats.
100
101
    """
101
 
    
 
102
 
102
103
    __slots__ = ['path', 'lock_path', 'lock_file', 'transport']
103
104
 
104
105
    def __init__(self, path, transport):
131
132
            pass
132
133
 
133
134
 
 
135
class _SFTPReadvHelper(object):
 
136
    """A class to help with managing the state of a readv request."""
 
137
 
 
138
    # See _get_requests for an explanation.
 
139
    _max_request_size = 32768
 
140
 
 
141
    def __init__(self, original_offsets, relpath, _report_activity):
 
142
        """Create a new readv helper.
 
143
 
 
144
        :param original_offsets: The original requests given by the caller of
 
145
            readv()
 
146
        :param relpath: The name of the file (if known)
 
147
        :param _report_activity: A Transport._report_activity bound method,
 
148
            to be called as data arrives.
 
149
        """
 
150
        self.original_offsets = list(original_offsets)
 
151
        self.relpath = relpath
 
152
        self._report_activity = _report_activity
 
153
 
 
154
    def _get_requests(self):
 
155
        """Break up the offsets into individual requests over sftp.
 
156
 
 
157
        The SFTP spec only requires implementers to support 32kB requests. We
 
158
        could try something larger (openssh supports 64kB), but then we have to
 
159
        handle requests that fail.
 
160
        So instead, we just break up our maximum chunks into 32kB chunks, and
 
161
        asyncronously requests them.
 
162
        Newer versions of paramiko would do the chunking for us, but we want to
 
163
        start processing results right away, so we do it ourselves.
 
164
        """
 
165
        # TODO: Because we issue async requests, we don't 'fudge' any extra
 
166
        #       data.  I'm not 100% sure that is the best choice.
 
167
 
 
168
        # The first thing we do, is to collapse the individual requests as much
 
169
        # as possible, so we don't issues requests <32kB
 
170
        sorted_offsets = sorted(self.original_offsets)
 
171
        coalesced = list(ConnectedTransport._coalesce_offsets(sorted_offsets,
 
172
                                                        limit=0, fudge_factor=0))
 
173
        requests = []
 
174
        for c_offset in coalesced:
 
175
            start = c_offset.start
 
176
            size = c_offset.length
 
177
 
 
178
            # Break this up into 32kB requests
 
179
            while size > 0:
 
180
                next_size = min(size, self._max_request_size)
 
181
                requests.append((start, next_size))
 
182
                size -= next_size
 
183
                start += next_size
 
184
        if 'sftp' in debug.debug_flags:
 
185
            mutter('SFTP.readv(%s) %s offsets => %s coalesced => %s requests',
 
186
                self.relpath, len(sorted_offsets), len(coalesced),
 
187
                len(requests))
 
188
        return requests
 
189
 
 
190
    def request_and_yield_offsets(self, fp):
 
191
        """Request the data from the remote machine, yielding the results.
 
192
 
 
193
        :param fp: A Paramiko SFTPFile object that supports readv.
 
194
        :return: Yield the data requested by the original readv caller, one by
 
195
            one.
 
196
        """
 
197
        requests = self._get_requests()
 
198
        offset_iter = iter(self.original_offsets)
 
199
        cur_offset, cur_size = offset_iter.next()
 
200
        # paramiko .readv() yields strings that are in the order of the requests
 
201
        # So we track the current request to know where the next data is
 
202
        # being returned from.
 
203
        input_start = None
 
204
        last_end = None
 
205
        buffered_data = []
 
206
        buffered_len = 0
 
207
 
 
208
        # This is used to buffer chunks which we couldn't process yet
 
209
        # It is (start, end, data) tuples.
 
210
        data_chunks = []
 
211
        # Create an 'unlimited' data stream, so we stop based on requests,
 
212
        # rather than just because the data stream ended. This lets us detect
 
213
        # short readv.
 
214
        data_stream = itertools.chain(fp.readv(requests),
 
215
                                      itertools.repeat(None))
 
216
        for (start, length), data in itertools.izip(requests, data_stream):
 
217
            if data is None:
 
218
                if cur_coalesced is not None:
 
219
                    raise errors.ShortReadvError(self.relpath,
 
220
                        start, length, len(data))
 
221
            if len(data) != length:
 
222
                raise errors.ShortReadvError(self.relpath,
 
223
                    start, length, len(data))
 
224
            self._report_activity(length, 'read')
 
225
            if last_end is None:
 
226
                # This is the first request, just buffer it
 
227
                buffered_data = [data]
 
228
                buffered_len = length
 
229
                input_start = start
 
230
            elif start == last_end:
 
231
                # The data we are reading fits neatly on the previous
 
232
                # buffer, so this is all part of a larger coalesced range.
 
233
                buffered_data.append(data)
 
234
                buffered_len += length
 
235
            else:
 
236
                # We have an 'interrupt' in the data stream. So we know we are
 
237
                # at a request boundary.
 
238
                if buffered_len > 0:
 
239
                    # We haven't consumed the buffer so far, so put it into
 
240
                    # data_chunks, and continue.
 
241
                    buffered = ''.join(buffered_data)
 
242
                    data_chunks.append((input_start, buffered))
 
243
                input_start = start
 
244
                buffered_data = [data]
 
245
                buffered_len = length
 
246
            last_end = start + length
 
247
            if input_start == cur_offset and cur_size <= buffered_len:
 
248
                # Simplify the next steps a bit by transforming buffered_data
 
249
                # into a single string. We also have the nice property that
 
250
                # when there is only one string ''.join([x]) == x, so there is
 
251
                # no data copying.
 
252
                buffered = ''.join(buffered_data)
 
253
                # Clean out buffered data so that we keep memory
 
254
                # consumption low
 
255
                del buffered_data[:]
 
256
                buffered_offset = 0
 
257
                # TODO: We *could* also consider the case where cur_offset is in
 
258
                #       in the buffered range, even though it doesn't *start*
 
259
                #       the buffered range. But for packs we pretty much always
 
260
                #       read in order, so you won't get any extra data in the
 
261
                #       middle.
 
262
                while (input_start == cur_offset
 
263
                       and (buffered_offset + cur_size) <= buffered_len):
 
264
                    # We've buffered enough data to process this request, spit it
 
265
                    # out
 
266
                    cur_data = buffered[buffered_offset:buffered_offset + cur_size]
 
267
                    # move the direct pointer into our buffered data
 
268
                    buffered_offset += cur_size
 
269
                    # Move the start-of-buffer pointer
 
270
                    input_start += cur_size
 
271
                    # Yield the requested data
 
272
                    yield cur_offset, cur_data
 
273
                    cur_offset, cur_size = offset_iter.next()
 
274
                # at this point, we've consumed as much of buffered as we can,
 
275
                # so break off the portion that we consumed
 
276
                if buffered_offset == len(buffered_data):
 
277
                    # No tail to leave behind
 
278
                    buffered_data = []
 
279
                    buffered_len = 0
 
280
                else:
 
281
                    buffered = buffered[buffered_offset:]
 
282
                    buffered_data = [buffered]
 
283
                    buffered_len = len(buffered)
 
284
        if buffered_len:
 
285
            buffered = ''.join(buffered_data)
 
286
            del buffered_data[:]
 
287
            data_chunks.append((input_start, buffered))
 
288
        if data_chunks:
 
289
            if 'sftp' in debug.debug_flags:
 
290
                mutter('SFTP readv left with %d out-of-order bytes',
 
291
                    sum(map(lambda x: len(x[1]), data_chunks)))
 
292
            # We've processed all the readv data, at this point, anything we
 
293
            # couldn't process is in data_chunks. This doesn't happen often, so
 
294
            # this code path isn't optimized
 
295
            # We use an interesting process for data_chunks
 
296
            # Specifically if we have "bisect_left([(start, len, entries)],
 
297
            #                                       (qstart,)])
 
298
            # If start == qstart, then we get the specific node. Otherwise we
 
299
            # get the previous node
 
300
            while True:
 
301
                idx = bisect.bisect_left(data_chunks, (cur_offset,))
 
302
                if idx < len(data_chunks) and data_chunks[idx][0] == cur_offset:
 
303
                    # The data starts here
 
304
                    data = data_chunks[idx][1][:cur_size]
 
305
                elif idx > 0:
 
306
                    # The data is in a portion of a previous page
 
307
                    idx -= 1
 
308
                    sub_offset = cur_offset - data_chunks[idx][0]
 
309
                    data = data_chunks[idx][1]
 
310
                    data = data[sub_offset:sub_offset + cur_size]
 
311
                else:
 
312
                    # We are missing the page where the data should be found,
 
313
                    # something is wrong
 
314
                    data = ''
 
315
                if len(data) != cur_size:
 
316
                    raise AssertionError('We must have miscalulated.'
 
317
                        ' We expected %d bytes, but only found %d'
 
318
                        % (cur_size, len(data)))
 
319
                yield cur_offset, data
 
320
                cur_offset, cur_size = offset_iter.next()
 
321
 
 
322
 
134
323
class SFTPTransport(ConnectedTransport):
135
324
    """Transport implementation for SFTP access."""
136
325
 
158
347
 
159
348
    def _remote_path(self, relpath):
160
349
        """Return the path to be passed along the sftp protocol for relpath.
161
 
        
 
350
 
162
351
        :param relpath: is a urlencoded string.
163
352
        """
164
353
        relative = urlutils.unescape(relpath).encode('utf-8')
192
381
            password = credentials
193
382
 
194
383
        vendor = ssh._get_ssh_vendor()
 
384
        user = self._user
 
385
        if user is None:
 
386
            auth = config.AuthenticationConfig()
 
387
            user = auth.get_user('ssh', self._host, self._port)
195
388
        connection = vendor.connect_sftp(self._user, password,
196
389
                                         self._host, self._port)
197
 
        return connection, password
 
390
        return connection, (user, password)
198
391
 
199
392
    def _get_sftp(self):
200
393
        """Ensures that a connection is established"""
211
404
        """
212
405
        try:
213
406
            self._get_sftp().stat(self._remote_path(relpath))
 
407
            # stat result is about 20 bytes, let's say
 
408
            self._report_activity(20, 'read')
214
409
            return True
215
410
        except IOError:
216
411
            return False
217
412
 
218
413
    def get(self, relpath):
219
 
        """
220
 
        Get the file at the given relative path.
 
414
        """Get the file at the given relative path.
221
415
 
222
416
        :param relpath: The relative path to the file
223
417
        """
224
418
        try:
 
419
            # FIXME: by returning the file directly, we don't pass this
 
420
            # through to report_activity.  We could try wrapping the object
 
421
            # before it's returned.  For readv and get_bytes it's handled in
 
422
            # the higher-level function.
 
423
            # -- mbp 20090126
225
424
            path = self._remote_path(relpath)
226
425
            f = self._get_sftp().file(path, mode='rb')
227
426
            if self._do_prefetch and (getattr(f, 'prefetch', None) is not None):
231
430
            self._translate_io_exception(e, path, ': error retrieving',
232
431
                failure_exc=errors.ReadError)
233
432
 
 
433
    def get_bytes(self, relpath):
 
434
        # reimplement this here so that we can report how many bytes came back
 
435
        f = self.get(relpath)
 
436
        try:
 
437
            bytes = f.read()
 
438
            self._report_activity(len(bytes), 'read')
 
439
            return bytes
 
440
        finally:
 
441
            f.close()
 
442
 
234
443
    def _readv(self, relpath, offsets):
235
444
        """See Transport.readv()"""
236
445
        # We overload the default readv() because we want to use a file
245
454
            readv = getattr(fp, 'readv', None)
246
455
            if readv:
247
456
                return self._sftp_readv(fp, offsets, relpath)
248
 
            mutter('seek and read %s offsets', len(offsets))
 
457
            if 'sftp' in debug.debug_flags:
 
458
                mutter('seek and read %s offsets', len(offsets))
249
459
            return self._seek_and_read(fp, offsets, relpath)
250
460
        except (IOError, paramiko.SSHException), e:
251
461
            self._translate_io_exception(e, path, ': error retrieving')
258
468
        """
259
469
        return 64 * 1024
260
470
 
261
 
    def _sftp_readv(self, fp, offsets, relpath='<unknown>'):
 
471
    def _sftp_readv(self, fp, offsets, relpath):
262
472
        """Use the readv() member of fp to do async readv.
263
473
 
264
 
        And then read them using paramiko.readv(). paramiko.readv()
 
474
        Then read them using paramiko.readv(). paramiko.readv()
265
475
        does not support ranges > 64K, so it caps the request size, and
266
 
        just reads until it gets all the stuff it wants
 
476
        just reads until it gets all the stuff it wants.
267
477
        """
268
 
        offsets = list(offsets)
269
 
        sorted_offsets = sorted(offsets)
270
 
 
271
 
        # The algorithm works as follows:
272
 
        # 1) Coalesce nearby reads into a single chunk
273
 
        #    This generates a list of combined regions, the total size
274
 
        #    and the size of the sub regions. This coalescing step is limited
275
 
        #    in the number of nearby chunks to combine, and is allowed to
276
 
        #    skip small breaks in the requests. Limiting it makes sure that
277
 
        #    we can start yielding some data earlier, and skipping means we
278
 
        #    make fewer requests. (Beneficial even when using async)
279
 
        # 2) Break up this combined regions into chunks that are smaller
280
 
        #    than 64KiB. Technically the limit is 65536, but we are a
281
 
        #    little bit conservative. This is because sftp has a maximum
282
 
        #    return chunk size of 64KiB (max size of an unsigned short)
283
 
        # 3) Issue a readv() to paramiko to create an async request for
284
 
        #    all of this data
285
 
        # 4) Read in the data as it comes back, until we've read one
286
 
        #    continuous section as determined in step 1
287
 
        # 5) Break up the full sections into hunks for the original requested
288
 
        #    offsets. And put them in a cache
289
 
        # 6) Check if the next request is in the cache, and if it is, remove
290
 
        #    it from the cache, and yield its data. Continue until no more
291
 
        #    entries are in the cache.
292
 
        # 7) loop back to step 4 until all data has been read
293
 
        #
294
 
        # TODO: jam 20060725 This could be optimized one step further, by
295
 
        #       attempting to yield whatever data we have read, even before
296
 
        #       the first coallesced section has been fully processed.
297
 
 
298
 
        # When coalescing for use with readv(), we don't really need to
299
 
        # use any fudge factor, because the requests are made asynchronously
300
 
        coalesced = list(self._coalesce_offsets(sorted_offsets,
301
 
                               limit=self._max_readv_combine,
302
 
                               fudge_factor=0,
303
 
                               ))
304
 
        requests = []
305
 
        for c_offset in coalesced:
306
 
            start = c_offset.start
307
 
            size = c_offset.length
308
 
 
309
 
            # We need to break this up into multiple requests
310
 
            while size > 0:
311
 
                next_size = min(size, self._max_request_size)
312
 
                requests.append((start, next_size))
313
 
                size -= next_size
314
 
                start += next_size
315
 
 
316
 
        mutter('SFTP.readv() %s offsets => %s coalesced => %s requests',
317
 
                len(offsets), len(coalesced), len(requests))
318
 
 
319
 
        # Queue the current read until we have read the full coalesced section
320
 
        cur_data = []
321
 
        cur_data_len = 0
322
 
        cur_coalesced_stack = iter(coalesced)
323
 
        cur_coalesced = cur_coalesced_stack.next()
324
 
 
325
 
        # Cache the results, but only until they have been fulfilled
326
 
        data_map = {}
327
 
        # turn the list of offsets into a stack
328
 
        offset_stack = iter(offsets)
329
 
        cur_offset_and_size = offset_stack.next()
330
 
 
331
 
        for data in fp.readv(requests):
332
 
            cur_data += data
333
 
            cur_data_len += len(data)
334
 
 
335
 
            if cur_data_len < cur_coalesced.length:
336
 
                continue
337
 
            if cur_data_len != cur_coalesced.length:
338
 
                raise AssertionError(
339
 
                    "Somehow we read too much: %s != %s" 
340
 
                    % (cur_data_len, cur_coalesced.length))
341
 
            all_data = ''.join(cur_data)
342
 
            cur_data = []
343
 
            cur_data_len = 0
344
 
 
345
 
            for suboffset, subsize in cur_coalesced.ranges:
346
 
                key = (cur_coalesced.start+suboffset, subsize)
347
 
                data_map[key] = all_data[suboffset:suboffset+subsize]
348
 
 
349
 
            # Now that we've read some data, see if we can yield anything back
350
 
            while cur_offset_and_size in data_map:
351
 
                this_data = data_map.pop(cur_offset_and_size)
352
 
                yield cur_offset_and_size[0], this_data
353
 
                cur_offset_and_size = offset_stack.next()
354
 
 
355
 
            # We read a coalesced entry, so mark it as done
356
 
            cur_coalesced = None
357
 
            # Now that we've read all of the data for this coalesced section
358
 
            # on to the next
359
 
            cur_coalesced = cur_coalesced_stack.next()
360
 
 
361
 
        if cur_coalesced is not None:
362
 
            raise errors.ShortReadvError(relpath, cur_coalesced.start,
363
 
                cur_coalesced.length, len(data))
 
478
        helper = _SFTPReadvHelper(offsets, relpath, self._report_activity)
 
479
        return helper.request_and_yield_offsets(fp)
364
480
 
365
481
    def put_file(self, relpath, f, mode=None):
366
482
        """
391
507
            #      sticky bit. So it is probably best to stop chmodding, and
392
508
            #      just tell users that they need to set the umask correctly.
393
509
            #      The attr.st_mode = mode, in _sftp_open_exclusive
394
 
            #      will handle when the user wants the final mode to be more 
395
 
            #      restrictive. And then we avoid a round trip. Unless 
 
510
            #      will handle when the user wants the final mode to be more
 
511
            #      restrictive. And then we avoid a round trip. Unless
396
512
            #      paramiko decides to expose an async chmod()
397
513
 
398
514
            # This is designed to chmod() right before we close.
399
 
            # Because we set_pipelined() earlier, theoretically we might 
 
515
            # Because we set_pipelined() earlier, theoretically we might
400
516
            # avoid the round trip for fout.close()
401
517
            if mode is not None:
402
518
                self._get_sftp().chmod(tmp_abspath, mode)
444
560
                                                 ': unable to open')
445
561
 
446
562
                # This is designed to chmod() right before we close.
447
 
                # Because we set_pipelined() earlier, theoretically we might 
 
563
                # Because we set_pipelined() earlier, theoretically we might
448
564
                # avoid the round trip for fout.close()
449
565
                if mode is not None:
450
566
                    self._get_sftp().chmod(abspath, mode)
501
617
 
502
618
    def iter_files_recursive(self):
503
619
        """Walk the relative paths of all files in this transport."""
 
620
        # progress is handled by list_dir
504
621
        queue = list(self.list_dir('.'))
505
622
        while queue:
506
623
            relpath = queue.pop(0)
517
634
        else:
518
635
            local_mode = mode
519
636
        try:
 
637
            self._report_activity(len(abspath), 'write')
520
638
            self._get_sftp().mkdir(abspath, local_mode)
 
639
            self._report_activity(1, 'read')
521
640
            if mode is not None:
522
641
                # chmod a dir through sftp will erase any sgid bit set
523
642
                # on the server side.  So, if the bit mode are already
545
664
    def open_write_stream(self, relpath, mode=None):
546
665
        """See Transport.open_write_stream."""
547
666
        # initialise the file to zero-length
548
 
        # this is three round trips, but we don't use this 
549
 
        # api more than once per write_group at the moment so 
 
667
        # this is three round trips, but we don't use this
 
668
        # api more than once per write_group at the moment so
550
669
        # it is a tolerable overhead. Better would be to truncate
551
670
        # the file after opening. RBC 20070805
552
671
        self.put_bytes_non_atomic(relpath, "", mode)
575
694
        :param failure_exc: Paramiko has the super fun ability to raise completely
576
695
                           opaque errors that just set "e.args = ('Failure',)" with
577
696
                           no more information.
578
 
                           If this parameter is set, it defines the exception 
 
697
                           If this parameter is set, it defines the exception
579
698
                           to raise in these cases.
580
699
        """
581
700
        # paramiko seems to generate detailless errors.
590
709
            # strange but true, for the paramiko server.
591
710
            if (e.args == ('Failure',)):
592
711
                raise failure_exc(path, str(e) + more_info)
 
712
            # Can be something like args = ('Directory not empty:
 
713
            # '/srv/bazaar.launchpad.net/blah...: '
 
714
            # [Errno 39] Directory not empty',)
 
715
            if (e.args[0].startswith('Directory not empty: ')
 
716
                or getattr(e, 'errno', None) == errno.ENOTEMPTY):
 
717
                raise errors.DirectoryNotEmpty(path, str(e))
593
718
            mutter('Raising exception with args %s', e.args)
594
719
        if getattr(e, 'errno', None) is not None:
595
720
            mutter('Raising exception with errno %s', e.errno)
622
747
 
623
748
    def _rename_and_overwrite(self, abs_from, abs_to):
624
749
        """Do a fancy rename on the remote server.
625
 
        
 
750
 
626
751
        Using the implementation provided by osutils.
627
752
        """
628
753
        try:
647
772
            self._get_sftp().remove(path)
648
773
        except (IOError, paramiko.SSHException), e:
649
774
            self._translate_io_exception(e, path, ': unable to delete')
650
 
            
 
775
 
651
776
    def external_url(self):
652
777
        """See bzrlib.transport.Transport.external_url."""
653
778
        # the external path for SFTP is the base
668
793
        path = self._remote_path(relpath)
669
794
        try:
670
795
            entries = self._get_sftp().listdir(path)
 
796
            self._report_activity(sum(map(len, entries)), 'read')
671
797
        except (IOError, paramiko.SSHException), e:
672
798
            self._translate_io_exception(e, path, ': failed to list_dir')
673
799
        return [urlutils.escape(entry) for entry in entries]
684
810
        """Return the stat information for a file."""
685
811
        path = self._remote_path(relpath)
686
812
        try:
687
 
            return self._get_sftp().stat(path)
 
813
            return self._get_sftp().lstat(path)
688
814
        except (IOError, paramiko.SSHException), e:
689
815
            self._translate_io_exception(e, path, ': unable to stat')
690
816
 
 
817
    def readlink(self, relpath):
 
818
        """See Transport.readlink."""
 
819
        path = self._remote_path(relpath)
 
820
        try:
 
821
            return self._get_sftp().readlink(path)
 
822
        except (IOError, paramiko.SSHException), e:
 
823
            self._translate_io_exception(e, path, ': unable to readlink')
 
824
 
 
825
    def symlink(self, source, link_name):
 
826
        """See Transport.symlink."""
 
827
        try:
 
828
            conn = self._get_sftp()
 
829
            sftp_retval = conn.symlink(source, link_name)
 
830
            if SFTP_OK != sftp_retval:
 
831
                raise TransportError(
 
832
                    '%r: unable to create symlink to %r' % (link_name, source),
 
833
                    sftp_retval
 
834
                )
 
835
        except (IOError, paramiko.SSHException), e:
 
836
            self._translate_io_exception(e, link_name,
 
837
                                         ': unable to create symlink to %r' % (source))
 
838
 
691
839
    def lock_read(self, relpath):
692
840
        """
693
841
        Lock the given file for shared (read) access.
730
878
        """
731
879
        # TODO: jam 20060816 Paramiko >= 1.6.2 (probably earlier) supports
732
880
        #       using the 'x' flag to indicate SFTP_FLAG_EXCL.
733
 
        #       However, there is no way to set the permission mode at open 
 
881
        #       However, there is no way to set the permission mode at open
734
882
        #       time using the sftp_client.file() functionality.
735
883
        path = self._get_sftp()._adjust_cwd(abspath)
736
884
        # mutter('sftp abspath %s => %s', abspath, path)
737
885
        attr = SFTPAttributes()
738
886
        if mode is not None:
739
887
            attr.st_mode = mode
740
 
        omode = (SFTP_FLAG_WRITE | SFTP_FLAG_CREATE 
 
888
        omode = (SFTP_FLAG_WRITE | SFTP_FLAG_CREATE
741
889
                | SFTP_FLAG_TRUNC | SFTP_FLAG_EXCL)
742
890
        try:
743
891
            t, msg = self._get_sftp()._request(CMD_OPEN, path, omode, attr)
756
904
        else:
757
905
            return True
758
906
 
759
 
# ------------- server test implementation --------------
760
 
import threading
761
 
 
762
 
from bzrlib.tests.stub_sftp import StubServer, StubSFTPServer
763
 
 
764
 
STUB_SERVER_KEY = """
765
 
-----BEGIN RSA PRIVATE KEY-----
766
 
MIICWgIBAAKBgQDTj1bqB4WmayWNPB+8jVSYpZYk80Ujvj680pOTh2bORBjbIAyz
767
 
oWGW+GUjzKxTiiPvVmxFgx5wdsFvF03v34lEVVhMpouqPAYQ15N37K/ir5XY+9m/
768
 
d8ufMCkjeXsQkKqFbAlQcnWMCRnOoPHS3I4vi6hmnDDeeYTSRvfLbW0fhwIBIwKB
769
 
gBIiOqZYaoqbeD9OS9z2K9KR2atlTxGxOJPXiP4ESqP3NVScWNwyZ3NXHpyrJLa0
770
 
EbVtzsQhLn6rF+TzXnOlcipFvjsem3iYzCpuChfGQ6SovTcOjHV9z+hnpXvQ/fon
771
 
soVRZY65wKnF7IAoUwTmJS9opqgrN6kRgCd3DASAMd1bAkEA96SBVWFt/fJBNJ9H
772
 
tYnBKZGw0VeHOYmVYbvMSstssn8un+pQpUm9vlG/bp7Oxd/m+b9KWEh2xPfv6zqU
773
 
avNwHwJBANqzGZa/EpzF4J8pGti7oIAPUIDGMtfIcmqNXVMckrmzQ2vTfqtkEZsA
774
 
4rE1IERRyiJQx6EJsz21wJmGV9WJQ5kCQQDwkS0uXqVdFzgHO6S++tjmjYcxwr3g
775
 
H0CoFYSgbddOT6miqRskOQF3DZVkJT3kyuBgU2zKygz52ukQZMqxCb1fAkASvuTv
776
 
qfpH87Qq5kQhNKdbbwbmd2NxlNabazPijWuphGTdW0VfJdWfklyS2Kr+iqrs/5wV
777
 
HhathJt636Eg7oIjAkA8ht3MQ+XSl9yIJIS8gVpbPxSw5OMfw0PjVE7tBdQruiSc
778
 
nvuQES5C9BMHjF39LZiGH1iLQy7FgdHyoP+eodI7
779
 
-----END RSA PRIVATE KEY-----
780
 
"""
781
 
 
782
 
 
783
 
class SocketListener(threading.Thread):
784
 
 
785
 
    def __init__(self, callback):
786
 
        threading.Thread.__init__(self)
787
 
        self._callback = callback
788
 
        self._socket = socket.socket()
789
 
        self._socket.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
790
 
        self._socket.bind(('localhost', 0))
791
 
        self._socket.listen(1)
792
 
        self.port = self._socket.getsockname()[1]
793
 
        self._stop_event = threading.Event()
794
 
 
795
 
    def stop(self):
796
 
        # called from outside this thread
797
 
        self._stop_event.set()
798
 
        # use a timeout here, because if the test fails, the server thread may
799
 
        # never notice the stop_event.
800
 
        self.join(5.0)
801
 
        self._socket.close()
802
 
 
803
 
    def run(self):
804
 
        while True:
805
 
            readable, writable_unused, exception_unused = \
806
 
                select.select([self._socket], [], [], 0.1)
807
 
            if self._stop_event.isSet():
808
 
                return
809
 
            if len(readable) == 0:
810
 
                continue
811
 
            try:
812
 
                s, addr_unused = self._socket.accept()
813
 
                # because the loopback socket is inline, and transports are
814
 
                # never explicitly closed, best to launch a new thread.
815
 
                threading.Thread(target=self._callback, args=(s,)).start()
816
 
            except socket.error, x:
817
 
                sys.excepthook(*sys.exc_info())
818
 
                warning('Socket error during accept() within unit test server'
819
 
                        ' thread: %r' % x)
820
 
            except Exception, x:
821
 
                # probably a failed test; unit test thread will log the
822
 
                # failure/error
823
 
                sys.excepthook(*sys.exc_info())
824
 
                warning('Exception from within unit test server thread: %r' % 
825
 
                        x)
826
 
 
827
 
 
828
 
class SocketDelay(object):
829
 
    """A socket decorator to make TCP appear slower.
830
 
 
831
 
    This changes recv, send, and sendall to add a fixed latency to each python
832
 
    call if a new roundtrip is detected. That is, when a recv is called and the
833
 
    flag new_roundtrip is set, latency is charged. Every send and send_all
834
 
    sets this flag.
835
 
 
836
 
    In addition every send, sendall and recv sleeps a bit per character send to
837
 
    simulate bandwidth.
838
 
 
839
 
    Not all methods are implemented, this is deliberate as this class is not a
840
 
    replacement for the builtin sockets layer. fileno is not implemented to
841
 
    prevent the proxy being bypassed. 
842
 
    """
843
 
 
844
 
    simulated_time = 0
845
 
    _proxied_arguments = dict.fromkeys([
846
 
        "close", "getpeername", "getsockname", "getsockopt", "gettimeout",
847
 
        "setblocking", "setsockopt", "settimeout", "shutdown"])
848
 
 
849
 
    def __init__(self, sock, latency, bandwidth=1.0, 
850
 
                 really_sleep=True):
851
 
        """ 
852
 
        :param bandwith: simulated bandwith (MegaBit)
853
 
        :param really_sleep: If set to false, the SocketDelay will just
854
 
        increase a counter, instead of calling time.sleep. This is useful for
855
 
        unittesting the SocketDelay.
856
 
        """
857
 
        self.sock = sock
858
 
        self.latency = latency
859
 
        self.really_sleep = really_sleep
860
 
        self.time_per_byte = 1 / (bandwidth / 8.0 * 1024 * 1024) 
861
 
        self.new_roundtrip = False
862
 
 
863
 
    def sleep(self, s):
864
 
        if self.really_sleep:
865
 
            time.sleep(s)
866
 
        else:
867
 
            SocketDelay.simulated_time += s
868
 
 
869
 
    def __getattr__(self, attr):
870
 
        if attr in SocketDelay._proxied_arguments:
871
 
            return getattr(self.sock, attr)
872
 
        raise AttributeError("'SocketDelay' object has no attribute %r" %
873
 
                             attr)
874
 
 
875
 
    def dup(self):
876
 
        return SocketDelay(self.sock.dup(), self.latency, self.time_per_byte,
877
 
                           self._sleep)
878
 
 
879
 
    def recv(self, *args):
880
 
        data = self.sock.recv(*args)
881
 
        if data and self.new_roundtrip:
882
 
            self.new_roundtrip = False
883
 
            self.sleep(self.latency)
884
 
        self.sleep(len(data) * self.time_per_byte)
885
 
        return data
886
 
 
887
 
    def sendall(self, data, flags=0):
888
 
        if not self.new_roundtrip:
889
 
            self.new_roundtrip = True
890
 
            self.sleep(self.latency)
891
 
        self.sleep(len(data) * self.time_per_byte)
892
 
        return self.sock.sendall(data, flags)
893
 
 
894
 
    def send(self, data, flags=0):
895
 
        if not self.new_roundtrip:
896
 
            self.new_roundtrip = True
897
 
            self.sleep(self.latency)
898
 
        bytes_sent = self.sock.send(data, flags)
899
 
        self.sleep(bytes_sent * self.time_per_byte)
900
 
        return bytes_sent
901
 
 
902
 
 
903
 
class SFTPServer(Server):
904
 
    """Common code for SFTP server facilities."""
905
 
 
906
 
    def __init__(self, server_interface=StubServer):
907
 
        self._original_vendor = None
908
 
        self._homedir = None
909
 
        self._server_homedir = None
910
 
        self._listener = None
911
 
        self._root = None
912
 
        self._vendor = ssh.ParamikoVendor()
913
 
        self._server_interface = server_interface
914
 
        # sftp server logs
915
 
        self.logs = []
916
 
        self.add_latency = 0
917
 
 
918
 
    def _get_sftp_url(self, path):
919
 
        """Calculate an sftp url to this server for path."""
920
 
        return 'sftp://foo:bar@localhost:%d/%s' % (self._listener.port, path)
921
 
 
922
 
    def log(self, message):
923
 
        """StubServer uses this to log when a new server is created."""
924
 
        self.logs.append(message)
925
 
 
926
 
    def _run_server_entry(self, sock):
927
 
        """Entry point for all implementations of _run_server.
928
 
        
929
 
        If self.add_latency is > 0.000001 then sock is given a latency adding
930
 
        decorator.
931
 
        """
932
 
        if self.add_latency > 0.000001:
933
 
            sock = SocketDelay(sock, self.add_latency)
934
 
        return self._run_server(sock)
935
 
 
936
 
    def _run_server(self, s):
937
 
        ssh_server = paramiko.Transport(s)
938
 
        key_file = pathjoin(self._homedir, 'test_rsa.key')
939
 
        f = open(key_file, 'w')
940
 
        f.write(STUB_SERVER_KEY)
941
 
        f.close()
942
 
        host_key = paramiko.RSAKey.from_private_key_file(key_file)
943
 
        ssh_server.add_server_key(host_key)
944
 
        server = self._server_interface(self)
945
 
        ssh_server.set_subsystem_handler('sftp', paramiko.SFTPServer,
946
 
                                         StubSFTPServer, root=self._root,
947
 
                                         home=self._server_homedir)
948
 
        event = threading.Event()
949
 
        ssh_server.start_server(event, server)
950
 
        event.wait(5.0)
951
 
    
952
 
    def setUp(self, backing_server=None):
953
 
        # XXX: TODO: make sftpserver back onto backing_server rather than local
954
 
        # disk.
955
 
        if not (backing_server is None or
956
 
                isinstance(backing_server, local.LocalURLServer)):
957
 
            raise AssertionError(
958
 
                "backing_server should not be %r, because this can only serve the "
959
 
                "local current working directory." % (backing_server,))
960
 
        self._original_vendor = ssh._ssh_vendor_manager._cached_ssh_vendor
961
 
        ssh._ssh_vendor_manager._cached_ssh_vendor = self._vendor
962
 
        if sys.platform == 'win32':
963
 
            # Win32 needs to use the UNICODE api
964
 
            self._homedir = getcwd()
965
 
        else:
966
 
            # But Linux SFTP servers should just deal in bytestreams
967
 
            self._homedir = os.getcwd()
968
 
        if self._server_homedir is None:
969
 
            self._server_homedir = self._homedir
970
 
        self._root = '/'
971
 
        if sys.platform == 'win32':
972
 
            self._root = ''
973
 
        self._listener = SocketListener(self._run_server_entry)
974
 
        self._listener.setDaemon(True)
975
 
        self._listener.start()
976
 
 
977
 
    def tearDown(self):
978
 
        """See bzrlib.transport.Server.tearDown."""
979
 
        self._listener.stop()
980
 
        ssh._ssh_vendor_manager._cached_ssh_vendor = self._original_vendor
981
 
 
982
 
    def get_bogus_url(self):
983
 
        """See bzrlib.transport.Server.get_bogus_url."""
984
 
        # this is chosen to try to prevent trouble with proxies, wierd dns, etc
985
 
        # we bind a random socket, so that we get a guaranteed unused port
986
 
        # we just never listen on that port
987
 
        s = socket.socket()
988
 
        s.bind(('localhost', 0))
989
 
        return 'sftp://%s:%s/' % s.getsockname()
990
 
 
991
 
 
992
 
class SFTPFullAbsoluteServer(SFTPServer):
993
 
    """A test server for sftp transports, using absolute urls and ssh."""
994
 
 
995
 
    def get_url(self):
996
 
        """See bzrlib.transport.Server.get_url."""
997
 
        homedir = self._homedir
998
 
        if sys.platform != 'win32':
999
 
            # Remove the initial '/' on all platforms but win32
1000
 
            homedir = homedir[1:]
1001
 
        return self._get_sftp_url(urlutils.escape(homedir))
1002
 
 
1003
 
 
1004
 
class SFTPServerWithoutSSH(SFTPServer):
1005
 
    """An SFTP server that uses a simple TCP socket pair rather than SSH."""
1006
 
 
1007
 
    def __init__(self):
1008
 
        super(SFTPServerWithoutSSH, self).__init__()
1009
 
        self._vendor = ssh.LoopbackVendor()
1010
 
 
1011
 
    def _run_server(self, sock):
1012
 
        # Re-import these as locals, so that they're still accessible during
1013
 
        # interpreter shutdown (when all module globals get set to None, leading
1014
 
        # to confusing errors like "'NoneType' object has no attribute 'error'".
1015
 
        class FakeChannel(object):
1016
 
            def get_transport(self):
1017
 
                return self
1018
 
            def get_log_channel(self):
1019
 
                return 'paramiko'
1020
 
            def get_name(self):
1021
 
                return '1'
1022
 
            def get_hexdump(self):
1023
 
                return False
1024
 
            def close(self):
1025
 
                pass
1026
 
 
1027
 
        server = paramiko.SFTPServer(
1028
 
            FakeChannel(), 'sftp', StubServer(self), StubSFTPServer,
1029
 
            root=self._root, home=self._server_homedir)
1030
 
        try:
1031
 
            server.start_subsystem(
1032
 
                'sftp', None, ssh.SocketAsChannelAdapter(sock))
1033
 
        except socket.error, e:
1034
 
            if (len(e.args) > 0) and (e.args[0] == errno.EPIPE):
1035
 
                # it's okay for the client to disconnect abruptly
1036
 
                # (bug in paramiko 1.6: it should absorb this exception)
1037
 
                pass
1038
 
            else:
1039
 
                raise
1040
 
        except Exception, e:
1041
 
            # This typically seems to happen during interpreter shutdown, so
1042
 
            # most of the useful ways to report this error are won't work.
1043
 
            # Writing the exception type, and then the text of the exception,
1044
 
            # seems to be the best we can do.
1045
 
            import sys
1046
 
            sys.stderr.write('\nEXCEPTION %r: ' % (e.__class__,))
1047
 
            sys.stderr.write('%s\n\n' % (e,))
1048
 
        server.finish_subsystem()
1049
 
 
1050
 
 
1051
 
class SFTPAbsoluteServer(SFTPServerWithoutSSH):
1052
 
    """A test server for sftp transports, using absolute urls."""
1053
 
 
1054
 
    def get_url(self):
1055
 
        """See bzrlib.transport.Server.get_url."""
1056
 
        homedir = self._homedir
1057
 
        if sys.platform != 'win32':
1058
 
            # Remove the initial '/' on all platforms but win32
1059
 
            homedir = homedir[1:]
1060
 
        return self._get_sftp_url(urlutils.escape(homedir))
1061
 
 
1062
 
 
1063
 
class SFTPHomeDirServer(SFTPServerWithoutSSH):
1064
 
    """A test server for sftp transports, using homedir relative urls."""
1065
 
 
1066
 
    def get_url(self):
1067
 
        """See bzrlib.transport.Server.get_url."""
1068
 
        return self._get_sftp_url("~/")
1069
 
 
1070
 
 
1071
 
class SFTPSiblingAbsoluteServer(SFTPAbsoluteServer):
1072
 
    """A test server for sftp transports where only absolute paths will work.
1073
 
 
1074
 
    It does this by serving from a deeply-nested directory that doesn't exist.
1075
 
    """
1076
 
 
1077
 
    def setUp(self, backing_server=None):
1078
 
        self._server_homedir = '/dev/noone/runs/tests/here'
1079
 
        super(SFTPSiblingAbsoluteServer, self).setUp(backing_server)
1080
 
 
1081
907
 
1082
908
def get_test_permutations():
1083
909
    """Return the permutations to be used in testing."""
1084
 
    return [(SFTPTransport, SFTPAbsoluteServer),
1085
 
            (SFTPTransport, SFTPHomeDirServer),
1086
 
            (SFTPTransport, SFTPSiblingAbsoluteServer),
 
910
    from bzrlib.tests import stub_sftp
 
911
    return [(SFTPTransport, stub_sftp.SFTPAbsoluteServer),
 
912
            (SFTPTransport, stub_sftp.SFTPHomeDirServer),
 
913
            (SFTPTransport, stub_sftp.SFTPSiblingAbsoluteServer),
1087
914
            ]