~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/transport/sftp.py

Updated NEWS re Tree Transform

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2005 Robey Pointer <robey@lag.net>
2
 
# Copyright (C) 2005, 2006 Canonical Ltd
3
 
#
 
1
# Copyright (C) 2005 Robey Pointer <robey@lag.net>, Canonical Ltd
 
2
 
4
3
# This program is free software; you can redistribute it and/or modify
5
4
# it under the terms of the GNU General Public License as published by
6
5
# the Free Software Foundation; either version 2 of the License, or
7
6
# (at your option) any later version.
8
 
#
 
7
 
9
8
# This program is distributed in the hope that it will be useful,
10
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
11
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12
11
# GNU General Public License for more details.
13
 
#
 
12
 
14
13
# You should have received a copy of the GNU General Public License
15
14
# along with this program; if not, write to the Free Software
16
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
17
16
 
18
17
"""Implementation of Transport over SFTP, using paramiko."""
19
18
 
20
 
# TODO: Remove the transport-based lock_read and lock_write methods.  They'll
21
 
# then raise TransportNotPossible, which will break remote access to any
22
 
# formats which rely on OS-level locks.  That should be fine as those formats
23
 
# are pretty old, but these combinations may have to be removed from the test
24
 
# suite.  Those formats all date back to 0.7; so we should be able to remove
25
 
# these methods when we officially drop support for those formats.
26
 
 
27
19
import errno
 
20
import getpass
28
21
import os
29
22
import random
30
 
import select
31
 
import socket
 
23
import re
32
24
import stat
 
25
import subprocess
33
26
import sys
34
27
import time
35
28
import urllib
36
29
import urlparse
37
30
import weakref
38
31
 
39
 
from bzrlib import (
40
 
    errors,
41
 
    urlutils,
42
 
    )
43
 
from bzrlib.errors import (FileExists,
44
 
                           NoSuchFile, PathNotChild,
 
32
from bzrlib.config import config_dir, ensure_config_dir_exists
 
33
from bzrlib.errors import (ConnectionError,
 
34
                           FileExists, 
 
35
                           TransportNotPossible, NoSuchFile, PathNotChild,
45
36
                           TransportError,
46
 
                           LockError,
47
 
                           PathError,
48
 
                           ParamikoNotPresent,
 
37
                           LockError, ParamikoNotPresent
49
38
                           )
50
 
from bzrlib.osutils import pathjoin, fancy_rename, getcwd
51
 
from bzrlib.trace import mutter, warning
52
 
from bzrlib.transport import (
53
 
    register_urlparse_netloc_protocol,
54
 
    Server,
55
 
    split_url,
56
 
    ssh,
57
 
    Transport,
58
 
    )
 
39
from bzrlib.osutils import pathjoin, fancy_rename
 
40
from bzrlib.trace import mutter, warning, error
 
41
from bzrlib.transport import Transport, Server, urlescape
 
42
import bzrlib.ui
59
43
 
60
44
try:
61
45
    import paramiko
67
51
                               CMD_HANDLE, CMD_OPEN)
68
52
    from paramiko.sftp_attr import SFTPAttributes
69
53
    from paramiko.sftp_file import SFTPFile
70
 
 
71
 
 
72
 
register_urlparse_netloc_protocol('sftp')
73
 
 
 
54
    from paramiko.sftp_client import SFTPClient
 
55
 
 
56
if 'sftp' not in urlparse.uses_netloc:
 
57
    urlparse.uses_netloc.append('sftp')
 
58
 
 
59
# don't use prefetch unless paramiko version >= 1.5.2 (there were bugs earlier)
 
60
_default_do_prefetch = False
 
61
if getattr(paramiko, '__version_info__', (0, 0, 0)) >= (1, 5, 2):
 
62
    _default_do_prefetch = True
 
63
 
 
64
 
 
65
_close_fds = True
 
66
if sys.platform == 'win32':
 
67
    # close_fds not supported on win32
 
68
    _close_fds = False
 
69
 
 
70
_ssh_vendor = None
 
71
 
 
72
def _get_ssh_vendor():
 
73
    """Find out what version of SSH is on the system."""
 
74
    global _ssh_vendor
 
75
    if _ssh_vendor is not None:
 
76
        return _ssh_vendor
 
77
 
 
78
    _ssh_vendor = 'none'
 
79
 
 
80
    if 'BZR_SSH' in os.environ:
 
81
        _ssh_vendor = os.environ['BZR_SSH']
 
82
        if _ssh_vendor == 'paramiko':
 
83
            _ssh_vendor = 'none'
 
84
        return _ssh_vendor
 
85
 
 
86
    try:
 
87
        p = subprocess.Popen(['ssh', '-V'],
 
88
                             close_fds=_close_fds,
 
89
                             stdin=subprocess.PIPE,
 
90
                             stdout=subprocess.PIPE,
 
91
                             stderr=subprocess.PIPE)
 
92
        returncode = p.returncode
 
93
        stdout, stderr = p.communicate()
 
94
    except OSError:
 
95
        returncode = -1
 
96
        stdout = stderr = ''
 
97
    if 'OpenSSH' in stderr:
 
98
        mutter('ssh implementation is OpenSSH')
 
99
        _ssh_vendor = 'openssh'
 
100
    elif 'SSH Secure Shell' in stderr:
 
101
        mutter('ssh implementation is SSH Corp.')
 
102
        _ssh_vendor = 'ssh'
 
103
 
 
104
    if _ssh_vendor != 'none':
 
105
        return _ssh_vendor
 
106
 
 
107
    # XXX: 20051123 jamesh
 
108
    # A check for putty's plink or lsh would go here.
 
109
 
 
110
    mutter('falling back to paramiko implementation')
 
111
    return _ssh_vendor
 
112
 
 
113
 
 
114
class SFTPSubprocess:
 
115
    """A socket-like object that talks to an ssh subprocess via pipes."""
 
116
    def __init__(self, hostname, vendor, port=None, user=None):
 
117
        assert vendor in ['openssh', 'ssh']
 
118
        if vendor == 'openssh':
 
119
            args = ['ssh',
 
120
                    '-oForwardX11=no', '-oForwardAgent=no',
 
121
                    '-oClearAllForwardings=yes', '-oProtocol=2',
 
122
                    '-oNoHostAuthenticationForLocalhost=yes']
 
123
            if port is not None:
 
124
                args.extend(['-p', str(port)])
 
125
            if user is not None:
 
126
                args.extend(['-l', user])
 
127
            args.extend(['-s', hostname, 'sftp'])
 
128
        elif vendor == 'ssh':
 
129
            args = ['ssh', '-x']
 
130
            if port is not None:
 
131
                args.extend(['-p', str(port)])
 
132
            if user is not None:
 
133
                args.extend(['-l', user])
 
134
            args.extend(['-s', 'sftp', hostname])
 
135
 
 
136
        self.proc = subprocess.Popen(args, close_fds=_close_fds,
 
137
                                     stdin=subprocess.PIPE,
 
138
                                     stdout=subprocess.PIPE)
 
139
 
 
140
    def send(self, data):
 
141
        return os.write(self.proc.stdin.fileno(), data)
 
142
 
 
143
    def recv_ready(self):
 
144
        # TODO: jam 20051215 this function is necessary to support the
 
145
        # pipelined() function. In reality, it probably should use
 
146
        # poll() or select() to actually return if there is data
 
147
        # available, otherwise we probably don't get any benefit
 
148
        return True
 
149
 
 
150
    def recv(self, count):
 
151
        return os.read(self.proc.stdout.fileno(), count)
 
152
 
 
153
    def close(self):
 
154
        self.proc.stdin.close()
 
155
        self.proc.stdout.close()
 
156
        self.proc.wait()
 
157
 
 
158
 
 
159
class LoopbackSFTP(object):
 
160
    """Simple wrapper for a socket that pretends to be a paramiko Channel."""
 
161
 
 
162
    def __init__(self, sock):
 
163
        self.__socket = sock
 
164
 
 
165
    def send(self, data):
 
166
        return self.__socket.send(data)
 
167
 
 
168
    def recv(self, n):
 
169
        return self.__socket.recv(n)
 
170
 
 
171
    def recv_ready(self):
 
172
        return True
 
173
 
 
174
    def close(self):
 
175
        self.__socket.close()
 
176
 
 
177
 
 
178
SYSTEM_HOSTKEYS = {}
 
179
BZR_HOSTKEYS = {}
74
180
 
75
181
# This is a weakref dictionary, so that we can reuse connections
76
182
# that are still active. Long term, it might be nice to have some
79
185
_connected_hosts = weakref.WeakValueDictionary()
80
186
 
81
187
 
82
 
_paramiko_version = getattr(paramiko, '__version_info__', (0, 0, 0))
83
 
# don't use prefetch unless paramiko version >= 1.5.5 (there were bugs earlier)
84
 
_default_do_prefetch = (_paramiko_version >= (1, 5, 5))
85
 
 
86
 
 
87
 
def clear_connection_cache():
88
 
    """Remove all hosts from the SFTP connection cache.
89
 
 
90
 
    Primarily useful for test cases wanting to force garbage collection.
91
 
    """
92
 
    _connected_hosts.clear()
 
188
def load_host_keys():
 
189
    """
 
190
    Load system host keys (probably doesn't work on windows) and any
 
191
    "discovered" keys from previous sessions.
 
192
    """
 
193
    global SYSTEM_HOSTKEYS, BZR_HOSTKEYS
 
194
    try:
 
195
        SYSTEM_HOSTKEYS = paramiko.util.load_host_keys(os.path.expanduser('~/.ssh/known_hosts'))
 
196
    except Exception, e:
 
197
        mutter('failed to load system host keys: ' + str(e))
 
198
    bzr_hostkey_path = pathjoin(config_dir(), 'ssh_host_keys')
 
199
    try:
 
200
        BZR_HOSTKEYS = paramiko.util.load_host_keys(bzr_hostkey_path)
 
201
    except Exception, e:
 
202
        mutter('failed to load bzr host keys: ' + str(e))
 
203
        save_host_keys()
 
204
 
 
205
 
 
206
def save_host_keys():
 
207
    """
 
208
    Save "discovered" host keys in $(config)/ssh_host_keys/.
 
209
    """
 
210
    global SYSTEM_HOSTKEYS, BZR_HOSTKEYS
 
211
    bzr_hostkey_path = pathjoin(config_dir(), 'ssh_host_keys')
 
212
    ensure_config_dir_exists()
 
213
 
 
214
    try:
 
215
        f = open(bzr_hostkey_path, 'w')
 
216
        f.write('# SSH host keys collected by bzr\n')
 
217
        for hostname, keys in BZR_HOSTKEYS.iteritems():
 
218
            for keytype, key in keys.iteritems():
 
219
                f.write('%s %s %s\n' % (hostname, keytype, key.get_base64()))
 
220
        f.close()
 
221
    except IOError, e:
 
222
        mutter('failed to save bzr host keys: ' + str(e))
93
223
 
94
224
 
95
225
class SFTPLock(object):
96
 
    """This fakes a lock in a remote location.
97
 
    
98
 
    A present lock is indicated just by the existence of a file.  This
99
 
    doesn't work well on all transports and they are only used in 
100
 
    deprecated storage formats.
101
 
    """
102
 
    
 
226
    """This fakes a lock in a remote location."""
103
227
    __slots__ = ['path', 'lock_path', 'lock_file', 'transport']
104
 
 
105
228
    def __init__(self, path, transport):
106
229
        assert isinstance(transport, SFTPTransport)
107
230
 
133
256
            # What specific errors should we catch here?
134
257
            pass
135
258
 
136
 
 
137
 
class SFTPUrlHandling(Transport):
138
 
    """Mix-in that does common handling of SSH/SFTP URLs."""
139
 
 
140
 
    def __init__(self, base):
 
259
class SFTPTransport (Transport):
 
260
    """
 
261
    Transport implementation for SFTP access.
 
262
    """
 
263
    _do_prefetch = _default_do_prefetch
 
264
 
 
265
    def __init__(self, base, clone_from=None):
 
266
        assert base.startswith('sftp://')
141
267
        self._parse_url(base)
142
 
        base = self._unparse_url(self._path)
 
268
        base = self._unparse_url()
143
269
        if base[-1] != '/':
144
 
            base += '/'
145
 
        super(SFTPUrlHandling, self).__init__(base)
146
 
 
147
 
    def _parse_url(self, url):
148
 
        (self._scheme,
149
 
         self._username, self._password,
150
 
         self._host, self._port, self._path) = self._split_url(url)
151
 
 
152
 
    def _unparse_url(self, path):
153
 
        """Return a URL for a path relative to this transport.
154
 
        """
155
 
        path = urllib.quote(path)
156
 
        # handle homedir paths
157
 
        if not path.startswith('/'):
158
 
            path = "/~/" + path
159
 
        netloc = urllib.quote(self._host)
160
 
        if self._username is not None:
161
 
            netloc = '%s@%s' % (urllib.quote(self._username), netloc)
162
 
        if self._port is not None:
163
 
            netloc = '%s:%d' % (netloc, self._port)
164
 
        return urlparse.urlunparse((self._scheme, netloc, path, '', '', ''))
165
 
 
166
 
    def _split_url(self, url):
167
 
        (scheme, username, password, host, port, path) = split_url(url)
168
 
        ## assert scheme == 'sftp'
169
 
 
170
 
        # the initial slash should be removed from the path, and treated
171
 
        # as a homedir relative path (the path begins with a double slash
172
 
        # if it is absolute).
173
 
        # see draft-ietf-secsh-scp-sftp-ssh-uri-03.txt
174
 
        # RBC 20060118 we are not using this as its too user hostile. instead
175
 
        # we are following lftp and using /~/foo to mean '~/foo'.
176
 
        # handle homedir paths
177
 
        if path.startswith('/~/'):
178
 
            path = path[3:]
179
 
        elif path == '/~':
180
 
            path = ''
181
 
        return (scheme, username, password, host, port, path)
182
 
 
183
 
    def abspath(self, relpath):
184
 
        """Return the full url to the given relative path.
185
 
        
186
 
        @param relpath: the relative path or path components
187
 
        @type relpath: str or list
188
 
        """
189
 
        return self._unparse_url(self._remote_path(relpath))
190
 
    
191
 
    def _remote_path(self, relpath):
192
 
        """Return the path to be passed along the sftp protocol for relpath.
193
 
        
194
 
        :param relpath: is a urlencoded string.
195
 
        """
196
 
        return self._combine_paths(self._path, relpath)
197
 
 
198
 
 
199
 
class SFTPTransport(SFTPUrlHandling):
200
 
    """Transport implementation for SFTP access."""
201
 
 
202
 
    _do_prefetch = _default_do_prefetch
203
 
    # TODO: jam 20060717 Conceivably these could be configurable, either
204
 
    #       by auto-tuning at run-time, or by a configuration (per host??)
205
 
    #       but the performance curve is pretty flat, so just going with
206
 
    #       reasonable defaults.
207
 
    _max_readv_combine = 200
208
 
    # Having to round trip to the server means waiting for a response,
209
 
    # so it is better to download extra bytes.
210
 
    # 8KiB had good performance for both local and remote network operations
211
 
    _bytes_to_read_before_seek = 8192
212
 
 
213
 
    # The sftp spec says that implementations SHOULD allow reads
214
 
    # to be at least 32K. paramiko.readv() does an async request
215
 
    # for the chunks. So we need to keep it within a single request
216
 
    # size for paramiko <= 1.6.1. paramiko 1.6.2 will probably chop
217
 
    # up the request itself, rather than us having to worry about it
218
 
    _max_request_size = 32768
219
 
 
220
 
    def __init__(self, base, clone_from=None):
 
270
            base = base + '/'
221
271
        super(SFTPTransport, self).__init__(base)
222
272
        if clone_from is None:
223
273
            self._sftp_connect()
243
293
        else:
244
294
            return SFTPTransport(self.abspath(offset), self)
245
295
 
 
296
    def abspath(self, relpath):
 
297
        """
 
298
        Return the full url to the given relative path.
 
299
        
 
300
        @param relpath: the relative path or path components
 
301
        @type relpath: str or list
 
302
        """
 
303
        return self._unparse_url(self._remote_path(relpath))
 
304
    
246
305
    def _remote_path(self, relpath):
247
306
        """Return the path to be passed along the sftp protocol for relpath.
248
307
        
249
308
        relpath is a urlencoded string.
250
 
 
251
 
        :return: a path prefixed with / for regular abspath-based urls, or a
252
 
            path that does not begin with / for urls which begin with /~/.
253
309
        """
254
 
        # how does this work? 
255
 
        # it processes relpath with respect to 
256
 
        # our state:
257
 
        # firstly we create a path to evaluate: 
258
 
        # if relpath is an abspath or homedir path, its the entire thing
259
 
        # otherwise we join our base with relpath
260
 
        # then we eliminate all empty segments (double //'s) outside the first
261
 
        # two elements of the list. This avoids problems with trailing 
262
 
        # slashes, or other abnormalities.
263
 
        # finally we evaluate the entire path in a single pass
264
 
        # '.'s are stripped,
265
 
        # '..' result in popping the left most already 
266
 
        # processed path (which can never be empty because of the check for
267
 
        # abspath and homedir meaning that its not, or that we've used our
268
 
        # path. If the pop would pop the root, we ignore it.
269
 
 
270
 
        # Specific case examinations:
271
 
        # remove the special casefor ~: if the current root is ~/ popping of it
272
 
        # = / thus our seed for a ~ based path is ['', '~']
273
 
        # and if we end up with [''] then we had basically ('', '..') (which is
274
 
        # '/..' so we append '' if the length is one, and assert that the first
275
 
        # element is still ''. Lastly, if we end with ['', '~'] as a prefix for
276
 
        # the output, we've got a homedir path, so we strip that prefix before
277
 
        # '/' joining the resulting list.
278
 
        #
279
 
        # case one: '/' -> ['', ''] cannot shrink
280
 
        # case two: '/' + '../foo' -> ['', 'foo'] (take '', '', '..', 'foo')
281
 
        #           and pop the second '' for the '..', append 'foo'
282
 
        # case three: '/~/' -> ['', '~', ''] 
283
 
        # case four: '/~/' + '../foo' -> ['', '~', '', '..', 'foo'],
284
 
        #           and we want to get '/foo' - the empty path in the middle
285
 
        #           needs to be stripped, then normal path manipulation will 
286
 
        #           work.
287
 
        # case five: '/..' ['', '..'], we want ['', '']
288
 
        #            stripping '' outside the first two is ok
289
 
        #            ignore .. if its too high up
290
 
        #
291
 
        # lastly this code is possibly reusable by FTP, but not reusable by
292
 
        # local paths: ~ is resolvable correctly, nor by HTTP or the smart
293
 
        # server: ~ is resolved remotely.
294
 
        # 
295
 
        # however, a version of this that acts on self.base is possible to be
296
 
        # written which manipulates the URL in canonical form, and would be
297
 
        # reusable for all transports, if a flag for allowing ~/ at all was
298
 
        # provided.
 
310
        # FIXME: share the common code across transports
299
311
        assert isinstance(relpath, basestring)
300
 
        relpath = urlutils.unescape(relpath)
301
 
 
302
 
        # case 1)
303
 
        if relpath.startswith('/'):
304
 
            # abspath - normal split is fine.
305
 
            current_path = relpath.split('/')
306
 
        elif relpath.startswith('~/'):
307
 
            # root is homedir based: normal split and prefix '' to remote the
308
 
            # special case
309
 
            current_path = [''].extend(relpath.split('/'))
310
 
        else:
311
 
            # root is from the current directory:
312
 
            if self._path.startswith('/'):
313
 
                # abspath, take the regular split
314
 
                current_path = []
315
 
            else:
316
 
                # homedir based, add the '', '~' not present in self._path
317
 
                current_path = ['', '~']
318
 
            # add our current dir
319
 
            current_path.extend(self._path.split('/'))
320
 
            # add the users relpath
321
 
            current_path.extend(relpath.split('/'))
322
 
        # strip '' segments that are not in the first one - the leading /.
323
 
        to_process = current_path[:1]
324
 
        for segment in current_path[1:]:
325
 
            if segment != '':
326
 
                to_process.append(segment)
327
 
 
328
 
        # process '.' and '..' segments into output_path.
329
 
        output_path = []
330
 
        for segment in to_process:
331
 
            if segment == '..':
332
 
                # directory pop. Remove a directory 
333
 
                # as long as we are not at the root
334
 
                if len(output_path) > 1:
335
 
                    output_path.pop()
336
 
                # else: pass
337
 
                # cannot pop beyond the root, so do nothing
338
 
            elif segment == '.':
339
 
                continue # strip the '.' from the output.
340
 
            else:
341
 
                # this will append '' to output_path for the root elements,
342
 
                # which is appropriate: its why we strip '' in the first pass.
343
 
                output_path.append(segment)
344
 
 
345
 
        # check output special cases:
346
 
        if output_path == ['']:
347
 
            # [''] -> ['', '']
348
 
            output_path = ['', '']
349
 
        elif output_path[:2] == ['', '~']:
350
 
            # ['', '~', ...] -> ...
351
 
            output_path = output_path[2:]
352
 
        path = '/'.join(output_path)
 
312
        relpath = urllib.unquote(relpath).split('/')
 
313
        basepath = self._path.split('/')
 
314
        if len(basepath) > 0 and basepath[-1] == '':
 
315
            basepath = basepath[:-1]
 
316
 
 
317
        for p in relpath:
 
318
            if p == '..':
 
319
                if len(basepath) == 0:
 
320
                    # In most filesystems, a request for the parent
 
321
                    # of root, just returns root.
 
322
                    continue
 
323
                basepath.pop()
 
324
            elif p == '.':
 
325
                continue # No-op
 
326
            else:
 
327
                basepath.append(p)
 
328
 
 
329
        path = '/'.join(basepath)
353
330
        return path
354
331
 
355
332
    def relpath(self, abspath):
356
 
        scheme, username, password, host, port, path = self._split_url(abspath)
 
333
        username, password, host, port, path = self._split_url(abspath)
357
334
        error = []
358
335
        if (username != self._username):
359
336
            error.append('username mismatch')
379
356
        except IOError:
380
357
            return False
381
358
 
382
 
    def get(self, relpath):
 
359
    def get(self, relpath, decode=False):
383
360
        """
384
361
        Get the file at the given relative path.
385
362
 
394
371
        except (IOError, paramiko.SSHException), e:
395
372
            self._translate_io_exception(e, path, ': error retrieving')
396
373
 
397
 
    def readv(self, relpath, offsets):
398
 
        """See Transport.readv()"""
399
 
        # We overload the default readv() because we want to use a file
400
 
        # that does not have prefetch enabled.
401
 
        # Also, if we have a new paramiko, it implements an async readv()
402
 
        if not offsets:
403
 
            return
404
 
 
405
 
        try:
406
 
            path = self._remote_path(relpath)
407
 
            fp = self._sftp.file(path, mode='rb')
408
 
            readv = getattr(fp, 'readv', None)
409
 
            if readv:
410
 
                return self._sftp_readv(fp, offsets, relpath)
411
 
            mutter('seek and read %s offsets', len(offsets))
412
 
            return self._seek_and_read(fp, offsets, relpath)
413
 
        except (IOError, paramiko.SSHException), e:
414
 
            self._translate_io_exception(e, path, ': error retrieving')
415
 
 
416
 
    def _sftp_readv(self, fp, offsets, relpath='<unknown>'):
417
 
        """Use the readv() member of fp to do async readv.
418
 
 
419
 
        And then read them using paramiko.readv(). paramiko.readv()
420
 
        does not support ranges > 64K, so it caps the request size, and
421
 
        just reads until it gets all the stuff it wants
422
 
        """
423
 
        offsets = list(offsets)
424
 
        sorted_offsets = sorted(offsets)
425
 
 
426
 
        # The algorithm works as follows:
427
 
        # 1) Coalesce nearby reads into a single chunk
428
 
        #    This generates a list of combined regions, the total size
429
 
        #    and the size of the sub regions. This coalescing step is limited
430
 
        #    in the number of nearby chunks to combine, and is allowed to
431
 
        #    skip small breaks in the requests. Limiting it makes sure that
432
 
        #    we can start yielding some data earlier, and skipping means we
433
 
        #    make fewer requests. (Beneficial even when using async)
434
 
        # 2) Break up this combined regions into chunks that are smaller
435
 
        #    than 64KiB. Technically the limit is 65536, but we are a
436
 
        #    little bit conservative. This is because sftp has a maximum
437
 
        #    return chunk size of 64KiB (max size of an unsigned short)
438
 
        # 3) Issue a readv() to paramiko to create an async request for
439
 
        #    all of this data
440
 
        # 4) Read in the data as it comes back, until we've read one
441
 
        #    continuous section as determined in step 1
442
 
        # 5) Break up the full sections into hunks for the original requested
443
 
        #    offsets. And put them in a cache
444
 
        # 6) Check if the next request is in the cache, and if it is, remove
445
 
        #    it from the cache, and yield its data. Continue until no more
446
 
        #    entries are in the cache.
447
 
        # 7) loop back to step 4 until all data has been read
448
 
        #
449
 
        # TODO: jam 20060725 This could be optimized one step further, by
450
 
        #       attempting to yield whatever data we have read, even before
451
 
        #       the first coallesced section has been fully processed.
452
 
 
453
 
        # When coalescing for use with readv(), we don't really need to
454
 
        # use any fudge factor, because the requests are made asynchronously
455
 
        coalesced = list(self._coalesce_offsets(sorted_offsets,
456
 
                               limit=self._max_readv_combine,
457
 
                               fudge_factor=0,
458
 
                               ))
459
 
        requests = []
460
 
        for c_offset in coalesced:
461
 
            start = c_offset.start
462
 
            size = c_offset.length
463
 
 
464
 
            # We need to break this up into multiple requests
465
 
            while size > 0:
466
 
                next_size = min(size, self._max_request_size)
467
 
                requests.append((start, next_size))
468
 
                size -= next_size
469
 
                start += next_size
470
 
 
471
 
        mutter('SFTP.readv() %s offsets => %s coalesced => %s requests',
472
 
                len(offsets), len(coalesced), len(requests))
473
 
 
474
 
        # Queue the current read until we have read the full coalesced section
475
 
        cur_data = []
476
 
        cur_data_len = 0
477
 
        cur_coalesced_stack = iter(coalesced)
478
 
        cur_coalesced = cur_coalesced_stack.next()
479
 
 
480
 
        # Cache the results, but only until they have been fulfilled
481
 
        data_map = {}
482
 
        # turn the list of offsets into a stack
483
 
        offset_stack = iter(offsets)
484
 
        cur_offset_and_size = offset_stack.next()
485
 
 
486
 
        for data in fp.readv(requests):
487
 
            cur_data += data
488
 
            cur_data_len += len(data)
489
 
 
490
 
            if cur_data_len < cur_coalesced.length:
491
 
                continue
492
 
            assert cur_data_len == cur_coalesced.length, \
493
 
                "Somehow we read too much: %s != %s" % (cur_data_len,
494
 
                                                        cur_coalesced.length)
495
 
            all_data = ''.join(cur_data)
496
 
            cur_data = []
497
 
            cur_data_len = 0
498
 
 
499
 
            for suboffset, subsize in cur_coalesced.ranges:
500
 
                key = (cur_coalesced.start+suboffset, subsize)
501
 
                data_map[key] = all_data[suboffset:suboffset+subsize]
502
 
 
503
 
            # Now that we've read some data, see if we can yield anything back
504
 
            while cur_offset_and_size in data_map:
505
 
                this_data = data_map.pop(cur_offset_and_size)
506
 
                yield cur_offset_and_size[0], this_data
507
 
                cur_offset_and_size = offset_stack.next()
508
 
 
509
 
            # We read a coalesced entry, so mark it as done
510
 
            cur_coalesced = None
511
 
            # Now that we've read all of the data for this coalesced section
512
 
            # on to the next
513
 
            cur_coalesced = cur_coalesced_stack.next()
514
 
 
515
 
        if cur_coalesced is not None:
516
 
            raise errors.ShortReadvError(relpath, cur_coalesced.start,
517
 
                cur_coalesced.length, len(data))
518
 
 
519
 
    def put_file(self, relpath, f, mode=None):
520
 
        """
521
 
        Copy the file-like object into the location.
 
374
    def get_partial(self, relpath, start, length=None):
 
375
        """
 
376
        Get just part of a file.
 
377
 
 
378
        :param relpath: Path to the file, relative to base
 
379
        :param start: The starting position to read from
 
380
        :param length: The length to read. A length of None indicates
 
381
                       read to the end of the file.
 
382
        :return: A file-like object containing at least the specified bytes.
 
383
                 Some implementations may return objects which can be read
 
384
                 past this length, but this is not guaranteed.
 
385
        """
 
386
        # TODO: implement get_partial_multi to help with knit support
 
387
        f = self.get(relpath)
 
388
        f.seek(start)
 
389
        if self._do_prefetch and hasattr(f, 'prefetch'):
 
390
            f.prefetch()
 
391
        return f
 
392
 
 
393
    def put(self, relpath, f, mode=None):
 
394
        """
 
395
        Copy the file-like or string object into the location.
522
396
 
523
397
        :param relpath: Location to put the contents, relative to base.
524
 
        :param f:       File-like object.
 
398
        :param f:       File-like or string object.
525
399
        :param mode: The final mode for the file
526
400
        """
527
401
        final_path = self._remote_path(relpath)
539
413
                self._pump(f, fout)
540
414
            except (IOError, paramiko.SSHException), e:
541
415
                self._translate_io_exception(e, tmp_abspath)
542
 
            # XXX: This doesn't truly help like we would like it to.
543
 
            #      The problem is that openssh strips sticky bits. So while we
544
 
            #      can properly set group write permission, we lose the group
545
 
            #      sticky bit. So it is probably best to stop chmodding, and
546
 
            #      just tell users that they need to set the umask correctly.
547
 
            #      The attr.st_mode = mode, in _sftp_open_exclusive
548
 
            #      will handle when the user wants the final mode to be more 
549
 
            #      restrictive. And then we avoid a round trip. Unless 
550
 
            #      paramiko decides to expose an async chmod()
551
 
 
552
 
            # This is designed to chmod() right before we close.
553
 
            # Because we set_pipelined() earlier, theoretically we might 
554
 
            # avoid the round trip for fout.close()
555
416
            if mode is not None:
556
417
                self._sftp.chmod(tmp_abspath, mode)
557
418
            fout.close()
558
419
            closed = True
559
 
            self._rename_and_overwrite(tmp_abspath, abspath)
 
420
            self._rename(tmp_abspath, abspath)
560
421
        except Exception, e:
561
422
            # If we fail, try to clean up the temporary file
562
423
            # before we throw the exception
575
436
            # raise the original with its traceback if we can.
576
437
            raise
577
438
 
578
 
    def _put_non_atomic_helper(self, relpath, writer, mode=None,
579
 
                               create_parent_dir=False,
580
 
                               dir_mode=None):
581
 
        abspath = self._remote_path(relpath)
582
 
 
583
 
        # TODO: jam 20060816 paramiko doesn't publicly expose a way to
584
 
        #       set the file mode at create time. If it does, use it.
585
 
        #       But for now, we just chmod later anyway.
586
 
 
587
 
        def _open_and_write_file():
588
 
            """Try to open the target file, raise error on failure"""
589
 
            fout = None
590
 
            try:
591
 
                try:
592
 
                    fout = self._sftp.file(abspath, mode='wb')
593
 
                    fout.set_pipelined(True)
594
 
                    writer(fout)
595
 
                except (paramiko.SSHException, IOError), e:
596
 
                    self._translate_io_exception(e, abspath,
597
 
                                                 ': unable to open')
598
 
 
599
 
                # This is designed to chmod() right before we close.
600
 
                # Because we set_pipelined() earlier, theoretically we might 
601
 
                # avoid the round trip for fout.close()
602
 
                if mode is not None:
603
 
                    self._sftp.chmod(abspath, mode)
604
 
            finally:
605
 
                if fout is not None:
606
 
                    fout.close()
607
 
 
608
 
        if not create_parent_dir:
609
 
            _open_and_write_file()
610
 
            return
611
 
 
612
 
        # Try error handling to create the parent directory if we need to
613
 
        try:
614
 
            _open_and_write_file()
615
 
        except NoSuchFile:
616
 
            # Try to create the parent directory, and then go back to
617
 
            # writing the file
618
 
            parent_dir = os.path.dirname(abspath)
619
 
            self._mkdir(parent_dir, dir_mode)
620
 
            _open_and_write_file()
621
 
 
622
 
    def put_file_non_atomic(self, relpath, f, mode=None,
623
 
                            create_parent_dir=False,
624
 
                            dir_mode=None):
625
 
        """Copy the file-like object into the target location.
626
 
 
627
 
        This function is not strictly safe to use. It is only meant to
628
 
        be used when you already know that the target does not exist.
629
 
        It is not safe, because it will open and truncate the remote
630
 
        file. So there may be a time when the file has invalid contents.
631
 
 
632
 
        :param relpath: The remote location to put the contents.
633
 
        :param f:       File-like object.
634
 
        :param mode:    Possible access permissions for new file.
635
 
                        None means do not set remote permissions.
636
 
        :param create_parent_dir: If we cannot create the target file because
637
 
                        the parent directory does not exist, go ahead and
638
 
                        create it, and then try again.
639
 
        """
640
 
        def writer(fout):
641
 
            self._pump(f, fout)
642
 
        self._put_non_atomic_helper(relpath, writer, mode=mode,
643
 
                                    create_parent_dir=create_parent_dir,
644
 
                                    dir_mode=dir_mode)
645
 
 
646
 
    def put_bytes_non_atomic(self, relpath, bytes, mode=None,
647
 
                             create_parent_dir=False,
648
 
                             dir_mode=None):
649
 
        def writer(fout):
650
 
            fout.write(bytes)
651
 
        self._put_non_atomic_helper(relpath, writer, mode=mode,
652
 
                                    create_parent_dir=create_parent_dir,
653
 
                                    dir_mode=dir_mode)
654
 
 
655
439
    def iter_files_recursive(self):
656
440
        """Walk the relative paths of all files in this transport."""
657
441
        queue = list(self.list_dir('.'))
658
442
        while queue:
659
 
            relpath = queue.pop(0)
 
443
            relpath = urllib.quote(queue.pop(0))
660
444
            st = self.stat(relpath)
661
445
            if stat.S_ISDIR(st.st_mode):
662
446
                for i, basename in enumerate(self.list_dir(relpath)):
664
448
            else:
665
449
                yield relpath
666
450
 
667
 
    def _mkdir(self, abspath, mode=None):
668
 
        if mode is None:
669
 
            local_mode = 0777
670
 
        else:
671
 
            local_mode = mode
672
 
        try:
673
 
            self._sftp.mkdir(abspath, local_mode)
674
 
            if mode is not None:
675
 
                self._sftp.chmod(abspath, mode=mode)
676
 
        except (paramiko.SSHException, IOError), e:
677
 
            self._translate_io_exception(e, abspath, ': unable to mkdir',
678
 
                failure_exc=FileExists)
679
 
 
680
451
    def mkdir(self, relpath, mode=None):
681
452
        """Create a directory at the given path."""
682
 
        self._mkdir(self._remote_path(relpath), mode=mode)
 
453
        try:
 
454
            path = self._remote_path(relpath)
 
455
            # In the paramiko documentation, it says that passing a mode flag 
 
456
            # will filtered against the server umask.
 
457
            # StubSFTPServer does not do this, which would be nice, because it is
 
458
            # what we really want :)
 
459
            # However, real servers do use umask, so we really should do it that way
 
460
            self._sftp.mkdir(path)
 
461
            if mode is not None:
 
462
                self._sftp.chmod(path, mode=mode)
 
463
        except (paramiko.SSHException, IOError), e:
 
464
            self._translate_io_exception(e, path, ': unable to mkdir',
 
465
                failure_exc=FileExists)
683
466
 
684
 
    def _translate_io_exception(self, e, path, more_info='', 
685
 
                                failure_exc=PathError):
 
467
    def _translate_io_exception(self, e, path, more_info='', failure_exc=NoSuchFile):
686
468
        """Translate a paramiko or IOError into a friendlier exception.
687
469
 
688
470
        :param e: The original exception
692
474
        :param failure_exc: Paramiko has the super fun ability to raise completely
693
475
                           opaque errors that just set "e.args = ('Failure',)" with
694
476
                           no more information.
695
 
                           If this parameter is set, it defines the exception 
696
 
                           to raise in these cases.
 
477
                           This sometimes means FileExists, but it also sometimes
 
478
                           means NoSuchFile
697
479
        """
698
480
        # paramiko seems to generate detailless errors.
699
481
        self._translate_error(e, path, raise_generic=False)
700
 
        if getattr(e, 'args', None) is not None:
 
482
        if hasattr(e, 'args'):
701
483
            if (e.args == ('No such file or directory',) or
702
484
                e.args == ('No such file',)):
703
485
                raise NoSuchFile(path, str(e) + more_info)
707
489
            if (e.args == ('Failure',)):
708
490
                raise failure_exc(path, str(e) + more_info)
709
491
            mutter('Raising exception with args %s', e.args)
710
 
        if getattr(e, 'errno', None) is not None:
 
492
        if hasattr(e, 'errno'):
711
493
            mutter('Raising exception with errno %s', e.errno)
712
494
        raise e
713
495
 
714
 
    def append_file(self, relpath, f, mode=None):
 
496
    def append(self, relpath, f):
715
497
        """
716
498
        Append the text in the file-like object into the final
717
499
        location.
719
501
        try:
720
502
            path = self._remote_path(relpath)
721
503
            fout = self._sftp.file(path, 'ab')
722
 
            if mode is not None:
723
 
                self._sftp.chmod(path, mode)
724
 
            result = fout.tell()
725
504
            self._pump(f, fout)
726
 
            return result
727
505
        except (IOError, paramiko.SSHException), e:
728
506
            self._translate_io_exception(e, relpath, ': unable to append')
729
507
 
730
 
    def rename(self, rel_from, rel_to):
731
 
        """Rename without special overwriting"""
732
 
        try:
733
 
            self._sftp.rename(self._remote_path(rel_from),
734
 
                              self._remote_path(rel_to))
735
 
        except (IOError, paramiko.SSHException), e:
736
 
            self._translate_io_exception(e, rel_from,
737
 
                    ': unable to rename to %r' % (rel_to))
738
 
 
739
 
    def _rename_and_overwrite(self, abs_from, abs_to):
 
508
    def _rename(self, abs_from, abs_to):
740
509
        """Do a fancy rename on the remote server.
741
510
        
742
511
        Using the implementation provided by osutils.
752
521
        """Move the item at rel_from to the location at rel_to"""
753
522
        path_from = self._remote_path(rel_from)
754
523
        path_to = self._remote_path(rel_to)
755
 
        self._rename_and_overwrite(path_from, path_to)
 
524
        self._rename(path_from, path_to)
756
525
 
757
526
    def delete(self, relpath):
758
527
        """Delete the item at relpath"""
771
540
        Return a list of all files at the given location.
772
541
        """
773
542
        # does anything actually use this?
774
 
        # -- Unknown
775
 
        # This is at least used by copy_tree for remote upgrades.
776
 
        # -- David Allouche 2006-08-11
777
543
        path = self._remote_path(relpath)
778
544
        try:
779
 
            entries = self._sftp.listdir(path)
 
545
            return self._sftp.listdir(path)
780
546
        except (IOError, paramiko.SSHException), e:
781
547
            self._translate_io_exception(e, path, ': failed to list_dir')
782
 
        return [urlutils.escape(entry) for entry in entries]
783
548
 
784
549
    def rmdir(self, relpath):
785
550
        """See Transport.rmdir."""
823
588
        # that we have taken the lock.
824
589
        return SFTPLock(relpath, self)
825
590
 
 
591
    def _unparse_url(self, path=None):
 
592
        if path is None:
 
593
            path = self._path
 
594
        path = urllib.quote(path)
 
595
        # handle homedir paths
 
596
        if not path.startswith('/'):
 
597
            path = "/~/" + path
 
598
        netloc = urllib.quote(self._host)
 
599
        if self._username is not None:
 
600
            netloc = '%s@%s' % (urllib.quote(self._username), netloc)
 
601
        if self._port is not None:
 
602
            netloc = '%s:%d' % (netloc, self._port)
 
603
 
 
604
        return urlparse.urlunparse(('sftp', netloc, path, '', '', ''))
 
605
 
 
606
    def _split_url(self, url):
 
607
        if isinstance(url, unicode):
 
608
            url = url.encode('utf-8')
 
609
        (scheme, netloc, path, params,
 
610
         query, fragment) = urlparse.urlparse(url, allow_fragments=False)
 
611
        assert scheme == 'sftp'
 
612
        username = password = host = port = None
 
613
        if '@' in netloc:
 
614
            username, host = netloc.split('@', 1)
 
615
            if ':' in username:
 
616
                username, password = username.split(':', 1)
 
617
                password = urllib.unquote(password)
 
618
            username = urllib.unquote(username)
 
619
        else:
 
620
            host = netloc
 
621
 
 
622
        if ':' in host:
 
623
            host, port = host.rsplit(':', 1)
 
624
            try:
 
625
                port = int(port)
 
626
            except ValueError:
 
627
                # TODO: Should this be ConnectionError?
 
628
                raise TransportError('%s: invalid port number' % port)
 
629
        host = urllib.unquote(host)
 
630
 
 
631
        path = urllib.unquote(path)
 
632
 
 
633
        # the initial slash should be removed from the path, and treated
 
634
        # as a homedir relative path (the path begins with a double slash
 
635
        # if it is absolute).
 
636
        # see draft-ietf-secsh-scp-sftp-ssh-uri-03.txt
 
637
        # RBC 20060118 we are not using this as its too user hostile. instead
 
638
        # we are following lftp and using /~/foo to mean '~/foo'.
 
639
        # handle homedir paths
 
640
        if path.startswith('/~/'):
 
641
            path = path[3:]
 
642
        elif path == '/~':
 
643
            path = ''
 
644
        return (username, password, host, port, path)
 
645
 
 
646
    def _parse_url(self, url):
 
647
        (self._username, self._password,
 
648
         self._host, self._port, self._path) = self._split_url(url)
 
649
 
826
650
    def _sftp_connect(self):
827
651
        """Connect to the remote sftp server.
828
652
        After this, self._sftp should have a valid connection (or
830
654
 
831
655
        TODO: Raise a more reasonable ConnectionFailed exception
832
656
        """
833
 
        self._sftp = _sftp_connect(self._host, self._port, self._username,
834
 
                self._password)
 
657
        global _connected_hosts
 
658
 
 
659
        idx = (self._host, self._port, self._username)
 
660
        try:
 
661
            self._sftp = _connected_hosts[idx]
 
662
            return
 
663
        except KeyError:
 
664
            pass
 
665
        
 
666
        vendor = _get_ssh_vendor()
 
667
        if vendor == 'loopback':
 
668
            sock = socket.socket()
 
669
            sock.connect((self._host, self._port))
 
670
            self._sftp = SFTPClient(LoopbackSFTP(sock))
 
671
        elif vendor != 'none':
 
672
            sock = SFTPSubprocess(self._host, vendor, self._port,
 
673
                                  self._username)
 
674
            self._sftp = SFTPClient(sock)
 
675
        else:
 
676
            self._paramiko_connect()
 
677
 
 
678
        _connected_hosts[idx] = self._sftp
 
679
 
 
680
    def _paramiko_connect(self):
 
681
        global SYSTEM_HOSTKEYS, BZR_HOSTKEYS
 
682
        
 
683
        load_host_keys()
 
684
 
 
685
        try:
 
686
            t = paramiko.Transport((self._host, self._port or 22))
 
687
            t.set_log_channel('bzr.paramiko')
 
688
            t.start_client()
 
689
        except paramiko.SSHException, e:
 
690
            raise ConnectionError('Unable to reach SSH host %s:%d' %
 
691
                                  (self._host, self._port), e)
 
692
            
 
693
        server_key = t.get_remote_server_key()
 
694
        server_key_hex = paramiko.util.hexify(server_key.get_fingerprint())
 
695
        keytype = server_key.get_name()
 
696
        if SYSTEM_HOSTKEYS.has_key(self._host) and SYSTEM_HOSTKEYS[self._host].has_key(keytype):
 
697
            our_server_key = SYSTEM_HOSTKEYS[self._host][keytype]
 
698
            our_server_key_hex = paramiko.util.hexify(our_server_key.get_fingerprint())
 
699
        elif BZR_HOSTKEYS.has_key(self._host) and BZR_HOSTKEYS[self._host].has_key(keytype):
 
700
            our_server_key = BZR_HOSTKEYS[self._host][keytype]
 
701
            our_server_key_hex = paramiko.util.hexify(our_server_key.get_fingerprint())
 
702
        else:
 
703
            warning('Adding %s host key for %s: %s' % (keytype, self._host, server_key_hex))
 
704
            if not BZR_HOSTKEYS.has_key(self._host):
 
705
                BZR_HOSTKEYS[self._host] = {}
 
706
            BZR_HOSTKEYS[self._host][keytype] = server_key
 
707
            our_server_key = server_key
 
708
            our_server_key_hex = paramiko.util.hexify(our_server_key.get_fingerprint())
 
709
            save_host_keys()
 
710
        if server_key != our_server_key:
 
711
            filename1 = os.path.expanduser('~/.ssh/known_hosts')
 
712
            filename2 = pathjoin(config_dir(), 'ssh_host_keys')
 
713
            raise TransportError('Host keys for %s do not match!  %s != %s' % \
 
714
                (self._host, our_server_key_hex, server_key_hex),
 
715
                ['Try editing %s or %s' % (filename1, filename2)])
 
716
 
 
717
        self._sftp_auth(t)
 
718
        
 
719
        try:
 
720
            self._sftp = t.open_sftp_client()
 
721
        except paramiko.SSHException, e:
 
722
            raise ConnectionError('Unable to start sftp client %s:%d' %
 
723
                                  (self._host, self._port), e)
 
724
 
 
725
    def _sftp_auth(self, transport):
 
726
        # paramiko requires a username, but it might be none if nothing was supplied
 
727
        # use the local username, just in case.
 
728
        # We don't override self._username, because if we aren't using paramiko,
 
729
        # the username might be specified in ~/.ssh/config and we don't want to
 
730
        # force it to something else
 
731
        # Also, it would mess up the self.relpath() functionality
 
732
        username = self._username or getpass.getuser()
 
733
 
 
734
        # Paramiko tries to open a socket.AF_UNIX in order to connect
 
735
        # to ssh-agent. That attribute doesn't exist on win32 (it does in cygwin)
 
736
        # so we get an AttributeError exception. For now, just don't try to
 
737
        # connect to an agent if we are on win32
 
738
        if sys.platform != 'win32':
 
739
            agent = paramiko.Agent()
 
740
            for key in agent.get_keys():
 
741
                mutter('Trying SSH agent key %s' % paramiko.util.hexify(key.get_fingerprint()))
 
742
                try:
 
743
                    transport.auth_publickey(username, key)
 
744
                    return
 
745
                except paramiko.SSHException, e:
 
746
                    pass
 
747
        
 
748
        # okay, try finding id_rsa or id_dss?  (posix only)
 
749
        if self._try_pkey_auth(transport, paramiko.RSAKey, username, 'id_rsa'):
 
750
            return
 
751
        if self._try_pkey_auth(transport, paramiko.DSSKey, username, 'id_dsa'):
 
752
            return
 
753
 
 
754
        if self._password:
 
755
            try:
 
756
                transport.auth_password(username, self._password)
 
757
                return
 
758
            except paramiko.SSHException, e:
 
759
                pass
 
760
 
 
761
            # FIXME: Don't keep a password held in memory if you can help it
 
762
            #self._password = None
 
763
 
 
764
        # give up and ask for a password
 
765
        password = bzrlib.ui.ui_factory.get_password(
 
766
                prompt='SSH %(user)s@%(host)s password',
 
767
                user=username, host=self._host)
 
768
        try:
 
769
            transport.auth_password(username, password)
 
770
        except paramiko.SSHException, e:
 
771
            raise ConnectionError('Unable to authenticate to SSH host as %s@%s' %
 
772
                                  (username, self._host), e)
 
773
 
 
774
    def _try_pkey_auth(self, transport, pkey_class, username, filename):
 
775
        filename = os.path.expanduser('~/.ssh/' + filename)
 
776
        try:
 
777
            key = pkey_class.from_private_key_file(filename)
 
778
            transport.auth_publickey(username, key)
 
779
            return True
 
780
        except paramiko.PasswordRequiredException:
 
781
            password = bzrlib.ui.ui_factory.get_password(
 
782
                    prompt='SSH %(filename)s password',
 
783
                    filename=filename)
 
784
            try:
 
785
                key = pkey_class.from_private_key_file(filename, password)
 
786
                transport.auth_publickey(username, key)
 
787
                return True
 
788
            except paramiko.SSHException:
 
789
                mutter('SSH authentication via %s key failed.' % (os.path.basename(filename),))
 
790
        except paramiko.SSHException:
 
791
            mutter('SSH authentication via %s key failed.' % (os.path.basename(filename),))
 
792
        except IOError:
 
793
            pass
 
794
        return False
835
795
 
836
796
    def _sftp_open_exclusive(self, abspath, mode=None):
837
797
        """Open a remote path exclusively.
847
807
        :param abspath: The remote absolute path where the file should be opened
848
808
        :param mode: The mode permissions bits for the new file
849
809
        """
850
 
        # TODO: jam 20060816 Paramiko >= 1.6.2 (probably earlier) supports
851
 
        #       using the 'x' flag to indicate SFTP_FLAG_EXCL.
852
 
        #       However, there is no way to set the permission mode at open 
853
 
        #       time using the sftp_client.file() functionality.
854
810
        path = self._sftp._adjust_cwd(abspath)
855
 
        # mutter('sftp abspath %s => %s', abspath, path)
856
811
        attr = SFTPAttributes()
857
812
        if mode is not None:
858
813
            attr.st_mode = mode
868
823
            self._translate_io_exception(e, abspath, ': unable to open',
869
824
                failure_exc=FileExists)
870
825
 
871
 
    def _can_roundtrip_unix_modebits(self):
872
 
        if sys.platform == 'win32':
873
 
            # anyone else?
874
 
            return False
875
 
        else:
876
 
            return True
877
826
 
878
827
# ------------- server test implementation --------------
 
828
import socket
879
829
import threading
880
830
 
881
831
from bzrlib.tests.stub_sftp import StubServer, StubSFTPServer
897
847
nvuQES5C9BMHjF39LZiGH1iLQy7FgdHyoP+eodI7
898
848
-----END RSA PRIVATE KEY-----
899
849
"""
900
 
 
901
 
 
902
 
class SocketListener(threading.Thread):
 
850
    
 
851
 
 
852
class SingleListener(threading.Thread):
903
853
 
904
854
    def __init__(self, callback):
905
855
        threading.Thread.__init__(self)
909
859
        self._socket.bind(('localhost', 0))
910
860
        self._socket.listen(1)
911
861
        self.port = self._socket.getsockname()[1]
912
 
        self._stop_event = threading.Event()
 
862
        self.stop_event = threading.Event()
 
863
 
 
864
    def run(self):
 
865
        s, _ = self._socket.accept()
 
866
        # now close the listen socket
 
867
        self._socket.close()
 
868
        try:
 
869
            self._callback(s, self.stop_event)
 
870
        except socket.error:
 
871
            pass #Ignore socket errors
 
872
        except Exception, x:
 
873
            # probably a failed test
 
874
            warning('Exception from within unit test server thread: %r' % x)
913
875
 
914
876
    def stop(self):
915
 
        # called from outside this thread
916
 
        self._stop_event.set()
 
877
        self.stop_event.set()
917
878
        # use a timeout here, because if the test fails, the server thread may
918
879
        # never notice the stop_event.
919
880
        self.join(5.0)
920
 
        self._socket.close()
921
 
 
922
 
    def run(self):
923
 
        while True:
924
 
            readable, writable_unused, exception_unused = \
925
 
                select.select([self._socket], [], [], 0.1)
926
 
            if self._stop_event.isSet():
927
 
                return
928
 
            if len(readable) == 0:
929
 
                continue
930
 
            try:
931
 
                s, addr_unused = self._socket.accept()
932
 
                # because the loopback socket is inline, and transports are
933
 
                # never explicitly closed, best to launch a new thread.
934
 
                threading.Thread(target=self._callback, args=(s,)).start()
935
 
            except socket.error, x:
936
 
                sys.excepthook(*sys.exc_info())
937
 
                warning('Socket error during accept() within unit test server'
938
 
                        ' thread: %r' % x)
939
 
            except Exception, x:
940
 
                # probably a failed test; unit test thread will log the
941
 
                # failure/error
942
 
                sys.excepthook(*sys.exc_info())
943
 
                warning('Exception from within unit test server thread: %r' % 
944
 
                        x)
945
 
 
946
 
 
947
 
class SocketDelay(object):
948
 
    """A socket decorator to make TCP appear slower.
949
 
 
950
 
    This changes recv, send, and sendall to add a fixed latency to each python
951
 
    call if a new roundtrip is detected. That is, when a recv is called and the
952
 
    flag new_roundtrip is set, latency is charged. Every send and send_all
953
 
    sets this flag.
954
 
 
955
 
    In addition every send, sendall and recv sleeps a bit per character send to
956
 
    simulate bandwidth.
957
 
 
958
 
    Not all methods are implemented, this is deliberate as this class is not a
959
 
    replacement for the builtin sockets layer. fileno is not implemented to
960
 
    prevent the proxy being bypassed. 
961
 
    """
962
 
 
963
 
    simulated_time = 0
964
 
    _proxied_arguments = dict.fromkeys([
965
 
        "close", "getpeername", "getsockname", "getsockopt", "gettimeout",
966
 
        "setblocking", "setsockopt", "settimeout", "shutdown"])
967
 
 
968
 
    def __init__(self, sock, latency, bandwidth=1.0, 
969
 
                 really_sleep=True):
970
 
        """ 
971
 
        :param bandwith: simulated bandwith (MegaBit)
972
 
        :param really_sleep: If set to false, the SocketDelay will just
973
 
        increase a counter, instead of calling time.sleep. This is useful for
974
 
        unittesting the SocketDelay.
975
 
        """
976
 
        self.sock = sock
977
 
        self.latency = latency
978
 
        self.really_sleep = really_sleep
979
 
        self.time_per_byte = 1 / (bandwidth / 8.0 * 1024 * 1024) 
980
 
        self.new_roundtrip = False
981
 
 
982
 
    def sleep(self, s):
983
 
        if self.really_sleep:
984
 
            time.sleep(s)
985
 
        else:
986
 
            SocketDelay.simulated_time += s
987
 
 
988
 
    def __getattr__(self, attr):
989
 
        if attr in SocketDelay._proxied_arguments:
990
 
            return getattr(self.sock, attr)
991
 
        raise AttributeError("'SocketDelay' object has no attribute %r" %
992
 
                             attr)
993
 
 
994
 
    def dup(self):
995
 
        return SocketDelay(self.sock.dup(), self.latency, self.time_per_byte,
996
 
                           self._sleep)
997
 
 
998
 
    def recv(self, *args):
999
 
        data = self.sock.recv(*args)
1000
 
        if data and self.new_roundtrip:
1001
 
            self.new_roundtrip = False
1002
 
            self.sleep(self.latency)
1003
 
        self.sleep(len(data) * self.time_per_byte)
1004
 
        return data
1005
 
 
1006
 
    def sendall(self, data, flags=0):
1007
 
        if not self.new_roundtrip:
1008
 
            self.new_roundtrip = True
1009
 
            self.sleep(self.latency)
1010
 
        self.sleep(len(data) * self.time_per_byte)
1011
 
        return self.sock.sendall(data, flags)
1012
 
 
1013
 
    def send(self, data, flags=0):
1014
 
        if not self.new_roundtrip:
1015
 
            self.new_roundtrip = True
1016
 
            self.sleep(self.latency)
1017
 
        bytes_sent = self.sock.send(data, flags)
1018
 
        self.sleep(bytes_sent * self.time_per_byte)
1019
 
        return bytes_sent
1020
881
 
1021
882
 
1022
883
class SFTPServer(Server):
1023
884
    """Common code for SFTP server facilities."""
1024
885
 
1025
 
    def __init__(self, server_interface=StubServer):
 
886
    def __init__(self):
1026
887
        self._original_vendor = None
1027
888
        self._homedir = None
1028
889
        self._server_homedir = None
1029
890
        self._listener = None
1030
891
        self._root = None
1031
 
        self._vendor = ssh.ParamikoVendor()
1032
 
        self._server_interface = server_interface
 
892
        self._vendor = 'none'
1033
893
        # sftp server logs
1034
894
        self.logs = []
1035
 
        self.add_latency = 0
1036
895
 
1037
896
    def _get_sftp_url(self, path):
1038
897
        """Calculate an sftp url to this server for path."""
1042
901
        """StubServer uses this to log when a new server is created."""
1043
902
        self.logs.append(message)
1044
903
 
1045
 
    def _run_server_entry(self, sock):
1046
 
        """Entry point for all implementations of _run_server.
1047
 
        
1048
 
        If self.add_latency is > 0.000001 then sock is given a latency adding
1049
 
        decorator.
1050
 
        """
1051
 
        if self.add_latency > 0.000001:
1052
 
            sock = SocketDelay(sock, self.add_latency)
1053
 
        return self._run_server(sock)
1054
 
 
1055
 
    def _run_server(self, s):
 
904
    def _run_server(self, s, stop_event):
1056
905
        ssh_server = paramiko.Transport(s)
1057
 
        key_file = pathjoin(self._homedir, 'test_rsa.key')
1058
 
        f = open(key_file, 'w')
1059
 
        f.write(STUB_SERVER_KEY)
1060
 
        f.close()
 
906
        key_file = os.path.join(self._homedir, 'test_rsa.key')
 
907
        file(key_file, 'w').write(STUB_SERVER_KEY)
1061
908
        host_key = paramiko.RSAKey.from_private_key_file(key_file)
1062
909
        ssh_server.add_server_key(host_key)
1063
 
        server = self._server_interface(self)
 
910
        server = StubServer(self)
1064
911
        ssh_server.set_subsystem_handler('sftp', paramiko.SFTPServer,
1065
912
                                         StubSFTPServer, root=self._root,
1066
913
                                         home=self._server_homedir)
1067
914
        event = threading.Event()
1068
915
        ssh_server.start_server(event, server)
1069
916
        event.wait(5.0)
 
917
        stop_event.wait(30.0)
1070
918
    
1071
919
    def setUp(self):
1072
 
        self._original_vendor = ssh._ssh_vendor
1073
 
        ssh._ssh_vendor = self._vendor
1074
 
        if sys.platform == 'win32':
1075
 
            # Win32 needs to use the UNICODE api
1076
 
            self._homedir = getcwd()
1077
 
        else:
1078
 
            # But Linux SFTP servers should just deal in bytestreams
1079
 
            self._homedir = os.getcwd()
 
920
        global _ssh_vendor
 
921
        self._original_vendor = _ssh_vendor
 
922
        _ssh_vendor = self._vendor
 
923
        self._homedir = os.getcwdu()
1080
924
        if self._server_homedir is None:
1081
925
            self._server_homedir = self._homedir
1082
926
        self._root = '/'
1083
 
        if sys.platform == 'win32':
1084
 
            self._root = ''
1085
 
        self._listener = SocketListener(self._run_server_entry)
 
927
        # FIXME WINDOWS: _root should be _server_homedir[0]:/
 
928
        self._listener = SingleListener(self._run_server)
1086
929
        self._listener.setDaemon(True)
1087
930
        self._listener.start()
1088
931
 
1089
932
    def tearDown(self):
1090
933
        """See bzrlib.transport.Server.tearDown."""
 
934
        global _ssh_vendor
1091
935
        self._listener.stop()
1092
 
        ssh._ssh_vendor = self._original_vendor
1093
 
 
1094
 
    def get_bogus_url(self):
1095
 
        """See bzrlib.transport.Server.get_bogus_url."""
1096
 
        # this is chosen to try to prevent trouble with proxies, wierd dns, etc
1097
 
        # we bind a random socket, so that we get a guaranteed unused port
1098
 
        # we just never listen on that port
1099
 
        s = socket.socket()
1100
 
        s.bind(('localhost', 0))
1101
 
        return 'sftp://%s:%s/' % s.getsockname()
 
936
        _ssh_vendor = self._original_vendor
1102
937
 
1103
938
 
1104
939
class SFTPFullAbsoluteServer(SFTPServer):
1106
941
 
1107
942
    def get_url(self):
1108
943
        """See bzrlib.transport.Server.get_url."""
1109
 
        return self._get_sftp_url(urlutils.escape(self._homedir[1:]))
 
944
        return self._get_sftp_url(urlescape(self._homedir[1:]))
1110
945
 
1111
946
 
1112
947
class SFTPServerWithoutSSH(SFTPServer):
1114
949
 
1115
950
    def __init__(self):
1116
951
        super(SFTPServerWithoutSSH, self).__init__()
1117
 
        self._vendor = ssh.LoopbackVendor()
 
952
        self._vendor = 'loopback'
1118
953
 
1119
 
    def _run_server(self, sock):
1120
 
        # Re-import these as locals, so that they're still accessible during
1121
 
        # interpreter shutdown (when all module globals get set to None, leading
1122
 
        # to confusing errors like "'NoneType' object has no attribute 'error'".
 
954
    def _run_server(self, sock, stop_event):
1123
955
        class FakeChannel(object):
1124
956
            def get_transport(self):
1125
957
                return self
1129
961
                return '1'
1130
962
            def get_hexdump(self):
1131
963
                return False
1132
 
            def close(self):
1133
 
                pass
1134
964
 
1135
965
        server = paramiko.SFTPServer(FakeChannel(), 'sftp', StubServer(self), StubSFTPServer,
1136
966
                                     root=self._root, home=self._server_homedir)
1137
 
        try:
1138
 
            server.start_subsystem('sftp', None, sock)
1139
 
        except socket.error, e:
1140
 
            if (len(e.args) > 0) and (e.args[0] == errno.EPIPE):
1141
 
                # it's okay for the client to disconnect abruptly
1142
 
                # (bug in paramiko 1.6: it should absorb this exception)
1143
 
                pass
1144
 
            else:
1145
 
                raise
1146
 
        except Exception, e:
1147
 
            import sys; sys.stderr.write('\nEXCEPTION %r\n\n' % e.__class__)
 
967
        server.start_subsystem('sftp', None, sock)
1148
968
        server.finish_subsystem()
1149
969
 
1150
970
 
1153
973
 
1154
974
    def get_url(self):
1155
975
        """See bzrlib.transport.Server.get_url."""
1156
 
        if sys.platform == 'win32':
1157
 
            return self._get_sftp_url(urlutils.escape(self._homedir))
1158
 
        else:
1159
 
            return self._get_sftp_url(urlutils.escape(self._homedir[1:]))
 
976
        return self._get_sftp_url(urlescape(self._homedir[1:]))
1160
977
 
1161
978
 
1162
979
class SFTPHomeDirServer(SFTPServerWithoutSSH):
1175
992
        super(SFTPSiblingAbsoluteServer, self).setUp()
1176
993
 
1177
994
 
1178
 
def _sftp_connect(host, port, username, password):
1179
 
    """Connect to the remote sftp server.
1180
 
 
1181
 
    :raises: a TransportError 'could not connect'.
1182
 
 
1183
 
    :returns: an paramiko.sftp_client.SFTPClient
1184
 
 
1185
 
    TODO: Raise a more reasonable ConnectionFailed exception
1186
 
    """
1187
 
    idx = (host, port, username)
1188
 
    try:
1189
 
        return _connected_hosts[idx]
1190
 
    except KeyError:
1191
 
        pass
1192
 
    
1193
 
    sftp = _sftp_connect_uncached(host, port, username, password)
1194
 
    _connected_hosts[idx] = sftp
1195
 
    return sftp
1196
 
 
1197
 
def _sftp_connect_uncached(host, port, username, password):
1198
 
    vendor = ssh._get_ssh_vendor()
1199
 
    sftp = vendor.connect_sftp(username, password, host, port)
1200
 
    return sftp
1201
 
 
1202
 
 
1203
995
def get_test_permutations():
1204
996
    """Return the permutations to be used in testing."""
1205
997
    return [(SFTPTransport, SFTPAbsoluteServer),