~abentley/bzrtools/bzrtools.dev

« back to all changes in this revision

Viewing changes to scriptlib.py

  • Committer: Aaron Bentley
  • Date: 2005-05-26 13:29:54 UTC
  • Revision ID: abentley@troll-20050526132954-76953c12b0da8d04
Added overwrite parameter to bzr-pull

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2005, 2006, 2007 Aaron Bentley <aaron@aaronbentley.com>
2
 
# Copyright (C) 2007 John Arbash Meinel
3
 
#
4
 
#    This program is free software; you can redistribute it and/or modify
5
 
#    it under the terms of the GNU General Public License as published by
6
 
#    the Free Software Foundation; either version 2 of the License, or
7
 
#    (at your option) any later version.
8
 
#
9
 
#    This program is distributed in the hope that it will be useful,
10
 
#    but WITHOUT ANY WARRANTY; without even the implied warranty of
11
 
#    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12
 
#    GNU General Public License for more details.
13
 
#
14
 
#    You should have received a copy of the GNU General Public License
15
 
#    along with this program; if not, write to the Free Software
16
 
#    Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
17
 
import codecs
18
 
import errno
 
1
import bzrlib
19
2
import os
20
 
import re
 
3
import os.path
 
4
import sys
21
5
import tempfile
22
6
import shutil
23
 
from subprocess import Popen, PIPE
24
 
import sys
25
 
 
26
 
import bzrlib
27
 
from bzrlib import revision as _mod_revision, trace, urlutils
28
 
from bzrlib.errors import (
29
 
    BzrCommandError,
30
 
    BzrError,
31
 
    NotBranchError,
32
 
    NoSuchFile,
33
 
    )
34
 
from bzrlib.bzrdir import BzrDir
35
 
from bzrlib.transport import get_transport
36
 
 
37
 
def temp_tree():
 
7
 
 
8
def temp_branch():
38
9
    dirname = tempfile.mkdtemp("temp-branch")
39
 
    return BzrDir.create_standalone_workingtree(dirname)
40
 
 
41
 
def rm_tree(tree):
42
 
    shutil.rmtree(tree.basedir)
43
 
 
44
 
def is_clean(cur_tree):
 
10
    return bzrlib.Branch(dirname, init=True)
 
11
 
 
12
def rm_branch(br):
 
13
    shutil.rmtree(br.base)
 
14
 
 
15
def is_clean(cur_branch):
45
16
    """
46
17
    Return true if no files are modifed or unknown
47
 
    """
48
 
    old_tree = cur_tree.basis_tree()
49
 
    new_tree = cur_tree
50
 
    non_source = []
51
 
    new_tree.lock_read()
52
 
    try:
53
 
        for path, file_class, kind, file_id, entry in new_tree.list_files():
54
 
            if file_class in ('?', 'I'):
55
 
                non_source.append(path)
56
 
        delta = new_tree.changes_from(old_tree, want_unchanged=False)
57
 
    finally:
58
 
        new_tree.unlock()
59
 
    return not delta.has_changed(), non_source
60
 
 
61
 
def set_push_data(tree, location):
62
 
    tree.branch._transport.put_bytes("x-push-data", "%s\n" % location)
63
 
 
64
 
def get_push_data(tree):
65
 
    """
66
 
    >>> tree = temp_tree()
67
 
    >>> get_push_data(tree) is None
68
 
    True
69
 
    >>> set_push_data(tree, 'http://somewhere')
70
 
    >>> get_push_data(tree)
71
 
    u'http://somewhere'
72
 
    >>> rm_tree(tree)
73
 
    """
74
 
    try:
75
 
        location = tree.branch._transport.get('x-push-data').read()
76
 
    except NoSuchFile:
 
18
    >>> br = temp_branch()
 
19
    >>> is_clean(br)
 
20
    True
 
21
    >>> fooname = os.path.join(br.base, "foo")
 
22
    >>> file(fooname, "wb").write("bar")
 
23
    >>> is_clean(br)
 
24
    False
 
25
    >>> bzrlib.add.smart_add([fooname])
 
26
    >>> is_clean(br)
 
27
    False
 
28
    >>> br.commit("added file")
 
29
    >>> is_clean(br)
 
30
    True
 
31
    >>> rm_branch(br)
 
32
    """
 
33
    old_tree = cur_branch.basis_tree()
 
34
    new_tree = cur_branch.working_tree()
 
35
    for path, file_class, kind, file_id in new_tree.list_files():
 
36
        if file_class == '?':
 
37
            return False
 
38
    delta = bzrlib.compare_trees(old_tree, new_tree, want_unchanged=False)
 
39
    if len(delta.added) > 0 or len(delta.removed) > 0 or \
 
40
        len(delta.modified) > 0:
 
41
        return False
 
42
    return True
 
43
 
 
44
def set_pull_data(br, location, rev_id):
 
45
    pull_file = file (br.controlfilename("x-pull-data"), "wb")
 
46
    pull_file.write("%s\n%s\n" % (location, rev_id))
 
47
 
 
48
def get_pull_data(br):
 
49
    """
 
50
    >>> br = temp_branch()
 
51
    >>> get_pull_data(br)
 
52
    (None, None)
 
53
    >>> set_pull_data(br, 'http://somewhere', '888-777')
 
54
    >>> get_pull_data(br)
 
55
    ('http://somewhere', '888-777')
 
56
    >>> rm_branch(br)
 
57
    """
 
58
    filename = br.controlfilename("x-pull-data")
 
59
    if not os.path.exists(filename):
 
60
        return (None, None)
 
61
    pull_file = file (filename, "rb")
 
62
    location, rev_id = [f.rstrip('\n') for f in pull_file]
 
63
    return location, rev_id
 
64
 
 
65
def set_push_data(br, location):
 
66
    push_file = file (br.controlfilename("x-push-data"), "wb")
 
67
    push_file.write("%s\n" % location)
 
68
 
 
69
def get_push_data(br):
 
70
    """
 
71
    >>> br = temp_branch()
 
72
    >>> get_push_data(br) is None
 
73
    True
 
74
    >>> set_push_data(br, 'http://somewhere')
 
75
    >>> get_push_data(br)
 
76
    'http://somewhere'
 
77
    >>> rm_branch(br)
 
78
    """
 
79
    filename = br.controlfilename("x-push-data")
 
80
    if not os.path.exists(filename):
77
81
        return None
78
 
    location = location.decode('utf-8')
79
 
    return location.rstrip('\n')
 
82
    push_file = file (filename, "rb")
 
83
    (location,) = [f.rstrip('\n') for f in push_file]
 
84
    return location
80
85
 
81
86
"""
82
87
>>> shell_escape('hello')
96
101
    arg_str = " ".join([shell_escape(a) for a in args])
97
102
    return os.system(arg_str)
98
103
 
99
 
class RsyncUnknownStatus(Exception):
100
 
    def __init__(self, status):
101
 
        Exception.__init__(self, "Unknown status: %d" % status)
102
 
 
103
 
class NoRsync(Exception):
104
 
    def __init__(self, rsync_name):
105
 
        Exception.__init__(self, "%s not found." % rsync_name)
106
 
 
107
 
 
108
 
def rsync(source, target, ssh=False, excludes=(), silent=False,
109
 
          rsync_name="rsync"):
110
 
    cmd = [rsync_name, "-av", "--delete"]
 
104
def rsync(source, target, ssh=False, exclude_globs=()):
 
105
    """
 
106
    >>> real_system = os.system
 
107
    >>> os.system = sys.stdout.write
 
108
    >>> rsync("a", "b")
 
109
    \\r\\s\\y\\n\\c \\-\\a\\v \\-\\-\\d\\e\\l\\e\\t\\e \\a \\b
 
110
    >>> rsync("a", "b", exclude_globs=("*.py",))
 
111
    \\r\\s\\y\\n\\c \\-\\a\\v \\-\\-\\d\\e\\l\\e\\t\\e\
 
112
 \\-\\-\\e\\x\\c\\l\\u\\d\\e \\*\\.\\p\\y \\a \\b
 
113
    >>> os.system = real_system
 
114
    """
 
115
    cmd = ["rsync", "-av", "--delete"]
111
116
    if ssh:
112
117
        cmd.extend(('-e', 'ssh'))
113
 
    if len(excludes) > 0:
114
 
        cmd.extend(('--exclude-from', '-'))
 
118
    for exclude in exclude_globs:
 
119
        cmd.extend(('--exclude', exclude))
115
120
    cmd.extend((source, target))
116
 
    if silent:
117
 
        stderr = PIPE
118
 
        stdout = PIPE
119
 
    else:
120
 
        stderr = None
121
 
        stdout = None
122
 
    try:
123
 
        proc = Popen(cmd, stdin=PIPE, stderr=stderr, stdout=stdout)
124
 
    except OSError, e:
125
 
        if e.errno == errno.ENOENT:
126
 
            raise NoRsync(rsync_name)
127
 
 
128
 
    proc.stdin.write('\n'.join(excludes)+'\n')
129
 
    proc.stdin.close()
130
 
    if silent:
131
 
        proc.stderr.read()
132
 
        proc.stderr.close()
133
 
        proc.stdout.read()
134
 
        proc.stdout.close()
135
 
    proc.wait()
136
 
    if proc.returncode == 12:
137
 
        raise RsyncStreamIO()
138
 
    elif proc.returncode == 23:
139
 
        raise RsyncNoFile(source)
140
 
    elif proc.returncode != 0:
141
 
        raise RsyncUnknownStatus(proc.returncode)
142
 
    return cmd
143
 
 
144
 
 
145
 
def rsync_ls(source, ssh=False, silent=True):
146
 
    cmd = ["rsync"]
147
 
    if ssh:
148
 
        cmd.extend(('-e', 'ssh'))
149
 
    cmd.append(source)
150
 
    if silent:
151
 
        stderr = PIPE
152
 
    else:
153
 
        stderr = None
154
 
    proc = Popen(cmd, stderr=stderr, stdout=PIPE)
155
 
    result = proc.stdout.read()
156
 
    proc.stdout.close()
157
 
    if silent:
158
 
        proc.stderr.read()
159
 
        proc.stderr.close()
160
 
    proc.wait()
161
 
    if proc.returncode == 12:
162
 
        raise RsyncStreamIO()
163
 
    elif proc.returncode == 23:
164
 
        raise RsyncNoFile(source)
165
 
    elif proc.returncode != 0:
166
 
        raise RsyncUnknownStatus(proc.returncode)
167
 
    return [l.split(' ')[-1].rstrip('\n') for l in result.splitlines(True)]
168
 
 
169
 
exclusions = ('.bzr/x-push-data', '.bzr/branch/x-push/data', '.bzr/parent',
170
 
              '.bzr/branch/parent', '.bzr/x-pull-data', '.bzr/x-pull',
171
 
              '.bzr/pull', '.bzr/stat-cache', '.bzr/x-rsync-data',
172
 
              '.bzr/basis-inventory', '.bzr/inventory.backup.weave')
173
 
 
174
 
 
175
 
def read_revision_history(fname):
176
 
    return [l.rstrip('\r\n') for l in
177
 
            codecs.open(fname, 'rb', 'utf-8').readlines()]
178
 
 
179
 
 
180
 
def read_revision_info(path):
181
 
    """Parse a last_revision file to determine revision_info"""
182
 
    line = open(path, 'rb').readlines()[0].strip('\n')
183
 
    revno, revision_id = line.split(' ', 1)
184
 
    revno = int(revno)
185
 
    return revno, revision_id
186
 
 
187
 
 
188
 
class RsyncNoFile(Exception):
189
 
    def __init__(self, path):
190
 
        Exception.__init__(self, "No such file %s" % path)
191
 
 
192
 
class RsyncStreamIO(Exception):
193
 
    def __init__(self):
194
 
        Exception.__init__(self, "Error in rsync protocol data stream.")
195
 
 
196
 
 
197
 
class NotStandalone(BzrError):
198
 
 
199
 
    _fmt = '%(location)s is not a standalone tree.'
200
 
    _internal = False
201
 
 
202
 
    def __init__(self, location):
203
 
        BzrError.__init__(self, location=location)
204
 
 
205
 
 
206
 
def get_revision_history(location, _rsync):
207
 
    tempdir = tempfile.mkdtemp('push')
208
 
    my_rsync = _rsync
209
 
    if my_rsync is None:
210
 
        my_rsync = rsync
211
 
    try:
212
 
        history_fname = os.path.join(tempdir, 'revision-history')
213
 
        try:
214
 
            cmd = my_rsync(location+'.bzr/revision-history', history_fname,
215
 
                        silent=True)
216
 
        except RsyncNoFile:
217
 
            cmd = rsync(location+'.bzr/branch/revision-history', history_fname,
218
 
                        silent=True)
219
 
        history = read_revision_history(history_fname)
220
 
    finally:
221
 
        shutil.rmtree(tempdir)
222
 
    return history
223
 
 
224
 
 
225
 
def get_revision_info(location, _rsync):
226
 
    """Get the revsision_info for an rsync-able branch"""
227
 
    tempdir = tempfile.mkdtemp('push')
228
 
    my_rsync = _rsync
229
 
    if my_rsync is None:
230
 
        my_rsync = rsync
231
 
    try:
232
 
        info_fname = os.path.join(tempdir, 'last-revision')
233
 
        cmd = rsync(location+'.bzr/branch/last-revision', info_fname,
234
 
                    silent=True)
235
 
        return read_revision_info(info_fname)
236
 
    finally:
237
 
        shutil.rmtree(tempdir)
238
 
 
239
 
 
240
 
def history_subset(location, branch, _rsync=None):
241
 
    local_history = branch.revision_history()
242
 
    try:
243
 
        remote_history = get_revision_history(location, _rsync)
244
 
    except RsyncNoFile:
245
 
        revno, revision_id = get_revision_info(location, _rsync)
246
 
        if revision_id == _mod_revision.NULL_REVISION:
247
 
            return True
248
 
        return bool(revision_id.decode('utf-8') in local_history)
249
 
    else:
250
 
        if len(remote_history) > len(local_history):
251
 
            return False
252
 
        for local, remote in zip(remote_history, local_history):
253
 
            if local != remote:
254
 
                return False
255
 
        return True
256
 
 
257
 
 
258
 
def empty_or_absent(location):
259
 
    try:
260
 
        files = rsync_ls(location)
261
 
        return files == ['.']
262
 
    except RsyncNoFile:
263
 
        return True
264
 
 
265
 
def rspush(tree, location=None, overwrite=False, working_tree=True,
266
 
    _rsync=None):
267
 
    tree.lock_write()
268
 
    try:
269
 
        my_rsync = _rsync
270
 
        if my_rsync is None:
271
 
            my_rsync = rsync
272
 
        if (tree.bzrdir.root_transport.base !=
273
 
            tree.branch.bzrdir.root_transport.base):
274
 
            raise NotStandalone(tree.bzrdir.root_transport.base)
275
 
        if (tree.branch.get_bound_location() is not None):
276
 
            raise NotStandalone(tree.bzrdir.root_transport.base)
277
 
        if (tree.branch.repository.is_shared()):
278
 
            raise NotStandalone(tree.bzrdir.root_transport.base)
279
 
        push_location = get_push_data(tree)
280
 
        if location is not None:
281
 
            if not location.endswith('/'):
282
 
                location += '/'
283
 
            push_location = location
284
 
 
285
 
        if push_location is None:
286
 
            raise BzrCommandError("No rspush location known or specified.")
287
 
 
288
 
        if (push_location.find('::') != -1):
289
 
            usessh=False
290
 
        else:
291
 
            usessh=True
292
 
 
293
 
        if (push_location.find('://') != -1 or
294
 
            push_location.find(':') == -1):
295
 
            raise BzrCommandError("Invalid rsync path %r." % push_location)
296
 
 
297
 
        if working_tree:
298
 
            clean, non_source = is_clean(tree)
299
 
            if not clean:
300
 
                raise BzrCommandError(
301
 
                    'This tree has uncommitted changes or unknown'
302
 
                    ' (?) files.  Use "bzr status" to list them.')
303
 
                sys.exit(1)
304
 
            final_exclusions = non_source[:]
305
 
        else:
306
 
            wt = tree
307
 
            final_exclusions = []
308
 
            for path, status, kind, file_id, entry in wt.list_files():
309
 
                final_exclusions.append(path)
310
 
 
311
 
        final_exclusions.extend(exclusions)
312
 
        if not overwrite:
313
 
            try:
314
 
                if not history_subset(push_location, tree.branch,
315
 
                                      _rsync=my_rsync):
316
 
                    raise BzrCommandError(
317
 
                        "Local branch is not a newer version of remote"
318
 
                        " branch.")
319
 
            except RsyncNoFile:
320
 
                if not empty_or_absent(push_location):
321
 
                    raise BzrCommandError(
322
 
                        "Remote location is not a bzr branch (or empty"
323
 
                        " directory)")
324
 
            except RsyncStreamIO:
325
 
                raise BzrCommandError("Rsync could not use the"
326
 
                    " specified location.  Please ensure that"
327
 
                    ' "%s" is of the form "machine:/path".' % push_location)
328
 
        trace.note("Pushing to %s", push_location)
329
 
        my_rsync(tree.basedir+'/', push_location, ssh=usessh,
330
 
                 excludes=final_exclusions)
331
 
 
332
 
        set_push_data(tree, push_location)
333
 
    finally:
334
 
        tree.unlock()
335
 
 
336
 
 
337
 
def short_committer(committer):
338
 
    new_committer = re.sub('<.*>', '', committer).strip(' ')
339
 
    if len(new_committer) < 2:
340
 
        return committer
341
 
    return new_committer
342
 
 
343
 
 
344
 
def apache_ls(t):
345
 
    """Screen-scrape Apache listings"""
346
 
    apache_dir = '<img border="0" src="/icons/folder.gif" alt="[dir]">'\
347
 
        ' <a href="'
348
 
    t = t.clone()
349
 
    t._remote_path = lambda x: t.base
350
 
    try:
351
 
        lines = t.get('')
352
 
    except NoSuchFile:
353
 
        return
354
 
    expr = re.compile('<a[^>]*href="([^>]*)\/"[^>]*>', flags=re.I)
355
 
    for line in lines:
356
 
        match = expr.search(line)
357
 
        if match is None:
358
 
            continue
359
 
        url = match.group(1)
360
 
        if url.startswith('http://') or url.startswith('/') or '../' in url:
361
 
            continue
362
 
        if '?' in url:
363
 
            continue
364
 
        yield url.rstrip('/')
365
 
 
366
 
 
367
 
def list_branches(t):
368
 
    def is_inside(branch):
369
 
        return bool(branch.base.startswith(t.base))
370
 
 
371
 
    if t.base.startswith('http://'):
372
 
        def evaluate(bzrdir):
373
 
            try:
374
 
                branch = bzrdir.open_branch()
375
 
                if is_inside(branch):
376
 
                    return True, branch
377
 
                else:
378
 
                    return True, None
379
 
            except NotBranchError:
380
 
                return True, None
381
 
        return [b for b in BzrDir.find_bzrdirs(t, list_current=apache_ls,
382
 
                evaluate=evaluate) if b is not None]
383
 
    elif not t.listable():
384
 
        raise BzrCommandError("Can't list this type of location.")
385
 
    return [b for b in BzrDir.find_branches(t) if is_inside(b)]
386
 
 
387
 
 
388
 
def evaluate_branch_tree(bzrdir):
389
 
    try:
390
 
        tree, branch = bzrdir._get_tree_branch()
391
 
    except NotBranchError:
392
 
        return True, None
393
 
    else:
394
 
        return True, (branch, tree)
395
 
 
396
 
 
397
 
def iter_branch_tree(t, lister=None):
398
 
    return (x for x in BzrDir.find_bzrdirs(t, evaluate=evaluate_branch_tree,
399
 
            list_current=lister) if x is not None)
400
 
 
401
 
 
402
 
def open_from_url(location):
403
 
    location = urlutils.normalize_url(location)
404
 
    dirname, basename = urlutils.split(location)
405
 
    if location.endswith('/') and not basename.endswith('/'):
406
 
        basename += '/'
407
 
    return get_transport(dirname).get(basename)
408
 
 
 
121
    safe_system(cmd)
 
122
 
 
123
exclusions = ('x-push-data', 'x-pull-data')
 
124
 
 
125
 
 
126
def pull(cur_branch, location=None, overwrite=False):
 
127
    pull_location, pull_revision = get_pull_data(cur_branch)
 
128
    if pull_location is not None:
 
129
        if not overwrite and cur_branch.last_patch() != pull_revision:
 
130
            print "Aborting: This branch has had commits, so pull would lose data."
 
131
            sys.exit(1)
 
132
    if location is not None:
 
133
        pull_location = location
 
134
        if not pull_location.endswith('/'):
 
135
            pull_location+='/'
 
136
 
 
137
    if pull_location is None:
 
138
        print "No pull location saved.  Please specify one on the command line."
 
139
        sys.exit(1)
 
140
 
 
141
    if not is_clean(cur_branch):
 
142
        print "Error: This tree has uncommitted changes or unknown (?) files."
 
143
        sys.exit(1)
 
144
 
 
145
    print "Synchronizing with %s" % pull_location
 
146
    rsync (pull_location, cur_branch.base+'/', exclude_globs=exclusions)
 
147
 
 
148
    set_pull_data(cur_branch, pull_location, cur_branch.last_patch())
 
149
 
 
150
 
 
151
def push(cur_branch, location=None):
 
152
    push_location = get_push_data(cur_branch)
 
153
    if location is not None:
 
154
        if not location.endswith('/'):
 
155
            location += '/'
 
156
        push_location = location
 
157
    
 
158
    if push_location is None:
 
159
        print "No push location saved.  Please specify one on the command line."
 
160
        sys.exit(1)
 
161
 
 
162
    if not is_clean(cur_branch):
 
163
        print "Error: This tree has uncommitted changes or unknown (?) files."
 
164
        sys.exit(1)
 
165
 
 
166
    print "Pushing to %s" % push_location
 
167
    rsync(cur_branch.base+'/', push_location, ssh=True,
 
168
          exclude_globs=exclusions)
 
169
 
 
170
    set_push_data(cur_branch, push_location)
409
171
 
410
172
def run_tests():
411
173
    import doctest