~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/merge.py

  • Committer: mbp at sourcefrog
  • Date: 2005-04-04 13:10:26 UTC
  • Revision ID: mbp@sourcefrog.net-20050404131026-628553cc03687658
new 'renames' command

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2005 Canonical Ltd
2
 
 
3
 
# This program is free software; you can redistribute it and/or modify
4
 
# it under the terms of the GNU General Public License as published by
5
 
# the Free Software Foundation; either version 2 of the License, or
6
 
# (at your option) any later version.
7
 
 
8
 
# This program is distributed in the hope that it will be useful,
9
 
# but WITHOUT ANY WARRANTY; without even the implied warranty of
10
 
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
11
 
# GNU General Public License for more details.
12
 
 
13
 
# You should have received a copy of the GNU General Public License
14
 
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
 
 
17
 
 
18
 
import os.path
19
 
import tempfile
20
 
import shutil
21
 
import errno
22
 
 
23
 
import bzrlib.osutils
24
 
import bzrlib.revision
25
 
from bzrlib.merge_core import merge_flex, ApplyMerge3, BackupBeforeChange
26
 
from bzrlib.changeset import generate_changeset, ExceptionConflictHandler
27
 
from bzrlib.changeset import Inventory, Diff3Merge
28
 
from bzrlib.branch import find_branch
29
 
from bzrlib.errors import BzrCommandError, UnrelatedBranches
30
 
from bzrlib.delta import compare_trees
31
 
from bzrlib.trace import mutter, warning
32
 
from bzrlib.fetch import greedy_fetch
33
 
from bzrlib.revision import is_ancestor
34
 
 
35
 
# comments from abentley on irc: merge happens in two stages, each
36
 
# of which generates a changeset object
37
 
 
38
 
# stage 1: generate OLD->OTHER,
39
 
# stage 2: use MINE and OLD->OTHER to generate MINE -> RESULT
40
 
 
41
 
class MergeConflictHandler(ExceptionConflictHandler):
42
 
    """Handle conflicts encountered while merging.
43
 
 
44
 
    This subclasses ExceptionConflictHandler, so that any types of
45
 
    conflict that are not explicitly handled cause an exception and
46
 
    terminate the merge.
47
 
    """
48
 
    def __init__(self, dir, ignore_zero=False):
49
 
        ExceptionConflictHandler.__init__(self, dir)
50
 
        self.conflicts = 0
51
 
        self.ignore_zero = ignore_zero
52
 
 
53
 
    def copy(self, source, dest):
54
 
        """Copy the text and mode of a file
55
 
        :param source: The path of the file to copy
56
 
        :param dest: The distination file to create
57
 
        """
58
 
        s_file = file(source, "rb")
59
 
        d_file = file(dest, "wb")
60
 
        for line in s_file:
61
 
            d_file.write(line)
62
 
        os.chmod(dest, 0777 & os.stat(source).st_mode)
63
 
 
64
 
    def dump(self, lines, dest):
65
 
        """Copy the text and mode of a file
66
 
        :param source: The path of the file to copy
67
 
        :param dest: The distination file to create
68
 
        """
69
 
        d_file = file(dest, "wb")
70
 
        for line in lines:
71
 
            d_file.write(line)
72
 
 
73
 
    def add_suffix(self, name, suffix, last_new_name=None):
74
 
        """Rename a file to append a suffix.  If the new name exists, the
75
 
        suffix is added repeatedly until a non-existant name is found
76
 
 
77
 
        :param name: The path of the file
78
 
        :param suffix: The suffix to append
79
 
        :param last_new_name: (used for recursive calls) the last name tried
80
 
        """
81
 
        if last_new_name is None:
82
 
            last_new_name = name
83
 
        new_name = last_new_name+suffix
84
 
        try:
85
 
            os.rename(name, new_name)
86
 
            return new_name
87
 
        except OSError, e:
88
 
            if e.errno != errno.EEXIST and e.errno != errno.ENOTEMPTY:
89
 
                raise
90
 
            return self.add_suffix(name, suffix, last_new_name=new_name)
91
 
 
92
 
    def conflict(self, text):
93
 
        warning(text)
94
 
        self.conflicts += 1
95
 
        
96
 
 
97
 
    def merge_conflict(self, new_file, this_path, base_lines, other_lines):
98
 
        """
99
 
        Handle diff3 conflicts by producing a .THIS, .BASE and .OTHER.  The
100
 
        main file will be a version with diff3 conflicts.
101
 
        :param new_file: Path to the output file with diff3 markers
102
 
        :param this_path: Path to the file text for the THIS tree
103
 
        :param base_path: Path to the file text for the BASE tree
104
 
        :param other_path: Path to the file text for the OTHER tree
105
 
        """
106
 
        self.add_suffix(this_path, ".THIS")
107
 
        self.dump(base_lines, this_path+".BASE")
108
 
        self.dump(other_lines, this_path+".OTHER")
109
 
        os.rename(new_file, this_path)
110
 
        self.conflict("Diff3 conflict encountered in %s" % this_path)
111
 
 
112
 
    def new_contents_conflict(self, filename, other_contents):
113
 
        """Conflicting contents for newly added file."""
114
 
        self.copy(other_contents, filename + ".OTHER")
115
 
        self.conflict("Conflict in newly added file %s" % filename)
116
 
    
117
 
 
118
 
    def target_exists(self, entry, target, old_path):
119
 
        """Handle the case when the target file or dir exists"""
120
 
        moved_path = self.add_suffix(target, ".moved")
121
 
        self.conflict("Moved existing %s to %s" % (target, moved_path))
122
 
 
123
 
    def rmdir_non_empty(self, filename):
124
 
        """Handle the case where the dir to be removed still has contents"""
125
 
        self.conflict("Directory %s not removed because it is not empty"\
126
 
            % filename)
127
 
        return "skip"
128
 
 
129
 
    def finalize(self):
130
 
        if not self.ignore_zero:
131
 
            print "%d conflicts encountered.\n" % self.conflicts
132
 
            
133
 
def get_tree(treespec, temp_root, label, local_branch=None):
134
 
    location, revno = treespec
135
 
    branch = find_branch(location)
136
 
    if revno is None:
137
 
        revision = None
138
 
    elif revno == -1:
139
 
        revision = branch.last_patch()
140
 
    else:
141
 
        revision = branch.lookup_revision(revno)
142
 
    return branch, get_revid_tree(branch, revision, temp_root, label,
143
 
                                  local_branch)
144
 
 
145
 
def get_revid_tree(branch, revision, temp_root, label, local_branch):
146
 
    if revision is None:
147
 
        base_tree = branch.working_tree()
148
 
    else:
149
 
        if local_branch is not None:
150
 
            greedy_fetch(local_branch, branch, revision)
151
 
            base_tree = local_branch.revision_tree(revision)
152
 
        else:
153
 
            base_tree = branch.revision_tree(revision)
154
 
    temp_path = os.path.join(temp_root, label)
155
 
    os.mkdir(temp_path)
156
 
    return MergeTree(base_tree, temp_path)
157
 
 
158
 
 
159
 
def file_exists(tree, file_id):
160
 
    return tree.has_filename(tree.id2path(file_id))
161
 
    
162
 
 
163
 
class MergeTree(object):
164
 
    def __init__(self, tree, tempdir):
165
 
        object.__init__(self)
166
 
        if hasattr(tree, "basedir"):
167
 
            self.root = tree.basedir
168
 
        else:
169
 
            self.root = None
170
 
        self.tree = tree
171
 
        self.tempdir = tempdir
172
 
        os.mkdir(os.path.join(self.tempdir, "texts"))
173
 
        self.cached = {}
174
 
 
175
 
    def __iter__(self):
176
 
        return self.tree.__iter__()
177
 
 
178
 
    def __contains__(self, file_id):
179
 
        return file_id in self.tree
180
 
 
181
 
    def get_file(self, file_id):
182
 
        return self.tree.get_file(file_id)
183
 
 
184
 
    def get_file_sha1(self, id):
185
 
        return self.tree.get_file_sha1(id)
186
 
 
187
 
    def id2path(self, file_id):
188
 
        return self.tree.id2path(file_id)
189
 
 
190
 
    def has_id(self, file_id):
191
 
        return self.tree.has_id(file_id)
192
 
 
193
 
    def has_or_had_id(self, file_id):
194
 
        if file_id == self.tree.inventory.root.file_id:
195
 
            return True
196
 
        return self.tree.inventory.has_id(file_id)
197
 
 
198
 
    def readonly_path(self, id):
199
 
        if id not in self.tree:
200
 
            return None
201
 
        if self.root is not None:
202
 
            return self.tree.abspath(self.tree.id2path(id))
203
 
        else:
204
 
            if self.tree.inventory[id].kind in ("directory", "root_directory"):
205
 
                return self.tempdir
206
 
            if not self.cached.has_key(id):
207
 
                path = os.path.join(self.tempdir, "texts", id)
208
 
                outfile = file(path, "wb")
209
 
                outfile.write(self.tree.get_file(id).read())
210
 
                assert(os.path.exists(path))
211
 
                self.cached[id] = path
212
 
            return self.cached[id]
213
 
 
214
 
 
215
 
 
216
 
def merge(other_revision, base_revision,
217
 
          check_clean=True, ignore_zero=False,
218
 
          this_dir=None, backup_files=False, merge_type=ApplyMerge3,
219
 
          file_list=None):
220
 
    """Merge changes into a tree.
221
 
 
222
 
    base_revision
223
 
        Base for three-way merge.
224
 
    other_revision
225
 
        Other revision for three-way merge.
226
 
    this_dir
227
 
        Directory to merge changes into; '.' by default.
228
 
    check_clean
229
 
        If true, this_dir must have no uncommitted changes before the
230
 
        merge begins.
231
 
    all available ancestors of other_revision and base_revision are
232
 
    automatically pulled into the branch.
233
 
    """
234
 
    from bzrlib.revision import common_ancestor, MultipleRevisionSources
235
 
    from bzrlib.errors import NoSuchRevision
236
 
    tempdir = tempfile.mkdtemp(prefix="bzr-")
237
 
    try:
238
 
        if this_dir is None:
239
 
            this_dir = '.'
240
 
        this_branch = find_branch(this_dir)
241
 
        this_rev_id = this_branch.last_patch()
242
 
        if this_rev_id is None:
243
 
            raise BzrCommandError("This branch has no commits")
244
 
        if check_clean:
245
 
            changes = compare_trees(this_branch.working_tree(), 
246
 
                                    this_branch.basis_tree(), False)
247
 
            if changes.has_changed():
248
 
                raise BzrCommandError("Working tree has uncommitted changes.")
249
 
        other_branch, other_tree = get_tree(other_revision, tempdir, "other",
250
 
                                            this_branch)
251
 
        if other_revision[1] == -1:
252
 
            other_rev_id = other_branch.last_patch()
253
 
            other_basis = other_rev_id
254
 
        elif other_revision[1] is not None:
255
 
            other_rev_id = other_branch.lookup_revision(other_revision[1])
256
 
            other_basis = other_rev_id
257
 
        else:
258
 
            other_rev_id = None
259
 
            other_basis = other_branch.last_patch()
260
 
        if base_revision == [None, None]:
261
 
            if other_revision[1] == -1:
262
 
                o_revno = None
263
 
            else:
264
 
                o_revno = other_revision[1]
265
 
                raise UnrelatedBranches()
266
 
            try:
267
 
                base_revision = this_branch.get_revision(base_rev_id)
268
 
                base_branch = this_branch
269
 
            except NoSuchRevision:
270
 
                base_branch = other_branch
271
 
            base_tree = get_revid_tree(base_branch, base_rev_id, tempdir, 
272
 
                                       "base")
273
 
            base_is_ancestor = True
274
 
        else:
275
 
            base_branch, base_tree = get_tree(base_revision, tempdir, "base")
276
 
            if base_revision[1] == -1:
277
 
                base_rev_id = base_branch.last_patch()
278
 
            elif base_revision[1] is None:
279
 
                base_rev_id = None
280
 
            else:
281
 
                base_rev_id = base_branch.lookup_revision(base_revision[1])
282
 
            if base_rev_id is not None:
283
 
                base_is_ancestor = is_ancestor(this_rev_id, base_rev_id, 
284
 
                                               MultipleRevisionSources(this_branch, 
285
 
                                                                       base_branch))
286
 
            else:
287
 
                base_is_ancestor = False
288
 
        if file_list is None:
289
 
            interesting_ids = None
290
 
        else:
291
 
            interesting_ids = set()
292
 
            this_tree = this_branch.working_tree()
293
 
            for fname in file_list:
294
 
                path = this_branch.relpath(fname)
295
 
                found_id = False
296
 
                for tree in (this_tree, base_tree.tree, other_tree.tree):
297
 
                    file_id = tree.inventory.path2id(path)
298
 
                    if file_id is not None:
299
 
                        interesting_ids.add(file_id)
300
 
                        found_id = True
301
 
                if not found_id:
302
 
                    raise BzrCommandError("%s is not a source file in any"
303
 
                                          " tree." % fname)
304
 
        merge_inner(this_branch, other_tree, base_tree, tempdir, 
305
 
                    ignore_zero=ignore_zero, backup_files=backup_files, 
306
 
                    merge_type=merge_type, interesting_ids=interesting_ids)
307
 
        if base_is_ancestor and other_rev_id is not None:
308
 
            this_branch.add_pending_merge(other_rev_id)
309
 
    finally:
310
 
        shutil.rmtree(tempdir)
311
 
 
312
 
 
313
 
def set_interesting(inventory_a, inventory_b, interesting_ids):
314
 
    """Mark files whose ids are in interesting_ids as interesting
315
 
    """
316
 
    for inventory in (inventory_a, inventory_b):
317
 
        for path, source_file in inventory.iteritems():
318
 
             source_file.interesting = source_file.id in interesting_ids
319
 
 
320
 
 
321
 
def generate_cset_optimized(tree_a, tree_b, interesting_ids=None):
322
 
    """Generate a changeset.  If interesting_ids is supplied, only changes
323
 
    to those files will be shown.  Metadata changes are stripped.
324
 
    """ 
325
 
    cset =  generate_changeset(tree_a, tree_b, interesting_ids)
326
 
    for entry in cset.entries.itervalues():
327
 
        entry.metadata_change = None
328
 
    return cset
329
 
 
330
 
 
331
 
def merge_inner(this_branch, other_tree, base_tree, tempdir, 
332
 
                ignore_zero=False, merge_type=ApplyMerge3, backup_files=False,
333
 
                interesting_ids=None):
334
 
 
335
 
    def merge_factory(file_id, base, other):
336
 
        contents_change = merge_type(file_id, base, other)
337
 
        if backup_files:
338
 
            contents_change = BackupBeforeChange(contents_change)
339
 
        return contents_change
340
 
 
341
 
    this_tree = get_tree((this_branch.base, None), tempdir, "this")[1]
342
 
 
343
 
    def get_inventory(tree):
344
 
        return tree.tree.inventory
345
 
 
346
 
    inv_changes = merge_flex(this_tree, base_tree, other_tree,
347
 
                             generate_cset_optimized, get_inventory,
348
 
                             MergeConflictHandler(base_tree.root,
349
 
                                                  ignore_zero=ignore_zero),
350
 
                             merge_factory=merge_factory, 
351
 
                             interesting_ids=interesting_ids)
352
 
 
353
 
    adjust_ids = []
354
 
    for id, path in inv_changes.iteritems():
355
 
        if path is not None:
356
 
            if path == '.':
357
 
                path = ''
358
 
            else:
359
 
                assert path.startswith('./'), "path is %s" % path
360
 
            path = path[2:]
361
 
        adjust_ids.append((path, id))
362
 
    if len(adjust_ids) > 0:
363
 
        this_branch.set_inventory(regen_inventory(this_branch, this_tree.root,
364
 
                                                  adjust_ids))
365
 
 
366
 
 
367
 
def regen_inventory(this_branch, root, new_entries):
368
 
    old_entries = this_branch.read_working_inventory()
369
 
    new_inventory = {}
370
 
    by_path = {}
371
 
    new_entries_map = {} 
372
 
    for path, file_id in new_entries:
373
 
        if path is None:
374
 
            continue
375
 
        new_entries_map[file_id] = path
376
 
 
377
 
    def id2path(file_id):
378
 
        path = new_entries_map.get(file_id)
379
 
        if path is not None:
380
 
            return path
381
 
        entry = old_entries[file_id]
382
 
        if entry.parent_id is None:
383
 
            return entry.name
384
 
        return os.path.join(id2path(entry.parent_id), entry.name)
385
 
        
386
 
    for file_id in old_entries:
387
 
        entry = old_entries[file_id]
388
 
        path = id2path(file_id)
389
 
        new_inventory[file_id] = (path, file_id, entry.parent_id, entry.kind)
390
 
        by_path[path] = file_id
391
 
    
392
 
    deletions = 0
393
 
    insertions = 0
394
 
    new_path_list = []
395
 
    for path, file_id in new_entries:
396
 
        if path is None:
397
 
            del new_inventory[file_id]
398
 
            deletions += 1
399
 
        else:
400
 
            new_path_list.append((path, file_id))
401
 
            if file_id not in old_entries:
402
 
                insertions += 1
403
 
    # Ensure no file is added before its parent
404
 
    new_path_list.sort()
405
 
    for path, file_id in new_path_list:
406
 
        if path == '':
407
 
            parent = None
408
 
        else:
409
 
            parent = by_path[os.path.dirname(path)]
410
 
        kind = bzrlib.osutils.file_kind(os.path.join(root, path))
411
 
        new_inventory[file_id] = (path, file_id, parent, kind)
412
 
        by_path[path] = file_id 
413
 
 
414
 
    # Get a list in insertion order
415
 
    new_inventory_list = new_inventory.values()
416
 
    mutter ("""Inventory regeneration:
417
 
old length: %i insertions: %i deletions: %i new_length: %i"""\
418
 
        % (len(old_entries), insertions, deletions, len(new_inventory_list)))
419
 
    assert len(new_inventory_list) == len(old_entries) + insertions - deletions
420
 
    new_inventory_list.sort()
421
 
    return new_inventory_list
422
 
 
423
 
merge_types = {     "merge3": (ApplyMerge3, "Native diff3-style merge"), 
424
 
                     "diff3": (Diff3Merge,  "Merge using external diff3")
425
 
              }
426