~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/merge.py

  • Committer: Martin Pool
  • Date: 2005-08-29 06:56:22 UTC
  • Revision ID: mbp@sourcefrog.net-20050829065622-5aa7add87c38f188
- additional trace messages for plugins

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# Copyright (C) 2005 Canonical Ltd
 
2
 
 
3
# This program is free software; you can redistribute it and/or modify
 
4
# it under the terms of the GNU General Public License as published by
 
5
# the Free Software Foundation; either version 2 of the License, or
 
6
# (at your option) any later version.
 
7
 
 
8
# This program is distributed in the hope that it will be useful,
 
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
11
# GNU General Public License for more details.
 
12
 
 
13
# You should have received a copy of the GNU General Public License
 
14
# along with this program; if not, write to the Free Software
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
16
 
 
17
 
 
18
import os.path
 
19
import tempfile
 
20
import shutil
 
21
import errno
 
22
 
 
23
import bzrlib.osutils
 
24
import bzrlib.revision
 
25
from bzrlib.merge_core import merge_flex, ApplyMerge3, BackupBeforeChange
 
26
from bzrlib.changeset import generate_changeset, ExceptionConflictHandler
 
27
from bzrlib.changeset import Inventory, Diff3Merge
 
28
from bzrlib.branch import find_branch
 
29
from bzrlib.errors import BzrCommandError, UnrelatedBranches
 
30
from bzrlib.delta import compare_trees
 
31
from bzrlib.trace import mutter, warning
 
32
from bzrlib.fetch import greedy_fetch
 
33
from bzrlib.revision import is_ancestor
 
34
 
 
35
# comments from abentley on irc: merge happens in two stages, each
 
36
# of which generates a changeset object
 
37
 
 
38
# stage 1: generate OLD->OTHER,
 
39
# stage 2: use MINE and OLD->OTHER to generate MINE -> RESULT
 
40
 
 
41
class MergeConflictHandler(ExceptionConflictHandler):
 
42
    """Handle conflicts encountered while merging.
 
43
 
 
44
    This subclasses ExceptionConflictHandler, so that any types of
 
45
    conflict that are not explicitly handled cause an exception and
 
46
    terminate the merge.
 
47
    """
 
48
    def __init__(self, dir, ignore_zero=False):
 
49
        ExceptionConflictHandler.__init__(self, dir)
 
50
        self.conflicts = 0
 
51
        self.ignore_zero = ignore_zero
 
52
 
 
53
    def copy(self, source, dest):
 
54
        """Copy the text and mode of a file
 
55
        :param source: The path of the file to copy
 
56
        :param dest: The distination file to create
 
57
        """
 
58
        s_file = file(source, "rb")
 
59
        d_file = file(dest, "wb")
 
60
        for line in s_file:
 
61
            d_file.write(line)
 
62
        os.chmod(dest, 0777 & os.stat(source).st_mode)
 
63
 
 
64
    def dump(self, lines, dest):
 
65
        """Copy the text and mode of a file
 
66
        :param source: The path of the file to copy
 
67
        :param dest: The distination file to create
 
68
        """
 
69
        d_file = file(dest, "wb")
 
70
        for line in lines:
 
71
            d_file.write(line)
 
72
 
 
73
    def add_suffix(self, name, suffix, last_new_name=None):
 
74
        """Rename a file to append a suffix.  If the new name exists, the
 
75
        suffix is added repeatedly until a non-existant name is found
 
76
 
 
77
        :param name: The path of the file
 
78
        :param suffix: The suffix to append
 
79
        :param last_new_name: (used for recursive calls) the last name tried
 
80
        """
 
81
        if last_new_name is None:
 
82
            last_new_name = name
 
83
        new_name = last_new_name+suffix
 
84
        try:
 
85
            os.rename(name, new_name)
 
86
            return new_name
 
87
        except OSError, e:
 
88
            if e.errno != errno.EEXIST and e.errno != errno.ENOTEMPTY:
 
89
                raise
 
90
            return self.add_suffix(name, suffix, last_new_name=new_name)
 
91
 
 
92
    def conflict(self, text):
 
93
        warning(text)
 
94
        self.conflicts += 1
 
95
        
 
96
 
 
97
    def merge_conflict(self, new_file, this_path, base_lines, other_lines):
 
98
        """
 
99
        Handle diff3 conflicts by producing a .THIS, .BASE and .OTHER.  The
 
100
        main file will be a version with diff3 conflicts.
 
101
        :param new_file: Path to the output file with diff3 markers
 
102
        :param this_path: Path to the file text for the THIS tree
 
103
        :param base_path: Path to the file text for the BASE tree
 
104
        :param other_path: Path to the file text for the OTHER tree
 
105
        """
 
106
        self.add_suffix(this_path, ".THIS")
 
107
        self.dump(base_lines, this_path+".BASE")
 
108
        self.dump(other_lines, this_path+".OTHER")
 
109
        os.rename(new_file, this_path)
 
110
        self.conflict("Diff3 conflict encountered in %s" % this_path)
 
111
 
 
112
    def new_contents_conflict(self, filename, other_contents):
 
113
        """Conflicting contents for newly added file."""
 
114
        self.copy(other_contents, filename + ".OTHER")
 
115
        self.conflict("Conflict in newly added file %s" % filename)
 
116
    
 
117
 
 
118
    def target_exists(self, entry, target, old_path):
 
119
        """Handle the case when the target file or dir exists"""
 
120
        moved_path = self.add_suffix(target, ".moved")
 
121
        self.conflict("Moved existing %s to %s" % (target, moved_path))
 
122
 
 
123
    def rmdir_non_empty(self, filename):
 
124
        """Handle the case where the dir to be removed still has contents"""
 
125
        self.conflict("Directory %s not removed because it is not empty"\
 
126
            % filename)
 
127
        return "skip"
 
128
 
 
129
    def finalize(self):
 
130
        if not self.ignore_zero:
 
131
            print "%d conflicts encountered.\n" % self.conflicts
 
132
            
 
133
def get_tree(treespec, temp_root, label, local_branch=None):
 
134
    location, revno = treespec
 
135
    branch = find_branch(location)
 
136
    if revno is None:
 
137
        revision = None
 
138
    elif revno == -1:
 
139
        revision = branch.last_patch()
 
140
    else:
 
141
        revision = branch.lookup_revision(revno)
 
142
    return branch, get_revid_tree(branch, revision, temp_root, label,
 
143
                                  local_branch)
 
144
 
 
145
def get_revid_tree(branch, revision, temp_root, label, local_branch):
 
146
    if revision is None:
 
147
        base_tree = branch.working_tree()
 
148
    else:
 
149
        if local_branch is not None:
 
150
            greedy_fetch(local_branch, branch, revision)
 
151
            base_tree = local_branch.revision_tree(revision)
 
152
        else:
 
153
            base_tree = branch.revision_tree(revision)
 
154
    temp_path = os.path.join(temp_root, label)
 
155
    os.mkdir(temp_path)
 
156
    return MergeTree(base_tree, temp_path)
 
157
 
 
158
 
 
159
def file_exists(tree, file_id):
 
160
    return tree.has_filename(tree.id2path(file_id))
 
161
    
 
162
 
 
163
class MergeTree(object):
 
164
    def __init__(self, tree, tempdir):
 
165
        object.__init__(self)
 
166
        if hasattr(tree, "basedir"):
 
167
            self.root = tree.basedir
 
168
        else:
 
169
            self.root = None
 
170
        self.tree = tree
 
171
        self.tempdir = tempdir
 
172
        os.mkdir(os.path.join(self.tempdir, "texts"))
 
173
        self.cached = {}
 
174
 
 
175
    def __iter__(self):
 
176
        return self.tree.__iter__()
 
177
 
 
178
    def __contains__(self, file_id):
 
179
        return file_id in self.tree
 
180
 
 
181
    def get_file(self, file_id):
 
182
        return self.tree.get_file(file_id)
 
183
 
 
184
    def get_file_sha1(self, id):
 
185
        return self.tree.get_file_sha1(id)
 
186
 
 
187
    def id2path(self, file_id):
 
188
        return self.tree.id2path(file_id)
 
189
 
 
190
    def has_id(self, file_id):
 
191
        return self.tree.has_id(file_id)
 
192
 
 
193
    def has_or_had_id(self, file_id):
 
194
        if file_id == self.tree.inventory.root.file_id:
 
195
            return True
 
196
        return self.tree.inventory.has_id(file_id)
 
197
 
 
198
    def readonly_path(self, id):
 
199
        if id not in self.tree:
 
200
            return None
 
201
        if self.root is not None:
 
202
            return self.tree.abspath(self.tree.id2path(id))
 
203
        else:
 
204
            if self.tree.inventory[id].kind in ("directory", "root_directory"):
 
205
                return self.tempdir
 
206
            if not self.cached.has_key(id):
 
207
                path = os.path.join(self.tempdir, "texts", id)
 
208
                outfile = file(path, "wb")
 
209
                outfile.write(self.tree.get_file(id).read())
 
210
                assert(os.path.exists(path))
 
211
                self.cached[id] = path
 
212
            return self.cached[id]
 
213
 
 
214
 
 
215
 
 
216
def merge(other_revision, base_revision,
 
217
          check_clean=True, ignore_zero=False,
 
218
          this_dir=None, backup_files=False, merge_type=ApplyMerge3,
 
219
          file_list=None):
 
220
    """Merge changes into a tree.
 
221
 
 
222
    base_revision
 
223
        Base for three-way merge.
 
224
    other_revision
 
225
        Other revision for three-way merge.
 
226
    this_dir
 
227
        Directory to merge changes into; '.' by default.
 
228
    check_clean
 
229
        If true, this_dir must have no uncommitted changes before the
 
230
        merge begins.
 
231
    all available ancestors of other_revision and base_revision are
 
232
    automatically pulled into the branch.
 
233
    """
 
234
    from bzrlib.revision import common_ancestor, MultipleRevisionSources
 
235
    from bzrlib.errors import NoSuchRevision
 
236
    tempdir = tempfile.mkdtemp(prefix="bzr-")
 
237
    try:
 
238
        if this_dir is None:
 
239
            this_dir = '.'
 
240
        this_branch = find_branch(this_dir)
 
241
        this_rev_id = this_branch.last_patch()
 
242
        if this_rev_id is None:
 
243
            raise BzrCommandError("This branch has no commits")
 
244
        if check_clean:
 
245
            changes = compare_trees(this_branch.working_tree(), 
 
246
                                    this_branch.basis_tree(), False)
 
247
            if changes.has_changed():
 
248
                raise BzrCommandError("Working tree has uncommitted changes.")
 
249
        other_branch, other_tree = get_tree(other_revision, tempdir, "other",
 
250
                                            this_branch)
 
251
        if other_revision[1] == -1:
 
252
            other_rev_id = other_branch.last_patch()
 
253
            other_basis = other_rev_id
 
254
        elif other_revision[1] is not None:
 
255
            other_rev_id = other_branch.lookup_revision(other_revision[1])
 
256
            other_basis = other_rev_id
 
257
        else:
 
258
            other_rev_id = None
 
259
            other_basis = other_branch.last_patch()
 
260
        if base_revision == [None, None]:
 
261
            if other_revision[1] == -1:
 
262
                o_revno = None
 
263
            else:
 
264
                o_revno = other_revision[1]
 
265
                raise UnrelatedBranches()
 
266
            try:
 
267
                base_revision = this_branch.get_revision(base_rev_id)
 
268
                base_branch = this_branch
 
269
            except NoSuchRevision:
 
270
                base_branch = other_branch
 
271
            base_tree = get_revid_tree(base_branch, base_rev_id, tempdir, 
 
272
                                       "base")
 
273
            base_is_ancestor = True
 
274
        else:
 
275
            base_branch, base_tree = get_tree(base_revision, tempdir, "base")
 
276
            if base_revision[1] == -1:
 
277
                base_rev_id = base_branch.last_patch()
 
278
            elif base_revision[1] is None:
 
279
                base_rev_id = None
 
280
            else:
 
281
                base_rev_id = base_branch.lookup_revision(base_revision[1])
 
282
            if base_rev_id is not None:
 
283
                base_is_ancestor = is_ancestor(this_rev_id, base_rev_id, 
 
284
                                               MultipleRevisionSources(this_branch, 
 
285
                                                                       base_branch))
 
286
            else:
 
287
                base_is_ancestor = False
 
288
        if file_list is None:
 
289
            interesting_ids = None
 
290
        else:
 
291
            interesting_ids = set()
 
292
            this_tree = this_branch.working_tree()
 
293
            for fname in file_list:
 
294
                path = this_branch.relpath(fname)
 
295
                found_id = False
 
296
                for tree in (this_tree, base_tree.tree, other_tree.tree):
 
297
                    file_id = tree.inventory.path2id(path)
 
298
                    if file_id is not None:
 
299
                        interesting_ids.add(file_id)
 
300
                        found_id = True
 
301
                if not found_id:
 
302
                    raise BzrCommandError("%s is not a source file in any"
 
303
                                          " tree." % fname)
 
304
        merge_inner(this_branch, other_tree, base_tree, tempdir, 
 
305
                    ignore_zero=ignore_zero, backup_files=backup_files, 
 
306
                    merge_type=merge_type, interesting_ids=interesting_ids)
 
307
        if base_is_ancestor and other_rev_id is not None:
 
308
            this_branch.add_pending_merge(other_rev_id)
 
309
    finally:
 
310
        shutil.rmtree(tempdir)
 
311
 
 
312
 
 
313
def set_interesting(inventory_a, inventory_b, interesting_ids):
 
314
    """Mark files whose ids are in interesting_ids as interesting
 
315
    """
 
316
    for inventory in (inventory_a, inventory_b):
 
317
        for path, source_file in inventory.iteritems():
 
318
             source_file.interesting = source_file.id in interesting_ids
 
319
 
 
320
 
 
321
def generate_cset_optimized(tree_a, tree_b, interesting_ids=None):
 
322
    """Generate a changeset.  If interesting_ids is supplied, only changes
 
323
    to those files will be shown.  Metadata changes are stripped.
 
324
    """ 
 
325
    cset =  generate_changeset(tree_a, tree_b, interesting_ids)
 
326
    for entry in cset.entries.itervalues():
 
327
        entry.metadata_change = None
 
328
    return cset
 
329
 
 
330
 
 
331
def merge_inner(this_branch, other_tree, base_tree, tempdir, 
 
332
                ignore_zero=False, merge_type=ApplyMerge3, backup_files=False,
 
333
                interesting_ids=None):
 
334
 
 
335
    def merge_factory(file_id, base, other):
 
336
        contents_change = merge_type(file_id, base, other)
 
337
        if backup_files:
 
338
            contents_change = BackupBeforeChange(contents_change)
 
339
        return contents_change
 
340
 
 
341
    this_tree = get_tree((this_branch.base, None), tempdir, "this")[1]
 
342
 
 
343
    def get_inventory(tree):
 
344
        return tree.tree.inventory
 
345
 
 
346
    inv_changes = merge_flex(this_tree, base_tree, other_tree,
 
347
                             generate_cset_optimized, get_inventory,
 
348
                             MergeConflictHandler(base_tree.root,
 
349
                                                  ignore_zero=ignore_zero),
 
350
                             merge_factory=merge_factory, 
 
351
                             interesting_ids=interesting_ids)
 
352
 
 
353
    adjust_ids = []
 
354
    for id, path in inv_changes.iteritems():
 
355
        if path is not None:
 
356
            if path == '.':
 
357
                path = ''
 
358
            else:
 
359
                assert path.startswith('./'), "path is %s" % path
 
360
            path = path[2:]
 
361
        adjust_ids.append((path, id))
 
362
    if len(adjust_ids) > 0:
 
363
        this_branch.set_inventory(regen_inventory(this_branch, this_tree.root,
 
364
                                                  adjust_ids))
 
365
 
 
366
 
 
367
def regen_inventory(this_branch, root, new_entries):
 
368
    old_entries = this_branch.read_working_inventory()
 
369
    new_inventory = {}
 
370
    by_path = {}
 
371
    new_entries_map = {} 
 
372
    for path, file_id in new_entries:
 
373
        if path is None:
 
374
            continue
 
375
        new_entries_map[file_id] = path
 
376
 
 
377
    def id2path(file_id):
 
378
        path = new_entries_map.get(file_id)
 
379
        if path is not None:
 
380
            return path
 
381
        entry = old_entries[file_id]
 
382
        if entry.parent_id is None:
 
383
            return entry.name
 
384
        return os.path.join(id2path(entry.parent_id), entry.name)
 
385
        
 
386
    for file_id in old_entries:
 
387
        entry = old_entries[file_id]
 
388
        path = id2path(file_id)
 
389
        new_inventory[file_id] = (path, file_id, entry.parent_id, entry.kind)
 
390
        by_path[path] = file_id
 
391
    
 
392
    deletions = 0
 
393
    insertions = 0
 
394
    new_path_list = []
 
395
    for path, file_id in new_entries:
 
396
        if path is None:
 
397
            del new_inventory[file_id]
 
398
            deletions += 1
 
399
        else:
 
400
            new_path_list.append((path, file_id))
 
401
            if file_id not in old_entries:
 
402
                insertions += 1
 
403
    # Ensure no file is added before its parent
 
404
    new_path_list.sort()
 
405
    for path, file_id in new_path_list:
 
406
        if path == '':
 
407
            parent = None
 
408
        else:
 
409
            parent = by_path[os.path.dirname(path)]
 
410
        kind = bzrlib.osutils.file_kind(os.path.join(root, path))
 
411
        new_inventory[file_id] = (path, file_id, parent, kind)
 
412
        by_path[path] = file_id 
 
413
 
 
414
    # Get a list in insertion order
 
415
    new_inventory_list = new_inventory.values()
 
416
    mutter ("""Inventory regeneration:
 
417
old length: %i insertions: %i deletions: %i new_length: %i"""\
 
418
        % (len(old_entries), insertions, deletions, len(new_inventory_list)))
 
419
    assert len(new_inventory_list) == len(old_entries) + insertions - deletions
 
420
    new_inventory_list.sort()
 
421
    return new_inventory_list
 
422
 
 
423
merge_types = {     "merge3": (ApplyMerge3, "Native diff3-style merge"), 
 
424
                     "diff3": (Diff3Merge,  "Merge using external diff3")
 
425
              }
 
426