~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/merge.py

[merge] from aaron

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# Copyright (C) 2005 Canonical Ltd
 
2
 
 
3
# This program is free software; you can redistribute it and/or modify
 
4
# it under the terms of the GNU General Public License as published by
 
5
# the Free Software Foundation; either version 2 of the License, or
 
6
# (at your option) any later version.
 
7
 
 
8
# This program is distributed in the hope that it will be useful,
 
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
11
# GNU General Public License for more details.
 
12
 
 
13
# You should have received a copy of the GNU General Public License
 
14
# along with this program; if not, write to the Free Software
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
16
 
 
17
 
 
18
import os
 
19
import tempfile
 
20
import shutil
 
21
import errno
 
22
 
 
23
import bzrlib.osutils
 
24
import bzrlib.revision
 
25
from bzrlib.merge_core import merge_flex, ApplyMerge3, BackupBeforeChange
 
26
from bzrlib.changeset import generate_changeset, ExceptionConflictHandler
 
27
from bzrlib.changeset import Inventory, Diff3Merge, ReplaceContents
 
28
from bzrlib.branch import Branch
 
29
from bzrlib.errors import BzrCommandError, UnrelatedBranches, NoCommonAncestor
 
30
from bzrlib.errors import NoCommits
 
31
from bzrlib.delta import compare_trees
 
32
from bzrlib.trace import mutter, warning, note
 
33
from bzrlib.fetch import greedy_fetch, fetch
 
34
from bzrlib.revision import is_ancestor
 
35
from bzrlib.osutils import rename
 
36
from bzrlib.revision import common_ancestor, MultipleRevisionSources
 
37
from bzrlib.errors import NoSuchRevision
 
38
 
 
39
# TODO: build_working_dir can be built on something simpler than merge()
 
40
 
 
41
# FIXME: merge() parameters seem oriented towards the command line
 
42
# NOTABUG: merge is a helper for commandline functions.  merge_inner is the
 
43
#          the core functionality.
 
44
 
 
45
# comments from abentley on irc: merge happens in two stages, each
 
46
# of which generates a changeset object
 
47
 
 
48
# stage 1: generate OLD->OTHER,
 
49
# stage 2: use MINE and OLD->OTHER to generate MINE -> RESULT
 
50
 
 
51
class MergeConflictHandler(ExceptionConflictHandler):
 
52
    """Handle conflicts encountered while merging.
 
53
 
 
54
    This subclasses ExceptionConflictHandler, so that any types of
 
55
    conflict that are not explicitly handled cause an exception and
 
56
    terminate the merge.
 
57
    """
 
58
    def __init__(self, this_tree, base_tree, other_tree, ignore_zero=False):
 
59
        ExceptionConflictHandler.__init__(self)
 
60
        self.conflicts = 0
 
61
        self.ignore_zero = ignore_zero
 
62
        self.this_tree = this_tree
 
63
        self.base_tree = base_tree
 
64
        self.other_tree = other_tree
 
65
 
 
66
    def copy(self, source, dest):
 
67
        """Copy the text and mode of a file
 
68
        :param source: The path of the file to copy
 
69
        :param dest: The distination file to create
 
70
        """
 
71
        s_file = file(source, "rb")
 
72
        d_file = file(dest, "wb")
 
73
        for line in s_file:
 
74
            d_file.write(line)
 
75
        os.chmod(dest, 0777 & os.stat(source).st_mode)
 
76
 
 
77
    def dump(self, lines, dest):
 
78
        """Copy the text and mode of a file
 
79
        :param source: The path of the file to copy
 
80
        :param dest: The distination file to create
 
81
        """
 
82
        d_file = file(dest, "wb")
 
83
        for line in lines:
 
84
            d_file.write(line)
 
85
 
 
86
    def add_suffix(self, name, suffix, last_new_name=None):
 
87
        """Rename a file to append a suffix.  If the new name exists, the
 
88
        suffix is added repeatedly until a non-existant name is found
 
89
 
 
90
        :param name: The path of the file
 
91
        :param suffix: The suffix to append
 
92
        :param last_new_name: (used for recursive calls) the last name tried
 
93
        """
 
94
        if last_new_name is None:
 
95
            last_new_name = name
 
96
        new_name = last_new_name+suffix
 
97
        try:
 
98
            rename(name, new_name)
 
99
            return new_name
 
100
        except OSError, e:
 
101
            if e.errno != errno.EEXIST and e.errno != errno.ENOTEMPTY:
 
102
                raise
 
103
            return self.add_suffix(name, suffix, last_new_name=new_name)
 
104
 
 
105
    def conflict(self, text):
 
106
        warning(text)
 
107
        self.conflicts += 1
 
108
        
 
109
 
 
110
    def merge_conflict(self, new_file, this_path, base_lines, other_lines):
 
111
        """
 
112
        Handle diff3 conflicts by producing a .THIS, .BASE and .OTHER.  The
 
113
        main file will be a version with diff3 conflicts.
 
114
        :param new_file: Path to the output file with diff3 markers
 
115
        :param this_path: Path to the file text for the THIS tree
 
116
        :param base_path: Path to the file text for the BASE tree
 
117
        :param other_path: Path to the file text for the OTHER tree
 
118
        """
 
119
        self.add_suffix(this_path, ".THIS")
 
120
        self.dump(base_lines, this_path+".BASE")
 
121
        self.dump(other_lines, this_path+".OTHER")
 
122
        rename(new_file, this_path)
 
123
        self.conflict("Diff3 conflict encountered in %s" % this_path)
 
124
 
 
125
    def new_contents_conflict(self, filename, other_contents):
 
126
        """Conflicting contents for newly added file."""
 
127
        other.contents.apply(filename + ".OTHER")
 
128
        self.conflict("Conflict in newly added file %s" % filename)
 
129
    
 
130
 
 
131
    def target_exists(self, entry, target, old_path):
 
132
        """Handle the case when the target file or dir exists"""
 
133
        moved_path = self.add_suffix(target, ".moved")
 
134
        self.conflict("Moved existing %s to %s" % (target, moved_path))
 
135
 
 
136
    def rmdir_non_empty(self, filename):
 
137
        """Handle the case where the dir to be removed still has contents"""
 
138
        self.conflict("Directory %s not removed because it is not empty"\
 
139
            % filename)
 
140
        return "skip"
 
141
 
 
142
    def rem_contents_conflict(self, filename, this_contents, base_contents):
 
143
        base_contents(filename+".BASE", self, False)
 
144
        this_contents(filename+".THIS", self, False)
 
145
        return ReplaceContents(this_contents, None)
 
146
 
 
147
    def rem_contents_conflict(self, filename, this_contents, base_contents):
 
148
        base_contents(filename+".BASE", self, False)
 
149
        this_contents(filename+".THIS", self, False)
 
150
        self.conflict("Other branch deleted locally modified file %s" %
 
151
                      filename)
 
152
        return ReplaceContents(this_contents, None)
 
153
 
 
154
    def abs_this_path(self, file_id):
 
155
        """Return the absolute path for a file_id in the this tree."""
 
156
        return self.this_tree.id2abspath(file_id)
 
157
 
 
158
    def add_missing_parents(self, file_id, tree):
 
159
        """If some of the parents for file_id are missing, add them."""
 
160
        entry = tree.inventory[file_id]
 
161
        if entry.parent_id not in self.this_tree:
 
162
            return self.create_all_missing(entry.parent_id, tree)
 
163
        else:
 
164
            return self.abs_this_path(entry.parent_id)
 
165
 
 
166
    def create_all_missing(self, file_id, tree):
 
167
        """Add contents for a file_id and all its parents to a tree."""
 
168
        entry = tree.inventory[file_id]
 
169
        if entry.parent_id is not None and entry.parent_id not in self.this_tree:
 
170
            abspath = self.create_all_missing(entry.parent_id, tree)
 
171
        else:
 
172
            abspath = self.abs_this_path(entry.parent_id)
 
173
        entry_path = os.path.join(abspath, entry.name)
 
174
        if not os.path.isdir(entry_path):
 
175
            self.create(file_id, entry_path, tree)
 
176
        return entry_path
 
177
 
 
178
    def create(self, file_id, path, tree, reverse=False):
 
179
        """Uses tree data to create a filesystem object for the file_id"""
 
180
        from changeset import get_contents
 
181
        get_contents(tree, file_id)(path, self, reverse)
 
182
 
 
183
    def missing_for_merge(self, file_id, other_path):
 
184
        """The file_id doesn't exist in THIS, but does in OTHER and BASE"""
 
185
        self.conflict("Other branch modified locally deleted file %s" %
 
186
                      other_path)
 
187
        parent_dir = self.add_missing_parents(file_id, self.other_tree)
 
188
        stem = os.path.join(parent_dir, os.path.basename(other_path))
 
189
        self.create(file_id, stem+".OTHER", self.other_tree)
 
190
        self.create(file_id, stem+".BASE", self.base_tree)
 
191
 
 
192
    def threeway_contents_conflict(filename, this_contents, base_contents,
 
193
                                   other_contents):
 
194
        self.conflict("Three-way conflict merging %s" % filename)
 
195
 
 
196
    def finalize(self):
 
197
        if not self.ignore_zero:
 
198
            note("%d conflicts encountered.\n" % self.conflicts)
 
199
            
 
200
def get_tree(treespec, local_branch=None):
 
201
    location, revno = treespec
 
202
    branch = Branch.open_containing(location)
 
203
    if revno is None:
 
204
        revision = None
 
205
    elif revno == -1:
 
206
        revision = branch.last_revision()
 
207
    else:
 
208
        revision = branch.get_rev_id(revno)
 
209
    return branch, get_revid_tree(branch, revision, local_branch)
 
210
 
 
211
def get_revid_tree(branch, revision, local_branch):
 
212
    if revision is None:
 
213
        base_tree = branch.working_tree()
 
214
    else:
 
215
        if local_branch is not None:
 
216
            greedy_fetch(local_branch, branch, revision)
 
217
            base_tree = local_branch.revision_tree(revision)
 
218
        else:
 
219
            base_tree = branch.revision_tree(revision)
 
220
    return base_tree
 
221
 
 
222
 
 
223
def file_exists(tree, file_id):
 
224
    return tree.has_filename(tree.id2path(file_id))
 
225
    
 
226
 
 
227
def build_working_dir(to_dir):
 
228
    """Build a working directory in an empty directory.
 
229
 
 
230
    to_dir is a directory containing branch metadata but no working files,
 
231
    typically constructed by cloning an existing branch. 
 
232
 
 
233
    This is split out as a special idiomatic case of merge.  It could
 
234
    eventually be done by just building the tree directly calling into 
 
235
    lower-level code (e.g. constructing a changeset).
 
236
    """
 
237
    merge((to_dir, -1), (to_dir, 0), this_dir=to_dir,
 
238
          check_clean=False, ignore_zero=True)
 
239
 
 
240
 
 
241
def merge(other_revision, base_revision,
 
242
          check_clean=True, ignore_zero=False,
 
243
          this_dir=None, backup_files=False, merge_type=ApplyMerge3,
 
244
          file_list=None):
 
245
    """Merge changes into a tree.
 
246
 
 
247
    base_revision
 
248
        tuple(path, revision) Base for three-way merge.
 
249
    other_revision
 
250
        tuple(path, revision) Other revision for three-way merge.
 
251
    this_dir
 
252
        Directory to merge changes into; '.' by default.
 
253
    check_clean
 
254
        If true, this_dir must have no uncommitted changes before the
 
255
        merge begins.
 
256
    ignore_zero - If true, suppress the "zero conflicts" message when 
 
257
        there are no conflicts; should be set when doing something we expect
 
258
        to complete perfectly.
 
259
 
 
260
    All available ancestors of other_revision and base_revision are
 
261
    automatically pulled into the branch.
 
262
    """
 
263
    tempdir = tempfile.mkdtemp(prefix="bzr-")
 
264
    try:
 
265
        if this_dir is None:
 
266
            this_dir = '.'
 
267
        this_branch = Branch.open_containing(this_dir)
 
268
        this_rev_id = this_branch.last_revision()
 
269
        if this_rev_id is None:
 
270
            raise BzrCommandError("This branch has no commits")
 
271
        if check_clean:
 
272
            changes = compare_trees(this_branch.working_tree(), 
 
273
                                    this_branch.basis_tree(), False)
 
274
            if changes.has_changed():
 
275
                raise BzrCommandError("Working tree has uncommitted changes.")
 
276
        other_branch, other_tree = get_tree(other_revision, this_branch)
 
277
        if other_revision[1] == -1:
 
278
            other_rev_id = other_branch.last_revision()
 
279
            if other_rev_id is None:
 
280
                raise NoCommits(other_branch)
 
281
            other_basis = other_rev_id
 
282
        elif other_revision[1] is not None:
 
283
            other_rev_id = other_branch.get_rev_id(other_revision[1])
 
284
            other_basis = other_rev_id
 
285
        else:
 
286
            other_rev_id = None
 
287
            other_basis = other_branch.last_revision()
 
288
            if other_basis is None:
 
289
                raise NoCommits(other_branch)
 
290
        if base_revision == [None, None]:
 
291
            try:
 
292
                base_rev_id = common_ancestor(this_rev_id, other_basis, 
 
293
                                              this_branch)
 
294
            except NoCommonAncestor:
 
295
                raise UnrelatedBranches()
 
296
            base_tree = get_revid_tree(this_branch, base_rev_id, None)
 
297
            base_is_ancestor = True
 
298
        else:
 
299
            base_branch, base_tree = get_tree(base_revision)
 
300
            if base_revision[1] == -1:
 
301
                base_rev_id = base_branch.last_revision()
 
302
            elif base_revision[1] is None:
 
303
                base_rev_id = None
 
304
            else:
 
305
                base_rev_id = base_branch.get_rev_id(base_revision[1])
 
306
            fetch(from_branch=base_branch, to_branch=this_branch)
 
307
            base_is_ancestor = is_ancestor(this_rev_id, base_rev_id,
 
308
                                           this_branch)
 
309
        if file_list is None:
 
310
            interesting_ids = None
 
311
        else:
 
312
            interesting_ids = set()
 
313
            this_tree = this_branch.working_tree()
 
314
            for fname in file_list:
 
315
                path = this_tree.relpath(fname)
 
316
                found_id = False
 
317
                for tree in (this_tree, base_tree, other_tree):
 
318
                    file_id = tree.inventory.path2id(path)
 
319
                    if file_id is not None:
 
320
                        interesting_ids.add(file_id)
 
321
                        found_id = True
 
322
                if not found_id:
 
323
                    raise BzrCommandError("%s is not a source file in any"
 
324
                                          " tree." % fname)
 
325
        merge_inner(this_branch, other_tree, base_tree, tempdir, 
 
326
                    ignore_zero=ignore_zero, backup_files=backup_files, 
 
327
                    merge_type=merge_type, interesting_ids=interesting_ids)
 
328
        if base_is_ancestor and other_rev_id is not None\
 
329
            and other_rev_id not in this_branch.revision_history():
 
330
            this_branch.add_pending_merge(other_rev_id)
 
331
    finally:
 
332
        shutil.rmtree(tempdir)
 
333
 
 
334
 
 
335
def set_interesting(inventory_a, inventory_b, interesting_ids):
 
336
    """Mark files whose ids are in interesting_ids as interesting
 
337
    """
 
338
    for inventory in (inventory_a, inventory_b):
 
339
        for path, source_file in inventory.iteritems():
 
340
             source_file.interesting = source_file.id in interesting_ids
 
341
 
 
342
 
 
343
def merge_inner(this_branch, other_tree, base_tree, tempdir, 
 
344
                ignore_zero=False, merge_type=ApplyMerge3, backup_files=False,
 
345
                interesting_ids=None):
 
346
 
 
347
    def merge_factory(file_id, base, other):
 
348
        contents_change = merge_type(file_id, base, other)
 
349
        if backup_files:
 
350
            contents_change = BackupBeforeChange(contents_change)
 
351
        return contents_change
 
352
 
 
353
    this_tree = get_tree((this_branch.base, None))[1]
 
354
 
 
355
    def get_inventory(tree):
 
356
        return tree.inventory
 
357
 
 
358
    inv_changes = merge_flex(this_tree, base_tree, other_tree,
 
359
                             generate_changeset, get_inventory,
 
360
                             MergeConflictHandler(this_tree, base_tree,
 
361
                             other_tree, ignore_zero=ignore_zero),
 
362
                             merge_factory=merge_factory, 
 
363
                             interesting_ids=interesting_ids)
 
364
 
 
365
    adjust_ids = []
 
366
    for id, path in inv_changes.iteritems():
 
367
        if path is not None:
 
368
            if path == '.':
 
369
                path = ''
 
370
            else:
 
371
                assert path.startswith('.' + os.sep), "path is %s" % path
 
372
            path = path[2:]
 
373
        adjust_ids.append((path, id))
 
374
    if len(adjust_ids) > 0:
 
375
        this_branch.set_inventory(regen_inventory(this_branch, 
 
376
                                                  this_tree.basedir,
 
377
                                                  adjust_ids))
 
378
 
 
379
 
 
380
def regen_inventory(this_branch, root, new_entries):
 
381
    old_entries = this_branch.read_working_inventory()
 
382
    new_inventory = {}
 
383
    by_path = {}
 
384
    new_entries_map = {} 
 
385
    for path, file_id in new_entries:
 
386
        if path is None:
 
387
            continue
 
388
        new_entries_map[file_id] = path
 
389
 
 
390
    def id2path(file_id):
 
391
        path = new_entries_map.get(file_id)
 
392
        if path is not None:
 
393
            return path
 
394
        entry = old_entries[file_id]
 
395
        if entry.parent_id is None:
 
396
            return entry.name
 
397
        return os.path.join(id2path(entry.parent_id), entry.name)
 
398
        
 
399
    for file_id in old_entries:
 
400
        entry = old_entries[file_id]
 
401
        path = id2path(file_id)
 
402
        new_inventory[file_id] = (path, file_id, entry.parent_id, entry.kind)
 
403
        by_path[path] = file_id
 
404
    
 
405
    deletions = 0
 
406
    insertions = 0
 
407
    new_path_list = []
 
408
    for path, file_id in new_entries:
 
409
        if path is None:
 
410
            del new_inventory[file_id]
 
411
            deletions += 1
 
412
        else:
 
413
            new_path_list.append((path, file_id))
 
414
            if file_id not in old_entries:
 
415
                insertions += 1
 
416
    # Ensure no file is added before its parent
 
417
    new_path_list.sort()
 
418
    for path, file_id in new_path_list:
 
419
        if path == '':
 
420
            parent = None
 
421
        else:
 
422
            parent = by_path[os.path.dirname(path)]
 
423
        kind = bzrlib.osutils.file_kind(os.path.join(root, path))
 
424
        new_inventory[file_id] = (path, file_id, parent, kind)
 
425
        by_path[path] = file_id 
 
426
 
 
427
    # Get a list in insertion order
 
428
    new_inventory_list = new_inventory.values()
 
429
    mutter ("""Inventory regeneration:
 
430
old length: %i insertions: %i deletions: %i new_length: %i"""\
 
431
        % (len(old_entries), insertions, deletions, len(new_inventory_list)))
 
432
    assert len(new_inventory_list) == len(old_entries) + insertions - deletions
 
433
    new_inventory_list.sort()
 
434
    return new_inventory_list
 
435
 
 
436
merge_types = {     "merge3": (ApplyMerge3, "Native diff3-style merge"), 
 
437
                     "diff3": (Diff3Merge,  "Merge using external diff3")
 
438
              }
 
439