~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/merge.py

  • Committer: Robert Collins
  • Date: 2005-10-10 23:18:27 UTC
  • mfrom: (1437)
  • mto: This revision was merged to the branch mainline in revision 1438.
  • Revision ID: robertc@robertcollins.net-20051010231827-f9e2dda2e92bf565
mergeĀ fromĀ upstream

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# Copyright (C) 2005 Canonical Ltd
 
2
 
 
3
# This program is free software; you can redistribute it and/or modify
 
4
# it under the terms of the GNU General Public License as published by
 
5
# the Free Software Foundation; either version 2 of the License, or
 
6
# (at your option) any later version.
 
7
 
 
8
# This program is distributed in the hope that it will be useful,
 
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
11
# GNU General Public License for more details.
 
12
 
 
13
# You should have received a copy of the GNU General Public License
 
14
# along with this program; if not, write to the Free Software
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
16
 
 
17
 
 
18
import os
 
19
import tempfile
 
20
import shutil
 
21
import errno
 
22
 
 
23
import bzrlib.osutils
 
24
import bzrlib.revision
 
25
from bzrlib.merge_core import merge_flex, ApplyMerge3, BackupBeforeChange
 
26
from bzrlib.changeset import generate_changeset, ExceptionConflictHandler
 
27
from bzrlib.changeset import Inventory, Diff3Merge, ReplaceContents
 
28
from bzrlib.branch import Branch
 
29
from bzrlib.errors import BzrCommandError, UnrelatedBranches, NoCommonAncestor
 
30
from bzrlib.errors import NoCommits
 
31
from bzrlib.delta import compare_trees
 
32
from bzrlib.trace import mutter, warning, note
 
33
from bzrlib.fetch import greedy_fetch, fetch
 
34
from bzrlib.revision import is_ancestor
 
35
from bzrlib.osutils import rename
 
36
from bzrlib.revision import common_ancestor, MultipleRevisionSources
 
37
from bzrlib.errors import NoSuchRevision
 
38
 
 
39
# TODO: build_working_dir can be built on something simpler than merge()
 
40
 
 
41
# FIXME: merge() parameters seem oriented towards the command line
 
42
# NOTABUG: merge is a helper for commandline functions.  merge_inner is the
 
43
#          the core functionality.
 
44
 
 
45
# comments from abentley on irc: merge happens in two stages, each
 
46
# of which generates a changeset object
 
47
 
 
48
# stage 1: generate OLD->OTHER,
 
49
# stage 2: use MINE and OLD->OTHER to generate MINE -> RESULT
 
50
 
 
51
class MergeConflictHandler(ExceptionConflictHandler):
 
52
    """Handle conflicts encountered while merging.
 
53
 
 
54
    This subclasses ExceptionConflictHandler, so that any types of
 
55
    conflict that are not explicitly handled cause an exception and
 
56
    terminate the merge.
 
57
    """
 
58
    def __init__(self, this_tree, base_tree, other_tree, ignore_zero=False):
 
59
        ExceptionConflictHandler.__init__(self)
 
60
        self.conflicts = 0
 
61
        self.ignore_zero = ignore_zero
 
62
        self.this_tree = this_tree
 
63
        self.base_tree = base_tree
 
64
        self.other_tree = other_tree
 
65
 
 
66
    def copy(self, source, dest):
 
67
        """Copy the text and mode of a file
 
68
        :param source: The path of the file to copy
 
69
        :param dest: The distination file to create
 
70
        """
 
71
        s_file = file(source, "rb")
 
72
        d_file = file(dest, "wb")
 
73
        for line in s_file:
 
74
            d_file.write(line)
 
75
        os.chmod(dest, 0777 & os.stat(source).st_mode)
 
76
 
 
77
    def dump(self, lines, dest):
 
78
        """Copy the text and mode of a file
 
79
        :param source: The path of the file to copy
 
80
        :param dest: The distination file to create
 
81
        """
 
82
        d_file = file(dest, "wb")
 
83
        for line in lines:
 
84
            d_file.write(line)
 
85
 
 
86
    def add_suffix(self, name, suffix, last_new_name=None):
 
87
        """Rename a file to append a suffix.  If the new name exists, the
 
88
        suffix is added repeatedly until a non-existant name is found
 
89
 
 
90
        :param name: The path of the file
 
91
        :param suffix: The suffix to append
 
92
        :param last_new_name: (used for recursive calls) the last name tried
 
93
        """
 
94
        if last_new_name is None:
 
95
            last_new_name = name
 
96
        new_name = last_new_name+suffix
 
97
        try:
 
98
            rename(name, new_name)
 
99
            return new_name
 
100
        except OSError, e:
 
101
            if e.errno != errno.EEXIST and e.errno != errno.ENOTEMPTY:
 
102
                raise
 
103
            return self.add_suffix(name, suffix, last_new_name=new_name)
 
104
 
 
105
    def conflict(self, text):
 
106
        warning(text)
 
107
        self.conflicts += 1
 
108
        
 
109
 
 
110
    def merge_conflict(self, new_file, this_path, base_lines, other_lines):
 
111
        """
 
112
        Handle diff3 conflicts by producing a .THIS, .BASE and .OTHER.  The
 
113
        main file will be a version with diff3 conflicts.
 
114
        :param new_file: Path to the output file with diff3 markers
 
115
        :param this_path: Path to the file text for the THIS tree
 
116
        :param base_path: Path to the file text for the BASE tree
 
117
        :param other_path: Path to the file text for the OTHER tree
 
118
        """
 
119
        self.add_suffix(this_path, ".THIS")
 
120
        self.dump(base_lines, this_path+".BASE")
 
121
        self.dump(other_lines, this_path+".OTHER")
 
122
        rename(new_file, this_path)
 
123
        self.conflict("Diff3 conflict encountered in %s" % this_path)
 
124
 
 
125
    def new_contents_conflict(self, filename, other_contents):
 
126
        """Conflicting contents for newly added file."""
 
127
        self.copy(other_contents, filename + ".OTHER")
 
128
        self.conflict("Conflict in newly added file %s" % filename)
 
129
    
 
130
 
 
131
    def target_exists(self, entry, target, old_path):
 
132
        """Handle the case when the target file or dir exists"""
 
133
        moved_path = self.add_suffix(target, ".moved")
 
134
        self.conflict("Moved existing %s to %s" % (target, moved_path))
 
135
 
 
136
    def rmdir_non_empty(self, filename):
 
137
        """Handle the case where the dir to be removed still has contents"""
 
138
        self.conflict("Directory %s not removed because it is not empty"\
 
139
            % filename)
 
140
        return "skip"
 
141
 
 
142
    def rem_contents_conflict(self, filename, this_contents, base_contents):
 
143
        base_contents(filename+".BASE", self, False)
 
144
        this_contents(filename+".THIS", self, False)
 
145
        return ReplaceContents(this_contents, None)
 
146
 
 
147
    def rem_contents_conflict(self, filename, this_contents, base_contents):
 
148
        base_contents(filename+".BASE", self, False)
 
149
        this_contents(filename+".THIS", self, False)
 
150
        self.conflict("Other branch deleted locally modified file %s" %
 
151
                      filename)
 
152
        return ReplaceContents(this_contents, None)
 
153
 
 
154
    def abs_this_path(self, file_id):
 
155
        """Return the absolute path for a file_id in the this tree."""
 
156
        relpath = self.this_tree.id2path(file_id)
 
157
        return self.this_tree.tree.abspath(relpath)
 
158
 
 
159
    def add_missing_parents(self, file_id, tree):
 
160
        """If some of the parents for file_id are missing, add them."""
 
161
        entry = tree.tree.inventory[file_id]
 
162
        if entry.parent_id not in self.this_tree:
 
163
            return self.create_all_missing(entry.parent_id, tree)
 
164
        else:
 
165
            return self.abs_this_path(entry.parent_id)
 
166
 
 
167
    def create_all_missing(self, file_id, tree):
 
168
        """Add contents for a file_id and all its parents to a tree."""
 
169
        entry = tree.tree.inventory[file_id]
 
170
        if entry.parent_id is not None and entry.parent_id not in self.this_tree:
 
171
            abspath = self.create_all_missing(entry.parent_id, tree)
 
172
        else:
 
173
            abspath = self.abs_this_path(entry.parent_id)
 
174
        entry_path = os.path.join(abspath, entry.name)
 
175
        if not os.path.isdir(entry_path):
 
176
            self.create(file_id, entry_path, tree)
 
177
        return entry_path
 
178
 
 
179
    def create(self, file_id, path, tree, reverse=False):
 
180
        """Uses tree data to create a filesystem object for the file_id"""
 
181
        from merge_core import get_id_contents
 
182
        get_id_contents(file_id, tree)(path, self, reverse)
 
183
 
 
184
    def missing_for_merge(self, file_id, other_path):
 
185
        """The file_id doesn't exist in THIS, but does in OTHER and BASE"""
 
186
        self.conflict("Other branch modified locally deleted file %s" %
 
187
                      other_path)
 
188
        parent_dir = self.add_missing_parents(file_id, self.other_tree)
 
189
        stem = os.path.join(parent_dir, os.path.basename(other_path))
 
190
        self.create(file_id, stem+".OTHER", self.other_tree)
 
191
        self.create(file_id, stem+".BASE", self.base_tree)
 
192
 
 
193
    def finalize(self):
 
194
        if not self.ignore_zero:
 
195
            note("%d conflicts encountered.\n" % self.conflicts)
 
196
            
 
197
def get_tree(treespec, temp_root, label, local_branch=None):
 
198
    location, revno = treespec
 
199
    branch = Branch.open_containing(location)
 
200
    if revno is None:
 
201
        revision = None
 
202
    elif revno == -1:
 
203
        revision = branch.last_revision()
 
204
    else:
 
205
        revision = branch.get_rev_id(revno)
 
206
    return branch, get_revid_tree(branch, revision, temp_root, label,
 
207
                                  local_branch)
 
208
 
 
209
def get_revid_tree(branch, revision, temp_root, label, local_branch):
 
210
    if revision is None:
 
211
        base_tree = branch.working_tree()
 
212
    else:
 
213
        if local_branch is not None:
 
214
            greedy_fetch(local_branch, branch, revision)
 
215
            base_tree = local_branch.revision_tree(revision)
 
216
        else:
 
217
            base_tree = branch.revision_tree(revision)
 
218
    temp_path = os.path.join(temp_root, label)
 
219
    os.mkdir(temp_path)
 
220
    return MergeTree(base_tree, temp_path)
 
221
 
 
222
 
 
223
def file_exists(tree, file_id):
 
224
    return tree.has_filename(tree.id2path(file_id))
 
225
    
 
226
 
 
227
class MergeTree(object):
 
228
    def __init__(self, tree, tempdir):
 
229
        object.__init__(self)
 
230
        if hasattr(tree, "basedir"):
 
231
            self.root = tree.basedir
 
232
        else:
 
233
            self.root = None
 
234
        self.tree = tree
 
235
        self.tempdir = tempdir
 
236
        os.mkdir(os.path.join(self.tempdir, "texts"))
 
237
        os.mkdir(os.path.join(self.tempdir, "symlinks"))
 
238
        self.cached = {}
 
239
 
 
240
    def __iter__(self):
 
241
        return self.tree.__iter__()
 
242
 
 
243
    def __contains__(self, file_id):
 
244
        return file_id in self.tree
 
245
 
 
246
    def get_file(self, file_id):
 
247
        return self.tree.get_file(file_id)
 
248
 
 
249
    def get_file_sha1(self, id):
 
250
        return self.tree.get_file_sha1(id)
 
251
 
 
252
    def is_executable(self, id):
 
253
        return self.tree.is_executable(id)
 
254
 
 
255
    def id2path(self, file_id):
 
256
        return self.tree.id2path(file_id)
 
257
 
 
258
    def has_id(self, file_id):
 
259
        return self.tree.has_id(file_id)
 
260
 
 
261
    def has_or_had_id(self, file_id):
 
262
        if file_id == self.tree.inventory.root.file_id:
 
263
            return True
 
264
        return self.tree.inventory.has_id(file_id)
 
265
 
 
266
    def has_or_had_id(self, file_id):
 
267
        if file_id == self.tree.inventory.root.file_id:
 
268
            return True
 
269
        return self.tree.inventory.has_id(file_id)
 
270
 
 
271
    def readonly_path(self, id):
 
272
        if id not in self.tree:
 
273
            return None
 
274
        if self.root is not None:
 
275
            return self.tree.abspath(self.tree.id2path(id))
 
276
        else:
 
277
            kind = self.tree.inventory[id].kind
 
278
            if kind in ("directory", "root_directory"):
 
279
                return self.tempdir
 
280
            if not self.cached.has_key(id):
 
281
                if kind == "file":
 
282
                    path = os.path.join(self.tempdir, "texts", id)
 
283
                    outfile = file(path, "wb")
 
284
                    outfile.write(self.tree.get_file(id).read())
 
285
                    assert(bzrlib.osutils.lexists(path))
 
286
                    if self.tree.is_executable(id):
 
287
                        os.chmod(path, 0755)
 
288
                else:
 
289
                    assert kind == "symlink"
 
290
                    path = os.path.join(self.tempdir, "symlinks", id)
 
291
                    target = self.tree.get_symlink_target(id)
 
292
                    os.symlink(target, path)
 
293
                self.cached[id] = path
 
294
            return self.cached[id]
 
295
 
 
296
 
 
297
def build_working_dir(to_dir):
 
298
    """Build a working directory in an empty directory.
 
299
 
 
300
    to_dir is a directory containing branch metadata but no working files,
 
301
    typically constructed by cloning an existing branch. 
 
302
 
 
303
    This is split out as a special idiomatic case of merge.  It could
 
304
    eventually be done by just building the tree directly calling into 
 
305
    lower-level code (e.g. constructing a changeset).
 
306
    """
 
307
    merge((to_dir, -1), (to_dir, 0), this_dir=to_dir,
 
308
          check_clean=False, ignore_zero=True)
 
309
 
 
310
 
 
311
def merge(other_revision, base_revision,
 
312
          check_clean=True, ignore_zero=False,
 
313
          this_dir=None, backup_files=False, merge_type=ApplyMerge3,
 
314
          file_list=None):
 
315
    """Merge changes into a tree.
 
316
 
 
317
    base_revision
 
318
        tuple(path, revision) Base for three-way merge.
 
319
    other_revision
 
320
        tuple(path, revision) Other revision for three-way merge.
 
321
    this_dir
 
322
        Directory to merge changes into; '.' by default.
 
323
    check_clean
 
324
        If true, this_dir must have no uncommitted changes before the
 
325
        merge begins.
 
326
    ignore_zero - If true, suppress the "zero conflicts" message when 
 
327
        there are no conflicts; should be set when doing something we expect
 
328
        to complete perfectly.
 
329
 
 
330
    All available ancestors of other_revision and base_revision are
 
331
    automatically pulled into the branch.
 
332
    """
 
333
    tempdir = tempfile.mkdtemp(prefix="bzr-")
 
334
    try:
 
335
        if this_dir is None:
 
336
            this_dir = '.'
 
337
        this_branch = Branch.open_containing(this_dir)
 
338
        this_rev_id = this_branch.last_revision()
 
339
        if this_rev_id is None:
 
340
            raise BzrCommandError("This branch has no commits")
 
341
        if check_clean:
 
342
            changes = compare_trees(this_branch.working_tree(), 
 
343
                                    this_branch.basis_tree(), False)
 
344
            if changes.has_changed():
 
345
                raise BzrCommandError("Working tree has uncommitted changes.")
 
346
        other_branch, other_tree = get_tree(other_revision, tempdir, "other",
 
347
                                            this_branch)
 
348
        if other_revision[1] == -1:
 
349
            other_rev_id = other_branch.last_revision()
 
350
            if other_rev_id is None:
 
351
                raise NoCommits(other_branch)
 
352
            other_basis = other_rev_id
 
353
        elif other_revision[1] is not None:
 
354
            other_rev_id = other_branch.get_rev_id(other_revision[1])
 
355
            other_basis = other_rev_id
 
356
        else:
 
357
            other_rev_id = None
 
358
            other_basis = other_branch.last_revision()
 
359
            if other_basis is None:
 
360
                raise NoCommits(other_branch)
 
361
        if base_revision == [None, None]:
 
362
            try:
 
363
                base_rev_id = common_ancestor(this_rev_id, other_basis, 
 
364
                                              this_branch)
 
365
            except NoCommonAncestor:
 
366
                raise UnrelatedBranches()
 
367
            base_tree = get_revid_tree(this_branch, base_rev_id, tempdir, 
 
368
                                       "base", None)
 
369
            base_is_ancestor = True
 
370
        else:
 
371
            base_branch, base_tree = get_tree(base_revision, tempdir, "base")
 
372
            if base_revision[1] == -1:
 
373
                base_rev_id = base_branch.last_revision()
 
374
            elif base_revision[1] is None:
 
375
                base_rev_id = None
 
376
            else:
 
377
                base_rev_id = base_branch.get_rev_id(base_revision[1])
 
378
            fetch(from_branch=base_branch, to_branch=this_branch)
 
379
            base_is_ancestor = is_ancestor(this_rev_id, base_rev_id,
 
380
                                           this_branch)
 
381
        if file_list is None:
 
382
            interesting_ids = None
 
383
        else:
 
384
            interesting_ids = set()
 
385
            this_tree = this_branch.working_tree()
 
386
            for fname in file_list:
 
387
                path = this_branch.relpath(fname)
 
388
                found_id = False
 
389
                for tree in (this_tree, base_tree.tree, other_tree.tree):
 
390
                    file_id = tree.inventory.path2id(path)
 
391
                    if file_id is not None:
 
392
                        interesting_ids.add(file_id)
 
393
                        found_id = True
 
394
                if not found_id:
 
395
                    raise BzrCommandError("%s is not a source file in any"
 
396
                                          " tree." % fname)
 
397
        merge_inner(this_branch, other_tree, base_tree, tempdir, 
 
398
                    ignore_zero=ignore_zero, backup_files=backup_files, 
 
399
                    merge_type=merge_type, interesting_ids=interesting_ids)
 
400
        if base_is_ancestor and other_rev_id is not None\
 
401
            and other_rev_id not in this_branch.revision_history():
 
402
            this_branch.add_pending_merge(other_rev_id)
 
403
    finally:
 
404
        shutil.rmtree(tempdir)
 
405
 
 
406
 
 
407
def set_interesting(inventory_a, inventory_b, interesting_ids):
 
408
    """Mark files whose ids are in interesting_ids as interesting
 
409
    """
 
410
    for inventory in (inventory_a, inventory_b):
 
411
        for path, source_file in inventory.iteritems():
 
412
             source_file.interesting = source_file.id in interesting_ids
 
413
 
 
414
 
 
415
def merge_inner(this_branch, other_tree, base_tree, tempdir, 
 
416
                ignore_zero=False, merge_type=ApplyMerge3, backup_files=False,
 
417
                interesting_ids=None):
 
418
 
 
419
    def merge_factory(file_id, base, other):
 
420
        contents_change = merge_type(file_id, base, other)
 
421
        if backup_files:
 
422
            contents_change = BackupBeforeChange(contents_change)
 
423
        return contents_change
 
424
 
 
425
    this_tree = get_tree((this_branch.base, None), tempdir, "this")[1]
 
426
 
 
427
    def get_inventory(tree):
 
428
        return tree.tree.inventory
 
429
 
 
430
    inv_changes = merge_flex(this_tree, base_tree, other_tree,
 
431
                             generate_changeset, get_inventory,
 
432
                             MergeConflictHandler(this_tree, base_tree,
 
433
                             other_tree, ignore_zero=ignore_zero),
 
434
                             merge_factory=merge_factory, 
 
435
                             interesting_ids=interesting_ids)
 
436
 
 
437
    adjust_ids = []
 
438
    for id, path in inv_changes.iteritems():
 
439
        if path is not None:
 
440
            if path == '.':
 
441
                path = ''
 
442
            else:
 
443
                assert path.startswith('.' + os.sep), "path is %s" % path
 
444
            path = path[2:]
 
445
        adjust_ids.append((path, id))
 
446
    if len(adjust_ids) > 0:
 
447
        this_branch.set_inventory(regen_inventory(this_branch, this_tree.root,
 
448
                                                  adjust_ids))
 
449
 
 
450
 
 
451
def regen_inventory(this_branch, root, new_entries):
 
452
    old_entries = this_branch.read_working_inventory()
 
453
    new_inventory = {}
 
454
    by_path = {}
 
455
    new_entries_map = {} 
 
456
    for path, file_id in new_entries:
 
457
        if path is None:
 
458
            continue
 
459
        new_entries_map[file_id] = path
 
460
 
 
461
    def id2path(file_id):
 
462
        path = new_entries_map.get(file_id)
 
463
        if path is not None:
 
464
            return path
 
465
        entry = old_entries[file_id]
 
466
        if entry.parent_id is None:
 
467
            return entry.name
 
468
        return os.path.join(id2path(entry.parent_id), entry.name)
 
469
        
 
470
    for file_id in old_entries:
 
471
        entry = old_entries[file_id]
 
472
        path = id2path(file_id)
 
473
        new_inventory[file_id] = (path, file_id, entry.parent_id, entry.kind)
 
474
        by_path[path] = file_id
 
475
    
 
476
    deletions = 0
 
477
    insertions = 0
 
478
    new_path_list = []
 
479
    for path, file_id in new_entries:
 
480
        if path is None:
 
481
            del new_inventory[file_id]
 
482
            deletions += 1
 
483
        else:
 
484
            new_path_list.append((path, file_id))
 
485
            if file_id not in old_entries:
 
486
                insertions += 1
 
487
    # Ensure no file is added before its parent
 
488
    new_path_list.sort()
 
489
    for path, file_id in new_path_list:
 
490
        if path == '':
 
491
            parent = None
 
492
        else:
 
493
            parent = by_path[os.path.dirname(path)]
 
494
        kind = bzrlib.osutils.file_kind(os.path.join(root, path))
 
495
        new_inventory[file_id] = (path, file_id, parent, kind)
 
496
        by_path[path] = file_id 
 
497
 
 
498
    # Get a list in insertion order
 
499
    new_inventory_list = new_inventory.values()
 
500
    mutter ("""Inventory regeneration:
 
501
old length: %i insertions: %i deletions: %i new_length: %i"""\
 
502
        % (len(old_entries), insertions, deletions, len(new_inventory_list)))
 
503
    assert len(new_inventory_list) == len(old_entries) + insertions - deletions
 
504
    new_inventory_list.sort()
 
505
    return new_inventory_list
 
506
 
 
507
merge_types = {     "merge3": (ApplyMerge3, "Native diff3-style merge"), 
 
508
                     "diff3": (Diff3Merge,  "Merge using external diff3")
 
509
              }
 
510