~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/merge.py

  • Committer: Martin Pool
  • Date: 2005-05-02 04:24:33 UTC
  • Revision ID: mbp@sourcefrog.net-20050502042433-c825a7f7235f6b15
doc: notes on merge

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2005 Canonical Ltd
2
 
 
3
 
# This program is free software; you can redistribute it and/or modify
4
 
# it under the terms of the GNU General Public License as published by
5
 
# the Free Software Foundation; either version 2 of the License, or
6
 
# (at your option) any later version.
7
 
 
8
 
# This program is distributed in the hope that it will be useful,
9
 
# but WITHOUT ANY WARRANTY; without even the implied warranty of
10
 
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
11
 
# GNU General Public License for more details.
12
 
 
13
 
# You should have received a copy of the GNU General Public License
14
 
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
 
 
17
 
 
18
 
import os
19
 
import tempfile
20
 
import shutil
21
 
import errno
22
 
 
23
 
import bzrlib.osutils
24
 
import bzrlib.revision
25
 
from bzrlib.merge_core import merge_flex, ApplyMerge3, BackupBeforeChange
26
 
from bzrlib.changeset import generate_changeset, ExceptionConflictHandler
27
 
from bzrlib.changeset import Inventory, Diff3Merge, ReplaceContents
28
 
from bzrlib.branch import Branch
29
 
from bzrlib.errors import BzrCommandError, UnrelatedBranches, NoCommonAncestor
30
 
from bzrlib.errors import NoCommits
31
 
from bzrlib.delta import compare_trees
32
 
from bzrlib.trace import mutter, warning, note
33
 
from bzrlib.fetch import greedy_fetch, fetch
34
 
from bzrlib.revision import is_ancestor
35
 
from bzrlib.osutils import rename
36
 
from bzrlib.revision import common_ancestor, MultipleRevisionSources
37
 
from bzrlib.errors import NoSuchRevision
38
 
 
39
 
# TODO: build_working_dir can be built on something simpler than merge()
40
 
 
41
 
# FIXME: merge() parameters seem oriented towards the command line
42
 
# NOTABUG: merge is a helper for commandline functions.  merge_inner is the
43
 
#          the core functionality.
44
 
 
45
 
# comments from abentley on irc: merge happens in two stages, each
46
 
# of which generates a changeset object
47
 
 
48
 
# stage 1: generate OLD->OTHER,
49
 
# stage 2: use MINE and OLD->OTHER to generate MINE -> RESULT
50
 
 
51
 
class MergeConflictHandler(ExceptionConflictHandler):
52
 
    """Handle conflicts encountered while merging.
53
 
 
54
 
    This subclasses ExceptionConflictHandler, so that any types of
55
 
    conflict that are not explicitly handled cause an exception and
56
 
    terminate the merge.
57
 
    """
58
 
    def __init__(self, this_tree, base_tree, other_tree, ignore_zero=False):
59
 
        ExceptionConflictHandler.__init__(self)
60
 
        self.conflicts = 0
61
 
        self.ignore_zero = ignore_zero
62
 
        self.this_tree = this_tree
63
 
        self.base_tree = base_tree
64
 
        self.other_tree = other_tree
65
 
 
66
 
    def copy(self, source, dest):
67
 
        """Copy the text and mode of a file
68
 
        :param source: The path of the file to copy
69
 
        :param dest: The distination file to create
70
 
        """
71
 
        s_file = file(source, "rb")
72
 
        d_file = file(dest, "wb")
73
 
        for line in s_file:
74
 
            d_file.write(line)
75
 
        os.chmod(dest, 0777 & os.stat(source).st_mode)
76
 
 
77
 
    def dump(self, lines, dest):
78
 
        """Copy the text and mode of a file
79
 
        :param source: The path of the file to copy
80
 
        :param dest: The distination file to create
81
 
        """
82
 
        d_file = file(dest, "wb")
83
 
        for line in lines:
84
 
            d_file.write(line)
85
 
 
86
 
    def add_suffix(self, name, suffix, last_new_name=None):
87
 
        """Rename a file to append a suffix.  If the new name exists, the
88
 
        suffix is added repeatedly until a non-existant name is found
89
 
 
90
 
        :param name: The path of the file
91
 
        :param suffix: The suffix to append
92
 
        :param last_new_name: (used for recursive calls) the last name tried
93
 
        """
94
 
        if last_new_name is None:
95
 
            last_new_name = name
96
 
        new_name = last_new_name+suffix
97
 
        try:
98
 
            rename(name, new_name)
99
 
            return new_name
100
 
        except OSError, e:
101
 
            if e.errno != errno.EEXIST and e.errno != errno.ENOTEMPTY:
102
 
                raise
103
 
            return self.add_suffix(name, suffix, last_new_name=new_name)
104
 
 
105
 
    def conflict(self, text):
106
 
        warning(text)
107
 
        self.conflicts += 1
108
 
        
109
 
 
110
 
    def merge_conflict(self, new_file, this_path, base_lines, other_lines):
111
 
        """
112
 
        Handle diff3 conflicts by producing a .THIS, .BASE and .OTHER.  The
113
 
        main file will be a version with diff3 conflicts.
114
 
        :param new_file: Path to the output file with diff3 markers
115
 
        :param this_path: Path to the file text for the THIS tree
116
 
        :param base_path: Path to the file text for the BASE tree
117
 
        :param other_path: Path to the file text for the OTHER tree
118
 
        """
119
 
        self.add_suffix(this_path, ".THIS")
120
 
        self.dump(base_lines, this_path+".BASE")
121
 
        self.dump(other_lines, this_path+".OTHER")
122
 
        rename(new_file, this_path)
123
 
        self.conflict("Diff3 conflict encountered in %s" % this_path)
124
 
 
125
 
    def new_contents_conflict(self, filename, other_contents):
126
 
        """Conflicting contents for newly added file."""
127
 
        self.copy(other_contents, filename + ".OTHER")
128
 
        self.conflict("Conflict in newly added file %s" % filename)
129
 
    
130
 
 
131
 
    def target_exists(self, entry, target, old_path):
132
 
        """Handle the case when the target file or dir exists"""
133
 
        moved_path = self.add_suffix(target, ".moved")
134
 
        self.conflict("Moved existing %s to %s" % (target, moved_path))
135
 
 
136
 
    def rmdir_non_empty(self, filename):
137
 
        """Handle the case where the dir to be removed still has contents"""
138
 
        self.conflict("Directory %s not removed because it is not empty"\
139
 
            % filename)
140
 
        return "skip"
141
 
 
142
 
    def rem_contents_conflict(self, filename, this_contents, base_contents):
143
 
        base_contents(filename+".BASE", self, False)
144
 
        this_contents(filename+".THIS", self, False)
145
 
        return ReplaceContents(this_contents, None)
146
 
 
147
 
    def rem_contents_conflict(self, filename, this_contents, base_contents):
148
 
        base_contents(filename+".BASE", self, False)
149
 
        this_contents(filename+".THIS", self, False)
150
 
        self.conflict("Other branch deleted locally modified file %s" %
151
 
                      filename)
152
 
        return ReplaceContents(this_contents, None)
153
 
 
154
 
    def abs_this_path(self, file_id):
155
 
        """Return the absolute path for a file_id in the this tree."""
156
 
        relpath = self.this_tree.id2path(file_id)
157
 
        return self.this_tree.tree.abspath(relpath)
158
 
 
159
 
    def add_missing_parents(self, file_id, tree):
160
 
        """If some of the parents for file_id are missing, add them."""
161
 
        entry = tree.tree.inventory[file_id]
162
 
        if entry.parent_id not in self.this_tree:
163
 
            return self.create_all_missing(entry.parent_id, tree)
164
 
        else:
165
 
            return self.abs_this_path(entry.parent_id)
166
 
 
167
 
    def create_all_missing(self, file_id, tree):
168
 
        """Add contents for a file_id and all its parents to a tree."""
169
 
        entry = tree.tree.inventory[file_id]
170
 
        if entry.parent_id is not None and entry.parent_id not in self.this_tree:
171
 
            abspath = self.create_all_missing(entry.parent_id, tree)
172
 
        else:
173
 
            abspath = self.abs_this_path(entry.parent_id)
174
 
        entry_path = os.path.join(abspath, entry.name)
175
 
        if not os.path.isdir(entry_path):
176
 
            self.create(file_id, entry_path, tree)
177
 
        return entry_path
178
 
 
179
 
    def create(self, file_id, path, tree, reverse=False):
180
 
        """Uses tree data to create a filesystem object for the file_id"""
181
 
        from merge_core import get_id_contents
182
 
        get_id_contents(file_id, tree)(path, self, reverse)
183
 
 
184
 
    def missing_for_merge(self, file_id, other_path):
185
 
        """The file_id doesn't exist in THIS, but does in OTHER and BASE"""
186
 
        self.conflict("Other branch modified locally deleted file %s" %
187
 
                      other_path)
188
 
        parent_dir = self.add_missing_parents(file_id, self.other_tree)
189
 
        stem = os.path.join(parent_dir, os.path.basename(other_path))
190
 
        self.create(file_id, stem+".OTHER", self.other_tree)
191
 
        self.create(file_id, stem+".BASE", self.base_tree)
192
 
 
193
 
    def finalize(self):
194
 
        if not self.ignore_zero:
195
 
            note("%d conflicts encountered.\n" % self.conflicts)
196
 
            
197
 
def get_tree(treespec, temp_root, label, local_branch=None):
198
 
    location, revno = treespec
199
 
    branch = Branch.open_containing(location)
200
 
    if revno is None:
201
 
        revision = None
202
 
    elif revno == -1:
203
 
        revision = branch.last_revision()
204
 
    else:
205
 
        revision = branch.get_rev_id(revno)
206
 
    return branch, get_revid_tree(branch, revision, temp_root, label,
207
 
                                  local_branch)
208
 
 
209
 
def get_revid_tree(branch, revision, temp_root, label, local_branch):
210
 
    if revision is None:
211
 
        base_tree = branch.working_tree()
212
 
    else:
213
 
        if local_branch is not None:
214
 
            greedy_fetch(local_branch, branch, revision)
215
 
            base_tree = local_branch.revision_tree(revision)
216
 
        else:
217
 
            base_tree = branch.revision_tree(revision)
218
 
    temp_path = os.path.join(temp_root, label)
219
 
    os.mkdir(temp_path)
220
 
    return MergeTree(base_tree, temp_path)
221
 
 
222
 
 
223
 
def file_exists(tree, file_id):
224
 
    return tree.has_filename(tree.id2path(file_id))
225
 
    
226
 
 
227
 
class MergeTree(object):
228
 
    def __init__(self, tree, tempdir):
229
 
        object.__init__(self)
230
 
        if hasattr(tree, "basedir"):
231
 
            self.root = tree.basedir
232
 
        else:
233
 
            self.root = None
234
 
        self.tree = tree
235
 
        self.tempdir = tempdir
236
 
        os.mkdir(os.path.join(self.tempdir, "texts"))
237
 
        os.mkdir(os.path.join(self.tempdir, "symlinks"))
238
 
        self.cached = {}
239
 
 
240
 
    def __iter__(self):
241
 
        return self.tree.__iter__()
242
 
 
243
 
    def __contains__(self, file_id):
244
 
        return file_id in self.tree
245
 
 
246
 
    def get_file(self, file_id):
247
 
        return self.tree.get_file(file_id)
248
 
 
249
 
    def get_file_sha1(self, id):
250
 
        return self.tree.get_file_sha1(id)
251
 
 
252
 
    def is_executable(self, id):
253
 
        return self.tree.is_executable(id)
254
 
 
255
 
    def id2path(self, file_id):
256
 
        return self.tree.id2path(file_id)
257
 
 
258
 
    def has_id(self, file_id):
259
 
        return self.tree.has_id(file_id)
260
 
 
261
 
    def has_or_had_id(self, file_id):
262
 
        if file_id == self.tree.inventory.root.file_id:
263
 
            return True
264
 
        return self.tree.inventory.has_id(file_id)
265
 
 
266
 
    def has_or_had_id(self, file_id):
267
 
        if file_id == self.tree.inventory.root.file_id:
268
 
            return True
269
 
        return self.tree.inventory.has_id(file_id)
270
 
 
271
 
    def readonly_path(self, id):
272
 
        if id not in self.tree:
273
 
            return None
274
 
        if self.root is not None:
275
 
            return self.tree.abspath(self.tree.id2path(id))
276
 
        else:
277
 
            kind = self.tree.inventory[id].kind
278
 
            if kind in ("directory", "root_directory"):
279
 
                return self.tempdir
280
 
            if not self.cached.has_key(id):
281
 
                if kind == "file":
282
 
                    path = os.path.join(self.tempdir, "texts", id)
283
 
                    outfile = file(path, "wb")
284
 
                    outfile.write(self.tree.get_file(id).read())
285
 
                    assert(bzrlib.osutils.lexists(path))
286
 
                    if self.tree.is_executable(id):
287
 
                        os.chmod(path, 0755)
288
 
                else:
289
 
                    assert kind == "symlink"
290
 
                    path = os.path.join(self.tempdir, "symlinks", id)
291
 
                    target = self.tree.get_symlink_target(id)
292
 
                    os.symlink(target, path)
293
 
                self.cached[id] = path
294
 
            return self.cached[id]
295
 
 
296
 
 
297
 
def build_working_dir(to_dir):
298
 
    """Build a working directory in an empty directory.
299
 
 
300
 
    to_dir is a directory containing branch metadata but no working files,
301
 
    typically constructed by cloning an existing branch. 
302
 
 
303
 
    This is split out as a special idiomatic case of merge.  It could
304
 
    eventually be done by just building the tree directly calling into 
305
 
    lower-level code (e.g. constructing a changeset).
306
 
    """
307
 
    merge((to_dir, -1), (to_dir, 0), this_dir=to_dir,
308
 
          check_clean=False, ignore_zero=True)
309
 
 
310
 
 
311
 
def merge(other_revision, base_revision,
312
 
          check_clean=True, ignore_zero=False,
313
 
          this_dir=None, backup_files=False, merge_type=ApplyMerge3,
314
 
          file_list=None):
315
 
    """Merge changes into a tree.
316
 
 
317
 
    base_revision
318
 
        tuple(path, revision) Base for three-way merge.
319
 
    other_revision
320
 
        tuple(path, revision) Other revision for three-way merge.
321
 
    this_dir
322
 
        Directory to merge changes into; '.' by default.
323
 
    check_clean
324
 
        If true, this_dir must have no uncommitted changes before the
325
 
        merge begins.
326
 
    ignore_zero - If true, suppress the "zero conflicts" message when 
327
 
        there are no conflicts; should be set when doing something we expect
328
 
        to complete perfectly.
329
 
 
330
 
    All available ancestors of other_revision and base_revision are
331
 
    automatically pulled into the branch.
332
 
    """
333
 
    tempdir = tempfile.mkdtemp(prefix="bzr-")
334
 
    try:
335
 
        if this_dir is None:
336
 
            this_dir = '.'
337
 
        this_branch = Branch.open_containing(this_dir)
338
 
        this_rev_id = this_branch.last_revision()
339
 
        if this_rev_id is None:
340
 
            raise BzrCommandError("This branch has no commits")
341
 
        if check_clean:
342
 
            changes = compare_trees(this_branch.working_tree(), 
343
 
                                    this_branch.basis_tree(), False)
344
 
            if changes.has_changed():
345
 
                raise BzrCommandError("Working tree has uncommitted changes.")
346
 
        other_branch, other_tree = get_tree(other_revision, tempdir, "other",
347
 
                                            this_branch)
348
 
        if other_revision[1] == -1:
349
 
            other_rev_id = other_branch.last_revision()
350
 
            if other_rev_id is None:
351
 
                raise NoCommits(other_branch)
352
 
            other_basis = other_rev_id
353
 
        elif other_revision[1] is not None:
354
 
            other_rev_id = other_branch.get_rev_id(other_revision[1])
355
 
            other_basis = other_rev_id
356
 
        else:
357
 
            other_rev_id = None
358
 
            other_basis = other_branch.last_revision()
359
 
            if other_basis is None:
360
 
                raise NoCommits(other_branch)
361
 
        if base_revision == [None, None]:
362
 
            try:
363
 
                base_rev_id = common_ancestor(this_rev_id, other_basis, 
364
 
                                              this_branch)
365
 
            except NoCommonAncestor:
366
 
                raise UnrelatedBranches()
367
 
            base_tree = get_revid_tree(this_branch, base_rev_id, tempdir, 
368
 
                                       "base", None)
369
 
            base_is_ancestor = True
370
 
        else:
371
 
            base_branch, base_tree = get_tree(base_revision, tempdir, "base")
372
 
            if base_revision[1] == -1:
373
 
                base_rev_id = base_branch.last_revision()
374
 
            elif base_revision[1] is None:
375
 
                base_rev_id = None
376
 
            else:
377
 
                base_rev_id = base_branch.get_rev_id(base_revision[1])
378
 
            fetch(from_branch=base_branch, to_branch=this_branch)
379
 
            base_is_ancestor = is_ancestor(this_rev_id, base_rev_id,
380
 
                                           this_branch)
381
 
        if file_list is None:
382
 
            interesting_ids = None
383
 
        else:
384
 
            interesting_ids = set()
385
 
            this_tree = this_branch.working_tree()
386
 
            for fname in file_list:
387
 
                path = this_branch.relpath(fname)
388
 
                found_id = False
389
 
                for tree in (this_tree, base_tree.tree, other_tree.tree):
390
 
                    file_id = tree.inventory.path2id(path)
391
 
                    if file_id is not None:
392
 
                        interesting_ids.add(file_id)
393
 
                        found_id = True
394
 
                if not found_id:
395
 
                    raise BzrCommandError("%s is not a source file in any"
396
 
                                          " tree." % fname)
397
 
        merge_inner(this_branch, other_tree, base_tree, tempdir, 
398
 
                    ignore_zero=ignore_zero, backup_files=backup_files, 
399
 
                    merge_type=merge_type, interesting_ids=interesting_ids)
400
 
        if base_is_ancestor and other_rev_id is not None\
401
 
            and other_rev_id not in this_branch.revision_history():
402
 
            this_branch.add_pending_merge(other_rev_id)
403
 
    finally:
404
 
        shutil.rmtree(tempdir)
405
 
 
406
 
 
407
 
def set_interesting(inventory_a, inventory_b, interesting_ids):
408
 
    """Mark files whose ids are in interesting_ids as interesting
409
 
    """
410
 
    for inventory in (inventory_a, inventory_b):
411
 
        for path, source_file in inventory.iteritems():
412
 
             source_file.interesting = source_file.id in interesting_ids
413
 
 
414
 
 
415
 
def merge_inner(this_branch, other_tree, base_tree, tempdir, 
416
 
                ignore_zero=False, merge_type=ApplyMerge3, backup_files=False,
417
 
                interesting_ids=None):
418
 
 
419
 
    def merge_factory(file_id, base, other):
420
 
        contents_change = merge_type(file_id, base, other)
421
 
        if backup_files:
422
 
            contents_change = BackupBeforeChange(contents_change)
423
 
        return contents_change
424
 
 
425
 
    this_tree = get_tree((this_branch.base, None), tempdir, "this")[1]
426
 
 
427
 
    def get_inventory(tree):
428
 
        return tree.tree.inventory
429
 
 
430
 
    inv_changes = merge_flex(this_tree, base_tree, other_tree,
431
 
                             generate_changeset, get_inventory,
432
 
                             MergeConflictHandler(this_tree, base_tree,
433
 
                             other_tree, ignore_zero=ignore_zero),
434
 
                             merge_factory=merge_factory, 
435
 
                             interesting_ids=interesting_ids)
436
 
 
437
 
    adjust_ids = []
438
 
    for id, path in inv_changes.iteritems():
439
 
        if path is not None:
440
 
            if path == '.':
441
 
                path = ''
442
 
            else:
443
 
                assert path.startswith('.' + os.sep), "path is %s" % path
444
 
            path = path[2:]
445
 
        adjust_ids.append((path, id))
446
 
    if len(adjust_ids) > 0:
447
 
        this_branch.set_inventory(regen_inventory(this_branch, this_tree.root,
448
 
                                                  adjust_ids))
449
 
 
450
 
 
451
 
def regen_inventory(this_branch, root, new_entries):
452
 
    old_entries = this_branch.read_working_inventory()
453
 
    new_inventory = {}
454
 
    by_path = {}
455
 
    new_entries_map = {} 
456
 
    for path, file_id in new_entries:
457
 
        if path is None:
458
 
            continue
459
 
        new_entries_map[file_id] = path
460
 
 
461
 
    def id2path(file_id):
462
 
        path = new_entries_map.get(file_id)
463
 
        if path is not None:
464
 
            return path
465
 
        entry = old_entries[file_id]
466
 
        if entry.parent_id is None:
467
 
            return entry.name
468
 
        return os.path.join(id2path(entry.parent_id), entry.name)
469
 
        
470
 
    for file_id in old_entries:
471
 
        entry = old_entries[file_id]
472
 
        path = id2path(file_id)
473
 
        new_inventory[file_id] = (path, file_id, entry.parent_id, entry.kind)
474
 
        by_path[path] = file_id
475
 
    
476
 
    deletions = 0
477
 
    insertions = 0
478
 
    new_path_list = []
479
 
    for path, file_id in new_entries:
480
 
        if path is None:
481
 
            del new_inventory[file_id]
482
 
            deletions += 1
483
 
        else:
484
 
            new_path_list.append((path, file_id))
485
 
            if file_id not in old_entries:
486
 
                insertions += 1
487
 
    # Ensure no file is added before its parent
488
 
    new_path_list.sort()
489
 
    for path, file_id in new_path_list:
490
 
        if path == '':
491
 
            parent = None
492
 
        else:
493
 
            parent = by_path[os.path.dirname(path)]
494
 
        kind = bzrlib.osutils.file_kind(os.path.join(root, path))
495
 
        new_inventory[file_id] = (path, file_id, parent, kind)
496
 
        by_path[path] = file_id 
497
 
 
498
 
    # Get a list in insertion order
499
 
    new_inventory_list = new_inventory.values()
500
 
    mutter ("""Inventory regeneration:
501
 
old length: %i insertions: %i deletions: %i new_length: %i"""\
502
 
        % (len(old_entries), insertions, deletions, len(new_inventory_list)))
503
 
    assert len(new_inventory_list) == len(old_entries) + insertions - deletions
504
 
    new_inventory_list.sort()
505
 
    return new_inventory_list
506
 
 
507
 
merge_types = {     "merge3": (ApplyMerge3, "Native diff3-style merge"), 
508
 
                     "diff3": (Diff3Merge,  "Merge using external diff3")
509
 
              }
510