~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/merge.py

  • Committer: mbp at sourcefrog
  • Date: 2005-03-30 22:27:17 UTC
  • Revision ID: mbp@sourcefrog.net-20050330222717-027b5837127b938d
experiment with new nested inventory file format
not used by default yet

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2005 Canonical Ltd
2
 
 
3
 
# This program is free software; you can redistribute it and/or modify
4
 
# it under the terms of the GNU General Public License as published by
5
 
# the Free Software Foundation; either version 2 of the License, or
6
 
# (at your option) any later version.
7
 
 
8
 
# This program is distributed in the hope that it will be useful,
9
 
# but WITHOUT ANY WARRANTY; without even the implied warranty of
10
 
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
11
 
# GNU General Public License for more details.
12
 
 
13
 
# You should have received a copy of the GNU General Public License
14
 
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
 
 
17
 
 
18
 
import os
19
 
import tempfile
20
 
import shutil
21
 
import errno
22
 
 
23
 
import bzrlib.osutils
24
 
import bzrlib.revision
25
 
from bzrlib.merge_core import merge_flex, ApplyMerge3, BackupBeforeChange
26
 
from bzrlib.changeset import generate_changeset, ExceptionConflictHandler
27
 
from bzrlib.changeset import Inventory, Diff3Merge, ReplaceContents
28
 
from bzrlib.branch import Branch
29
 
from bzrlib.errors import BzrCommandError, UnrelatedBranches, NoCommonAncestor
30
 
from bzrlib.errors import NoCommits
31
 
from bzrlib.delta import compare_trees
32
 
from bzrlib.trace import mutter, warning
33
 
from bzrlib.fetch import greedy_fetch, fetch
34
 
from bzrlib.revision import is_ancestor
35
 
from bzrlib.osutils import rename
36
 
from bzrlib.revision import common_ancestor, MultipleRevisionSources
37
 
from bzrlib.errors import NoSuchRevision
38
 
 
39
 
# TODO: build_working_dir can be built on something simpler than merge()
40
 
 
41
 
# FIXME: merge() parameters seem oriented towards the command line
42
 
 
43
 
# comments from abentley on irc: merge happens in two stages, each
44
 
# of which generates a changeset object
45
 
 
46
 
# stage 1: generate OLD->OTHER,
47
 
# stage 2: use MINE and OLD->OTHER to generate MINE -> RESULT
48
 
 
49
 
class MergeConflictHandler(ExceptionConflictHandler):
50
 
    """Handle conflicts encountered while merging.
51
 
 
52
 
    This subclasses ExceptionConflictHandler, so that any types of
53
 
    conflict that are not explicitly handled cause an exception and
54
 
    terminate the merge.
55
 
    """
56
 
    def __init__(self, this_tree, base_tree, other_tree, ignore_zero=False):
57
 
        ExceptionConflictHandler.__init__(self)
58
 
        self.conflicts = 0
59
 
        self.ignore_zero = ignore_zero
60
 
        self.this_tree = this_tree
61
 
        self.base_tree = base_tree
62
 
        self.other_tree = other_tree
63
 
 
64
 
    def copy(self, source, dest):
65
 
        """Copy the text and mode of a file
66
 
        :param source: The path of the file to copy
67
 
        :param dest: The distination file to create
68
 
        """
69
 
        s_file = file(source, "rb")
70
 
        d_file = file(dest, "wb")
71
 
        for line in s_file:
72
 
            d_file.write(line)
73
 
        os.chmod(dest, 0777 & os.stat(source).st_mode)
74
 
 
75
 
    def dump(self, lines, dest):
76
 
        """Copy the text and mode of a file
77
 
        :param source: The path of the file to copy
78
 
        :param dest: The distination file to create
79
 
        """
80
 
        d_file = file(dest, "wb")
81
 
        for line in lines:
82
 
            d_file.write(line)
83
 
 
84
 
    def add_suffix(self, name, suffix, last_new_name=None):
85
 
        """Rename a file to append a suffix.  If the new name exists, the
86
 
        suffix is added repeatedly until a non-existant name is found
87
 
 
88
 
        :param name: The path of the file
89
 
        :param suffix: The suffix to append
90
 
        :param last_new_name: (used for recursive calls) the last name tried
91
 
        """
92
 
        if last_new_name is None:
93
 
            last_new_name = name
94
 
        new_name = last_new_name+suffix
95
 
        try:
96
 
            rename(name, new_name)
97
 
            return new_name
98
 
        except OSError, e:
99
 
            if e.errno != errno.EEXIST and e.errno != errno.ENOTEMPTY:
100
 
                raise
101
 
            return self.add_suffix(name, suffix, last_new_name=new_name)
102
 
 
103
 
    def conflict(self, text):
104
 
        warning(text)
105
 
        self.conflicts += 1
106
 
        
107
 
 
108
 
    def merge_conflict(self, new_file, this_path, base_lines, other_lines):
109
 
        """
110
 
        Handle diff3 conflicts by producing a .THIS, .BASE and .OTHER.  The
111
 
        main file will be a version with diff3 conflicts.
112
 
        :param new_file: Path to the output file with diff3 markers
113
 
        :param this_path: Path to the file text for the THIS tree
114
 
        :param base_path: Path to the file text for the BASE tree
115
 
        :param other_path: Path to the file text for the OTHER tree
116
 
        """
117
 
        self.add_suffix(this_path, ".THIS")
118
 
        self.dump(base_lines, this_path+".BASE")
119
 
        self.dump(other_lines, this_path+".OTHER")
120
 
        rename(new_file, this_path)
121
 
        self.conflict("Diff3 conflict encountered in %s" % this_path)
122
 
 
123
 
    def new_contents_conflict(self, filename, other_contents):
124
 
        """Conflicting contents for newly added file."""
125
 
        self.copy(other_contents, filename + ".OTHER")
126
 
        self.conflict("Conflict in newly added file %s" % filename)
127
 
    
128
 
 
129
 
    def target_exists(self, entry, target, old_path):
130
 
        """Handle the case when the target file or dir exists"""
131
 
        moved_path = self.add_suffix(target, ".moved")
132
 
        self.conflict("Moved existing %s to %s" % (target, moved_path))
133
 
 
134
 
    def rmdir_non_empty(self, filename):
135
 
        """Handle the case where the dir to be removed still has contents"""
136
 
        self.conflict("Directory %s not removed because it is not empty"\
137
 
            % filename)
138
 
        return "skip"
139
 
 
140
 
    def rem_contents_conflict(self, filename, this_contents, base_contents):
141
 
        base_contents(filename+".BASE", self, False)
142
 
        this_contents(filename+".THIS", self, False)
143
 
        self.conflict("Other branch deleted locally modified file %s" %
144
 
                      filename)
145
 
        return ReplaceContents(this_contents, None)
146
 
 
147
 
    def abs_this_path(self, file_id):
148
 
        """Return the absolute path for a file_id in the this tree."""
149
 
        relpath = self.this_tree.id2path(file_id)
150
 
        return self.this_tree.tree.abspath(relpath)
151
 
 
152
 
    def add_missing_parents(self, file_id, tree):
153
 
        """If some of the parents for file_id are missing, add them."""
154
 
        entry = tree.tree.inventory[file_id]
155
 
        if entry.parent_id not in self.this_tree:
156
 
            return self.create_all_missing(entry.parent_id, tree)
157
 
        else:
158
 
            return self.abs_this_path(entry.parent_id)
159
 
 
160
 
    def create_all_missing(self, file_id, tree):
161
 
        """Add contents for a file_id and all its parents to a tree."""
162
 
        entry = tree.tree.inventory[file_id]
163
 
        if entry.parent_id is not None and entry.parent_id not in self.this_tree:
164
 
            abspath = self.create_all_missing(entry.parent_id, tree)
165
 
        else:
166
 
            abspath = self.abs_this_path(entry.parent_id)
167
 
        entry_path = os.path.join(abspath, entry.name)
168
 
        if not os.path.isdir(entry_path):
169
 
            self.create(file_id, entry_path, tree)
170
 
        return entry_path
171
 
 
172
 
    def create(self, file_id, path, tree, reverse=False):
173
 
        """Uses tree data to create a filesystem object for the file_id"""
174
 
        from merge_core import get_id_contents
175
 
        get_id_contents(file_id, tree)(path, self, reverse)
176
 
 
177
 
    def missing_for_merge(self, file_id, other_path):
178
 
        """The file_id doesn't exist in THIS, but does in OTHER and BASE"""
179
 
        self.conflict("Other branch modified locally deleted file %s" %
180
 
                      other_path)
181
 
        parent_dir = self.add_missing_parents(file_id, self.other_tree)
182
 
        stem = os.path.join(parent_dir, os.path.basename(other_path))
183
 
        self.create(file_id, stem+".OTHER", self.other_tree)
184
 
        self.create(file_id, stem+".BASE", self.base_tree)
185
 
 
186
 
    def finalize(self):
187
 
        if not self.ignore_zero:
188
 
            print "%d conflicts encountered.\n" % self.conflicts
189
 
            
190
 
def get_tree(treespec, temp_root, label, local_branch=None):
191
 
    location, revno = treespec
192
 
    branch = Branch.open_containing(location)
193
 
    if revno is None:
194
 
        revision = None
195
 
    elif revno == -1:
196
 
        revision = branch.last_revision()
197
 
    else:
198
 
        revision = branch.get_rev_id(revno)
199
 
    return branch, get_revid_tree(branch, revision, temp_root, label,
200
 
                                  local_branch)
201
 
 
202
 
def get_revid_tree(branch, revision, temp_root, label, local_branch):
203
 
    if revision is None:
204
 
        base_tree = branch.working_tree()
205
 
    else:
206
 
        if local_branch is not None:
207
 
            greedy_fetch(local_branch, branch, revision)
208
 
            base_tree = local_branch.revision_tree(revision)
209
 
        else:
210
 
            base_tree = branch.revision_tree(revision)
211
 
    temp_path = os.path.join(temp_root, label)
212
 
    os.mkdir(temp_path)
213
 
    return MergeTree(base_tree, temp_path)
214
 
 
215
 
 
216
 
def file_exists(tree, file_id):
217
 
    return tree.has_filename(tree.id2path(file_id))
218
 
    
219
 
 
220
 
class MergeTree(object):
221
 
    def __init__(self, tree, tempdir):
222
 
        object.__init__(self)
223
 
        if hasattr(tree, "basedir"):
224
 
            self.root = tree.basedir
225
 
        else:
226
 
            self.root = None
227
 
        self.tree = tree
228
 
        self.tempdir = tempdir
229
 
        os.mkdir(os.path.join(self.tempdir, "texts"))
230
 
        os.mkdir(os.path.join(self.tempdir, "symlinks"))
231
 
        self.cached = {}
232
 
 
233
 
    def __iter__(self):
234
 
        return self.tree.__iter__()
235
 
 
236
 
    def __contains__(self, file_id):
237
 
        return file_id in self.tree
238
 
 
239
 
    def get_file(self, file_id):
240
 
        return self.tree.get_file(file_id)
241
 
 
242
 
    def get_file_sha1(self, id):
243
 
        return self.tree.get_file_sha1(id)
244
 
 
245
 
    def is_executable(self, id):
246
 
        return self.tree.is_executable(id)
247
 
 
248
 
    def id2path(self, file_id):
249
 
        return self.tree.id2path(file_id)
250
 
 
251
 
    def has_id(self, file_id):
252
 
        return self.tree.has_id(file_id)
253
 
 
254
 
    def has_or_had_id(self, file_id):
255
 
        if file_id == self.tree.inventory.root.file_id:
256
 
            return True
257
 
        return self.tree.inventory.has_id(file_id)
258
 
 
259
 
    def has_or_had_id(self, file_id):
260
 
        if file_id == self.tree.inventory.root.file_id:
261
 
            return True
262
 
        return self.tree.inventory.has_id(file_id)
263
 
 
264
 
    def readonly_path(self, id):
265
 
        if id not in self.tree:
266
 
            return None
267
 
        if self.root is not None:
268
 
            return self.tree.abspath(self.tree.id2path(id))
269
 
        else:
270
 
            kind = self.tree.inventory[id].kind
271
 
            if kind in ("directory", "root_directory"):
272
 
                return self.tempdir
273
 
            if not self.cached.has_key(id):
274
 
                if kind == "file":
275
 
                    path = os.path.join(self.tempdir, "texts", id)
276
 
                    outfile = file(path, "wb")
277
 
                    outfile.write(self.tree.get_file(id).read())
278
 
                    assert(bzrlib.osutils.lexists(path))
279
 
                    if self.tree.is_executable(id):
280
 
                        os.chmod(path, 0755)
281
 
                else:
282
 
                    assert kind == "symlink"
283
 
                    path = os.path.join(self.tempdir, "symlinks", id)
284
 
                    target = self.tree.get_symlink_target(id)
285
 
                    os.symlink(target, path)
286
 
                self.cached[id] = path
287
 
            return self.cached[id]
288
 
 
289
 
 
290
 
def build_working_dir(to_dir):
291
 
    """Build a working directory in an empty directory.
292
 
 
293
 
    to_dir is a directory containing branch metadata but no working files,
294
 
    typically constructed by cloning an existing branch. 
295
 
 
296
 
    This is split out as a special idiomatic case of merge.  It could
297
 
    eventually be done by just building the tree directly calling into 
298
 
    lower-level code (e.g. constructing a changeset).
299
 
    """
300
 
    merge((to_dir, -1), (to_dir, 0), this_dir=to_dir,
301
 
          check_clean=False, ignore_zero=True)
302
 
 
303
 
 
304
 
def merge(other_revision, base_revision,
305
 
          check_clean=True, ignore_zero=False,
306
 
          this_dir=None, backup_files=False, merge_type=ApplyMerge3,
307
 
          file_list=None):
308
 
    """Merge changes into a tree.
309
 
 
310
 
    base_revision
311
 
        tuple(path, revision) Base for three-way merge.
312
 
    other_revision
313
 
        tuple(path, revision) Other revision for three-way merge.
314
 
    this_dir
315
 
        Directory to merge changes into; '.' by default.
316
 
    check_clean
317
 
        If true, this_dir must have no uncommitted changes before the
318
 
        merge begins.
319
 
    ignore_zero - If true, suppress the "zero conflicts" message when 
320
 
        there are no conflicts; should be set when doing something we expect
321
 
        to complete perfectly.
322
 
 
323
 
    All available ancestors of other_revision and base_revision are
324
 
    automatically pulled into the branch.
325
 
    """
326
 
    tempdir = tempfile.mkdtemp(prefix="bzr-")
327
 
    try:
328
 
        if this_dir is None:
329
 
            this_dir = '.'
330
 
        this_branch = Branch.open_containing(this_dir)
331
 
        this_rev_id = this_branch.last_revision()
332
 
        if this_rev_id is None:
333
 
            raise BzrCommandError("This branch has no commits")
334
 
        if check_clean:
335
 
            changes = compare_trees(this_branch.working_tree(), 
336
 
                                    this_branch.basis_tree(), False)
337
 
            if changes.has_changed():
338
 
                raise BzrCommandError("Working tree has uncommitted changes.")
339
 
        other_branch, other_tree = get_tree(other_revision, tempdir, "other",
340
 
                                            this_branch)
341
 
        if other_revision[1] == -1:
342
 
            other_rev_id = other_branch.last_revision()
343
 
            if other_rev_id is None:
344
 
                raise NoCommits(other_branch)
345
 
            other_basis = other_rev_id
346
 
        elif other_revision[1] is not None:
347
 
            other_rev_id = other_branch.get_rev_id(other_revision[1])
348
 
            other_basis = other_rev_id
349
 
        else:
350
 
            other_rev_id = None
351
 
            other_basis = other_branch.last_revision()
352
 
            if other_basis is None:
353
 
                raise NoCommits(other_branch)
354
 
        if base_revision == [None, None]:
355
 
            try:
356
 
                base_rev_id = common_ancestor(this_rev_id, other_basis, 
357
 
                                              this_branch)
358
 
            except NoCommonAncestor:
359
 
                raise UnrelatedBranches()
360
 
            base_tree = get_revid_tree(this_branch, base_rev_id, tempdir, 
361
 
                                       "base", None)
362
 
            base_is_ancestor = True
363
 
        else:
364
 
            base_branch, base_tree = get_tree(base_revision, tempdir, "base")
365
 
            if base_revision[1] == -1:
366
 
                base_rev_id = base_branch.last_revision()
367
 
            elif base_revision[1] is None:
368
 
                base_rev_id = None
369
 
            else:
370
 
                base_rev_id = base_branch.get_rev_id(base_revision[1])
371
 
            fetch(from_branch=base_branch, to_branch=this_branch)
372
 
            base_is_ancestor = is_ancestor(this_rev_id, base_rev_id,
373
 
                                           this_branch)
374
 
        if file_list is None:
375
 
            interesting_ids = None
376
 
        else:
377
 
            interesting_ids = set()
378
 
            this_tree = this_branch.working_tree()
379
 
            for fname in file_list:
380
 
                path = this_branch.relpath(fname)
381
 
                found_id = False
382
 
                for tree in (this_tree, base_tree.tree, other_tree.tree):
383
 
                    file_id = tree.inventory.path2id(path)
384
 
                    if file_id is not None:
385
 
                        interesting_ids.add(file_id)
386
 
                        found_id = True
387
 
                if not found_id:
388
 
                    raise BzrCommandError("%s is not a source file in any"
389
 
                                          " tree." % fname)
390
 
        merge_inner(this_branch, other_tree, base_tree, tempdir, 
391
 
                    ignore_zero=ignore_zero, backup_files=backup_files, 
392
 
                    merge_type=merge_type, interesting_ids=interesting_ids)
393
 
        if base_is_ancestor and other_rev_id is not None\
394
 
            and other_rev_id not in this_branch.revision_history():
395
 
            this_branch.add_pending_merge(other_rev_id)
396
 
    finally:
397
 
        shutil.rmtree(tempdir)
398
 
 
399
 
 
400
 
def set_interesting(inventory_a, inventory_b, interesting_ids):
401
 
    """Mark files whose ids are in interesting_ids as interesting
402
 
    """
403
 
    for inventory in (inventory_a, inventory_b):
404
 
        for path, source_file in inventory.iteritems():
405
 
             source_file.interesting = source_file.id in interesting_ids
406
 
 
407
 
 
408
 
def generate_cset_optimized(tree_a, tree_b, interesting_ids=None):
409
 
    """Generate a changeset.  If interesting_ids is supplied, only changes
410
 
    to those files will be shown.  Metadata changes are stripped.
411
 
    """ 
412
 
    cset =  generate_changeset(tree_a, tree_b, interesting_ids)
413
 
    for entry in cset.entries.itervalues():
414
 
        entry.metadata_change = None
415
 
    return cset
416
 
 
417
 
 
418
 
def merge_inner(this_branch, other_tree, base_tree, tempdir, 
419
 
                ignore_zero=False, merge_type=ApplyMerge3, backup_files=False,
420
 
                interesting_ids=None):
421
 
 
422
 
    def merge_factory(file_id, base, other):
423
 
        contents_change = merge_type(file_id, base, other)
424
 
        if backup_files:
425
 
            contents_change = BackupBeforeChange(contents_change)
426
 
        return contents_change
427
 
 
428
 
    this_tree = get_tree((this_branch.base, None), tempdir, "this")[1]
429
 
 
430
 
    def get_inventory(tree):
431
 
        return tree.tree.inventory
432
 
 
433
 
    inv_changes = merge_flex(this_tree, base_tree, other_tree,
434
 
                             generate_cset_optimized, get_inventory,
435
 
                             MergeConflictHandler(this_tree, base_tree,
436
 
                             other_tree, ignore_zero=ignore_zero),
437
 
                             merge_factory=merge_factory, 
438
 
                             interesting_ids=interesting_ids)
439
 
 
440
 
    adjust_ids = []
441
 
    for id, path in inv_changes.iteritems():
442
 
        if path is not None:
443
 
            if path == '.':
444
 
                path = ''
445
 
            else:
446
 
                assert path.startswith('.' + os.sep), "path is %s" % path
447
 
            path = path[2:]
448
 
        adjust_ids.append((path, id))
449
 
    if len(adjust_ids) > 0:
450
 
        this_branch.set_inventory(regen_inventory(this_branch, this_tree.root,
451
 
                                                  adjust_ids))
452
 
 
453
 
 
454
 
def regen_inventory(this_branch, root, new_entries):
455
 
    old_entries = this_branch.read_working_inventory()
456
 
    new_inventory = {}
457
 
    by_path = {}
458
 
    new_entries_map = {} 
459
 
    for path, file_id in new_entries:
460
 
        if path is None:
461
 
            continue
462
 
        new_entries_map[file_id] = path
463
 
 
464
 
    def id2path(file_id):
465
 
        path = new_entries_map.get(file_id)
466
 
        if path is not None:
467
 
            return path
468
 
        entry = old_entries[file_id]
469
 
        if entry.parent_id is None:
470
 
            return entry.name
471
 
        return os.path.join(id2path(entry.parent_id), entry.name)
472
 
        
473
 
    for file_id in old_entries:
474
 
        entry = old_entries[file_id]
475
 
        path = id2path(file_id)
476
 
        new_inventory[file_id] = (path, file_id, entry.parent_id, entry.kind)
477
 
        by_path[path] = file_id
478
 
    
479
 
    deletions = 0
480
 
    insertions = 0
481
 
    new_path_list = []
482
 
    for path, file_id in new_entries:
483
 
        if path is None:
484
 
            del new_inventory[file_id]
485
 
            deletions += 1
486
 
        else:
487
 
            new_path_list.append((path, file_id))
488
 
            if file_id not in old_entries:
489
 
                insertions += 1
490
 
    # Ensure no file is added before its parent
491
 
    new_path_list.sort()
492
 
    for path, file_id in new_path_list:
493
 
        if path == '':
494
 
            parent = None
495
 
        else:
496
 
            parent = by_path[os.path.dirname(path)]
497
 
        kind = bzrlib.osutils.file_kind(os.path.join(root, path))
498
 
        new_inventory[file_id] = (path, file_id, parent, kind)
499
 
        by_path[path] = file_id 
500
 
 
501
 
    # Get a list in insertion order
502
 
    new_inventory_list = new_inventory.values()
503
 
    mutter ("""Inventory regeneration:
504
 
old length: %i insertions: %i deletions: %i new_length: %i"""\
505
 
        % (len(old_entries), insertions, deletions, len(new_inventory_list)))
506
 
    assert len(new_inventory_list) == len(old_entries) + insertions - deletions
507
 
    new_inventory_list.sort()
508
 
    return new_inventory_list
509
 
 
510
 
merge_types = {     "merge3": (ApplyMerge3, "Native diff3-style merge"), 
511
 
                     "diff3": (Diff3Merge,  "Merge using external diff3")
512
 
              }
513