~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/merge.py

  • Committer: Martin Pool
  • Date: 2005-05-03 08:00:27 UTC
  • Revision ID: mbp@sourcefrog.net-20050503080027-908edb5b39982198
doc

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2005 Canonical Ltd
2
 
 
3
 
# This program is free software; you can redistribute it and/or modify
4
 
# it under the terms of the GNU General Public License as published by
5
 
# the Free Software Foundation; either version 2 of the License, or
6
 
# (at your option) any later version.
7
 
 
8
 
# This program is distributed in the hope that it will be useful,
9
 
# but WITHOUT ANY WARRANTY; without even the implied warranty of
10
 
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
11
 
# GNU General Public License for more details.
12
 
 
13
 
# You should have received a copy of the GNU General Public License
14
 
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
 
 
17
 
 
18
 
import os
19
 
import tempfile
20
 
import shutil
21
 
import errno
22
 
from fetch import greedy_fetch
23
 
 
24
 
import bzrlib.osutils
25
 
import bzrlib.revision
26
 
from bzrlib.merge_core import merge_flex, ApplyMerge3, BackupBeforeChange
27
 
from bzrlib.changeset import generate_changeset, ExceptionConflictHandler
28
 
from bzrlib.changeset import Inventory, Diff3Merge, ReplaceContents
29
 
from bzrlib.branch import Branch
30
 
from bzrlib.errors import BzrCommandError, UnrelatedBranches, NoCommonAncestor
31
 
from bzrlib.errors import NoCommits
32
 
from bzrlib.delta import compare_trees
33
 
from bzrlib.trace import mutter, warning
34
 
from bzrlib.fetch import greedy_fetch
35
 
from bzrlib.revision import is_ancestor
36
 
 
37
 
# comments from abentley on irc: merge happens in two stages, each
38
 
# of which generates a changeset object
39
 
 
40
 
# stage 1: generate OLD->OTHER,
41
 
# stage 2: use MINE and OLD->OTHER to generate MINE -> RESULT
42
 
 
43
 
class MergeConflictHandler(ExceptionConflictHandler):
44
 
    """Handle conflicts encountered while merging.
45
 
 
46
 
    This subclasses ExceptionConflictHandler, so that any types of
47
 
    conflict that are not explicitly handled cause an exception and
48
 
    terminate the merge.
49
 
    """
50
 
    def __init__(self, ignore_zero=False):
51
 
        ExceptionConflictHandler.__init__(self)
52
 
        self.conflicts = 0
53
 
        self.ignore_zero = ignore_zero
54
 
 
55
 
    def copy(self, source, dest):
56
 
        """Copy the text and mode of a file
57
 
        :param source: The path of the file to copy
58
 
        :param dest: The distination file to create
59
 
        """
60
 
        s_file = file(source, "rb")
61
 
        d_file = file(dest, "wb")
62
 
        for line in s_file:
63
 
            d_file.write(line)
64
 
        os.chmod(dest, 0777 & os.stat(source).st_mode)
65
 
 
66
 
    def dump(self, lines, dest):
67
 
        """Copy the text and mode of a file
68
 
        :param source: The path of the file to copy
69
 
        :param dest: The distination file to create
70
 
        """
71
 
        d_file = file(dest, "wb")
72
 
        for line in lines:
73
 
            d_file.write(line)
74
 
 
75
 
    def add_suffix(self, name, suffix, last_new_name=None):
76
 
        """Rename a file to append a suffix.  If the new name exists, the
77
 
        suffix is added repeatedly until a non-existant name is found
78
 
 
79
 
        :param name: The path of the file
80
 
        :param suffix: The suffix to append
81
 
        :param last_new_name: (used for recursive calls) the last name tried
82
 
        """
83
 
        if last_new_name is None:
84
 
            last_new_name = name
85
 
        new_name = last_new_name+suffix
86
 
        try:
87
 
            os.rename(name, new_name)
88
 
            return new_name
89
 
        except OSError, e:
90
 
            if e.errno != errno.EEXIST and e.errno != errno.ENOTEMPTY:
91
 
                raise
92
 
            return self.add_suffix(name, suffix, last_new_name=new_name)
93
 
 
94
 
    def conflict(self, text):
95
 
        warning(text)
96
 
        self.conflicts += 1
97
 
        
98
 
 
99
 
    def merge_conflict(self, new_file, this_path, base_lines, other_lines):
100
 
        """
101
 
        Handle diff3 conflicts by producing a .THIS, .BASE and .OTHER.  The
102
 
        main file will be a version with diff3 conflicts.
103
 
        :param new_file: Path to the output file with diff3 markers
104
 
        :param this_path: Path to the file text for the THIS tree
105
 
        :param base_path: Path to the file text for the BASE tree
106
 
        :param other_path: Path to the file text for the OTHER tree
107
 
        """
108
 
        self.add_suffix(this_path, ".THIS")
109
 
        self.dump(base_lines, this_path+".BASE")
110
 
        self.dump(other_lines, this_path+".OTHER")
111
 
        os.rename(new_file, this_path)
112
 
        self.conflict("Diff3 conflict encountered in %s" % this_path)
113
 
 
114
 
    def new_contents_conflict(self, filename, other_contents):
115
 
        """Conflicting contents for newly added file."""
116
 
        self.copy(other_contents, filename + ".OTHER")
117
 
        self.conflict("Conflict in newly added file %s" % filename)
118
 
    
119
 
 
120
 
    def target_exists(self, entry, target, old_path):
121
 
        """Handle the case when the target file or dir exists"""
122
 
        moved_path = self.add_suffix(target, ".moved")
123
 
        self.conflict("Moved existing %s to %s" % (target, moved_path))
124
 
 
125
 
    def rmdir_non_empty(self, filename):
126
 
        """Handle the case where the dir to be removed still has contents"""
127
 
        self.conflict("Directory %s not removed because it is not empty"\
128
 
            % filename)
129
 
        return "skip"
130
 
 
131
 
    def rem_contents_conflict(self, filename, this_contents, base_contents):
132
 
        base_contents(filename+".BASE", self, False)
133
 
        this_contents(filename+".THIS", self, False)
134
 
        return ReplaceContents(this_contents, None)
135
 
 
136
 
    def finalize(self):
137
 
        if not self.ignore_zero:
138
 
            print "%d conflicts encountered.\n" % self.conflicts
139
 
            
140
 
def get_tree(treespec, temp_root, label, local_branch=None):
141
 
    location, revno = treespec
142
 
    branch = Branch.open_containing(location)
143
 
    if revno is None:
144
 
        revision = None
145
 
    elif revno == -1:
146
 
        revision = branch.last_patch()
147
 
    else:
148
 
        revision = branch.get_rev_id(revno)
149
 
    return branch, get_revid_tree(branch, revision, temp_root, label,
150
 
                                  local_branch)
151
 
 
152
 
def get_revid_tree(branch, revision, temp_root, label, local_branch):
153
 
    if revision is None:
154
 
        base_tree = branch.working_tree()
155
 
    else:
156
 
        if local_branch is not None:
157
 
            greedy_fetch(local_branch, branch, revision)
158
 
            base_tree = local_branch.revision_tree(revision)
159
 
        else:
160
 
            base_tree = branch.revision_tree(revision)
161
 
    temp_path = os.path.join(temp_root, label)
162
 
    os.mkdir(temp_path)
163
 
    return MergeTree(base_tree, temp_path)
164
 
 
165
 
 
166
 
def file_exists(tree, file_id):
167
 
    return tree.has_filename(tree.id2path(file_id))
168
 
    
169
 
 
170
 
class MergeTree(object):
171
 
    def __init__(self, tree, tempdir):
172
 
        object.__init__(self)
173
 
        if hasattr(tree, "basedir"):
174
 
            self.root = tree.basedir
175
 
        else:
176
 
            self.root = None
177
 
        self.tree = tree
178
 
        self.tempdir = tempdir
179
 
        os.mkdir(os.path.join(self.tempdir, "texts"))
180
 
        self.cached = {}
181
 
 
182
 
    def __iter__(self):
183
 
        return self.tree.__iter__()
184
 
 
185
 
    def __contains__(self, file_id):
186
 
        return file_id in self.tree
187
 
 
188
 
    def get_file(self, file_id):
189
 
        return self.tree.get_file(file_id)
190
 
 
191
 
    def get_file_sha1(self, id):
192
 
        return self.tree.get_file_sha1(id)
193
 
 
194
 
    def id2path(self, file_id):
195
 
        return self.tree.id2path(file_id)
196
 
 
197
 
    def has_id(self, file_id):
198
 
        return self.tree.has_id(file_id)
199
 
 
200
 
    def has_or_had_id(self, file_id):
201
 
        if file_id == self.tree.inventory.root.file_id:
202
 
            return True
203
 
        return self.tree.inventory.has_id(file_id)
204
 
 
205
 
    def has_or_had_id(self, file_id):
206
 
        if file_id == self.tree.inventory.root.file_id:
207
 
            return True
208
 
        return self.tree.inventory.has_id(file_id)
209
 
 
210
 
    def readonly_path(self, id):
211
 
        if id not in self.tree:
212
 
            return None
213
 
        if self.root is not None:
214
 
            return self.tree.abspath(self.tree.id2path(id))
215
 
        else:
216
 
            if self.tree.inventory[id].kind in ("directory", "root_directory"):
217
 
                return self.tempdir
218
 
            if not self.cached.has_key(id):
219
 
                path = os.path.join(self.tempdir, "texts", id)
220
 
                outfile = file(path, "wb")
221
 
                outfile.write(self.tree.get_file(id).read())
222
 
                assert(os.path.exists(path))
223
 
                self.cached[id] = path
224
 
            return self.cached[id]
225
 
 
226
 
 
227
 
 
228
 
def merge(other_revision, base_revision,
229
 
          check_clean=True, ignore_zero=False,
230
 
          this_dir=None, backup_files=False, merge_type=ApplyMerge3,
231
 
          file_list=None):
232
 
    """Merge changes into a tree.
233
 
 
234
 
    base_revision
235
 
        tuple(path, revision) Base for three-way merge.
236
 
    other_revision
237
 
        tuple(path, revision) Other revision for three-way merge.
238
 
    this_dir
239
 
        Directory to merge changes into; '.' by default.
240
 
    check_clean
241
 
        If true, this_dir must have no uncommitted changes before the
242
 
        merge begins.
243
 
    all available ancestors of other_revision and base_revision are
244
 
    automatically pulled into the branch.
245
 
    """
246
 
    from bzrlib.revision import common_ancestor, MultipleRevisionSources
247
 
    from bzrlib.errors import NoSuchRevision
248
 
    tempdir = tempfile.mkdtemp(prefix="bzr-")
249
 
    try:
250
 
        if this_dir is None:
251
 
            this_dir = '.'
252
 
        this_branch = Branch.open_containing(this_dir)
253
 
        this_rev_id = this_branch.last_patch()
254
 
        if this_rev_id is None:
255
 
            raise BzrCommandError("This branch has no commits")
256
 
        if check_clean:
257
 
            changes = compare_trees(this_branch.working_tree(), 
258
 
                                    this_branch.basis_tree(), False)
259
 
            if changes.has_changed():
260
 
                raise BzrCommandError("Working tree has uncommitted changes.")
261
 
        other_branch, other_tree = get_tree(other_revision, tempdir, "other",
262
 
                                            this_branch)
263
 
        if other_revision[1] == -1:
264
 
            other_rev_id = other_branch.last_patch()
265
 
            if other_rev_id is None:
266
 
                raise NoCommits(other_branch)
267
 
            other_basis = other_rev_id
268
 
        elif other_revision[1] is not None:
269
 
            other_rev_id = other_branch.get_rev_id(other_revision[1])
270
 
            other_basis = other_rev_id
271
 
        else:
272
 
            other_rev_id = None
273
 
            other_basis = other_branch.last_patch()
274
 
            if other_basis is None:
275
 
                raise NoCommits(other_branch)
276
 
        if base_revision == [None, None]:
277
 
            try:
278
 
                base_rev_id = common_ancestor(this_rev_id, other_basis, 
279
 
                                              this_branch)
280
 
            except NoCommonAncestor:
281
 
                raise UnrelatedBranches()
282
 
            base_tree = get_revid_tree(this_branch, base_rev_id, tempdir, 
283
 
                                       "base", None)
284
 
            base_is_ancestor = True
285
 
        else:
286
 
            base_branch, base_tree = get_tree(base_revision, tempdir, "base")
287
 
            if base_revision[1] == -1:
288
 
                base_rev_id = base_branch.last_patch()
289
 
            elif base_revision[1] is None:
290
 
                base_rev_id = None
291
 
            else:
292
 
                base_rev_id = base_branch.get_rev_id(base_revision[1])
293
 
            multi_source = MultipleRevisionSources(this_branch, base_branch)
294
 
            base_is_ancestor = is_ancestor(this_rev_id, base_rev_id,
295
 
                                           multi_source)
296
 
        if file_list is None:
297
 
            interesting_ids = None
298
 
        else:
299
 
            interesting_ids = set()
300
 
            this_tree = this_branch.working_tree()
301
 
            for fname in file_list:
302
 
                path = this_branch.relpath(fname)
303
 
                found_id = False
304
 
                for tree in (this_tree, base_tree.tree, other_tree.tree):
305
 
                    file_id = tree.inventory.path2id(path)
306
 
                    if file_id is not None:
307
 
                        interesting_ids.add(file_id)
308
 
                        found_id = True
309
 
                if not found_id:
310
 
                    raise BzrCommandError("%s is not a source file in any"
311
 
                                          " tree." % fname)
312
 
        merge_inner(this_branch, other_tree, base_tree, tempdir, 
313
 
                    ignore_zero=ignore_zero, backup_files=backup_files, 
314
 
                    merge_type=merge_type, interesting_ids=interesting_ids)
315
 
        if base_is_ancestor and other_rev_id is not None\
316
 
            and other_rev_id not in this_branch.revision_history():
317
 
            this_branch.add_pending_merge(other_rev_id)
318
 
    finally:
319
 
        shutil.rmtree(tempdir)
320
 
 
321
 
 
322
 
def set_interesting(inventory_a, inventory_b, interesting_ids):
323
 
    """Mark files whose ids are in interesting_ids as interesting
324
 
    """
325
 
    for inventory in (inventory_a, inventory_b):
326
 
        for path, source_file in inventory.iteritems():
327
 
             source_file.interesting = source_file.id in interesting_ids
328
 
 
329
 
 
330
 
def generate_cset_optimized(tree_a, tree_b, interesting_ids=None):
331
 
    """Generate a changeset.  If interesting_ids is supplied, only changes
332
 
    to those files will be shown.  Metadata changes are stripped.
333
 
    """ 
334
 
    cset =  generate_changeset(tree_a, tree_b, interesting_ids)
335
 
    for entry in cset.entries.itervalues():
336
 
        entry.metadata_change = None
337
 
    return cset
338
 
 
339
 
 
340
 
def merge_inner(this_branch, other_tree, base_tree, tempdir, 
341
 
                ignore_zero=False, merge_type=ApplyMerge3, backup_files=False,
342
 
                interesting_ids=None):
343
 
 
344
 
    def merge_factory(file_id, base, other):
345
 
        contents_change = merge_type(file_id, base, other)
346
 
        if backup_files:
347
 
            contents_change = BackupBeforeChange(contents_change)
348
 
        return contents_change
349
 
 
350
 
    this_tree = get_tree((this_branch.base, None), tempdir, "this")[1]
351
 
 
352
 
    def get_inventory(tree):
353
 
        return tree.tree.inventory
354
 
 
355
 
    inv_changes = merge_flex(this_tree, base_tree, other_tree,
356
 
                             generate_cset_optimized, get_inventory,
357
 
                             MergeConflictHandler(ignore_zero=ignore_zero),
358
 
                             merge_factory=merge_factory, 
359
 
                             interesting_ids=interesting_ids)
360
 
 
361
 
    adjust_ids = []
362
 
    for id, path in inv_changes.iteritems():
363
 
        if path is not None:
364
 
            if path == '.':
365
 
                path = ''
366
 
            else:
367
 
                assert path.startswith('.' + os.sep), "path is %s" % path
368
 
            path = path[2:]
369
 
        adjust_ids.append((path, id))
370
 
    if len(adjust_ids) > 0:
371
 
        this_branch.set_inventory(regen_inventory(this_branch, this_tree.root,
372
 
                                                  adjust_ids))
373
 
 
374
 
 
375
 
def regen_inventory(this_branch, root, new_entries):
376
 
    old_entries = this_branch.read_working_inventory()
377
 
    new_inventory = {}
378
 
    by_path = {}
379
 
    new_entries_map = {} 
380
 
    for path, file_id in new_entries:
381
 
        if path is None:
382
 
            continue
383
 
        new_entries_map[file_id] = path
384
 
 
385
 
    def id2path(file_id):
386
 
        path = new_entries_map.get(file_id)
387
 
        if path is not None:
388
 
            return path
389
 
        entry = old_entries[file_id]
390
 
        if entry.parent_id is None:
391
 
            return entry.name
392
 
        return os.path.join(id2path(entry.parent_id), entry.name)
393
 
        
394
 
    for file_id in old_entries:
395
 
        entry = old_entries[file_id]
396
 
        path = id2path(file_id)
397
 
        new_inventory[file_id] = (path, file_id, entry.parent_id, entry.kind)
398
 
        by_path[path] = file_id
399
 
    
400
 
    deletions = 0
401
 
    insertions = 0
402
 
    new_path_list = []
403
 
    for path, file_id in new_entries:
404
 
        if path is None:
405
 
            del new_inventory[file_id]
406
 
            deletions += 1
407
 
        else:
408
 
            new_path_list.append((path, file_id))
409
 
            if file_id not in old_entries:
410
 
                insertions += 1
411
 
    # Ensure no file is added before its parent
412
 
    new_path_list.sort()
413
 
    for path, file_id in new_path_list:
414
 
        if path == '':
415
 
            parent = None
416
 
        else:
417
 
            parent = by_path[os.path.dirname(path)]
418
 
        kind = bzrlib.osutils.file_kind(os.path.join(root, path))
419
 
        new_inventory[file_id] = (path, file_id, parent, kind)
420
 
        by_path[path] = file_id 
421
 
 
422
 
    # Get a list in insertion order
423
 
    new_inventory_list = new_inventory.values()
424
 
    mutter ("""Inventory regeneration:
425
 
old length: %i insertions: %i deletions: %i new_length: %i"""\
426
 
        % (len(old_entries), insertions, deletions, len(new_inventory_list)))
427
 
    assert len(new_inventory_list) == len(old_entries) + insertions - deletions
428
 
    new_inventory_list.sort()
429
 
    return new_inventory_list
430
 
 
431
 
merge_types = {     "merge3": (ApplyMerge3, "Native diff3-style merge"), 
432
 
                     "diff3": (Diff3Merge,  "Merge using external diff3")
433
 
              }
434