~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/merge.py

  • Committer: Robert Collins
  • Date: 2005-09-28 04:58:18 UTC
  • mto: (1092.2.19)
  • mto: This revision was merged to the branch mainline in revision 1391.
  • Revision ID: robertc@robertcollins.net-20050928045818-c5ce6c7cc796f6fc
patch from Rob Weir to correct bzr-man.py

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# Copyright (C) 2005 Canonical Ltd
 
2
 
 
3
# This program is free software; you can redistribute it and/or modify
 
4
# it under the terms of the GNU General Public License as published by
 
5
# the Free Software Foundation; either version 2 of the License, or
 
6
# (at your option) any later version.
 
7
 
 
8
# This program is distributed in the hope that it will be useful,
 
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
11
# GNU General Public License for more details.
 
12
 
 
13
# You should have received a copy of the GNU General Public License
 
14
# along with this program; if not, write to the Free Software
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
16
 
 
17
 
 
18
import os
 
19
import tempfile
 
20
import shutil
 
21
import errno
 
22
from fetch import greedy_fetch
 
23
 
 
24
import bzrlib.osutils
 
25
import bzrlib.revision
 
26
from bzrlib.merge_core import merge_flex, ApplyMerge3, BackupBeforeChange
 
27
from bzrlib.changeset import generate_changeset, ExceptionConflictHandler
 
28
from bzrlib.changeset import Inventory, Diff3Merge
 
29
from bzrlib.branch import Branch
 
30
from bzrlib.errors import BzrCommandError, UnrelatedBranches, NoCommonAncestor
 
31
from bzrlib.errors import NoCommits
 
32
from bzrlib.delta import compare_trees
 
33
from bzrlib.trace import mutter, warning
 
34
from bzrlib.fetch import greedy_fetch
 
35
from bzrlib.revision import is_ancestor
 
36
from bzrlib.osutils import rename
 
37
 
 
38
 
 
39
# comments from abentley on irc: merge happens in two stages, each
 
40
# of which generates a changeset object
 
41
 
 
42
# stage 1: generate OLD->OTHER,
 
43
# stage 2: use MINE and OLD->OTHER to generate MINE -> RESULT
 
44
 
 
45
class MergeConflictHandler(ExceptionConflictHandler):
 
46
    """Handle conflicts encountered while merging.
 
47
 
 
48
    This subclasses ExceptionConflictHandler, so that any types of
 
49
    conflict that are not explicitly handled cause an exception and
 
50
    terminate the merge.
 
51
    """
 
52
    def __init__(self, ignore_zero=False):
 
53
        ExceptionConflictHandler.__init__(self)
 
54
        self.conflicts = 0
 
55
        self.ignore_zero = ignore_zero
 
56
 
 
57
    def copy(self, source, dest):
 
58
        """Copy the text and mode of a file
 
59
        :param source: The path of the file to copy
 
60
        :param dest: The distination file to create
 
61
        """
 
62
        s_file = file(source, "rb")
 
63
        d_file = file(dest, "wb")
 
64
        for line in s_file:
 
65
            d_file.write(line)
 
66
        os.chmod(dest, 0777 & os.stat(source).st_mode)
 
67
 
 
68
    def dump(self, lines, dest):
 
69
        """Copy the text and mode of a file
 
70
        :param source: The path of the file to copy
 
71
        :param dest: The distination file to create
 
72
        """
 
73
        d_file = file(dest, "wb")
 
74
        for line in lines:
 
75
            d_file.write(line)
 
76
 
 
77
    def add_suffix(self, name, suffix, last_new_name=None):
 
78
        """Rename a file to append a suffix.  If the new name exists, the
 
79
        suffix is added repeatedly until a non-existant name is found
 
80
 
 
81
        :param name: The path of the file
 
82
        :param suffix: The suffix to append
 
83
        :param last_new_name: (used for recursive calls) the last name tried
 
84
        """
 
85
        if last_new_name is None:
 
86
            last_new_name = name
 
87
        new_name = last_new_name+suffix
 
88
        try:
 
89
            rename(name, new_name)
 
90
            return new_name
 
91
        except OSError, e:
 
92
            if e.errno != errno.EEXIST and e.errno != errno.ENOTEMPTY:
 
93
                raise
 
94
            return self.add_suffix(name, suffix, last_new_name=new_name)
 
95
 
 
96
    def conflict(self, text):
 
97
        warning(text)
 
98
        self.conflicts += 1
 
99
        
 
100
 
 
101
    def merge_conflict(self, new_file, this_path, base_lines, other_lines):
 
102
        """
 
103
        Handle diff3 conflicts by producing a .THIS, .BASE and .OTHER.  The
 
104
        main file will be a version with diff3 conflicts.
 
105
        :param new_file: Path to the output file with diff3 markers
 
106
        :param this_path: Path to the file text for the THIS tree
 
107
        :param base_path: Path to the file text for the BASE tree
 
108
        :param other_path: Path to the file text for the OTHER tree
 
109
        """
 
110
        self.add_suffix(this_path, ".THIS")
 
111
        self.dump(base_lines, this_path+".BASE")
 
112
        self.dump(other_lines, this_path+".OTHER")
 
113
        rename(new_file, this_path)
 
114
        self.conflict("Diff3 conflict encountered in %s" % this_path)
 
115
 
 
116
    def new_contents_conflict(self, filename, other_contents):
 
117
        """Conflicting contents for newly added file."""
 
118
        self.copy(other_contents, filename + ".OTHER")
 
119
        self.conflict("Conflict in newly added file %s" % filename)
 
120
    
 
121
 
 
122
    def target_exists(self, entry, target, old_path):
 
123
        """Handle the case when the target file or dir exists"""
 
124
        moved_path = self.add_suffix(target, ".moved")
 
125
        self.conflict("Moved existing %s to %s" % (target, moved_path))
 
126
 
 
127
    def rmdir_non_empty(self, filename):
 
128
        """Handle the case where the dir to be removed still has contents"""
 
129
        self.conflict("Directory %s not removed because it is not empty"\
 
130
            % filename)
 
131
        return "skip"
 
132
 
 
133
    def finalize(self):
 
134
        if not self.ignore_zero:
 
135
            print "%d conflicts encountered.\n" % self.conflicts
 
136
            
 
137
def get_tree(treespec, temp_root, label, local_branch=None):
 
138
    location, revno = treespec
 
139
    branch = Branch.open_containing(location)
 
140
    if revno is None:
 
141
        revision = None
 
142
    elif revno == -1:
 
143
        revision = branch.last_patch()
 
144
    else:
 
145
        revision = branch.get_rev_id(revno)
 
146
    return branch, get_revid_tree(branch, revision, temp_root, label,
 
147
                                  local_branch)
 
148
 
 
149
def get_revid_tree(branch, revision, temp_root, label, local_branch):
 
150
    if revision is None:
 
151
        base_tree = branch.working_tree()
 
152
    else:
 
153
        if local_branch is not None:
 
154
            greedy_fetch(local_branch, branch, revision)
 
155
            base_tree = local_branch.revision_tree(revision)
 
156
        else:
 
157
            base_tree = branch.revision_tree(revision)
 
158
    temp_path = os.path.join(temp_root, label)
 
159
    os.mkdir(temp_path)
 
160
    return MergeTree(base_tree, temp_path)
 
161
 
 
162
 
 
163
def file_exists(tree, file_id):
 
164
    return tree.has_filename(tree.id2path(file_id))
 
165
    
 
166
 
 
167
class MergeTree(object):
 
168
    def __init__(self, tree, tempdir):
 
169
        object.__init__(self)
 
170
        if hasattr(tree, "basedir"):
 
171
            self.root = tree.basedir
 
172
        else:
 
173
            self.root = None
 
174
        self.tree = tree
 
175
        self.tempdir = tempdir
 
176
        os.mkdir(os.path.join(self.tempdir, "texts"))
 
177
        self.cached = {}
 
178
 
 
179
    def __iter__(self):
 
180
        return self.tree.__iter__()
 
181
 
 
182
    def __contains__(self, file_id):
 
183
        return file_id in self.tree
 
184
 
 
185
    def get_file(self, file_id):
 
186
        return self.tree.get_file(file_id)
 
187
 
 
188
    def get_file_sha1(self, id):
 
189
        return self.tree.get_file_sha1(id)
 
190
 
 
191
    def id2path(self, file_id):
 
192
        return self.tree.id2path(file_id)
 
193
 
 
194
    def has_id(self, file_id):
 
195
        return self.tree.has_id(file_id)
 
196
 
 
197
    def has_or_had_id(self, file_id):
 
198
        if file_id == self.tree.inventory.root.file_id:
 
199
            return True
 
200
        return self.tree.inventory.has_id(file_id)
 
201
 
 
202
    def has_or_had_id(self, file_id):
 
203
        if file_id == self.tree.inventory.root.file_id:
 
204
            return True
 
205
        return self.tree.inventory.has_id(file_id)
 
206
 
 
207
    def readonly_path(self, id):
 
208
        if id not in self.tree:
 
209
            return None
 
210
        if self.root is not None:
 
211
            return self.tree.abspath(self.tree.id2path(id))
 
212
        else:
 
213
            if self.tree.inventory[id].kind in ("directory", "root_directory"):
 
214
                return self.tempdir
 
215
            if not self.cached.has_key(id):
 
216
                path = os.path.join(self.tempdir, "texts", id)
 
217
                outfile = file(path, "wb")
 
218
                outfile.write(self.tree.get_file(id).read())
 
219
                assert(os.path.exists(path))
 
220
                self.cached[id] = path
 
221
            return self.cached[id]
 
222
 
 
223
 
 
224
 
 
225
def merge(other_revision, base_revision,
 
226
          check_clean=True, ignore_zero=False,
 
227
          this_dir=None, backup_files=False, merge_type=ApplyMerge3,
 
228
          file_list=None):
 
229
    """Merge changes into a tree.
 
230
 
 
231
    base_revision
 
232
        tuple(path, revision) Base for three-way merge.
 
233
    other_revision
 
234
        tuple(path, revision) Other revision for three-way merge.
 
235
    this_dir
 
236
        Directory to merge changes into; '.' by default.
 
237
    check_clean
 
238
        If true, this_dir must have no uncommitted changes before the
 
239
        merge begins.
 
240
    all available ancestors of other_revision and base_revision are
 
241
    automatically pulled into the branch.
 
242
    """
 
243
    from bzrlib.revision import common_ancestor, MultipleRevisionSources
 
244
    from bzrlib.errors import NoSuchRevision
 
245
    tempdir = tempfile.mkdtemp(prefix="bzr-")
 
246
    try:
 
247
        if this_dir is None:
 
248
            this_dir = '.'
 
249
        this_branch = Branch.open_containing(this_dir)
 
250
        this_rev_id = this_branch.last_patch()
 
251
        if this_rev_id is None:
 
252
            raise BzrCommandError("This branch has no commits")
 
253
        if check_clean:
 
254
            changes = compare_trees(this_branch.working_tree(), 
 
255
                                    this_branch.basis_tree(), False)
 
256
            if changes.has_changed():
 
257
                raise BzrCommandError("Working tree has uncommitted changes.")
 
258
        other_branch, other_tree = get_tree(other_revision, tempdir, "other",
 
259
                                            this_branch)
 
260
        if other_revision[1] == -1:
 
261
            other_rev_id = other_branch.last_patch()
 
262
            if other_rev_id is None:
 
263
                raise NoCommits(other_branch)
 
264
            other_basis = other_rev_id
 
265
        elif other_revision[1] is not None:
 
266
            other_rev_id = other_branch.get_rev_id(other_revision[1])
 
267
            other_basis = other_rev_id
 
268
        else:
 
269
            other_rev_id = None
 
270
            other_basis = other_branch.last_patch()
 
271
            if other_basis is None:
 
272
                raise NoCommits(other_branch)
 
273
        if base_revision == [None, None]:
 
274
            try:
 
275
                base_rev_id = common_ancestor(this_rev_id, other_basis, 
 
276
                                              this_branch)
 
277
            except NoCommonAncestor:
 
278
                raise UnrelatedBranches()
 
279
            base_tree = get_revid_tree(this_branch, base_rev_id, tempdir, 
 
280
                                       "base", None)
 
281
            base_is_ancestor = True
 
282
        else:
 
283
            base_branch, base_tree = get_tree(base_revision, tempdir, "base")
 
284
            if base_revision[1] == -1:
 
285
                base_rev_id = base_branch.last_patch()
 
286
            elif base_revision[1] is None:
 
287
                base_rev_id = None
 
288
            else:
 
289
                base_rev_id = base_branch.get_rev_id(base_revision[1])
 
290
            multi_source = MultipleRevisionSources(this_branch, base_branch)
 
291
            base_is_ancestor = is_ancestor(this_rev_id, base_rev_id,
 
292
                                           multi_source)
 
293
        if file_list is None:
 
294
            interesting_ids = None
 
295
        else:
 
296
            interesting_ids = set()
 
297
            this_tree = this_branch.working_tree()
 
298
            for fname in file_list:
 
299
                path = this_branch.relpath(fname)
 
300
                found_id = False
 
301
                for tree in (this_tree, base_tree.tree, other_tree.tree):
 
302
                    file_id = tree.inventory.path2id(path)
 
303
                    if file_id is not None:
 
304
                        interesting_ids.add(file_id)
 
305
                        found_id = True
 
306
                if not found_id:
 
307
                    raise BzrCommandError("%s is not a source file in any"
 
308
                                          " tree." % fname)
 
309
        merge_inner(this_branch, other_tree, base_tree, tempdir, 
 
310
                    ignore_zero=ignore_zero, backup_files=backup_files, 
 
311
                    merge_type=merge_type, interesting_ids=interesting_ids)
 
312
        if base_is_ancestor and other_rev_id is not None\
 
313
            and other_rev_id not in this_branch.revision_history():
 
314
            this_branch.add_pending_merge(other_rev_id)
 
315
    finally:
 
316
        shutil.rmtree(tempdir)
 
317
 
 
318
 
 
319
def set_interesting(inventory_a, inventory_b, interesting_ids):
 
320
    """Mark files whose ids are in interesting_ids as interesting
 
321
    """
 
322
    for inventory in (inventory_a, inventory_b):
 
323
        for path, source_file in inventory.iteritems():
 
324
             source_file.interesting = source_file.id in interesting_ids
 
325
 
 
326
 
 
327
def generate_cset_optimized(tree_a, tree_b, interesting_ids=None):
 
328
    """Generate a changeset.  If interesting_ids is supplied, only changes
 
329
    to those files will be shown.  Metadata changes are stripped.
 
330
    """ 
 
331
    cset =  generate_changeset(tree_a, tree_b, interesting_ids)
 
332
    for entry in cset.entries.itervalues():
 
333
        entry.metadata_change = None
 
334
    return cset
 
335
 
 
336
 
 
337
def merge_inner(this_branch, other_tree, base_tree, tempdir, 
 
338
                ignore_zero=False, merge_type=ApplyMerge3, backup_files=False,
 
339
                interesting_ids=None):
 
340
 
 
341
    def merge_factory(file_id, base, other):
 
342
        contents_change = merge_type(file_id, base, other)
 
343
        if backup_files:
 
344
            contents_change = BackupBeforeChange(contents_change)
 
345
        return contents_change
 
346
 
 
347
    this_tree = get_tree((this_branch.base, None), tempdir, "this")[1]
 
348
 
 
349
    def get_inventory(tree):
 
350
        return tree.tree.inventory
 
351
 
 
352
    inv_changes = merge_flex(this_tree, base_tree, other_tree,
 
353
                             generate_cset_optimized, get_inventory,
 
354
                             MergeConflictHandler(ignore_zero=ignore_zero),
 
355
                             merge_factory=merge_factory, 
 
356
                             interesting_ids=interesting_ids)
 
357
 
 
358
    adjust_ids = []
 
359
    for id, path in inv_changes.iteritems():
 
360
        if path is not None:
 
361
            if path == '.':
 
362
                path = ''
 
363
            else:
 
364
                assert path.startswith('.' + os.sep), "path is %s" % path
 
365
            path = path[2:]
 
366
        adjust_ids.append((path, id))
 
367
    if len(adjust_ids) > 0:
 
368
        this_branch.set_inventory(regen_inventory(this_branch, this_tree.root,
 
369
                                                  adjust_ids))
 
370
 
 
371
 
 
372
def regen_inventory(this_branch, root, new_entries):
 
373
    old_entries = this_branch.read_working_inventory()
 
374
    new_inventory = {}
 
375
    by_path = {}
 
376
    new_entries_map = {} 
 
377
    for path, file_id in new_entries:
 
378
        if path is None:
 
379
            continue
 
380
        new_entries_map[file_id] = path
 
381
 
 
382
    def id2path(file_id):
 
383
        path = new_entries_map.get(file_id)
 
384
        if path is not None:
 
385
            return path
 
386
        entry = old_entries[file_id]
 
387
        if entry.parent_id is None:
 
388
            return entry.name
 
389
        return os.path.join(id2path(entry.parent_id), entry.name)
 
390
        
 
391
    for file_id in old_entries:
 
392
        entry = old_entries[file_id]
 
393
        path = id2path(file_id)
 
394
        new_inventory[file_id] = (path, file_id, entry.parent_id, entry.kind)
 
395
        by_path[path] = file_id
 
396
    
 
397
    deletions = 0
 
398
    insertions = 0
 
399
    new_path_list = []
 
400
    for path, file_id in new_entries:
 
401
        if path is None:
 
402
            del new_inventory[file_id]
 
403
            deletions += 1
 
404
        else:
 
405
            new_path_list.append((path, file_id))
 
406
            if file_id not in old_entries:
 
407
                insertions += 1
 
408
    # Ensure no file is added before its parent
 
409
    new_path_list.sort()
 
410
    for path, file_id in new_path_list:
 
411
        if path == '':
 
412
            parent = None
 
413
        else:
 
414
            parent = by_path[os.path.dirname(path)]
 
415
        kind = bzrlib.osutils.file_kind(os.path.join(root, path))
 
416
        new_inventory[file_id] = (path, file_id, parent, kind)
 
417
        by_path[path] = file_id 
 
418
 
 
419
    # Get a list in insertion order
 
420
    new_inventory_list = new_inventory.values()
 
421
    mutter ("""Inventory regeneration:
 
422
old length: %i insertions: %i deletions: %i new_length: %i"""\
 
423
        % (len(old_entries), insertions, deletions, len(new_inventory_list)))
 
424
    assert len(new_inventory_list) == len(old_entries) + insertions - deletions
 
425
    new_inventory_list.sort()
 
426
    return new_inventory_list
 
427
 
 
428
merge_types = {     "merge3": (ApplyMerge3, "Native diff3-style merge"), 
 
429
                     "diff3": (Diff3Merge,  "Merge using external diff3")
 
430
              }
 
431