~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/merge.py

  • Committer: mbp at sourcefrog
  • Date: 2005-03-09 04:08:15 UTC
  • Revision ID: mbp@sourcefrog.net-20050309040815-13242001617e4a06
import from baz patch-364

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2005 Canonical Ltd
2
 
 
3
 
# This program is free software; you can redistribute it and/or modify
4
 
# it under the terms of the GNU General Public License as published by
5
 
# the Free Software Foundation; either version 2 of the License, or
6
 
# (at your option) any later version.
7
 
 
8
 
# This program is distributed in the hope that it will be useful,
9
 
# but WITHOUT ANY WARRANTY; without even the implied warranty of
10
 
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
11
 
# GNU General Public License for more details.
12
 
 
13
 
# You should have received a copy of the GNU General Public License
14
 
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
 
 
17
 
 
18
 
import os.path
19
 
import tempfile
20
 
import shutil
21
 
import errno
22
 
from fetch import greedy_fetch
23
 
 
24
 
import bzrlib.osutils
25
 
import bzrlib.revision
26
 
from bzrlib.merge_core import merge_flex, ApplyMerge3, BackupBeforeChange
27
 
from bzrlib.changeset import generate_changeset, ExceptionConflictHandler
28
 
from bzrlib.changeset import Inventory, Diff3Merge
29
 
from bzrlib.branch import find_branch
30
 
from bzrlib.errors import BzrCommandError, UnrelatedBranches
31
 
from bzrlib.delta import compare_trees
32
 
from bzrlib.trace import mutter, warning
33
 
from bzrlib.fetch import greedy_fetch
34
 
from bzrlib.revision import is_ancestor
35
 
 
36
 
# comments from abentley on irc: merge happens in two stages, each
37
 
# of which generates a changeset object
38
 
 
39
 
# stage 1: generate OLD->OTHER,
40
 
# stage 2: use MINE and OLD->OTHER to generate MINE -> RESULT
41
 
 
42
 
class MergeConflictHandler(ExceptionConflictHandler):
43
 
    """Handle conflicts encountered while merging.
44
 
 
45
 
    This subclasses ExceptionConflictHandler, so that any types of
46
 
    conflict that are not explicitly handled cause an exception and
47
 
    terminate the merge.
48
 
    """
49
 
    def __init__(self, dir, ignore_zero=False):
50
 
        ExceptionConflictHandler.__init__(self, dir)
51
 
        self.conflicts = 0
52
 
        self.ignore_zero = ignore_zero
53
 
 
54
 
    def copy(self, source, dest):
55
 
        """Copy the text and mode of a file
56
 
        :param source: The path of the file to copy
57
 
        :param dest: The distination file to create
58
 
        """
59
 
        s_file = file(source, "rb")
60
 
        d_file = file(dest, "wb")
61
 
        for line in s_file:
62
 
            d_file.write(line)
63
 
        os.chmod(dest, 0777 & os.stat(source).st_mode)
64
 
 
65
 
    def dump(self, lines, dest):
66
 
        """Copy the text and mode of a file
67
 
        :param source: The path of the file to copy
68
 
        :param dest: The distination file to create
69
 
        """
70
 
        d_file = file(dest, "wb")
71
 
        for line in lines:
72
 
            d_file.write(line)
73
 
 
74
 
    def add_suffix(self, name, suffix, last_new_name=None):
75
 
        """Rename a file to append a suffix.  If the new name exists, the
76
 
        suffix is added repeatedly until a non-existant name is found
77
 
 
78
 
        :param name: The path of the file
79
 
        :param suffix: The suffix to append
80
 
        :param last_new_name: (used for recursive calls) the last name tried
81
 
        """
82
 
        if last_new_name is None:
83
 
            last_new_name = name
84
 
        new_name = last_new_name+suffix
85
 
        try:
86
 
            os.rename(name, new_name)
87
 
            return new_name
88
 
        except OSError, e:
89
 
            if e.errno != errno.EEXIST and e.errno != errno.ENOTEMPTY:
90
 
                raise
91
 
            return self.add_suffix(name, suffix, last_new_name=new_name)
92
 
 
93
 
    def conflict(self, text):
94
 
        warning(text)
95
 
        self.conflicts += 1
96
 
        
97
 
 
98
 
    def merge_conflict(self, new_file, this_path, base_lines, other_lines):
99
 
        """
100
 
        Handle diff3 conflicts by producing a .THIS, .BASE and .OTHER.  The
101
 
        main file will be a version with diff3 conflicts.
102
 
        :param new_file: Path to the output file with diff3 markers
103
 
        :param this_path: Path to the file text for the THIS tree
104
 
        :param base_path: Path to the file text for the BASE tree
105
 
        :param other_path: Path to the file text for the OTHER tree
106
 
        """
107
 
        self.add_suffix(this_path, ".THIS")
108
 
        self.dump(base_lines, this_path+".BASE")
109
 
        self.dump(other_lines, this_path+".OTHER")
110
 
        os.rename(new_file, this_path)
111
 
        self.conflict("Diff3 conflict encountered in %s" % this_path)
112
 
 
113
 
    def new_contents_conflict(self, filename, other_contents):
114
 
        """Conflicting contents for newly added file."""
115
 
        self.copy(other_contents, filename + ".OTHER")
116
 
        self.conflict("Conflict in newly added file %s" % filename)
117
 
    
118
 
 
119
 
    def target_exists(self, entry, target, old_path):
120
 
        """Handle the case when the target file or dir exists"""
121
 
        moved_path = self.add_suffix(target, ".moved")
122
 
        self.conflict("Moved existing %s to %s" % (target, moved_path))
123
 
 
124
 
    def rmdir_non_empty(self, filename):
125
 
        """Handle the case where the dir to be removed still has contents"""
126
 
        self.conflict("Directory %s not removed because it is not empty"\
127
 
            % filename)
128
 
        return "skip"
129
 
 
130
 
    def finalize(self):
131
 
        if not self.ignore_zero:
132
 
            print "%d conflicts encountered.\n" % self.conflicts
133
 
            
134
 
def get_tree(treespec, temp_root, label, local_branch=None):
135
 
    location, revno = treespec
136
 
    branch = find_branch(location)
137
 
    if revno is None:
138
 
        revision = None
139
 
    elif revno == -1:
140
 
        revision = branch.last_patch()
141
 
    else:
142
 
        revision = branch.lookup_revision(revno)
143
 
    return branch, get_revid_tree(branch, revision, temp_root, label,
144
 
                                  local_branch)
145
 
 
146
 
def get_revid_tree(branch, revision, temp_root, label, local_branch):
147
 
    if revision is None:
148
 
        base_tree = branch.working_tree()
149
 
    else:
150
 
        if local_branch is not None:
151
 
            greedy_fetch(local_branch, branch, revision)
152
 
            base_tree = local_branch.revision_tree(revision)
153
 
        else:
154
 
            base_tree = branch.revision_tree(revision)
155
 
    temp_path = os.path.join(temp_root, label)
156
 
    os.mkdir(temp_path)
157
 
    return MergeTree(base_tree, temp_path)
158
 
 
159
 
 
160
 
def file_exists(tree, file_id):
161
 
    return tree.has_filename(tree.id2path(file_id))
162
 
    
163
 
 
164
 
class MergeTree(object):
165
 
    def __init__(self, tree, tempdir):
166
 
        object.__init__(self)
167
 
        if hasattr(tree, "basedir"):
168
 
            self.root = tree.basedir
169
 
        else:
170
 
            self.root = None
171
 
        self.tree = tree
172
 
        self.tempdir = tempdir
173
 
        os.mkdir(os.path.join(self.tempdir, "texts"))
174
 
        self.cached = {}
175
 
 
176
 
    def __iter__(self):
177
 
        return self.tree.__iter__()
178
 
 
179
 
    def __contains__(self, file_id):
180
 
        return file_id in self.tree
181
 
 
182
 
    def get_file(self, file_id):
183
 
        return self.tree.get_file(file_id)
184
 
 
185
 
    def get_file_sha1(self, id):
186
 
        return self.tree.get_file_sha1(id)
187
 
 
188
 
    def id2path(self, file_id):
189
 
        return self.tree.id2path(file_id)
190
 
 
191
 
    def has_id(self, file_id):
192
 
        return self.tree.has_id(file_id)
193
 
 
194
 
    def has_or_had_id(self, file_id):
195
 
        if file_id == self.tree.inventory.root.file_id:
196
 
            return True
197
 
        return self.tree.inventory.has_id(file_id)
198
 
 
199
 
    def readonly_path(self, id):
200
 
        if id not in self.tree:
201
 
            return None
202
 
        if self.root is not None:
203
 
            return self.tree.abspath(self.tree.id2path(id))
204
 
        else:
205
 
            if self.tree.inventory[id].kind in ("directory", "root_directory"):
206
 
                return self.tempdir
207
 
            if not self.cached.has_key(id):
208
 
                path = os.path.join(self.tempdir, "texts", id)
209
 
                outfile = file(path, "wb")
210
 
                outfile.write(self.tree.get_file(id).read())
211
 
                assert(os.path.exists(path))
212
 
                self.cached[id] = path
213
 
            return self.cached[id]
214
 
 
215
 
 
216
 
 
217
 
def merge(other_revision, base_revision,
218
 
          check_clean=True, ignore_zero=False,
219
 
          this_dir=None, backup_files=False, merge_type=ApplyMerge3,
220
 
          file_list=None):
221
 
    """Merge changes into a tree.
222
 
 
223
 
    base_revision
224
 
        tuple(path, revision) Base for three-way merge.
225
 
    other_revision
226
 
        tuple(path, revision) Other revision for three-way merge.
227
 
    this_dir
228
 
        Directory to merge changes into; '.' by default.
229
 
    check_clean
230
 
        If true, this_dir must have no uncommitted changes before the
231
 
        merge begins.
232
 
    all available ancestors of other_revision and base_revision are
233
 
    automatically pulled into the branch.
234
 
    """
235
 
    from bzrlib.revision import common_ancestor, MultipleRevisionSources
236
 
    from bzrlib.errors import NoSuchRevision
237
 
    tempdir = tempfile.mkdtemp(prefix="bzr-")
238
 
    try:
239
 
        if this_dir is None:
240
 
            this_dir = '.'
241
 
        this_branch = find_branch(this_dir)
242
 
        this_rev_id = this_branch.last_patch()
243
 
        if this_rev_id is None:
244
 
            raise BzrCommandError("This branch has no commits")
245
 
        if check_clean:
246
 
            changes = compare_trees(this_branch.working_tree(), 
247
 
                                    this_branch.basis_tree(), False)
248
 
            if changes.has_changed():
249
 
                raise BzrCommandError("Working tree has uncommitted changes.")
250
 
        other_branch, other_tree = get_tree(other_revision, tempdir, "other",
251
 
                                            this_branch)
252
 
        if other_revision[1] == -1:
253
 
            other_rev_id = other_branch.last_patch()
254
 
            other_basis = other_rev_id
255
 
        elif other_revision[1] is not None:
256
 
            other_rev_id = other_branch.lookup_revision(other_revision[1])
257
 
            other_basis = other_rev_id
258
 
        else:
259
 
            other_rev_id = None
260
 
            other_basis = other_branch.last_patch()
261
 
        if base_revision == [None, None]:
262
 
            base_rev_id = common_ancestor(this_rev_id, other_basis, 
263
 
                                          this_branch)
264
 
            if base_rev_id is None:
265
 
                raise UnrelatedBranches()
266
 
            base_tree = get_revid_tree(this_branch, base_rev_id, tempdir, 
267
 
                                       "base", None)
268
 
            base_is_ancestor = True
269
 
        else:
270
 
            base_branch, base_tree = get_tree(base_revision, tempdir, "base")
271
 
            if base_revision[1] == -1:
272
 
                base_rev_id = base_branch.last_patch()
273
 
            elif base_revision[1] is None:
274
 
                base_rev_id = None
275
 
            else:
276
 
                base_rev_id = base_branch.lookup_revision(base_revision[1])
277
 
            if base_rev_id is not None:
278
 
                base_is_ancestor = is_ancestor(this_rev_id, base_rev_id, 
279
 
                                               MultipleRevisionSources(this_branch, 
280
 
                                                                       base_branch))
281
 
            else:
282
 
                base_is_ancestor = False
283
 
        if file_list is None:
284
 
            interesting_ids = None
285
 
        else:
286
 
            interesting_ids = set()
287
 
            this_tree = this_branch.working_tree()
288
 
            for fname in file_list:
289
 
                path = this_branch.relpath(fname)
290
 
                found_id = False
291
 
                for tree in (this_tree, base_tree.tree, other_tree.tree):
292
 
                    file_id = tree.inventory.path2id(path)
293
 
                    if file_id is not None:
294
 
                        interesting_ids.add(file_id)
295
 
                        found_id = True
296
 
                if not found_id:
297
 
                    raise BzrCommandError("%s is not a source file in any"
298
 
                                          " tree." % fname)
299
 
        merge_inner(this_branch, other_tree, base_tree, tempdir, 
300
 
                    ignore_zero=ignore_zero, backup_files=backup_files, 
301
 
                    merge_type=merge_type, interesting_ids=interesting_ids)
302
 
        if base_is_ancestor and other_rev_id is not None:
303
 
            this_branch.add_pending_merge(other_rev_id)
304
 
    finally:
305
 
        shutil.rmtree(tempdir)
306
 
 
307
 
 
308
 
def set_interesting(inventory_a, inventory_b, interesting_ids):
309
 
    """Mark files whose ids are in interesting_ids as interesting
310
 
    """
311
 
    for inventory in (inventory_a, inventory_b):
312
 
        for path, source_file in inventory.iteritems():
313
 
             source_file.interesting = source_file.id in interesting_ids
314
 
 
315
 
 
316
 
def generate_cset_optimized(tree_a, tree_b, interesting_ids=None):
317
 
    """Generate a changeset.  If interesting_ids is supplied, only changes
318
 
    to those files will be shown.  Metadata changes are stripped.
319
 
    """ 
320
 
    cset =  generate_changeset(tree_a, tree_b, interesting_ids)
321
 
    for entry in cset.entries.itervalues():
322
 
        entry.metadata_change = None
323
 
    return cset
324
 
 
325
 
 
326
 
def merge_inner(this_branch, other_tree, base_tree, tempdir, 
327
 
                ignore_zero=False, merge_type=ApplyMerge3, backup_files=False,
328
 
                interesting_ids=None):
329
 
 
330
 
    def merge_factory(file_id, base, other):
331
 
        contents_change = merge_type(file_id, base, other)
332
 
        if backup_files:
333
 
            contents_change = BackupBeforeChange(contents_change)
334
 
        return contents_change
335
 
 
336
 
    this_tree = get_tree((this_branch.base, None), tempdir, "this")[1]
337
 
 
338
 
    def get_inventory(tree):
339
 
        return tree.tree.inventory
340
 
 
341
 
    inv_changes = merge_flex(this_tree, base_tree, other_tree,
342
 
                             generate_cset_optimized, get_inventory,
343
 
                             MergeConflictHandler(base_tree.root,
344
 
                                                  ignore_zero=ignore_zero),
345
 
                             merge_factory=merge_factory, 
346
 
                             interesting_ids=interesting_ids)
347
 
 
348
 
    adjust_ids = []
349
 
    for id, path in inv_changes.iteritems():
350
 
        if path is not None:
351
 
            if path == '.':
352
 
                path = ''
353
 
            else:
354
 
                assert path.startswith('./'), "path is %s" % path
355
 
            path = path[2:]
356
 
        adjust_ids.append((path, id))
357
 
    if len(adjust_ids) > 0:
358
 
        this_branch.set_inventory(regen_inventory(this_branch, this_tree.root,
359
 
                                                  adjust_ids))
360
 
 
361
 
 
362
 
def regen_inventory(this_branch, root, new_entries):
363
 
    old_entries = this_branch.read_working_inventory()
364
 
    new_inventory = {}
365
 
    by_path = {}
366
 
    new_entries_map = {} 
367
 
    for path, file_id in new_entries:
368
 
        if path is None:
369
 
            continue
370
 
        new_entries_map[file_id] = path
371
 
 
372
 
    def id2path(file_id):
373
 
        path = new_entries_map.get(file_id)
374
 
        if path is not None:
375
 
            return path
376
 
        entry = old_entries[file_id]
377
 
        if entry.parent_id is None:
378
 
            return entry.name
379
 
        return os.path.join(id2path(entry.parent_id), entry.name)
380
 
        
381
 
    for file_id in old_entries:
382
 
        entry = old_entries[file_id]
383
 
        path = id2path(file_id)
384
 
        new_inventory[file_id] = (path, file_id, entry.parent_id, entry.kind)
385
 
        by_path[path] = file_id
386
 
    
387
 
    deletions = 0
388
 
    insertions = 0
389
 
    new_path_list = []
390
 
    for path, file_id in new_entries:
391
 
        if path is None:
392
 
            del new_inventory[file_id]
393
 
            deletions += 1
394
 
        else:
395
 
            new_path_list.append((path, file_id))
396
 
            if file_id not in old_entries:
397
 
                insertions += 1
398
 
    # Ensure no file is added before its parent
399
 
    new_path_list.sort()
400
 
    for path, file_id in new_path_list:
401
 
        if path == '':
402
 
            parent = None
403
 
        else:
404
 
            parent = by_path[os.path.dirname(path)]
405
 
        kind = bzrlib.osutils.file_kind(os.path.join(root, path))
406
 
        new_inventory[file_id] = (path, file_id, parent, kind)
407
 
        by_path[path] = file_id 
408
 
 
409
 
    # Get a list in insertion order
410
 
    new_inventory_list = new_inventory.values()
411
 
    mutter ("""Inventory regeneration:
412
 
old length: %i insertions: %i deletions: %i new_length: %i"""\
413
 
        % (len(old_entries), insertions, deletions, len(new_inventory_list)))
414
 
    assert len(new_inventory_list) == len(old_entries) + insertions - deletions
415
 
    new_inventory_list.sort()
416
 
    return new_inventory_list
417
 
 
418
 
merge_types = {     "merge3": (ApplyMerge3, "Native diff3-style merge"), 
419
 
                     "diff3": (Diff3Merge,  "Merge using external diff3")
420
 
              }
421