~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/merge.py

  • Committer: Martin Pool
  • Date: 2005-08-25 07:46:11 UTC
  • Revision ID: mbp@sourcefrog.net-20050825074611-98130ea6d05d9d2a
- add functions to enable and disable default logging, so that we can
  turn it off while running the tests

- default logging gets turned on from the bzr main function so that
  other applications using the library can make their own decisions

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# Copyright (C) 2005 Canonical Ltd
 
2
 
 
3
# This program is free software; you can redistribute it and/or modify
 
4
# it under the terms of the GNU General Public License as published by
 
5
# the Free Software Foundation; either version 2 of the License, or
 
6
# (at your option) any later version.
 
7
 
 
8
# This program is distributed in the hope that it will be useful,
 
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
11
# GNU General Public License for more details.
 
12
 
 
13
# You should have received a copy of the GNU General Public License
 
14
# along with this program; if not, write to the Free Software
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
16
 
 
17
 
 
18
from bzrlib.merge_core import merge_flex, ApplyMerge3, BackupBeforeChange
 
19
from bzrlib.changeset import generate_changeset, ExceptionConflictHandler
 
20
from bzrlib.changeset import Inventory, Diff3Merge
 
21
from bzrlib.branch import find_branch
 
22
import bzrlib.osutils
 
23
from bzrlib.errors import BzrCommandError, UnrelatedBranches
 
24
from bzrlib.delta import compare_trees
 
25
from trace import mutter, warning
 
26
import os.path
 
27
import tempfile
 
28
import shutil
 
29
import errno
 
30
from fetch import greedy_fetch
 
31
 
 
32
 
 
33
# comments from abentley on irc: merge happens in two stages, each
 
34
# of which generates a changeset object
 
35
 
 
36
# stage 1: generate OLD->OTHER,
 
37
# stage 2: use MINE and OLD->OTHER to generate MINE -> RESULT
 
38
 
 
39
class MergeConflictHandler(ExceptionConflictHandler):
 
40
    """Handle conflicts encountered while merging.
 
41
 
 
42
    This subclasses ExceptionConflictHandler, so that any types of
 
43
    conflict that are not explicitly handled cause an exception and
 
44
    terminate the merge.
 
45
    """
 
46
    def __init__(self, dir, ignore_zero=False):
 
47
        ExceptionConflictHandler.__init__(self, dir)
 
48
        self.conflicts = 0
 
49
        self.ignore_zero = ignore_zero
 
50
 
 
51
    def copy(self, source, dest):
 
52
        """Copy the text and mode of a file
 
53
        :param source: The path of the file to copy
 
54
        :param dest: The distination file to create
 
55
        """
 
56
        s_file = file(source, "rb")
 
57
        d_file = file(dest, "wb")
 
58
        for line in s_file:
 
59
            d_file.write(line)
 
60
        os.chmod(dest, 0777 & os.stat(source).st_mode)
 
61
 
 
62
    def dump(self, lines, dest):
 
63
        """Copy the text and mode of a file
 
64
        :param source: The path of the file to copy
 
65
        :param dest: The distination file to create
 
66
        """
 
67
        d_file = file(dest, "wb")
 
68
        for line in lines:
 
69
            d_file.write(line)
 
70
 
 
71
    def add_suffix(self, name, suffix, last_new_name=None):
 
72
        """Rename a file to append a suffix.  If the new name exists, the
 
73
        suffix is added repeatedly until a non-existant name is found
 
74
 
 
75
        :param name: The path of the file
 
76
        :param suffix: The suffix to append
 
77
        :param last_new_name: (used for recursive calls) the last name tried
 
78
        """
 
79
        if last_new_name is None:
 
80
            last_new_name = name
 
81
        new_name = last_new_name+suffix
 
82
        try:
 
83
            os.rename(name, new_name)
 
84
            return new_name
 
85
        except OSError, e:
 
86
            if e.errno != errno.EEXIST and e.errno != errno.ENOTEMPTY:
 
87
                raise
 
88
            return self.add_suffix(name, suffix, last_new_name=new_name)
 
89
 
 
90
    def conflict(self, text):
 
91
        warning(text)
 
92
        self.conflicts += 1
 
93
        
 
94
 
 
95
    def merge_conflict(self, new_file, this_path, base_lines, other_lines):
 
96
        """
 
97
        Handle diff3 conflicts by producing a .THIS, .BASE and .OTHER.  The
 
98
        main file will be a version with diff3 conflicts.
 
99
        :param new_file: Path to the output file with diff3 markers
 
100
        :param this_path: Path to the file text for the THIS tree
 
101
        :param base_path: Path to the file text for the BASE tree
 
102
        :param other_path: Path to the file text for the OTHER tree
 
103
        """
 
104
        self.add_suffix(this_path, ".THIS")
 
105
        self.dump(base_lines, this_path+".BASE")
 
106
        self.dump(other_lines, this_path+".OTHER")
 
107
        os.rename(new_file, this_path)
 
108
        self.conflict("Diff3 conflict encountered in %s" % this_path)
 
109
 
 
110
    def new_contents_conflict(self, filename, other_contents):
 
111
        """Conflicting contents for newly added file."""
 
112
        self.copy(other_contents, filename + ".OTHER")
 
113
        self.conflict("Conflict in newly added file %s" % filename)
 
114
    
 
115
 
 
116
    def target_exists(self, entry, target, old_path):
 
117
        """Handle the case when the target file or dir exists"""
 
118
        moved_path = self.add_suffix(target, ".moved")
 
119
        self.conflict("Moved existing %s to %s" % (target, moved_path))
 
120
 
 
121
    def rmdir_non_empty(self, filename):
 
122
        """Handle the case where the dir to be removed still has contents"""
 
123
        self.conflict("Directory %s not removed because it is not empty"\
 
124
            % filename)
 
125
        return "skip"
 
126
 
 
127
    def finalize(self):
 
128
        if not self.ignore_zero:
 
129
            print "%d conflicts encountered.\n" % self.conflicts
 
130
            
 
131
def get_tree(treespec, temp_root, label, local_branch=None):
 
132
    location, revno = treespec
 
133
    branch = find_branch(location)
 
134
    if revno is None:
 
135
        revision = None
 
136
    elif revno == -1:
 
137
        revision = branch.last_patch()
 
138
    else:
 
139
        revision = branch.lookup_revision(revno)
 
140
    return branch, get_revid_tree(branch, revision, temp_root, label,
 
141
                                  local_branch)
 
142
 
 
143
def get_revid_tree(branch, revision, temp_root, label, local_branch):
 
144
    if revision is None:
 
145
        base_tree = branch.working_tree()
 
146
    else:
 
147
        if local_branch is not None:
 
148
            greedy_fetch(local_branch, branch, revision)
 
149
            base_tree = local_branch.revision_tree(revision)
 
150
        else:
 
151
            base_tree = branch.revision_tree(revision)
 
152
    temp_path = os.path.join(temp_root, label)
 
153
    os.mkdir(temp_path)
 
154
    return MergeTree(base_tree, temp_path)
 
155
 
 
156
 
 
157
def file_exists(tree, file_id):
 
158
    return tree.has_filename(tree.id2path(file_id))
 
159
    
 
160
 
 
161
class MergeTree(object):
 
162
    def __init__(self, tree, tempdir):
 
163
        object.__init__(self)
 
164
        if hasattr(tree, "basedir"):
 
165
            self.root = tree.basedir
 
166
        else:
 
167
            self.root = None
 
168
        self.tree = tree
 
169
        self.tempdir = tempdir
 
170
        os.mkdir(os.path.join(self.tempdir, "texts"))
 
171
        self.cached = {}
 
172
 
 
173
    def __iter__(self):
 
174
        return self.tree.__iter__()
 
175
 
 
176
    def __contains__(self, file_id):
 
177
        return file_id in self.tree
 
178
 
 
179
    def get_file(self, file_id):
 
180
        return self.tree.get_file(file_id)
 
181
 
 
182
    def get_file_sha1(self, id):
 
183
        return self.tree.get_file_sha1(id)
 
184
 
 
185
    def id2path(self, file_id):
 
186
        return self.tree.id2path(file_id)
 
187
 
 
188
    def has_id(self, file_id):
 
189
        return self.tree.has_id(file_id)
 
190
 
 
191
    def has_or_had_id(self, file_id):
 
192
        if file_id == self.tree.inventory.root.file_id:
 
193
            return True
 
194
        return self.tree.inventory.has_id(file_id)
 
195
 
 
196
    def readonly_path(self, id):
 
197
        if id not in self.tree:
 
198
            return None
 
199
        if self.root is not None:
 
200
            return self.tree.abspath(self.tree.id2path(id))
 
201
        else:
 
202
            if self.tree.inventory[id].kind in ("directory", "root_directory"):
 
203
                return self.tempdir
 
204
            if not self.cached.has_key(id):
 
205
                path = os.path.join(self.tempdir, "texts", id)
 
206
                outfile = file(path, "wb")
 
207
                outfile.write(self.tree.get_file(id).read())
 
208
                assert(os.path.exists(path))
 
209
                self.cached[id] = path
 
210
            return self.cached[id]
 
211
 
 
212
 
 
213
 
 
214
def merge(other_revision, base_revision,
 
215
          check_clean=True, ignore_zero=False,
 
216
          this_dir=None, backup_files=False, merge_type=ApplyMerge3,
 
217
          file_list=None):
 
218
    """Merge changes into a tree.
 
219
 
 
220
    base_revision
 
221
        Base for three-way merge.
 
222
    other_revision
 
223
        Other revision for three-way merge.
 
224
    this_dir
 
225
        Directory to merge changes into; '.' by default.
 
226
    check_clean
 
227
        If true, this_dir must have no uncommitted changes before the
 
228
        merge begins.
 
229
    all available ancestors of other_revision and base_revision are
 
230
    automatically pulled into the branch.
 
231
    """
 
232
    from bzrlib.revision import common_ancestor, MultipleRevisionSources
 
233
    from bzrlib.errors import NoSuchRevision
 
234
    tempdir = tempfile.mkdtemp(prefix="bzr-")
 
235
    try:
 
236
        if this_dir is None:
 
237
            this_dir = '.'
 
238
        this_branch = find_branch(this_dir)
 
239
        this_rev_id = this_branch.last_patch()
 
240
        if this_rev_id is None:
 
241
            raise BzrCommandError("This branch has no commits")
 
242
        if check_clean:
 
243
            changes = compare_trees(this_branch.working_tree(), 
 
244
                                    this_branch.basis_tree(), False)
 
245
            if changes.has_changed():
 
246
                raise BzrCommandError("Working tree has uncommitted changes.")
 
247
        other_branch, other_tree = get_tree(other_revision, tempdir, "other",
 
248
                                            this_branch)
 
249
        if other_revision[1] == -1:
 
250
            other_rev_id = other_branch.last_patch()
 
251
            other_basis = other_rev_id
 
252
        elif other_revision[1] is not None:
 
253
            other_rev_id = other_branch.lookup_revision(other_revision[1])
 
254
            other_basis = other_rev_id
 
255
        else:
 
256
            other_rev_id = None
 
257
            other_basis = other_branch.last_patch()
 
258
        if base_revision == [None, None]:
 
259
            if other_revision[1] == -1:
 
260
                o_revno = None
 
261
            else:
 
262
                o_revno = other_revision[1]
 
263
                raise UnrelatedBranches()
 
264
            try:
 
265
                base_revision = this_branch.get_revision(base_rev_id)
 
266
                base_branch = this_branch
 
267
            except NoSuchRevision:
 
268
                base_branch = other_branch
 
269
            base_tree = get_revid_tree(base_branch, base_rev_id, tempdir, 
 
270
                                       "base")
 
271
            base_is_ancestor = True
 
272
        else:
 
273
            base_branch, base_tree = get_tree(base_revision, tempdir, "base")
 
274
            if base_revision[1] == -1:
 
275
                base_rev_id = base_branch.last_patch()
 
276
            elif base_revision[1] is None:
 
277
                base_rev_id = None
 
278
            else:
 
279
                base_rev_id = base_branch.lookup_revision(base_revision[1])
 
280
            if base_rev_id is not None:
 
281
                base_is_ancestor = is_ancestor(this_rev_id, base_rev_id, 
 
282
                                               MultipleRevisionSources(
 
283
                                               this_branch, 
 
284
                                               base_branch))
 
285
            else:
 
286
                base_is_ancestor = False
 
287
        if file_list is None:
 
288
            interesting_ids = None
 
289
        else:
 
290
            interesting_ids = set()
 
291
            this_tree = this_branch.working_tree()
 
292
            for fname in file_list:
 
293
                path = this_branch.relpath(fname)
 
294
                found_id = False
 
295
                for tree in (this_tree, base_tree.tree, other_tree.tree):
 
296
                    file_id = tree.inventory.path2id(path)
 
297
                    if file_id is not None:
 
298
                        interesting_ids.add(file_id)
 
299
                        found_id = True
 
300
                if not found_id:
 
301
                    raise BzrCommandError("%s is not a source file in any"
 
302
                                          " tree." % fname)
 
303
        merge_inner(this_branch, other_tree, base_tree, tempdir, 
 
304
                    ignore_zero=ignore_zero, backup_files=backup_files, 
 
305
                    merge_type=merge_type, interesting_ids=interesting_ids)
 
306
        if base_is_ancestor and other_rev_id is not None:
 
307
            this_branch.add_pending_merge(other_rev_id)
 
308
    finally:
 
309
        shutil.rmtree(tempdir)
 
310
 
 
311
 
 
312
def set_interesting(inventory_a, inventory_b, interesting_ids):
 
313
    """Mark files whose ids are in interesting_ids as interesting
 
314
    """
 
315
    for inventory in (inventory_a, inventory_b):
 
316
        for path, source_file in inventory.iteritems():
 
317
             source_file.interesting = source_file.id in interesting_ids
 
318
 
 
319
 
 
320
def generate_cset_optimized(tree_a, tree_b, interesting_ids=None):
 
321
    """Generate a changeset.  If interesting_ids is supplied, only changes
 
322
    to those files will be shown.  Metadata changes are stripped.
 
323
    """ 
 
324
    cset =  generate_changeset(tree_a, tree_b, interesting_ids)
 
325
    for entry in cset.entries.itervalues():
 
326
        entry.metadata_change = None
 
327
    return cset
 
328
 
 
329
 
 
330
def merge_inner(this_branch, other_tree, base_tree, tempdir, 
 
331
                ignore_zero=False, merge_type=ApplyMerge3, backup_files=False,
 
332
                interesting_ids=None):
 
333
 
 
334
    def merge_factory(file_id, base, other):
 
335
        contents_change = merge_type(file_id, base, other)
 
336
        if backup_files:
 
337
            contents_change = BackupBeforeChange(contents_change)
 
338
        return contents_change
 
339
 
 
340
    this_tree = get_tree((this_branch.base, None), tempdir, "this")[1]
 
341
 
 
342
    def get_inventory(tree):
 
343
        return tree.tree.inventory
 
344
 
 
345
    inv_changes = merge_flex(this_tree, base_tree, other_tree,
 
346
                             generate_cset_optimized, get_inventory,
 
347
                             MergeConflictHandler(base_tree.root,
 
348
                                                  ignore_zero=ignore_zero),
 
349
                             merge_factory=merge_factory, 
 
350
                             interesting_ids=interesting_ids)
 
351
 
 
352
    adjust_ids = []
 
353
    for id, path in inv_changes.iteritems():
 
354
        if path is not None:
 
355
            if path == '.':
 
356
                path = ''
 
357
            else:
 
358
                assert path.startswith('./'), "path is %s" % path
 
359
            path = path[2:]
 
360
        adjust_ids.append((path, id))
 
361
    if len(adjust_ids) > 0:
 
362
        this_branch.set_inventory(regen_inventory(this_branch, this_tree.root,
 
363
                                                  adjust_ids))
 
364
 
 
365
 
 
366
def regen_inventory(this_branch, root, new_entries):
 
367
    old_entries = this_branch.read_working_inventory()
 
368
    new_inventory = {}
 
369
    by_path = {}
 
370
    new_entries_map = {} 
 
371
    for path, file_id in new_entries:
 
372
        if path is None:
 
373
            continue
 
374
        new_entries_map[file_id] = path
 
375
 
 
376
    def id2path(file_id):
 
377
        path = new_entries_map.get(file_id)
 
378
        if path is not None:
 
379
            return path
 
380
        entry = old_entries[file_id]
 
381
        if entry.parent_id is None:
 
382
            return entry.name
 
383
        return os.path.join(id2path(entry.parent_id), entry.name)
 
384
        
 
385
    for file_id in old_entries:
 
386
        entry = old_entries[file_id]
 
387
        path = id2path(file_id)
 
388
        new_inventory[file_id] = (path, file_id, entry.parent_id, entry.kind)
 
389
        by_path[path] = file_id
 
390
    
 
391
    deletions = 0
 
392
    insertions = 0
 
393
    new_path_list = []
 
394
    for path, file_id in new_entries:
 
395
        if path is None:
 
396
            del new_inventory[file_id]
 
397
            deletions += 1
 
398
        else:
 
399
            new_path_list.append((path, file_id))
 
400
            if file_id not in old_entries:
 
401
                insertions += 1
 
402
    # Ensure no file is added before its parent
 
403
    new_path_list.sort()
 
404
    for path, file_id in new_path_list:
 
405
        if path == '':
 
406
            parent = None
 
407
        else:
 
408
            parent = by_path[os.path.dirname(path)]
 
409
        kind = bzrlib.osutils.file_kind(os.path.join(root, path))
 
410
        new_inventory[file_id] = (path, file_id, parent, kind)
 
411
        by_path[path] = file_id 
 
412
 
 
413
    # Get a list in insertion order
 
414
    new_inventory_list = new_inventory.values()
 
415
    mutter ("""Inventory regeneration:
 
416
old length: %i insertions: %i deletions: %i new_length: %i"""\
 
417
        % (len(old_entries), insertions, deletions, len(new_inventory_list)))
 
418
    assert len(new_inventory_list) == len(old_entries) + insertions - deletions
 
419
    new_inventory_list.sort()
 
420
    return new_inventory_list
 
421
 
 
422
merge_types = {     "merge3": (ApplyMerge3, "Native diff3-style merge"), 
 
423
                     "diff3": (Diff3Merge,  "Merge using external diff3")
 
424
              }
 
425