~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/merge3.py

  • Committer: Robert Collins
  • Date: 2006-02-15 08:11:37 UTC
  • mto: (1534.1.24 integration)
  • mto: This revision was merged to the branch mainline in revision 1554.
  • Revision ID: robertc@robertcollins.net-20060215081137-4c27377517e96dd1
Make format 4/5/6 branches share a single LockableFiles instance across wt/branch/repository.

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2004, 2005 Canonical Ltd
2
 
#
 
1
# Copyright (C) 2004, 2005 by Canonical Ltd
 
2
 
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
5
5
# the Free Software Foundation; either version 2 of the License, or
6
6
# (at your option) any later version.
7
 
#
 
7
 
8
8
# This program is distributed in the hope that it will be useful,
9
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
10
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
11
11
# GNU General Public License for more details.
12
 
#
 
12
 
13
13
# You should have received a copy of the GNU General Public License
14
14
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
16
 
17
17
 
18
18
# mbp: "you know that thing where cvs gives you conflict markers?"
19
19
# s: "i hate that."
20
20
 
21
21
 
 
22
from difflib import SequenceMatcher
22
23
from bzrlib.errors import CantReprocessAndShowBase
23
 
import bzrlib.patiencediff
24
 
from bzrlib.textfile import check_text_lines
25
 
 
26
24
 
27
25
def intersect(ra, rb):
28
26
    """Given two ranges return the range where they intersect or None.
36
34
    >>> intersect((0, 9), (7, 15))
37
35
    (7, 9)
38
36
    """
39
 
    # preconditions: (ra[0] <= ra[1]) and (rb[0] <= rb[1])
40
 
 
 
37
    assert ra[0] <= ra[1]
 
38
    assert rb[0] <= rb[1]
 
39
    
41
40
    sa = max(ra[0], rb[0])
42
41
    sb = min(ra[1], rb[1])
43
42
    if sa < sb:
56
55
            return False
57
56
    else:
58
57
        return True
59
 
 
 
58
        
60
59
 
61
60
 
62
61
 
66
65
    Given BASE, OTHER, THIS, tries to produce a combined text
67
66
    incorporating the changes from both BASE->OTHER and BASE->THIS.
68
67
    All three will typically be sequences of lines."""
69
 
    def __init__(self, base, a, b, is_cherrypick=False):
70
 
        check_text_lines(base)
71
 
        check_text_lines(a)
72
 
        check_text_lines(b)
 
68
    def __init__(self, base, a, b):
73
69
        self.base = base
74
70
        self.a = a
75
71
        self.b = b
76
 
        self.is_cherrypick = is_cherrypick
 
72
 
 
73
 
77
74
 
78
75
    def merge_lines(self,
79
76
                    name_a=None,
86
83
                    reprocess=False):
87
84
        """Return merge in cvs-like form.
88
85
        """
89
 
        newline = '\n'
90
 
        if len(self.a) > 0:
91
 
            if self.a[0].endswith('\r\n'):
92
 
                newline = '\r\n'
93
 
            elif self.a[0].endswith('\r'):
94
 
                newline = '\r'
95
86
        if base_marker and reprocess:
96
87
            raise CantReprocessAndShowBase()
97
88
        if name_a:
115
106
                for i in range(t[1], t[2]):
116
107
                    yield self.b[i]
117
108
            elif what == 'conflict':
118
 
                yield start_marker + newline
 
109
                yield start_marker + '\n'
119
110
                for i in range(t[3], t[4]):
120
111
                    yield self.a[i]
121
112
                if base_marker is not None:
122
 
                    yield base_marker + newline
 
113
                    yield base_marker + '\n'
123
114
                    for i in range(t[1], t[2]):
124
115
                        yield self.base[i]
125
 
                yield mid_marker + newline
 
116
                yield mid_marker + '\n'
126
117
                for i in range(t[5], t[6]):
127
118
                    yield self.b[i]
128
 
                yield end_marker + newline
 
119
                yield end_marker + '\n'
129
120
            else:
130
121
                raise ValueError(what)
 
122
        
 
123
        
 
124
 
 
125
 
131
126
 
132
127
    def merge_annotated(self):
133
128
        """Return merge with conflicts, showing origin of lines.
134
129
 
135
 
        Most useful for debugging merge.
 
130
        Most useful for debugging merge.        
136
131
        """
137
132
        for t in self.merge_regions():
138
133
            what = t[0]
155
150
                yield '>>>>\n'
156
151
            else:
157
152
                raise ValueError(what)
 
153
        
 
154
        
 
155
 
 
156
 
158
157
 
159
158
    def merge_groups(self):
160
159
        """Yield sequence of line groups.  Each one is a tuple:
190
189
            else:
191
190
                raise ValueError(what)
192
191
 
 
192
 
193
193
    def merge_regions(self):
194
194
        """Return sequences of matching and conflicting regions.
195
195
 
219
219
 
220
220
        # section a[0:ia] has been disposed of, etc
221
221
        iz = ia = ib = 0
222
 
 
 
222
        
223
223
        for zmatch, zend, amatch, aend, bmatch, bend in self.find_sync_regions():
 
224
            #print 'match base [%d:%d]' % (zmatch, zend)
 
225
            
224
226
            matchlen = zend - zmatch
225
 
            # invariants:
226
 
            #   matchlen >= 0
227
 
            #   matchlen == (aend - amatch)
228
 
            #   matchlen == (bend - bmatch)
 
227
            assert matchlen >= 0
 
228
            assert matchlen == (aend - amatch)
 
229
            assert matchlen == (bend - bmatch)
 
230
            
229
231
            len_a = amatch - ia
230
232
            len_b = bmatch - ib
231
233
            len_base = zmatch - iz
232
 
            # invariants:
233
 
            # assert len_a >= 0
234
 
            # assert len_b >= 0
235
 
            # assert len_base >= 0
 
234
            assert len_a >= 0
 
235
            assert len_b >= 0
 
236
            assert len_base >= 0
236
237
 
237
238
            #print 'unmatched a=%d, b=%d' % (len_a, len_b)
238
239
 
239
240
            if len_a or len_b:
240
241
                # try to avoid actually slicing the lists
 
242
                equal_a = compare_range(self.a, ia, amatch,
 
243
                                        self.base, iz, zmatch)
 
244
                equal_b = compare_range(self.b, ib, bmatch,
 
245
                                        self.base, iz, zmatch)
241
246
                same = compare_range(self.a, ia, amatch,
242
247
                                     self.b, ib, bmatch)
243
248
 
244
249
                if same:
245
250
                    yield 'same', ia, amatch
 
251
                elif equal_a and not equal_b:
 
252
                    yield 'b', ib, bmatch
 
253
                elif equal_b and not equal_a:
 
254
                    yield 'a', ia, amatch
 
255
                elif not equal_a and not equal_b:
 
256
                    yield 'conflict', iz, zmatch, ia, amatch, ib, bmatch
246
257
                else:
247
 
                    equal_a = compare_range(self.a, ia, amatch,
248
 
                                            self.base, iz, zmatch)
249
 
                    equal_b = compare_range(self.b, ib, bmatch,
250
 
                                            self.base, iz, zmatch)
251
 
                    if equal_a and not equal_b:
252
 
                        yield 'b', ib, bmatch
253
 
                    elif equal_b and not equal_a:
254
 
                        yield 'a', ia, amatch
255
 
                    elif not equal_a and not equal_b:
256
 
                        if self.is_cherrypick:
257
 
                            for node in self._refine_cherrypick_conflict(
258
 
                                                    iz, zmatch, ia, amatch,
259
 
                                                    ib, bmatch):
260
 
                                yield node
261
 
                        else:
262
 
                            yield 'conflict', iz, zmatch, ia, amatch, ib, bmatch
263
 
                    else:
264
 
                        raise AssertionError("can't handle a=b=base but unmatched")
 
258
                    raise AssertionError("can't handle a=b=base but unmatched")
265
259
 
266
260
                ia = amatch
267
261
                ib = bmatch
270
264
            # if the same part of the base was deleted on both sides
271
265
            # that's OK, we can just skip it.
272
266
 
 
267
                
273
268
            if matchlen > 0:
274
 
                # invariants:
275
 
                # assert ia == amatch
276
 
                # assert ib == bmatch
277
 
                # assert iz == zmatch
278
 
 
 
269
                assert ia == amatch
 
270
                assert ib == bmatch
 
271
                assert iz == zmatch
 
272
                
279
273
                yield 'unchanged', zmatch, zend
280
274
                iz = zend
281
275
                ia = aend
282
276
                ib = bend
283
 
 
284
 
    def _refine_cherrypick_conflict(self, zstart, zend, astart, aend, bstart, bend):
285
 
        """When cherrypicking b => a, ignore matches with b and base."""
286
 
        # Do not emit regions which match, only regions which do not match
287
 
        matches = bzrlib.patiencediff.PatienceSequenceMatcher(None,
288
 
            self.base[zstart:zend], self.b[bstart:bend]).get_matching_blocks()
289
 
        last_base_idx = 0
290
 
        last_b_idx = 0
291
 
        last_b_idx = 0
292
 
        yielded_a = False
293
 
        for base_idx, b_idx, match_len in matches:
294
 
            conflict_z_len = base_idx - last_base_idx
295
 
            conflict_b_len = b_idx - last_b_idx
296
 
            if conflict_b_len == 0: # There are no lines in b which conflict,
297
 
                                    # so skip it
298
 
                pass
299
 
            else:
300
 
                if yielded_a:
301
 
                    yield ('conflict',
302
 
                           zstart + last_base_idx, zstart + base_idx,
303
 
                           aend, aend, bstart + last_b_idx, bstart + b_idx)
304
 
                else:
305
 
                    # The first conflict gets the a-range
306
 
                    yielded_a = True
307
 
                    yield ('conflict', zstart + last_base_idx, zstart +
308
 
                    base_idx,
309
 
                           astart, aend, bstart + last_b_idx, bstart + b_idx)
310
 
            last_base_idx = base_idx + match_len
311
 
            last_b_idx = b_idx + match_len
312
 
        if last_base_idx != zend - zstart or last_b_idx != bend - bstart:
313
 
            if yielded_a:
314
 
                yield ('conflict', zstart + last_base_idx, zstart + base_idx,
315
 
                       aend, aend, bstart + last_b_idx, bstart + b_idx)
316
 
            else:
317
 
                # The first conflict gets the a-range
318
 
                yielded_a = True
319
 
                yield ('conflict', zstart + last_base_idx, zstart + base_idx,
320
 
                       astart, aend, bstart + last_b_idx, bstart + b_idx)
321
 
        if not yielded_a:
322
 
            yield ('conflict', zstart, zend, astart, aend, bstart, bend)
 
277
    
323
278
 
324
279
    def reprocess_merge_regions(self, merge_regions):
325
280
        """Where there are conflict regions, remove the agreed lines.
326
281
 
327
 
        Lines where both A and B have made the same changes are
 
282
        Lines where both A and B have made the same changes are 
328
283
        eliminated.
329
284
        """
330
285
        for region in merge_regions:
334
289
            type, iz, zmatch, ia, amatch, ib, bmatch = region
335
290
            a_region = self.a[ia:amatch]
336
291
            b_region = self.b[ib:bmatch]
337
 
            matches = bzrlib.patiencediff.PatienceSequenceMatcher(
338
 
                    None, a_region, b_region).get_matching_blocks()
 
292
            matches = SequenceMatcher(None, a_region, 
 
293
                                      b_region).get_matching_blocks()
339
294
            next_a = ia
340
295
            next_b = ib
341
296
            for region_ia, region_ib, region_len in matches[:-1]:
352
307
            if reg is not None:
353
308
                yield reg
354
309
 
 
310
 
355
311
    @staticmethod
356
312
    def mismatch_region(next_a, region_ia,  next_b, region_ib):
357
313
        if next_a < region_ia or next_b < region_ib:
358
314
            return 'conflict', None, None, next_a, region_ia, next_b, region_ib
 
315
            
359
316
 
360
317
    def find_sync_regions(self):
361
318
        """Return a list of sync regions, where both descendents match the base.
365
322
        """
366
323
 
367
324
        ia = ib = 0
368
 
        amatches = bzrlib.patiencediff.PatienceSequenceMatcher(
369
 
                None, self.base, self.a).get_matching_blocks()
370
 
        bmatches = bzrlib.patiencediff.PatienceSequenceMatcher(
371
 
                None, self.base, self.b).get_matching_blocks()
 
325
        amatches = SequenceMatcher(None, self.base, self.a).get_matching_blocks()
 
326
        bmatches = SequenceMatcher(None, self.base, self.b).get_matching_blocks()
372
327
        len_a = len(amatches)
373
328
        len_b = len(bmatches)
374
329
 
388
343
 
389
344
                # found a match of base[i[0], i[1]]; this may be less than
390
345
                # the region that matches in either one
391
 
                # assert intlen <= alen
392
 
                # assert intlen <= blen
393
 
                # assert abase <= intbase
394
 
                # assert bbase <= intbase
 
346
                assert intlen <= alen
 
347
                assert intlen <= blen
 
348
                assert abase <= intbase
 
349
                assert bbase <= intbase
395
350
 
396
351
                asub = amatch + (intbase - abase)
397
352
                bsub = bmatch + (intbase - bbase)
398
353
                aend = asub + intlen
399
354
                bend = bsub + intlen
400
355
 
401
 
                # assert self.base[intbase:intend] == self.a[asub:aend], \
402
 
                #       (self.base[intbase:intend], self.a[asub:aend])
403
 
                # assert self.base[intbase:intend] == self.b[bsub:bend]
 
356
                assert self.base[intbase:intend] == self.a[asub:aend], \
 
357
                       (self.base[intbase:intend], self.a[asub:aend])
 
358
 
 
359
                assert self.base[intbase:intend] == self.b[bsub:bend]
404
360
 
405
361
                sl.append((intbase, intend,
406
362
                           asub, aend,
407
363
                           bsub, bend))
 
364
 
408
365
            # advance whichever one ends first in the base text
409
366
            if (abase + alen) < (bbase + blen):
410
367
                ia += 1
411
368
            else:
412
369
                ib += 1
413
 
 
 
370
            
414
371
        intbase = len(self.base)
415
372
        abase = len(self.a)
416
373
        bbase = len(self.b)
418
375
 
419
376
        return sl
420
377
 
 
378
 
 
379
 
421
380
    def find_unconflicted(self):
422
381
        """Return a list of ranges in base that are not conflicted."""
423
 
        am = bzrlib.patiencediff.PatienceSequenceMatcher(
424
 
                None, self.base, self.a).get_matching_blocks()
425
 
        bm = bzrlib.patiencediff.PatienceSequenceMatcher(
426
 
                None, self.base, self.b).get_matching_blocks()
 
382
 
 
383
        import re
 
384
 
 
385
        # don't sync-up on lines containing only blanks or pounds
 
386
        junk_re = re.compile(r'^[ \t#]*$')
 
387
        
 
388
        am = SequenceMatcher(junk_re.match, self.base, self.a).get_matching_blocks()
 
389
        bm = SequenceMatcher(junk_re.match, self.base, self.b).get_matching_blocks()
427
390
 
428
391
        unc = []
429
392
 
442
405
                del am[0]
443
406
            else:
444
407
                del bm[0]
445
 
 
 
408
                
446
409
        return unc
447
410
 
448
411