~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/merge3.py

  • Committer: Robert Collins
  • Date: 2009-09-07 03:08:30 UTC
  • mto: This revision was merged to the branch mainline in revision 4690.
  • Revision ID: robertc@robertcollins.net-20090907030830-rf59kt28d550eauj
Milestones language tightning, internal consistency.

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2004, 2005 by Canonical Ltd
2
 
 
 
1
# Copyright (C) 2004, 2005 Canonical Ltd
 
2
#
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
5
5
# the Free Software Foundation; either version 2 of the License, or
6
6
# (at your option) any later version.
7
 
 
 
7
#
8
8
# This program is distributed in the hope that it will be useful,
9
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
10
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
11
11
# GNU General Public License for more details.
12
 
 
 
12
#
13
13
# You should have received a copy of the GNU General Public License
14
14
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
15
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
16
16
 
17
17
 
18
18
# mbp: "you know that thing where cvs gives you conflict markers?"
19
19
# s: "i hate that."
20
20
 
21
21
 
22
 
from difflib import SequenceMatcher
23
22
from bzrlib.errors import CantReprocessAndShowBase
 
23
import bzrlib.patiencediff
 
24
from bzrlib.textfile import check_text_lines
 
25
 
24
26
 
25
27
def intersect(ra, rb):
26
28
    """Given two ranges return the range where they intersect or None.
34
36
    >>> intersect((0, 9), (7, 15))
35
37
    (7, 9)
36
38
    """
37
 
    assert ra[0] <= ra[1]
38
 
    assert rb[0] <= rb[1]
39
 
    
 
39
    # preconditions: (ra[0] <= ra[1]) and (rb[0] <= rb[1])
 
40
 
40
41
    sa = max(ra[0], rb[0])
41
42
    sb = min(ra[1], rb[1])
42
43
    if sa < sb:
55
56
            return False
56
57
    else:
57
58
        return True
58
 
        
 
59
 
59
60
 
60
61
 
61
62
 
65
66
    Given BASE, OTHER, THIS, tries to produce a combined text
66
67
    incorporating the changes from both BASE->OTHER and BASE->THIS.
67
68
    All three will typically be sequences of lines."""
68
 
    def __init__(self, base, a, b):
 
69
    def __init__(self, base, a, b, is_cherrypick=False):
 
70
        check_text_lines(base)
 
71
        check_text_lines(a)
 
72
        check_text_lines(b)
69
73
        self.base = base
70
74
        self.a = a
71
75
        self.b = b
72
 
 
73
 
 
 
76
        self.is_cherrypick = is_cherrypick
74
77
 
75
78
    def merge_lines(self,
76
79
                    name_a=None,
83
86
                    reprocess=False):
84
87
        """Return merge in cvs-like form.
85
88
        """
 
89
        newline = '\n'
 
90
        if len(self.a) > 0:
 
91
            if self.a[0].endswith('\r\n'):
 
92
                newline = '\r\n'
 
93
            elif self.a[0].endswith('\r'):
 
94
                newline = '\r'
86
95
        if base_marker and reprocess:
87
96
            raise CantReprocessAndShowBase()
88
97
        if name_a:
106
115
                for i in range(t[1], t[2]):
107
116
                    yield self.b[i]
108
117
            elif what == 'conflict':
109
 
                yield start_marker + '\n'
 
118
                yield start_marker + newline
110
119
                for i in range(t[3], t[4]):
111
120
                    yield self.a[i]
112
121
                if base_marker is not None:
113
 
                    yield base_marker + '\n'
 
122
                    yield base_marker + newline
114
123
                    for i in range(t[1], t[2]):
115
124
                        yield self.base[i]
116
 
                yield mid_marker + '\n'
 
125
                yield mid_marker + newline
117
126
                for i in range(t[5], t[6]):
118
127
                    yield self.b[i]
119
 
                yield end_marker + '\n'
 
128
                yield end_marker + newline
120
129
            else:
121
130
                raise ValueError(what)
122
 
        
123
 
        
124
 
 
125
 
 
126
131
 
127
132
    def merge_annotated(self):
128
133
        """Return merge with conflicts, showing origin of lines.
129
134
 
130
 
        Most useful for debugging merge.        
 
135
        Most useful for debugging merge.
131
136
        """
132
137
        for t in self.merge_regions():
133
138
            what = t[0]
150
155
                yield '>>>>\n'
151
156
            else:
152
157
                raise ValueError(what)
153
 
        
154
 
        
155
 
 
156
 
 
157
158
 
158
159
    def merge_groups(self):
159
160
        """Yield sequence of line groups.  Each one is a tuple:
189
190
            else:
190
191
                raise ValueError(what)
191
192
 
192
 
 
193
193
    def merge_regions(self):
194
194
        """Return sequences of matching and conflicting regions.
195
195
 
219
219
 
220
220
        # section a[0:ia] has been disposed of, etc
221
221
        iz = ia = ib = 0
222
 
        
 
222
 
223
223
        for zmatch, zend, amatch, aend, bmatch, bend in self.find_sync_regions():
224
 
            #print 'match base [%d:%d]' % (zmatch, zend)
225
 
            
226
224
            matchlen = zend - zmatch
227
 
            assert matchlen >= 0
228
 
            assert matchlen == (aend - amatch)
229
 
            assert matchlen == (bend - bmatch)
230
 
            
 
225
            # invariants:
 
226
            #   matchlen >= 0
 
227
            #   matchlen == (aend - amatch)
 
228
            #   matchlen == (bend - bmatch)
231
229
            len_a = amatch - ia
232
230
            len_b = bmatch - ib
233
231
            len_base = zmatch - iz
234
 
            assert len_a >= 0
235
 
            assert len_b >= 0
236
 
            assert len_base >= 0
 
232
            # invariants:
 
233
            # assert len_a >= 0
 
234
            # assert len_b >= 0
 
235
            # assert len_base >= 0
237
236
 
238
237
            #print 'unmatched a=%d, b=%d' % (len_a, len_b)
239
238
 
240
239
            if len_a or len_b:
241
240
                # try to avoid actually slicing the lists
242
 
                equal_a = compare_range(self.a, ia, amatch,
243
 
                                        self.base, iz, zmatch)
244
 
                equal_b = compare_range(self.b, ib, bmatch,
245
 
                                        self.base, iz, zmatch)
246
241
                same = compare_range(self.a, ia, amatch,
247
242
                                     self.b, ib, bmatch)
248
243
 
249
244
                if same:
250
245
                    yield 'same', ia, amatch
251
 
                elif equal_a and not equal_b:
252
 
                    yield 'b', ib, bmatch
253
 
                elif equal_b and not equal_a:
254
 
                    yield 'a', ia, amatch
255
 
                elif not equal_a and not equal_b:
256
 
                    yield 'conflict', iz, zmatch, ia, amatch, ib, bmatch
257
246
                else:
258
 
                    raise AssertionError("can't handle a=b=base but unmatched")
 
247
                    equal_a = compare_range(self.a, ia, amatch,
 
248
                                            self.base, iz, zmatch)
 
249
                    equal_b = compare_range(self.b, ib, bmatch,
 
250
                                            self.base, iz, zmatch)
 
251
                    if equal_a and not equal_b:
 
252
                        yield 'b', ib, bmatch
 
253
                    elif equal_b and not equal_a:
 
254
                        yield 'a', ia, amatch
 
255
                    elif not equal_a and not equal_b:
 
256
                        if self.is_cherrypick:
 
257
                            for node in self._refine_cherrypick_conflict(
 
258
                                                    iz, zmatch, ia, amatch,
 
259
                                                    ib, bmatch):
 
260
                                yield node
 
261
                        else:
 
262
                            yield 'conflict', iz, zmatch, ia, amatch, ib, bmatch
 
263
                    else:
 
264
                        raise AssertionError("can't handle a=b=base but unmatched")
259
265
 
260
266
                ia = amatch
261
267
                ib = bmatch
264
270
            # if the same part of the base was deleted on both sides
265
271
            # that's OK, we can just skip it.
266
272
 
267
 
                
268
273
            if matchlen > 0:
269
 
                assert ia == amatch
270
 
                assert ib == bmatch
271
 
                assert iz == zmatch
272
 
                
 
274
                # invariants:
 
275
                # assert ia == amatch
 
276
                # assert ib == bmatch
 
277
                # assert iz == zmatch
 
278
 
273
279
                yield 'unchanged', zmatch, zend
274
280
                iz = zend
275
281
                ia = aend
276
282
                ib = bend
277
 
    
 
283
 
 
284
    def _refine_cherrypick_conflict(self, zstart, zend, astart, aend, bstart, bend):
 
285
        """When cherrypicking b => a, ignore matches with b and base."""
 
286
        # Do not emit regions which match, only regions which do not match
 
287
        matches = bzrlib.patiencediff.PatienceSequenceMatcher(None,
 
288
            self.base[zstart:zend], self.b[bstart:bend]).get_matching_blocks()
 
289
        last_base_idx = 0
 
290
        last_b_idx = 0
 
291
        last_b_idx = 0
 
292
        yielded_a = False
 
293
        for base_idx, b_idx, match_len in matches:
 
294
            conflict_z_len = base_idx - last_base_idx
 
295
            conflict_b_len = b_idx - last_b_idx
 
296
            if conflict_b_len == 0: # There are no lines in b which conflict,
 
297
                                    # so skip it
 
298
                pass
 
299
            else:
 
300
                if yielded_a:
 
301
                    yield ('conflict',
 
302
                           zstart + last_base_idx, zstart + base_idx,
 
303
                           aend, aend, bstart + last_b_idx, bstart + b_idx)
 
304
                else:
 
305
                    # The first conflict gets the a-range
 
306
                    yielded_a = True
 
307
                    yield ('conflict', zstart + last_base_idx, zstart +
 
308
                    base_idx,
 
309
                           astart, aend, bstart + last_b_idx, bstart + b_idx)
 
310
            last_base_idx = base_idx + match_len
 
311
            last_b_idx = b_idx + match_len
 
312
        if last_base_idx != zend - zstart or last_b_idx != bend - bstart:
 
313
            if yielded_a:
 
314
                yield ('conflict', zstart + last_base_idx, zstart + base_idx,
 
315
                       aend, aend, bstart + last_b_idx, bstart + b_idx)
 
316
            else:
 
317
                # The first conflict gets the a-range
 
318
                yielded_a = True
 
319
                yield ('conflict', zstart + last_base_idx, zstart + base_idx,
 
320
                       astart, aend, bstart + last_b_idx, bstart + b_idx)
 
321
        if not yielded_a:
 
322
            yield ('conflict', zstart, zend, astart, aend, bstart, bend)
278
323
 
279
324
    def reprocess_merge_regions(self, merge_regions):
280
325
        """Where there are conflict regions, remove the agreed lines.
281
326
 
282
 
        Lines where both A and B have made the same changes are 
 
327
        Lines where both A and B have made the same changes are
283
328
        eliminated.
284
329
        """
285
330
        for region in merge_regions:
289
334
            type, iz, zmatch, ia, amatch, ib, bmatch = region
290
335
            a_region = self.a[ia:amatch]
291
336
            b_region = self.b[ib:bmatch]
292
 
            matches = SequenceMatcher(None, a_region, 
293
 
                                      b_region).get_matching_blocks()
 
337
            matches = bzrlib.patiencediff.PatienceSequenceMatcher(
 
338
                    None, a_region, b_region).get_matching_blocks()
294
339
            next_a = ia
295
340
            next_b = ib
296
341
            for region_ia, region_ib, region_len in matches[:-1]:
307
352
            if reg is not None:
308
353
                yield reg
309
354
 
310
 
 
311
355
    @staticmethod
312
356
    def mismatch_region(next_a, region_ia,  next_b, region_ib):
313
357
        if next_a < region_ia or next_b < region_ib:
314
358
            return 'conflict', None, None, next_a, region_ia, next_b, region_ib
315
 
            
316
359
 
317
360
    def find_sync_regions(self):
318
361
        """Return a list of sync regions, where both descendents match the base.
322
365
        """
323
366
 
324
367
        ia = ib = 0
325
 
        amatches = SequenceMatcher(None, self.base, self.a).get_matching_blocks()
326
 
        bmatches = SequenceMatcher(None, self.base, self.b).get_matching_blocks()
 
368
        amatches = bzrlib.patiencediff.PatienceSequenceMatcher(
 
369
                None, self.base, self.a).get_matching_blocks()
 
370
        bmatches = bzrlib.patiencediff.PatienceSequenceMatcher(
 
371
                None, self.base, self.b).get_matching_blocks()
327
372
        len_a = len(amatches)
328
373
        len_b = len(bmatches)
329
374
 
343
388
 
344
389
                # found a match of base[i[0], i[1]]; this may be less than
345
390
                # the region that matches in either one
346
 
                assert intlen <= alen
347
 
                assert intlen <= blen
348
 
                assert abase <= intbase
349
 
                assert bbase <= intbase
 
391
                # assert intlen <= alen
 
392
                # assert intlen <= blen
 
393
                # assert abase <= intbase
 
394
                # assert bbase <= intbase
350
395
 
351
396
                asub = amatch + (intbase - abase)
352
397
                bsub = bmatch + (intbase - bbase)
353
398
                aend = asub + intlen
354
399
                bend = bsub + intlen
355
400
 
356
 
                assert self.base[intbase:intend] == self.a[asub:aend], \
357
 
                       (self.base[intbase:intend], self.a[asub:aend])
358
 
 
359
 
                assert self.base[intbase:intend] == self.b[bsub:bend]
 
401
                # assert self.base[intbase:intend] == self.a[asub:aend], \
 
402
                #       (self.base[intbase:intend], self.a[asub:aend])
 
403
                # assert self.base[intbase:intend] == self.b[bsub:bend]
360
404
 
361
405
                sl.append((intbase, intend,
362
406
                           asub, aend,
363
407
                           bsub, bend))
364
 
 
365
408
            # advance whichever one ends first in the base text
366
409
            if (abase + alen) < (bbase + blen):
367
410
                ia += 1
368
411
            else:
369
412
                ib += 1
370
 
            
 
413
 
371
414
        intbase = len(self.base)
372
415
        abase = len(self.a)
373
416
        bbase = len(self.b)
375
418
 
376
419
        return sl
377
420
 
378
 
 
379
 
 
380
421
    def find_unconflicted(self):
381
422
        """Return a list of ranges in base that are not conflicted."""
382
 
 
383
 
        import re
384
 
 
385
 
        # don't sync-up on lines containing only blanks or pounds
386
 
        junk_re = re.compile(r'^[ \t#]*$')
387
 
        
388
 
        am = SequenceMatcher(junk_re.match, self.base, self.a).get_matching_blocks()
389
 
        bm = SequenceMatcher(junk_re.match, self.base, self.b).get_matching_blocks()
 
423
        am = bzrlib.patiencediff.PatienceSequenceMatcher(
 
424
                None, self.base, self.a).get_matching_blocks()
 
425
        bm = bzrlib.patiencediff.PatienceSequenceMatcher(
 
426
                None, self.base, self.b).get_matching_blocks()
390
427
 
391
428
        unc = []
392
429
 
405
442
                del am[0]
406
443
            else:
407
444
                del bm[0]
408
 
                
 
445
 
409
446
        return unc
410
447
 
411
448