~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/merge3.py

  • Committer: Martin Pool
  • Date: 2006-05-24 00:06:33 UTC
  • mto: This revision was merged to the branch mainline in revision 1740.
  • Revision ID: mbp@sourcefrog.net-20060524000633-02937e5715bac1c7
Remove duplicated RevisionSpec_revs (guillaume)

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2005-2010 Canonical Ltd
2
 
#
 
1
# Copyright (C) 2004, 2005 by Canonical Ltd
 
2
 
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
5
5
# the Free Software Foundation; either version 2 of the License, or
6
6
# (at your option) any later version.
7
 
#
 
7
 
8
8
# This program is distributed in the hope that it will be useful,
9
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
10
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
11
11
# GNU General Public License for more details.
12
 
#
 
12
 
13
13
# You should have received a copy of the GNU General Public License
14
14
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
16
 
17
17
 
18
18
# mbp: "you know that thing where cvs gives you conflict markers?"
19
19
# s: "i hate that."
20
20
 
21
 
from bzrlib import (
22
 
    errors,
23
 
    patiencediff,
24
 
    textfile,
25
 
    )
26
21
 
 
22
from bzrlib.errors import CantReprocessAndShowBase
 
23
from bzrlib.patiencediff import SequenceMatcher
 
24
from bzrlib.textfile import check_text_lines
27
25
 
28
26
def intersect(ra, rb):
29
27
    """Given two ranges return the range where they intersect or None.
37
35
    >>> intersect((0, 9), (7, 15))
38
36
    (7, 9)
39
37
    """
40
 
    # preconditions: (ra[0] <= ra[1]) and (rb[0] <= rb[1])
41
 
 
 
38
    assert ra[0] <= ra[1]
 
39
    assert rb[0] <= rb[1]
 
40
    
42
41
    sa = max(ra[0], rb[0])
43
42
    sb = min(ra[1], rb[1])
44
43
    if sa < sb:
57
56
            return False
58
57
    else:
59
58
        return True
60
 
 
 
59
        
61
60
 
62
61
 
63
62
 
67
66
    Given BASE, OTHER, THIS, tries to produce a combined text
68
67
    incorporating the changes from both BASE->OTHER and BASE->THIS.
69
68
    All three will typically be sequences of lines."""
70
 
 
71
 
    def __init__(self, base, a, b, is_cherrypick=False, allow_objects=False):
72
 
        """Constructor.
73
 
 
74
 
        :param base: lines in BASE
75
 
        :param a: lines in A
76
 
        :param b: lines in B
77
 
        :param is_cherrypick: flag indicating if this merge is a cherrypick.
78
 
            When cherrypicking b => a, matches with b and base do not conflict.
79
 
        :param allow_objects: if True, do not require that base, a and b are
80
 
            plain Python strs.  Also prevents BinaryFile from being raised.
81
 
            Lines can be any sequence of comparable and hashable Python
82
 
            objects.
83
 
        """
84
 
        if not allow_objects:
85
 
            textfile.check_text_lines(base)
86
 
            textfile.check_text_lines(a)
87
 
            textfile.check_text_lines(b)
 
69
    def __init__(self, base, a, b):
 
70
        check_text_lines(base)
 
71
        check_text_lines(a)
 
72
        check_text_lines(b)
88
73
        self.base = base
89
74
        self.a = a
90
75
        self.b = b
91
 
        self.is_cherrypick = is_cherrypick
 
76
 
 
77
 
92
78
 
93
79
    def merge_lines(self,
94
80
                    name_a=None,
101
87
                    reprocess=False):
102
88
        """Return merge in cvs-like form.
103
89
        """
104
 
        newline = '\n'
105
 
        if len(self.a) > 0:
106
 
            if self.a[0].endswith('\r\n'):
107
 
                newline = '\r\n'
108
 
            elif self.a[0].endswith('\r'):
109
 
                newline = '\r'
110
90
        if base_marker and reprocess:
111
 
            raise errors.CantReprocessAndShowBase()
 
91
            raise CantReprocessAndShowBase()
112
92
        if name_a:
113
93
            start_marker = start_marker + ' ' + name_a
114
94
        if name_b:
130
110
                for i in range(t[1], t[2]):
131
111
                    yield self.b[i]
132
112
            elif what == 'conflict':
133
 
                yield start_marker + newline
 
113
                yield start_marker + '\n'
134
114
                for i in range(t[3], t[4]):
135
115
                    yield self.a[i]
136
116
                if base_marker is not None:
137
 
                    yield base_marker + newline
 
117
                    yield base_marker + '\n'
138
118
                    for i in range(t[1], t[2]):
139
119
                        yield self.base[i]
140
 
                yield mid_marker + newline
 
120
                yield mid_marker + '\n'
141
121
                for i in range(t[5], t[6]):
142
122
                    yield self.b[i]
143
 
                yield end_marker + newline
 
123
                yield end_marker + '\n'
144
124
            else:
145
125
                raise ValueError(what)
 
126
        
 
127
        
 
128
 
 
129
 
146
130
 
147
131
    def merge_annotated(self):
148
132
        """Return merge with conflicts, showing origin of lines.
149
133
 
150
 
        Most useful for debugging merge.
 
134
        Most useful for debugging merge.        
151
135
        """
152
136
        for t in self.merge_regions():
153
137
            what = t[0]
170
154
                yield '>>>>\n'
171
155
            else:
172
156
                raise ValueError(what)
 
157
        
 
158
        
 
159
 
 
160
 
173
161
 
174
162
    def merge_groups(self):
175
163
        """Yield sequence of line groups.  Each one is a tuple:
205
193
            else:
206
194
                raise ValueError(what)
207
195
 
 
196
 
208
197
    def merge_regions(self):
209
198
        """Return sequences of matching and conflicting regions.
210
199
 
234
223
 
235
224
        # section a[0:ia] has been disposed of, etc
236
225
        iz = ia = ib = 0
237
 
 
 
226
        
238
227
        for zmatch, zend, amatch, aend, bmatch, bend in self.find_sync_regions():
 
228
            #print 'match base [%d:%d]' % (zmatch, zend)
 
229
            
239
230
            matchlen = zend - zmatch
240
 
            # invariants:
241
 
            #   matchlen >= 0
242
 
            #   matchlen == (aend - amatch)
243
 
            #   matchlen == (bend - bmatch)
 
231
            assert matchlen >= 0
 
232
            assert matchlen == (aend - amatch)
 
233
            assert matchlen == (bend - bmatch)
 
234
            
244
235
            len_a = amatch - ia
245
236
            len_b = bmatch - ib
246
237
            len_base = zmatch - iz
247
 
            # invariants:
248
 
            # assert len_a >= 0
249
 
            # assert len_b >= 0
250
 
            # assert len_base >= 0
 
238
            assert len_a >= 0
 
239
            assert len_b >= 0
 
240
            assert len_base >= 0
251
241
 
252
242
            #print 'unmatched a=%d, b=%d' % (len_a, len_b)
253
243
 
254
244
            if len_a or len_b:
255
245
                # try to avoid actually slicing the lists
 
246
                equal_a = compare_range(self.a, ia, amatch,
 
247
                                        self.base, iz, zmatch)
 
248
                equal_b = compare_range(self.b, ib, bmatch,
 
249
                                        self.base, iz, zmatch)
256
250
                same = compare_range(self.a, ia, amatch,
257
251
                                     self.b, ib, bmatch)
258
252
 
259
253
                if same:
260
254
                    yield 'same', ia, amatch
 
255
                elif equal_a and not equal_b:
 
256
                    yield 'b', ib, bmatch
 
257
                elif equal_b and not equal_a:
 
258
                    yield 'a', ia, amatch
 
259
                elif not equal_a and not equal_b:
 
260
                    yield 'conflict', iz, zmatch, ia, amatch, ib, bmatch
261
261
                else:
262
 
                    equal_a = compare_range(self.a, ia, amatch,
263
 
                                            self.base, iz, zmatch)
264
 
                    equal_b = compare_range(self.b, ib, bmatch,
265
 
                                            self.base, iz, zmatch)
266
 
                    if equal_a and not equal_b:
267
 
                        yield 'b', ib, bmatch
268
 
                    elif equal_b and not equal_a:
269
 
                        yield 'a', ia, amatch
270
 
                    elif not equal_a and not equal_b:
271
 
                        if self.is_cherrypick:
272
 
                            for node in self._refine_cherrypick_conflict(
273
 
                                                    iz, zmatch, ia, amatch,
274
 
                                                    ib, bmatch):
275
 
                                yield node
276
 
                        else:
277
 
                            yield 'conflict', iz, zmatch, ia, amatch, ib, bmatch
278
 
                    else:
279
 
                        raise AssertionError("can't handle a=b=base but unmatched")
 
262
                    raise AssertionError("can't handle a=b=base but unmatched")
280
263
 
281
264
                ia = amatch
282
265
                ib = bmatch
285
268
            # if the same part of the base was deleted on both sides
286
269
            # that's OK, we can just skip it.
287
270
 
 
271
                
288
272
            if matchlen > 0:
289
 
                # invariants:
290
 
                # assert ia == amatch
291
 
                # assert ib == bmatch
292
 
                # assert iz == zmatch
293
 
 
 
273
                assert ia == amatch
 
274
                assert ib == bmatch
 
275
                assert iz == zmatch
 
276
                
294
277
                yield 'unchanged', zmatch, zend
295
278
                iz = zend
296
279
                ia = aend
297
280
                ib = bend
298
 
 
299
 
    def _refine_cherrypick_conflict(self, zstart, zend, astart, aend, bstart, bend):
300
 
        """When cherrypicking b => a, ignore matches with b and base."""
301
 
        # Do not emit regions which match, only regions which do not match
302
 
        matches = patiencediff.PatienceSequenceMatcher(None,
303
 
            self.base[zstart:zend], self.b[bstart:bend]).get_matching_blocks()
304
 
        last_base_idx = 0
305
 
        last_b_idx = 0
306
 
        last_b_idx = 0
307
 
        yielded_a = False
308
 
        for base_idx, b_idx, match_len in matches:
309
 
            conflict_z_len = base_idx - last_base_idx
310
 
            conflict_b_len = b_idx - last_b_idx
311
 
            if conflict_b_len == 0: # There are no lines in b which conflict,
312
 
                                    # so skip it
313
 
                pass
314
 
            else:
315
 
                if yielded_a:
316
 
                    yield ('conflict',
317
 
                           zstart + last_base_idx, zstart + base_idx,
318
 
                           aend, aend, bstart + last_b_idx, bstart + b_idx)
319
 
                else:
320
 
                    # The first conflict gets the a-range
321
 
                    yielded_a = True
322
 
                    yield ('conflict', zstart + last_base_idx, zstart +
323
 
                    base_idx,
324
 
                           astart, aend, bstart + last_b_idx, bstart + b_idx)
325
 
            last_base_idx = base_idx + match_len
326
 
            last_b_idx = b_idx + match_len
327
 
        if last_base_idx != zend - zstart or last_b_idx != bend - bstart:
328
 
            if yielded_a:
329
 
                yield ('conflict', zstart + last_base_idx, zstart + base_idx,
330
 
                       aend, aend, bstart + last_b_idx, bstart + b_idx)
331
 
            else:
332
 
                # The first conflict gets the a-range
333
 
                yielded_a = True
334
 
                yield ('conflict', zstart + last_base_idx, zstart + base_idx,
335
 
                       astart, aend, bstart + last_b_idx, bstart + b_idx)
336
 
        if not yielded_a:
337
 
            yield ('conflict', zstart, zend, astart, aend, bstart, bend)
 
281
    
338
282
 
339
283
    def reprocess_merge_regions(self, merge_regions):
340
284
        """Where there are conflict regions, remove the agreed lines.
341
285
 
342
 
        Lines where both A and B have made the same changes are
 
286
        Lines where both A and B have made the same changes are 
343
287
        eliminated.
344
288
        """
345
289
        for region in merge_regions:
349
293
            type, iz, zmatch, ia, amatch, ib, bmatch = region
350
294
            a_region = self.a[ia:amatch]
351
295
            b_region = self.b[ib:bmatch]
352
 
            matches = patiencediff.PatienceSequenceMatcher(
353
 
                    None, a_region, b_region).get_matching_blocks()
 
296
            matches = SequenceMatcher(None, a_region, 
 
297
                                      b_region).get_matching_blocks()
354
298
            next_a = ia
355
299
            next_b = ib
356
300
            for region_ia, region_ib, region_len in matches[:-1]:
367
311
            if reg is not None:
368
312
                yield reg
369
313
 
 
314
 
370
315
    @staticmethod
371
316
    def mismatch_region(next_a, region_ia,  next_b, region_ib):
372
317
        if next_a < region_ia or next_b < region_ib:
373
318
            return 'conflict', None, None, next_a, region_ia, next_b, region_ib
 
319
            
374
320
 
375
321
    def find_sync_regions(self):
376
322
        """Return a list of sync regions, where both descendents match the base.
380
326
        """
381
327
 
382
328
        ia = ib = 0
383
 
        amatches = patiencediff.PatienceSequenceMatcher(
384
 
                None, self.base, self.a).get_matching_blocks()
385
 
        bmatches = patiencediff.PatienceSequenceMatcher(
386
 
                None, self.base, self.b).get_matching_blocks()
 
329
        amatches = SequenceMatcher(None, self.base, self.a).get_matching_blocks()
 
330
        bmatches = SequenceMatcher(None, self.base, self.b).get_matching_blocks()
387
331
        len_a = len(amatches)
388
332
        len_b = len(bmatches)
389
333
 
403
347
 
404
348
                # found a match of base[i[0], i[1]]; this may be less than
405
349
                # the region that matches in either one
406
 
                # assert intlen <= alen
407
 
                # assert intlen <= blen
408
 
                # assert abase <= intbase
409
 
                # assert bbase <= intbase
 
350
                assert intlen <= alen
 
351
                assert intlen <= blen
 
352
                assert abase <= intbase
 
353
                assert bbase <= intbase
410
354
 
411
355
                asub = amatch + (intbase - abase)
412
356
                bsub = bmatch + (intbase - bbase)
413
357
                aend = asub + intlen
414
358
                bend = bsub + intlen
415
359
 
416
 
                # assert self.base[intbase:intend] == self.a[asub:aend], \
417
 
                #       (self.base[intbase:intend], self.a[asub:aend])
418
 
                # assert self.base[intbase:intend] == self.b[bsub:bend]
 
360
                assert self.base[intbase:intend] == self.a[asub:aend], \
 
361
                       (self.base[intbase:intend], self.a[asub:aend])
 
362
 
 
363
                assert self.base[intbase:intend] == self.b[bsub:bend]
419
364
 
420
365
                sl.append((intbase, intend,
421
366
                           asub, aend,
422
367
                           bsub, bend))
 
368
 
423
369
            # advance whichever one ends first in the base text
424
370
            if (abase + alen) < (bbase + blen):
425
371
                ia += 1
426
372
            else:
427
373
                ib += 1
428
 
 
 
374
            
429
375
        intbase = len(self.base)
430
376
        abase = len(self.a)
431
377
        bbase = len(self.b)
433
379
 
434
380
        return sl
435
381
 
 
382
 
 
383
 
436
384
    def find_unconflicted(self):
437
385
        """Return a list of ranges in base that are not conflicted."""
438
 
        am = patiencediff.PatienceSequenceMatcher(
439
 
                None, self.base, self.a).get_matching_blocks()
440
 
        bm = patiencediff.PatienceSequenceMatcher(
441
 
                None, self.base, self.b).get_matching_blocks()
 
386
        am = SequenceMatcher(None, self.base, self.a).get_matching_blocks()
 
387
        bm = SequenceMatcher(None, self.base, self.b).get_matching_blocks()
442
388
 
443
389
        unc = []
444
390
 
457
403
                del am[0]
458
404
            else:
459
405
                del bm[0]
460
 
 
 
406
                
461
407
        return unc
462
408
 
463
409