~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/merge3.py

  • Committer: Patch Queue Manager
  • Date: 2016-04-21 04:10:52 UTC
  • mfrom: (6616.1.1 fix-en-user-guide)
  • Revision ID: pqm@pqm.ubuntu.com-20160421041052-clcye7ns1qcl2n7w
(richard-wilbur) Ensure build of English use guide always uses English text
 even when user's locale specifies a different language. (Jelmer Vernooij)

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2004, 2005 by Canonical Ltd
2
 
 
 
1
# Copyright (C) 2005-2010 Canonical Ltd
 
2
#
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
5
5
# the Free Software Foundation; either version 2 of the License, or
6
6
# (at your option) any later version.
7
 
 
 
7
#
8
8
# This program is distributed in the hope that it will be useful,
9
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
10
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
11
11
# GNU General Public License for more details.
12
 
 
 
12
#
13
13
# You should have received a copy of the GNU General Public License
14
14
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
15
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
16
16
 
 
17
from __future__ import absolute_import
17
18
 
18
19
# mbp: "you know that thing where cvs gives you conflict markers?"
19
20
# s: "i hate that."
20
21
 
21
 
 
22
 
from difflib import SequenceMatcher
23
 
 
24
 
from bzrlib.errors import CantReprocessAndShowBase
25
 
from bzrlib.textfile import check_text_lines
 
22
from bzrlib import (
 
23
    errors,
 
24
    patiencediff,
 
25
    textfile,
 
26
    )
 
27
 
26
28
 
27
29
def intersect(ra, rb):
28
30
    """Given two ranges return the range where they intersect or None.
36
38
    >>> intersect((0, 9), (7, 15))
37
39
    (7, 9)
38
40
    """
39
 
    assert ra[0] <= ra[1]
40
 
    assert rb[0] <= rb[1]
41
 
    
 
41
    # preconditions: (ra[0] <= ra[1]) and (rb[0] <= rb[1])
 
42
 
42
43
    sa = max(ra[0], rb[0])
43
44
    sb = min(ra[1], rb[1])
44
45
    if sa < sb:
57
58
            return False
58
59
    else:
59
60
        return True
60
 
        
 
61
 
61
62
 
62
63
 
63
64
 
67
68
    Given BASE, OTHER, THIS, tries to produce a combined text
68
69
    incorporating the changes from both BASE->OTHER and BASE->THIS.
69
70
    All three will typically be sequences of lines."""
70
 
    def __init__(self, base, a, b):
71
 
        check_text_lines(base)
72
 
        check_text_lines(a)
73
 
        check_text_lines(b)
 
71
 
 
72
    def __init__(self, base, a, b, is_cherrypick=False, allow_objects=False):
 
73
        """Constructor.
 
74
 
 
75
        :param base: lines in BASE
 
76
        :param a: lines in A
 
77
        :param b: lines in B
 
78
        :param is_cherrypick: flag indicating if this merge is a cherrypick.
 
79
            When cherrypicking b => a, matches with b and base do not conflict.
 
80
        :param allow_objects: if True, do not require that base, a and b are
 
81
            plain Python strs.  Also prevents BinaryFile from being raised.
 
82
            Lines can be any sequence of comparable and hashable Python
 
83
            objects.
 
84
        """
 
85
        if not allow_objects:
 
86
            textfile.check_text_lines(base)
 
87
            textfile.check_text_lines(a)
 
88
            textfile.check_text_lines(b)
74
89
        self.base = base
75
90
        self.a = a
76
91
        self.b = b
77
 
 
78
 
 
 
92
        self.is_cherrypick = is_cherrypick
79
93
 
80
94
    def merge_lines(self,
81
95
                    name_a=None,
88
102
                    reprocess=False):
89
103
        """Return merge in cvs-like form.
90
104
        """
 
105
        newline = '\n'
 
106
        if len(self.a) > 0:
 
107
            if self.a[0].endswith('\r\n'):
 
108
                newline = '\r\n'
 
109
            elif self.a[0].endswith('\r'):
 
110
                newline = '\r'
91
111
        if base_marker and reprocess:
92
 
            raise CantReprocessAndShowBase()
 
112
            raise errors.CantReprocessAndShowBase()
93
113
        if name_a:
94
114
            start_marker = start_marker + ' ' + name_a
95
115
        if name_b:
111
131
                for i in range(t[1], t[2]):
112
132
                    yield self.b[i]
113
133
            elif what == 'conflict':
114
 
                yield start_marker + '\n'
 
134
                yield start_marker + newline
115
135
                for i in range(t[3], t[4]):
116
136
                    yield self.a[i]
117
137
                if base_marker is not None:
118
 
                    yield base_marker + '\n'
 
138
                    yield base_marker + newline
119
139
                    for i in range(t[1], t[2]):
120
140
                        yield self.base[i]
121
 
                yield mid_marker + '\n'
 
141
                yield mid_marker + newline
122
142
                for i in range(t[5], t[6]):
123
143
                    yield self.b[i]
124
 
                yield end_marker + '\n'
 
144
                yield end_marker + newline
125
145
            else:
126
146
                raise ValueError(what)
127
 
        
128
 
        
129
 
 
130
 
 
131
147
 
132
148
    def merge_annotated(self):
133
149
        """Return merge with conflicts, showing origin of lines.
134
150
 
135
 
        Most useful for debugging merge.        
 
151
        Most useful for debugging merge.
136
152
        """
137
153
        for t in self.merge_regions():
138
154
            what = t[0]
155
171
                yield '>>>>\n'
156
172
            else:
157
173
                raise ValueError(what)
158
 
        
159
 
        
160
 
 
161
 
 
162
174
 
163
175
    def merge_groups(self):
164
176
        """Yield sequence of line groups.  Each one is a tuple:
194
206
            else:
195
207
                raise ValueError(what)
196
208
 
197
 
 
198
209
    def merge_regions(self):
199
210
        """Return sequences of matching and conflicting regions.
200
211
 
224
235
 
225
236
        # section a[0:ia] has been disposed of, etc
226
237
        iz = ia = ib = 0
227
 
        
 
238
 
228
239
        for zmatch, zend, amatch, aend, bmatch, bend in self.find_sync_regions():
229
 
            #print 'match base [%d:%d]' % (zmatch, zend)
230
 
            
231
240
            matchlen = zend - zmatch
232
 
            assert matchlen >= 0
233
 
            assert matchlen == (aend - amatch)
234
 
            assert matchlen == (bend - bmatch)
235
 
            
 
241
            # invariants:
 
242
            #   matchlen >= 0
 
243
            #   matchlen == (aend - amatch)
 
244
            #   matchlen == (bend - bmatch)
236
245
            len_a = amatch - ia
237
246
            len_b = bmatch - ib
238
247
            len_base = zmatch - iz
239
 
            assert len_a >= 0
240
 
            assert len_b >= 0
241
 
            assert len_base >= 0
 
248
            # invariants:
 
249
            # assert len_a >= 0
 
250
            # assert len_b >= 0
 
251
            # assert len_base >= 0
242
252
 
243
253
            #print 'unmatched a=%d, b=%d' % (len_a, len_b)
244
254
 
245
255
            if len_a or len_b:
246
256
                # try to avoid actually slicing the lists
247
 
                equal_a = compare_range(self.a, ia, amatch,
248
 
                                        self.base, iz, zmatch)
249
 
                equal_b = compare_range(self.b, ib, bmatch,
250
 
                                        self.base, iz, zmatch)
251
257
                same = compare_range(self.a, ia, amatch,
252
258
                                     self.b, ib, bmatch)
253
259
 
254
260
                if same:
255
261
                    yield 'same', ia, amatch
256
 
                elif equal_a and not equal_b:
257
 
                    yield 'b', ib, bmatch
258
 
                elif equal_b and not equal_a:
259
 
                    yield 'a', ia, amatch
260
 
                elif not equal_a and not equal_b:
261
 
                    yield 'conflict', iz, zmatch, ia, amatch, ib, bmatch
262
262
                else:
263
 
                    raise AssertionError("can't handle a=b=base but unmatched")
 
263
                    equal_a = compare_range(self.a, ia, amatch,
 
264
                                            self.base, iz, zmatch)
 
265
                    equal_b = compare_range(self.b, ib, bmatch,
 
266
                                            self.base, iz, zmatch)
 
267
                    if equal_a and not equal_b:
 
268
                        yield 'b', ib, bmatch
 
269
                    elif equal_b and not equal_a:
 
270
                        yield 'a', ia, amatch
 
271
                    elif not equal_a and not equal_b:
 
272
                        if self.is_cherrypick:
 
273
                            for node in self._refine_cherrypick_conflict(
 
274
                                                    iz, zmatch, ia, amatch,
 
275
                                                    ib, bmatch):
 
276
                                yield node
 
277
                        else:
 
278
                            yield 'conflict', iz, zmatch, ia, amatch, ib, bmatch
 
279
                    else:
 
280
                        raise AssertionError("can't handle a=b=base but unmatched")
264
281
 
265
282
                ia = amatch
266
283
                ib = bmatch
269
286
            # if the same part of the base was deleted on both sides
270
287
            # that's OK, we can just skip it.
271
288
 
272
 
                
273
289
            if matchlen > 0:
274
 
                assert ia == amatch
275
 
                assert ib == bmatch
276
 
                assert iz == zmatch
277
 
                
 
290
                # invariants:
 
291
                # assert ia == amatch
 
292
                # assert ib == bmatch
 
293
                # assert iz == zmatch
 
294
 
278
295
                yield 'unchanged', zmatch, zend
279
296
                iz = zend
280
297
                ia = aend
281
298
                ib = bend
282
 
    
 
299
 
 
300
    def _refine_cherrypick_conflict(self, zstart, zend, astart, aend, bstart, bend):
 
301
        """When cherrypicking b => a, ignore matches with b and base."""
 
302
        # Do not emit regions which match, only regions which do not match
 
303
        matches = patiencediff.PatienceSequenceMatcher(None,
 
304
            self.base[zstart:zend], self.b[bstart:bend]).get_matching_blocks()
 
305
        last_base_idx = 0
 
306
        last_b_idx = 0
 
307
        last_b_idx = 0
 
308
        yielded_a = False
 
309
        for base_idx, b_idx, match_len in matches:
 
310
            conflict_z_len = base_idx - last_base_idx
 
311
            conflict_b_len = b_idx - last_b_idx
 
312
            if conflict_b_len == 0: # There are no lines in b which conflict,
 
313
                                    # so skip it
 
314
                pass
 
315
            else:
 
316
                if yielded_a:
 
317
                    yield ('conflict',
 
318
                           zstart + last_base_idx, zstart + base_idx,
 
319
                           aend, aend, bstart + last_b_idx, bstart + b_idx)
 
320
                else:
 
321
                    # The first conflict gets the a-range
 
322
                    yielded_a = True
 
323
                    yield ('conflict', zstart + last_base_idx, zstart +
 
324
                    base_idx,
 
325
                           astart, aend, bstart + last_b_idx, bstart + b_idx)
 
326
            last_base_idx = base_idx + match_len
 
327
            last_b_idx = b_idx + match_len
 
328
        if last_base_idx != zend - zstart or last_b_idx != bend - bstart:
 
329
            if yielded_a:
 
330
                yield ('conflict', zstart + last_base_idx, zstart + base_idx,
 
331
                       aend, aend, bstart + last_b_idx, bstart + b_idx)
 
332
            else:
 
333
                # The first conflict gets the a-range
 
334
                yielded_a = True
 
335
                yield ('conflict', zstart + last_base_idx, zstart + base_idx,
 
336
                       astart, aend, bstart + last_b_idx, bstart + b_idx)
 
337
        if not yielded_a:
 
338
            yield ('conflict', zstart, zend, astart, aend, bstart, bend)
283
339
 
284
340
    def reprocess_merge_regions(self, merge_regions):
285
341
        """Where there are conflict regions, remove the agreed lines.
286
342
 
287
 
        Lines where both A and B have made the same changes are 
 
343
        Lines where both A and B have made the same changes are
288
344
        eliminated.
289
345
        """
290
346
        for region in merge_regions:
294
350
            type, iz, zmatch, ia, amatch, ib, bmatch = region
295
351
            a_region = self.a[ia:amatch]
296
352
            b_region = self.b[ib:bmatch]
297
 
            matches = SequenceMatcher(None, a_region, 
298
 
                                      b_region).get_matching_blocks()
 
353
            matches = patiencediff.PatienceSequenceMatcher(
 
354
                    None, a_region, b_region).get_matching_blocks()
299
355
            next_a = ia
300
356
            next_b = ib
301
357
            for region_ia, region_ib, region_len in matches[:-1]:
312
368
            if reg is not None:
313
369
                yield reg
314
370
 
315
 
 
316
371
    @staticmethod
317
372
    def mismatch_region(next_a, region_ia,  next_b, region_ib):
318
373
        if next_a < region_ia or next_b < region_ib:
319
374
            return 'conflict', None, None, next_a, region_ia, next_b, region_ib
320
 
            
321
375
 
322
376
    def find_sync_regions(self):
323
377
        """Return a list of sync regions, where both descendents match the base.
327
381
        """
328
382
 
329
383
        ia = ib = 0
330
 
        amatches = SequenceMatcher(None, self.base, self.a).get_matching_blocks()
331
 
        bmatches = SequenceMatcher(None, self.base, self.b).get_matching_blocks()
 
384
        amatches = patiencediff.PatienceSequenceMatcher(
 
385
                None, self.base, self.a).get_matching_blocks()
 
386
        bmatches = patiencediff.PatienceSequenceMatcher(
 
387
                None, self.base, self.b).get_matching_blocks()
332
388
        len_a = len(amatches)
333
389
        len_b = len(bmatches)
334
390
 
348
404
 
349
405
                # found a match of base[i[0], i[1]]; this may be less than
350
406
                # the region that matches in either one
351
 
                assert intlen <= alen
352
 
                assert intlen <= blen
353
 
                assert abase <= intbase
354
 
                assert bbase <= intbase
 
407
                # assert intlen <= alen
 
408
                # assert intlen <= blen
 
409
                # assert abase <= intbase
 
410
                # assert bbase <= intbase
355
411
 
356
412
                asub = amatch + (intbase - abase)
357
413
                bsub = bmatch + (intbase - bbase)
358
414
                aend = asub + intlen
359
415
                bend = bsub + intlen
360
416
 
361
 
                assert self.base[intbase:intend] == self.a[asub:aend], \
362
 
                       (self.base[intbase:intend], self.a[asub:aend])
363
 
 
364
 
                assert self.base[intbase:intend] == self.b[bsub:bend]
 
417
                # assert self.base[intbase:intend] == self.a[asub:aend], \
 
418
                #       (self.base[intbase:intend], self.a[asub:aend])
 
419
                # assert self.base[intbase:intend] == self.b[bsub:bend]
365
420
 
366
421
                sl.append((intbase, intend,
367
422
                           asub, aend,
368
423
                           bsub, bend))
369
 
 
370
424
            # advance whichever one ends first in the base text
371
425
            if (abase + alen) < (bbase + blen):
372
426
                ia += 1
373
427
            else:
374
428
                ib += 1
375
 
            
 
429
 
376
430
        intbase = len(self.base)
377
431
        abase = len(self.a)
378
432
        bbase = len(self.b)
380
434
 
381
435
        return sl
382
436
 
383
 
 
384
 
 
385
437
    def find_unconflicted(self):
386
438
        """Return a list of ranges in base that are not conflicted."""
387
 
 
388
 
        import re
389
 
 
390
 
        # don't sync-up on lines containing only blanks or pounds
391
 
        junk_re = re.compile(r'^[ \t#]*$')
392
 
        
393
 
        am = SequenceMatcher(junk_re.match, self.base, self.a).get_matching_blocks()
394
 
        bm = SequenceMatcher(junk_re.match, self.base, self.b).get_matching_blocks()
 
439
        am = patiencediff.PatienceSequenceMatcher(
 
440
                None, self.base, self.a).get_matching_blocks()
 
441
        bm = patiencediff.PatienceSequenceMatcher(
 
442
                None, self.base, self.b).get_matching_blocks()
395
443
 
396
444
        unc = []
397
445
 
410
458
                del am[0]
411
459
            else:
412
460
                del bm[0]
413
 
                
 
461
 
414
462
        return unc
415
463
 
416
464