~abentley/bzrtools/bzrtools.dev

« back to all changes in this revision

Viewing changes to patches.py

  • Committer: Aaron Bentley
  • Date: 2005-12-13 16:54:59 UTC
  • Revision ID: abentley@panoramicfeedback.com-20051213165459-e7785dda3c5605c6
Updated docs

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# Copyright (C) 2004, 2005 Aaron Bentley
 
2
# <aaron.bentley@utoronto.ca>
 
3
#
 
4
#    This program is free software; you can redistribute it and/or modify
 
5
#    it under the terms of the GNU General Public License as published by
 
6
#    the Free Software Foundation; either version 2 of the License, or
 
7
#    (at your option) any later version.
 
8
#
 
9
#    This program is distributed in the hope that it will be useful,
 
10
#    but WITHOUT ANY WARRANTY; without even the implied warranty of
 
11
#    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
12
#    GNU General Public License for more details.
 
13
#
 
14
#    You should have received a copy of the GNU General Public License
 
15
#    along with this program; if not, write to the Free Software
 
16
#    Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
17
 
 
18
class PatchSyntax(Exception):
 
19
    def __init__(self, msg):
 
20
        Exception.__init__(self, msg)
 
21
 
 
22
 
 
23
class MalformedPatchHeader(PatchSyntax):
 
24
    def __init__(self, desc, line):
 
25
        self.desc = desc
 
26
        self.line = line
 
27
        msg = "Malformed patch header.  %s\n%r" % (self.desc, self.line)
 
28
        PatchSyntax.__init__(self, msg)
 
29
 
 
30
class MalformedHunkHeader(PatchSyntax):
 
31
    def __init__(self, desc, line):
 
32
        self.desc = desc
 
33
        self.line = line
 
34
        msg = "Malformed hunk header.  %s\n%r" % (self.desc, self.line)
 
35
        PatchSyntax.__init__(self, msg)
 
36
 
 
37
class MalformedLine(PatchSyntax):
 
38
    def __init__(self, desc, line):
 
39
        self.desc = desc
 
40
        self.line = line
 
41
        msg = "Malformed line.  %s\n%s" % (self.desc, self.line)
 
42
        PatchSyntax.__init__(self, msg)
 
43
 
 
44
def get_patch_names(iter_lines):
 
45
    try:
 
46
        line = iter_lines.next()
 
47
        if not line.startswith("--- "):
 
48
            raise MalformedPatchHeader("No orig name", line)
 
49
        else:
 
50
            orig_name = line[4:].rstrip("\n")
 
51
    except StopIteration:
 
52
        raise MalformedPatchHeader("No orig line", "")
 
53
    try:
 
54
        line = iter_lines.next()
 
55
        if not line.startswith("+++ "):
 
56
            raise PatchSyntax("No mod name")
 
57
        else:
 
58
            mod_name = line[4:].rstrip("\n")
 
59
    except StopIteration:
 
60
        raise MalformedPatchHeader("No mod line", "")
 
61
    return (orig_name, mod_name)
 
62
 
 
63
def parse_range(textrange):
 
64
    """Parse a patch range, handling the "1" special-case
 
65
 
 
66
    :param textrange: The text to parse
 
67
    :type textrange: str
 
68
    :return: the position and range, as a tuple
 
69
    :rtype: (int, int)
 
70
    """
 
71
    tmp = textrange.split(',')
 
72
    if len(tmp) == 1:
 
73
        pos = tmp[0]
 
74
        range = "1"
 
75
    else:
 
76
        (pos, range) = tmp
 
77
    pos = int(pos)
 
78
    range = int(range)
 
79
    return (pos, range)
 
80
 
 
81
 
 
82
def hunk_from_header(line):
 
83
    if not line.startswith("@@") or not line.endswith("@@\n") \
 
84
        or not len(line) > 4:
 
85
        raise MalformedHunkHeader("Does not start and end with @@.", line)
 
86
    try:
 
87
        (orig, mod) = line[3:-4].split(" ")
 
88
    except Exception, e:
 
89
        raise MalformedHunkHeader(str(e), line)
 
90
    if not orig.startswith('-') or not mod.startswith('+'):
 
91
        raise MalformedHunkHeader("Positions don't start with + or -.", line)
 
92
    try:
 
93
        (orig_pos, orig_range) = parse_range(orig[1:])
 
94
        (mod_pos, mod_range) = parse_range(mod[1:])
 
95
    except Exception, e:
 
96
        raise MalformedHunkHeader(str(e), line)
 
97
    if mod_range < 0 or orig_range < 0:
 
98
        raise MalformedHunkHeader("Hunk range is negative", line)
 
99
    return Hunk(orig_pos, orig_range, mod_pos, mod_range)
 
100
 
 
101
 
 
102
class HunkLine:
 
103
    def __init__(self, contents):
 
104
        self.contents = contents
 
105
 
 
106
    def get_str(self, leadchar):
 
107
        if self.contents == "\n" and leadchar == " " and False:
 
108
            return "\n"
 
109
        if not self.contents.endswith('\n'):
 
110
            terminator = '\n' + NO_NL
 
111
        else:
 
112
            terminator = ''
 
113
        return leadchar + self.contents + terminator
 
114
 
 
115
 
 
116
class ContextLine(HunkLine):
 
117
    def __init__(self, contents):
 
118
        HunkLine.__init__(self, contents)
 
119
 
 
120
    def __str__(self):
 
121
        return self.get_str(" ")
 
122
 
 
123
 
 
124
class InsertLine(HunkLine):
 
125
    def __init__(self, contents):
 
126
        HunkLine.__init__(self, contents)
 
127
 
 
128
    def __str__(self):
 
129
        return self.get_str("+")
 
130
 
 
131
 
 
132
class RemoveLine(HunkLine):
 
133
    def __init__(self, contents):
 
134
        HunkLine.__init__(self, contents)
 
135
 
 
136
    def __str__(self):
 
137
        return self.get_str("-")
 
138
 
 
139
NO_NL = '\\ No newline at end of file\n'
 
140
__pychecker__="no-returnvalues"
 
141
 
 
142
def parse_line(line):
 
143
    if line.startswith("\n"):
 
144
        return ContextLine(line)
 
145
    elif line.startswith(" "):
 
146
        return ContextLine(line[1:])
 
147
    elif line.startswith("+"):
 
148
        return InsertLine(line[1:])
 
149
    elif line.startswith("-"):
 
150
        return RemoveLine(line[1:])
 
151
    elif line == NO_NL:
 
152
        return NO_NL
 
153
    else:
 
154
        raise MalformedLine("Unknown line type", line)
 
155
__pychecker__=""
 
156
 
 
157
 
 
158
class Hunk:
 
159
    def __init__(self, orig_pos, orig_range, mod_pos, mod_range):
 
160
        self.orig_pos = orig_pos
 
161
        self.orig_range = orig_range
 
162
        self.mod_pos = mod_pos
 
163
        self.mod_range = mod_range
 
164
        self.lines = []
 
165
 
 
166
    def get_header(self):
 
167
        return "@@ -%s +%s @@\n" % (self.range_str(self.orig_pos, 
 
168
                                                   self.orig_range),
 
169
                                    self.range_str(self.mod_pos, 
 
170
                                                   self.mod_range))
 
171
 
 
172
    def range_str(self, pos, range):
 
173
        """Return a file range, special-casing for 1-line files.
 
174
 
 
175
        :param pos: The position in the file
 
176
        :type pos: int
 
177
        :range: The range in the file
 
178
        :type range: int
 
179
        :return: a string in the format 1,4 except when range == pos == 1
 
180
        """
 
181
        if range == 1:
 
182
            return "%i" % pos
 
183
        else:
 
184
            return "%i,%i" % (pos, range)
 
185
 
 
186
    def __str__(self):
 
187
        lines = [self.get_header()]
 
188
        for line in self.lines:
 
189
            lines.append(str(line))
 
190
        return "".join(lines)
 
191
 
 
192
    def shift_to_mod(self, pos):
 
193
        if pos < self.orig_pos-1:
 
194
            return 0
 
195
        elif pos > self.orig_pos+self.orig_range:
 
196
            return self.mod_range - self.orig_range
 
197
        else:
 
198
            return self.shift_to_mod_lines(pos)
 
199
 
 
200
    def shift_to_mod_lines(self, pos):
 
201
        assert (pos >= self.orig_pos-1 and pos <= self.orig_pos+self.orig_range)
 
202
        position = self.orig_pos-1
 
203
        shift = 0
 
204
        for line in self.lines:
 
205
            if isinstance(line, InsertLine):
 
206
                shift += 1
 
207
            elif isinstance(line, RemoveLine):
 
208
                if position == pos:
 
209
                    return None
 
210
                shift -= 1
 
211
                position += 1
 
212
            elif isinstance(line, ContextLine):
 
213
                position += 1
 
214
            if position > pos:
 
215
                break
 
216
        return shift
 
217
 
 
218
def iter_hunks(iter_lines):
 
219
    hunk = None
 
220
    for line in iter_lines:
 
221
        if line == "\n":
 
222
            if hunk is not None:
 
223
                yield hunk
 
224
                hunk = None
 
225
            continue
 
226
        if hunk is not None:
 
227
            yield hunk
 
228
        hunk = hunk_from_header(line)
 
229
        orig_size = 0
 
230
        mod_size = 0
 
231
        while orig_size < hunk.orig_range or mod_size < hunk.mod_range:
 
232
            hunk_line = parse_line(iter_lines.next())
 
233
            hunk.lines.append(hunk_line)
 
234
            if isinstance(hunk_line, (RemoveLine, ContextLine)):
 
235
                orig_size += 1
 
236
            if isinstance(hunk_line, (InsertLine, ContextLine)):
 
237
                mod_size += 1
 
238
    if hunk is not None:
 
239
        yield hunk
 
240
 
 
241
class Patch:
 
242
    def __init__(self, oldname, newname):
 
243
        self.oldname = oldname
 
244
        self.newname = newname
 
245
        self.hunks = []
 
246
 
 
247
    def __str__(self):
 
248
        ret = self.get_header() 
 
249
        ret += "".join([str(h) for h in self.hunks])
 
250
        return ret
 
251
 
 
252
    def get_header(self):
 
253
        return "--- %s\n+++ %s\n" % (self.oldname, self.newname)
 
254
 
 
255
    def stats_str(self):
 
256
        """Return a string of patch statistics"""
 
257
        removes = 0
 
258
        inserts = 0
 
259
        for hunk in self.hunks:
 
260
            for line in hunk.lines:
 
261
                if isinstance(line, InsertLine):
 
262
                     inserts+=1;
 
263
                elif isinstance(line, RemoveLine):
 
264
                     removes+=1;
 
265
        return "%i inserts, %i removes in %i hunks" % \
 
266
            (inserts, removes, len(self.hunks))
 
267
 
 
268
    def pos_in_mod(self, position):
 
269
        newpos = position
 
270
        for hunk in self.hunks:
 
271
            shift = hunk.shift_to_mod(position)
 
272
            if shift is None:
 
273
                return None
 
274
            newpos += shift
 
275
        return newpos
 
276
            
 
277
    def iter_inserted(self):
 
278
        """Iteraties through inserted lines
 
279
        
 
280
        :return: Pair of line number, line
 
281
        :rtype: iterator of (int, InsertLine)
 
282
        """
 
283
        for hunk in self.hunks:
 
284
            pos = hunk.mod_pos - 1;
 
285
            for line in hunk.lines:
 
286
                if isinstance(line, InsertLine):
 
287
                    yield (pos, line)
 
288
                    pos += 1
 
289
                if isinstance(line, ContextLine):
 
290
                    pos += 1
 
291
 
 
292
def parse_patch(iter_lines):
 
293
    (orig_name, mod_name) = get_patch_names(iter_lines)
 
294
    patch = Patch(orig_name, mod_name)
 
295
    for hunk in iter_hunks(iter_lines):
 
296
        patch.hunks.append(hunk)
 
297
    return patch
 
298
 
 
299
 
 
300
def iter_file_patch(iter_lines):
 
301
    saved_lines = []
 
302
    for line in iter_lines:
 
303
        if line.startswith('*** '):
 
304
            continue
 
305
        if line.startswith('==='):
 
306
            continue
 
307
        elif line.startswith('--- '):
 
308
            if len(saved_lines) > 0:
 
309
                yield saved_lines
 
310
            saved_lines = []
 
311
        saved_lines.append(line)
 
312
    if len(saved_lines) > 0:
 
313
        yield saved_lines
 
314
 
 
315
 
 
316
def iter_lines_handle_nl(iter_lines):
 
317
    """
 
318
    Iterates through lines, ensuring that lines that originally had no
 
319
    terminating \n are produced without one.  This transformation may be
 
320
    applied at any point up until hunk line parsing, and is safe to apply
 
321
    repeatedly.
 
322
    """
 
323
    last_line = None
 
324
    for line in iter_lines:
 
325
        if line == NO_NL:
 
326
            assert last_line.endswith('\n')
 
327
            last_line = last_line[:-1]
 
328
            line = None
 
329
        if last_line is not None:
 
330
            yield last_line
 
331
        last_line = line
 
332
    if last_line is not None:
 
333
        yield last_line
 
334
 
 
335
 
 
336
def parse_patches(iter_lines):
 
337
    iter_lines = iter_lines_handle_nl(iter_lines)
 
338
    return [parse_patch(f.__iter__()) for f in iter_file_patch(iter_lines)]
 
339
 
 
340
 
 
341
def difference_index(atext, btext):
 
342
    """Find the indext of the first character that differs betweeen two texts
 
343
 
 
344
    :param atext: The first text
 
345
    :type atext: str
 
346
    :param btext: The second text
 
347
    :type str: str
 
348
    :return: The index, or None if there are no differences within the range
 
349
    :rtype: int or NoneType
 
350
    """
 
351
    length = len(atext)
 
352
    if len(btext) < length:
 
353
        length = len(btext)
 
354
    for i in range(length):
 
355
        if atext[i] != btext[i]:
 
356
            return i;
 
357
    return None
 
358
 
 
359
class PatchConflict(Exception):
 
360
    def __init__(self, line_no, orig_line, patch_line):
 
361
        orig = orig_line.rstrip('\n')
 
362
        patch = str(patch_line).rstrip('\n')
 
363
        msg = 'Text contents mismatch at line %d.  Original has "%s",'\
 
364
            ' but patch says it should be "%s"' % (line_no, orig, patch)
 
365
        Exception.__init__(self, msg)
 
366
 
 
367
 
 
368
def iter_patched(orig_lines, patch_lines):
 
369
    """Iterate through a series of lines with a patch applied.
 
370
    This handles a single file, and does exact, not fuzzy patching.
 
371
    """
 
372
    if orig_lines is not None:
 
373
        orig_lines = orig_lines.__iter__()
 
374
    seen_patch = []
 
375
    patch_lines = iter_lines_handle_nl(patch_lines.__iter__())
 
376
    get_patch_names(patch_lines)
 
377
    line_no = 1
 
378
    for hunk in iter_hunks(patch_lines):
 
379
        while line_no < hunk.orig_pos:
 
380
            orig_line = orig_lines.next()
 
381
            yield orig_line
 
382
            line_no += 1
 
383
        for hunk_line in hunk.lines:
 
384
            seen_patch.append(str(hunk_line))
 
385
            if isinstance(hunk_line, InsertLine):
 
386
                yield hunk_line.contents
 
387
            elif isinstance(hunk_line, (ContextLine, RemoveLine)):
 
388
                orig_line = orig_lines.next()
 
389
                if orig_line != hunk_line.contents:
 
390
                    raise PatchConflict(line_no, orig_line, "".join(seen_patch))
 
391
                if isinstance(hunk_line, ContextLine):
 
392
                    yield orig_line
 
393
                else:
 
394
                    assert isinstance(hunk_line, RemoveLine)
 
395
                line_no += 1
 
396
                    
 
397
import unittest
 
398
import os.path
 
399
class PatchesTester(unittest.TestCase):
 
400
    def datafile(self, filename):
 
401
        data_path = os.path.join(os.path.dirname(__file__), "testdata", 
 
402
                                 filename)
 
403
        return file(data_path, "rb")
 
404
 
 
405
    def testValidPatchHeader(self):
 
406
        """Parse a valid patch header"""
 
407
        lines = "--- orig/commands.py\n+++ mod/dommands.py\n".split('\n')
 
408
        (orig, mod) = get_patch_names(lines.__iter__())
 
409
        assert(orig == "orig/commands.py")
 
410
        assert(mod == "mod/dommands.py")
 
411
 
 
412
    def testInvalidPatchHeader(self):
 
413
        """Parse an invalid patch header"""
 
414
        lines = "-- orig/commands.py\n+++ mod/dommands.py".split('\n')
 
415
        self.assertRaises(MalformedPatchHeader, get_patch_names,
 
416
                          lines.__iter__())
 
417
 
 
418
    def testValidHunkHeader(self):
 
419
        """Parse a valid hunk header"""
 
420
        header = "@@ -34,11 +50,6 @@\n"
 
421
        hunk = hunk_from_header(header);
 
422
        assert (hunk.orig_pos == 34)
 
423
        assert (hunk.orig_range == 11)
 
424
        assert (hunk.mod_pos == 50)
 
425
        assert (hunk.mod_range == 6)
 
426
        assert (str(hunk) == header)
 
427
 
 
428
    def testValidHunkHeader2(self):
 
429
        """Parse a tricky, valid hunk header"""
 
430
        header = "@@ -1 +0,0 @@\n"
 
431
        hunk = hunk_from_header(header);
 
432
        assert (hunk.orig_pos == 1)
 
433
        assert (hunk.orig_range == 1)
 
434
        assert (hunk.mod_pos == 0)
 
435
        assert (hunk.mod_range == 0)
 
436
        assert (str(hunk) == header)
 
437
 
 
438
    def makeMalformed(self, header):
 
439
        self.assertRaises(MalformedHunkHeader, hunk_from_header, header)
 
440
 
 
441
    def testInvalidHeader(self):
 
442
        """Parse an invalid hunk header"""
 
443
        self.makeMalformed(" -34,11 +50,6 \n")
 
444
        self.makeMalformed("@@ +50,6 -34,11 @@\n")
 
445
        self.makeMalformed("@@ -34,11 +50,6 @@")
 
446
        self.makeMalformed("@@ -34.5,11 +50,6 @@\n")
 
447
        self.makeMalformed("@@-34,11 +50,6@@\n")
 
448
        self.makeMalformed("@@ 34,11 50,6 @@\n")
 
449
        self.makeMalformed("@@ -34,11 @@\n")
 
450
        self.makeMalformed("@@ -34,11 +50,6.5 @@\n")
 
451
        self.makeMalformed("@@ -34,11 +50,-6 @@\n")
 
452
 
 
453
    def lineThing(self,text, type):
 
454
        line = parse_line(text)
 
455
        assert(isinstance(line, type))
 
456
        assert(str(line)==text)
 
457
 
 
458
    def makeMalformedLine(self, text):
 
459
        self.assertRaises(MalformedLine, parse_line, text)
 
460
 
 
461
    def testValidLine(self):
 
462
        """Parse a valid hunk line"""
 
463
        self.lineThing(" hello\n", ContextLine)
 
464
        self.lineThing("+hello\n", InsertLine)
 
465
        self.lineThing("-hello\n", RemoveLine)
 
466
    
 
467
    def testMalformedLine(self):
 
468
        """Parse invalid valid hunk lines"""
 
469
        self.makeMalformedLine("hello\n")
 
470
    
 
471
    def compare_parsed(self, patchtext):
 
472
        lines = patchtext.splitlines(True)
 
473
        patch = parse_patch(lines.__iter__())
 
474
        pstr = str(patch)
 
475
        i = difference_index(patchtext, pstr)
 
476
        if i is not None:
 
477
            print "%i: \"%s\" != \"%s\"" % (i, patchtext[i], pstr[i])
 
478
        self.assertEqual (patchtext, str(patch))
 
479
 
 
480
    def testAll(self):
 
481
        """Test parsing a whole patch"""
 
482
        patchtext = """--- orig/commands.py
 
483
+++ mod/commands.py
 
484
@@ -1337,7 +1337,8 @@
 
485
 
 
486
     def set_title(self, command=None):
 
487
         try:
 
488
-            version = self.tree.tree_version.nonarch
 
489
+            version = pylon.alias_or_version(self.tree.tree_version, self.tree,
 
490
+                                             full=False)
 
491
         except:
 
492
             version = "[no version]"
 
493
         if command is None:
 
494
@@ -1983,7 +1984,11 @@
 
495
                                          version)
 
496
         if len(new_merges) > 0:
 
497
             if cmdutil.prompt("Log for merge"):
 
498
-                mergestuff = cmdutil.log_for_merge(tree, comp_version)
 
499
+                if cmdutil.prompt("changelog for merge"):
 
500
+                    mergestuff = "Patches applied:\\n"
 
501
+                    mergestuff += pylon.changelog_for_merge(new_merges)
 
502
+                else:
 
503
+                    mergestuff = cmdutil.log_for_merge(tree, comp_version)
 
504
                 log.description += mergestuff
 
505
         log.save()
 
506
     try:
 
507
"""
 
508
        self.compare_parsed(patchtext)
 
509
 
 
510
    def testInit(self):
 
511
        """Handle patches missing half the position, range tuple"""
 
512
        patchtext = \
 
513
"""--- orig/__init__.py
 
514
+++ mod/__init__.py
 
515
@@ -1 +1,2 @@
 
516
 __docformat__ = "restructuredtext en"
 
517
+__doc__ = An alternate Arch commandline interface
 
518
"""
 
519
        self.compare_parsed(patchtext)
 
520
        
 
521
 
 
522
 
 
523
    def testLineLookup(self):
 
524
        import sys
 
525
        """Make sure we can accurately look up mod line from orig"""
 
526
        patch = parse_patch(self.datafile("diff"))
 
527
        orig = list(self.datafile("orig"))
 
528
        mod = list(self.datafile("mod"))
 
529
        removals = []
 
530
        for i in range(len(orig)):
 
531
            mod_pos = patch.pos_in_mod(i)
 
532
            if mod_pos is None:
 
533
                removals.append(orig[i])
 
534
                continue
 
535
            assert(mod[mod_pos]==orig[i])
 
536
        rem_iter = removals.__iter__()
 
537
        for hunk in patch.hunks:
 
538
            for line in hunk.lines:
 
539
                if isinstance(line, RemoveLine):
 
540
                    next = rem_iter.next()
 
541
                    if line.contents != next:
 
542
                        sys.stdout.write(" orig:%spatch:%s" % (next,
 
543
                                         line.contents))
 
544
                    assert(line.contents == next)
 
545
        self.assertRaises(StopIteration, rem_iter.next)
 
546
 
 
547
    def testFirstLineRenumber(self):
 
548
        """Make sure we handle lines at the beginning of the hunk"""
 
549
        patch = parse_patch(self.datafile("insert_top.patch"))
 
550
        assert (patch.pos_in_mod(0)==1)
 
551
 
 
552
def test():
 
553
    patchesTestSuite = unittest.makeSuite(PatchesTester,'test')
 
554
    runner = unittest.TextTestRunner(verbosity=0)
 
555
    return runner.run(patchesTestSuite)
 
556
    
 
557
 
 
558
if __name__ == "__main__":
 
559
    test()
 
560
# arch-tag: d1541a25-eac5-4de9-a476-08a7cecd5683