~abentley/bzrtools/bzrtools.dev

« back to all changes in this revision

Viewing changes to patches.py

  • Committer: Aaron Bentley
  • Date: 2008-04-11 00:03:51 UTC
  • Revision ID: aaron@aaronbentley.com-20080411000351-dmbvgmanygnphzgp
Add escaping to HTML output

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2004, 2005 Aaron Bentley
2
 
# <aaron.bentley@utoronto.ca>
3
 
#
4
 
#    This program is free software; you can redistribute it and/or modify
5
 
#    it under the terms of the GNU General Public License as published by
6
 
#    the Free Software Foundation; either version 2 of the License, or
7
 
#    (at your option) any later version.
8
 
#
9
 
#    This program is distributed in the hope that it will be useful,
10
 
#    but WITHOUT ANY WARRANTY; without even the implied warranty of
11
 
#    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12
 
#    GNU General Public License for more details.
13
 
#
14
 
#    You should have received a copy of the GNU General Public License
15
 
#    along with this program; if not, write to the Free Software
16
 
#    Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
17
 
 
18
 
class PatchSyntax(Exception):
19
 
    def __init__(self, msg):
20
 
        Exception.__init__(self, msg)
21
 
 
22
 
 
23
 
class MalformedPatchHeader(PatchSyntax):
24
 
    def __init__(self, desc, line):
25
 
        self.desc = desc
26
 
        self.line = line
27
 
        msg = "Malformed patch header.  %s\n%r" % (self.desc, self.line)
28
 
        PatchSyntax.__init__(self, msg)
29
 
 
30
 
class MalformedHunkHeader(PatchSyntax):
31
 
    def __init__(self, desc, line):
32
 
        self.desc = desc
33
 
        self.line = line
34
 
        msg = "Malformed hunk header.  %s\n%r" % (self.desc, self.line)
35
 
        PatchSyntax.__init__(self, msg)
36
 
 
37
 
class MalformedLine(PatchSyntax):
38
 
    def __init__(self, desc, line):
39
 
        self.desc = desc
40
 
        self.line = line
41
 
        msg = "Malformed line.  %s\n%s" % (self.desc, self.line)
42
 
        PatchSyntax.__init__(self, msg)
43
 
 
44
 
def get_patch_names(iter_lines):
45
 
    try:
46
 
        line = iter_lines.next()
47
 
        if not line.startswith("--- "):
48
 
            raise MalformedPatchHeader("No orig name", line)
49
 
        else:
50
 
            orig_name = line[4:].rstrip("\n")
51
 
    except StopIteration:
52
 
        raise MalformedPatchHeader("No orig line", "")
53
 
    try:
54
 
        line = iter_lines.next()
55
 
        if not line.startswith("+++ "):
56
 
            raise PatchSyntax("No mod name")
57
 
        else:
58
 
            mod_name = line[4:].rstrip("\n")
59
 
    except StopIteration:
60
 
        raise MalformedPatchHeader("No mod line", "")
61
 
    return (orig_name, mod_name)
62
 
 
63
 
def parse_range(textrange):
64
 
    """Parse a patch range, handling the "1" special-case
65
 
 
66
 
    :param textrange: The text to parse
67
 
    :type textrange: str
68
 
    :return: the position and range, as a tuple
69
 
    :rtype: (int, int)
70
 
    """
71
 
    tmp = textrange.split(',')
72
 
    if len(tmp) == 1:
73
 
        pos = tmp[0]
74
 
        range = "1"
75
 
    else:
76
 
        (pos, range) = tmp
77
 
    pos = int(pos)
78
 
    range = int(range)
79
 
    return (pos, range)
80
 
 
81
 
 
82
 
def hunk_from_header(line):
83
 
    if not line.startswith("@@") or not line.endswith("@@\n") \
84
 
        or not len(line) > 4:
85
 
        raise MalformedHunkHeader("Does not start and end with @@.", line)
86
 
    try:
87
 
        (orig, mod) = line[3:-4].split(" ")
88
 
    except Exception, e:
89
 
        raise MalformedHunkHeader(str(e), line)
90
 
    if not orig.startswith('-') or not mod.startswith('+'):
91
 
        raise MalformedHunkHeader("Positions don't start with + or -.", line)
92
 
    try:
93
 
        (orig_pos, orig_range) = parse_range(orig[1:])
94
 
        (mod_pos, mod_range) = parse_range(mod[1:])
95
 
    except Exception, e:
96
 
        raise MalformedHunkHeader(str(e), line)
97
 
    if mod_range < 0 or orig_range < 0:
98
 
        raise MalformedHunkHeader("Hunk range is negative", line)
99
 
    return Hunk(orig_pos, orig_range, mod_pos, mod_range)
100
 
 
101
 
 
102
 
class HunkLine:
103
 
    def __init__(self, contents):
104
 
        self.contents = contents
105
 
 
106
 
    def get_str(self, leadchar):
107
 
        if self.contents == "\n" and leadchar == " " and False:
108
 
            return "\n"
109
 
        if not self.contents.endswith('\n'):
110
 
            terminator = '\n' + NO_NL
111
 
        else:
112
 
            terminator = ''
113
 
        return leadchar + self.contents + terminator
114
 
 
115
 
 
116
 
class ContextLine(HunkLine):
117
 
    def __init__(self, contents):
118
 
        HunkLine.__init__(self, contents)
119
 
 
120
 
    def __str__(self):
121
 
        return self.get_str(" ")
122
 
 
123
 
 
124
 
class InsertLine(HunkLine):
125
 
    def __init__(self, contents):
126
 
        HunkLine.__init__(self, contents)
127
 
 
128
 
    def __str__(self):
129
 
        return self.get_str("+")
130
 
 
131
 
 
132
 
class RemoveLine(HunkLine):
133
 
    def __init__(self, contents):
134
 
        HunkLine.__init__(self, contents)
135
 
 
136
 
    def __str__(self):
137
 
        return self.get_str("-")
138
 
 
139
 
NO_NL = '\\ No newline at end of file\n'
140
 
__pychecker__="no-returnvalues"
141
 
 
142
 
def parse_line(line):
143
 
    if line.startswith("\n"):
144
 
        return ContextLine(line)
145
 
    elif line.startswith(" "):
146
 
        return ContextLine(line[1:])
147
 
    elif line.startswith("+"):
148
 
        return InsertLine(line[1:])
149
 
    elif line.startswith("-"):
150
 
        return RemoveLine(line[1:])
151
 
    elif line == NO_NL:
152
 
        return NO_NL
153
 
    else:
154
 
        raise MalformedLine("Unknown line type", line)
155
 
__pychecker__=""
156
 
 
157
 
 
158
 
class Hunk:
159
 
    def __init__(self, orig_pos, orig_range, mod_pos, mod_range):
160
 
        self.orig_pos = orig_pos
161
 
        self.orig_range = orig_range
162
 
        self.mod_pos = mod_pos
163
 
        self.mod_range = mod_range
164
 
        self.lines = []
165
 
 
166
 
    def get_header(self):
167
 
        return "@@ -%s +%s @@\n" % (self.range_str(self.orig_pos, 
168
 
                                                   self.orig_range),
169
 
                                    self.range_str(self.mod_pos, 
170
 
                                                   self.mod_range))
171
 
 
172
 
    def range_str(self, pos, range):
173
 
        """Return a file range, special-casing for 1-line files.
174
 
 
175
 
        :param pos: The position in the file
176
 
        :type pos: int
177
 
        :range: The range in the file
178
 
        :type range: int
179
 
        :return: a string in the format 1,4 except when range == pos == 1
180
 
        """
181
 
        if range == 1:
182
 
            return "%i" % pos
183
 
        else:
184
 
            return "%i,%i" % (pos, range)
185
 
 
186
 
    def __str__(self):
187
 
        lines = [self.get_header()]
188
 
        for line in self.lines:
189
 
            lines.append(str(line))
190
 
        return "".join(lines)
191
 
 
192
 
    def shift_to_mod(self, pos):
193
 
        if pos < self.orig_pos-1:
194
 
            return 0
195
 
        elif pos > self.orig_pos+self.orig_range:
196
 
            return self.mod_range - self.orig_range
197
 
        else:
198
 
            return self.shift_to_mod_lines(pos)
199
 
 
200
 
    def shift_to_mod_lines(self, pos):
201
 
        assert (pos >= self.orig_pos-1 and pos <= self.orig_pos+self.orig_range)
202
 
        position = self.orig_pos-1
203
 
        shift = 0
204
 
        for line in self.lines:
205
 
            if isinstance(line, InsertLine):
206
 
                shift += 1
207
 
            elif isinstance(line, RemoveLine):
208
 
                if position == pos:
209
 
                    return None
210
 
                shift -= 1
211
 
                position += 1
212
 
            elif isinstance(line, ContextLine):
213
 
                position += 1
214
 
            if position > pos:
215
 
                break
216
 
        return shift
217
 
 
218
 
def iter_hunks(iter_lines):
219
 
    hunk = None
220
 
    for line in iter_lines:
221
 
        if line == "\n":
222
 
            if hunk is not None:
223
 
                yield hunk
224
 
                hunk = None
225
 
            continue
226
 
        if hunk is not None:
227
 
            yield hunk
228
 
        hunk = hunk_from_header(line)
229
 
        orig_size = 0
230
 
        mod_size = 0
231
 
        while orig_size < hunk.orig_range or mod_size < hunk.mod_range:
232
 
            hunk_line = parse_line(iter_lines.next())
233
 
            hunk.lines.append(hunk_line)
234
 
            if isinstance(hunk_line, (RemoveLine, ContextLine)):
235
 
                orig_size += 1
236
 
            if isinstance(hunk_line, (InsertLine, ContextLine)):
237
 
                mod_size += 1
238
 
    if hunk is not None:
239
 
        yield hunk
240
 
 
241
 
class Patch:
242
 
    def __init__(self, oldname, newname):
243
 
        self.oldname = oldname
244
 
        self.newname = newname
245
 
        self.hunks = []
246
 
 
247
 
    def __str__(self):
248
 
        ret = self.get_header() 
249
 
        ret += "".join([str(h) for h in self.hunks])
250
 
        return ret
251
 
 
252
 
    def get_header(self):
253
 
        return "--- %s\n+++ %s\n" % (self.oldname, self.newname)
254
 
 
255
 
    def stats_str(self):
256
 
        """Return a string of patch statistics"""
257
 
        removes = 0
258
 
        inserts = 0
259
 
        for hunk in self.hunks:
260
 
            for line in hunk.lines:
261
 
                if isinstance(line, InsertLine):
262
 
                     inserts+=1;
263
 
                elif isinstance(line, RemoveLine):
264
 
                     removes+=1;
265
 
        return "%i inserts, %i removes in %i hunks" % \
266
 
            (inserts, removes, len(self.hunks))
267
 
 
268
 
    def pos_in_mod(self, position):
269
 
        newpos = position
270
 
        for hunk in self.hunks:
271
 
            shift = hunk.shift_to_mod(position)
272
 
            if shift is None:
273
 
                return None
274
 
            newpos += shift
275
 
        return newpos
276
 
            
277
 
    def iter_inserted(self):
278
 
        """Iteraties through inserted lines
279
 
        
280
 
        :return: Pair of line number, line
281
 
        :rtype: iterator of (int, InsertLine)
282
 
        """
283
 
        for hunk in self.hunks:
284
 
            pos = hunk.mod_pos - 1;
285
 
            for line in hunk.lines:
286
 
                if isinstance(line, InsertLine):
287
 
                    yield (pos, line)
288
 
                    pos += 1
289
 
                if isinstance(line, ContextLine):
290
 
                    pos += 1
291
 
 
292
 
def parse_patch(iter_lines):
293
 
    (orig_name, mod_name) = get_patch_names(iter_lines)
294
 
    patch = Patch(orig_name, mod_name)
295
 
    for hunk in iter_hunks(iter_lines):
296
 
        patch.hunks.append(hunk)
297
 
    return patch
298
 
 
299
 
 
300
 
def iter_file_patch(iter_lines):
301
 
    saved_lines = []
302
 
    for line in iter_lines:
303
 
        if line.startswith('*** '):
304
 
            continue
305
 
        elif line.startswith('--- '):
306
 
            if len(saved_lines) > 0:
307
 
                yield saved_lines
308
 
            saved_lines = []
309
 
        saved_lines.append(line)
310
 
    if len(saved_lines) > 0:
311
 
        yield saved_lines
312
 
 
313
 
 
314
 
def iter_lines_handle_nl(iter_lines):
315
 
    """
316
 
    Iterates through lines, ensuring that lines that originally had no
317
 
    terminating \n are produced without one.  This transformation may be
318
 
    applied at any point up until hunk line parsing, and is safe to apply
319
 
    repeatedly.
320
 
    """
321
 
    last_line = None
322
 
    for line in iter_lines:
323
 
        if line == NO_NL:
324
 
            assert last_line.endswith('\n')
325
 
            last_line = last_line[:-1]
326
 
            line = None
327
 
        if last_line is not None:
328
 
            yield last_line
329
 
        last_line = line
330
 
    if last_line is not None:
331
 
        yield last_line
332
 
 
333
 
 
334
 
def parse_patches(iter_lines):
335
 
    iter_lines = iter_lines_handle_nl(iter_lines)
336
 
    return [parse_patch(f.__iter__()) for f in iter_file_patch(iter_lines)]
337
 
 
338
 
 
339
 
def difference_index(atext, btext):
340
 
    """Find the indext of the first character that differs betweeen two texts
341
 
 
342
 
    :param atext: The first text
343
 
    :type atext: str
344
 
    :param btext: The second text
345
 
    :type str: str
346
 
    :return: The index, or None if there are no differences within the range
347
 
    :rtype: int or NoneType
348
 
    """
349
 
    length = len(atext)
350
 
    if len(btext) < length:
351
 
        length = len(btext)
352
 
    for i in range(length):
353
 
        if atext[i] != btext[i]:
354
 
            return i;
355
 
    return None
356
 
 
357
 
class PatchConflict(Exception):
358
 
    def __init__(self, line_no, orig_line, patch_line):
359
 
        orig = orig_line.rstrip('\n')
360
 
        patch = str(patch_line).rstrip('\n')
361
 
        msg = 'Text contents mismatch at line %d.  Original has "%s",'\
362
 
            ' but patch says it should be "%s"' % (line_no, orig, patch)
363
 
        Exception.__init__(self, msg)
364
 
 
365
 
 
366
 
def iter_patched(orig_lines, patch_lines):
367
 
    """Iterate through a series of lines with a patch applied.
368
 
    This handles a single file, and does exact, not fuzzy patching.
369
 
    """
370
 
    if orig_lines is not None:
371
 
        orig_lines = orig_lines.__iter__()
372
 
    seen_patch = []
373
 
    patch_lines = iter_lines_handle_nl(patch_lines.__iter__())
374
 
    get_patch_names(patch_lines)
375
 
    line_no = 1
376
 
    for hunk in iter_hunks(patch_lines):
377
 
        while line_no < hunk.orig_pos:
378
 
            orig_line = orig_lines.next()
379
 
            yield orig_line
380
 
            line_no += 1
381
 
        for hunk_line in hunk.lines:
382
 
            seen_patch.append(str(hunk_line))
383
 
            if isinstance(hunk_line, InsertLine):
384
 
                yield hunk_line.contents
385
 
            elif isinstance(hunk_line, (ContextLine, RemoveLine)):
386
 
                orig_line = orig_lines.next()
387
 
                if orig_line != hunk_line.contents:
388
 
                    raise PatchConflict(line_no, orig_line, "".join(seen_patch))
389
 
                if isinstance(hunk_line, ContextLine):
390
 
                    yield orig_line
391
 
                else:
392
 
                    assert isinstance(hunk_line, RemoveLine)
393
 
                line_no += 1
394
 
                    
395
 
import unittest
396
 
import os.path
397
 
class PatchesTester(unittest.TestCase):
398
 
    def datafile(self, filename):
399
 
        data_path = os.path.join(os.path.dirname(__file__), "testdata", 
400
 
                                 filename)
401
 
        return file(data_path, "rb")
402
 
 
403
 
    def testValidPatchHeader(self):
404
 
        """Parse a valid patch header"""
405
 
        lines = "--- orig/commands.py\n+++ mod/dommands.py\n".split('\n')
406
 
        (orig, mod) = get_patch_names(lines.__iter__())
407
 
        assert(orig == "orig/commands.py")
408
 
        assert(mod == "mod/dommands.py")
409
 
 
410
 
    def testInvalidPatchHeader(self):
411
 
        """Parse an invalid patch header"""
412
 
        lines = "-- orig/commands.py\n+++ mod/dommands.py".split('\n')
413
 
        self.assertRaises(MalformedPatchHeader, get_patch_names,
414
 
                          lines.__iter__())
415
 
 
416
 
    def testValidHunkHeader(self):
417
 
        """Parse a valid hunk header"""
418
 
        header = "@@ -34,11 +50,6 @@\n"
419
 
        hunk = hunk_from_header(header);
420
 
        assert (hunk.orig_pos == 34)
421
 
        assert (hunk.orig_range == 11)
422
 
        assert (hunk.mod_pos == 50)
423
 
        assert (hunk.mod_range == 6)
424
 
        assert (str(hunk) == header)
425
 
 
426
 
    def testValidHunkHeader2(self):
427
 
        """Parse a tricky, valid hunk header"""
428
 
        header = "@@ -1 +0,0 @@\n"
429
 
        hunk = hunk_from_header(header);
430
 
        assert (hunk.orig_pos == 1)
431
 
        assert (hunk.orig_range == 1)
432
 
        assert (hunk.mod_pos == 0)
433
 
        assert (hunk.mod_range == 0)
434
 
        assert (str(hunk) == header)
435
 
 
436
 
    def makeMalformed(self, header):
437
 
        self.assertRaises(MalformedHunkHeader, hunk_from_header, header)
438
 
 
439
 
    def testInvalidHeader(self):
440
 
        """Parse an invalid hunk header"""
441
 
        self.makeMalformed(" -34,11 +50,6 \n")
442
 
        self.makeMalformed("@@ +50,6 -34,11 @@\n")
443
 
        self.makeMalformed("@@ -34,11 +50,6 @@")
444
 
        self.makeMalformed("@@ -34.5,11 +50,6 @@\n")
445
 
        self.makeMalformed("@@-34,11 +50,6@@\n")
446
 
        self.makeMalformed("@@ 34,11 50,6 @@\n")
447
 
        self.makeMalformed("@@ -34,11 @@\n")
448
 
        self.makeMalformed("@@ -34,11 +50,6.5 @@\n")
449
 
        self.makeMalformed("@@ -34,11 +50,-6 @@\n")
450
 
 
451
 
    def lineThing(self,text, type):
452
 
        line = parse_line(text)
453
 
        assert(isinstance(line, type))
454
 
        assert(str(line)==text)
455
 
 
456
 
    def makeMalformedLine(self, text):
457
 
        self.assertRaises(MalformedLine, parse_line, text)
458
 
 
459
 
    def testValidLine(self):
460
 
        """Parse a valid hunk line"""
461
 
        self.lineThing(" hello\n", ContextLine)
462
 
        self.lineThing("+hello\n", InsertLine)
463
 
        self.lineThing("-hello\n", RemoveLine)
464
 
    
465
 
    def testMalformedLine(self):
466
 
        """Parse invalid valid hunk lines"""
467
 
        self.makeMalformedLine("hello\n")
468
 
    
469
 
    def compare_parsed(self, patchtext):
470
 
        lines = patchtext.splitlines(True)
471
 
        patch = parse_patch(lines.__iter__())
472
 
        pstr = str(patch)
473
 
        i = difference_index(patchtext, pstr)
474
 
        if i is not None:
475
 
            print "%i: \"%s\" != \"%s\"" % (i, patchtext[i], pstr[i])
476
 
        self.assertEqual (patchtext, str(patch))
477
 
 
478
 
    def testAll(self):
479
 
        """Test parsing a whole patch"""
480
 
        patchtext = """--- orig/commands.py
481
 
+++ mod/commands.py
482
 
@@ -1337,7 +1337,8 @@
483
 
 
484
 
     def set_title(self, command=None):
485
 
         try:
486
 
-            version = self.tree.tree_version.nonarch
487
 
+            version = pylon.alias_or_version(self.tree.tree_version, self.tree,
488
 
+                                             full=False)
489
 
         except:
490
 
             version = "[no version]"
491
 
         if command is None:
492
 
@@ -1983,7 +1984,11 @@
493
 
                                          version)
494
 
         if len(new_merges) > 0:
495
 
             if cmdutil.prompt("Log for merge"):
496
 
-                mergestuff = cmdutil.log_for_merge(tree, comp_version)
497
 
+                if cmdutil.prompt("changelog for merge"):
498
 
+                    mergestuff = "Patches applied:\\n"
499
 
+                    mergestuff += pylon.changelog_for_merge(new_merges)
500
 
+                else:
501
 
+                    mergestuff = cmdutil.log_for_merge(tree, comp_version)
502
 
                 log.description += mergestuff
503
 
         log.save()
504
 
     try:
505
 
"""
506
 
        self.compare_parsed(patchtext)
507
 
 
508
 
    def testInit(self):
509
 
        """Handle patches missing half the position, range tuple"""
510
 
        patchtext = \
511
 
"""--- orig/__init__.py
512
 
+++ mod/__init__.py
513
 
@@ -1 +1,2 @@
514
 
 __docformat__ = "restructuredtext en"
515
 
+__doc__ = An alternate Arch commandline interface
516
 
"""
517
 
        self.compare_parsed(patchtext)
518
 
        
519
 
 
520
 
 
521
 
    def testLineLookup(self):
522
 
        import sys
523
 
        """Make sure we can accurately look up mod line from orig"""
524
 
        patch = parse_patch(self.datafile("diff"))
525
 
        orig = list(self.datafile("orig"))
526
 
        mod = list(self.datafile("mod"))
527
 
        removals = []
528
 
        for i in range(len(orig)):
529
 
            mod_pos = patch.pos_in_mod(i)
530
 
            if mod_pos is None:
531
 
                removals.append(orig[i])
532
 
                continue
533
 
            assert(mod[mod_pos]==orig[i])
534
 
        rem_iter = removals.__iter__()
535
 
        for hunk in patch.hunks:
536
 
            for line in hunk.lines:
537
 
                if isinstance(line, RemoveLine):
538
 
                    next = rem_iter.next()
539
 
                    if line.contents != next:
540
 
                        sys.stdout.write(" orig:%spatch:%s" % (next,
541
 
                                         line.contents))
542
 
                    assert(line.contents == next)
543
 
        self.assertRaises(StopIteration, rem_iter.next)
544
 
 
545
 
    def testFirstLineRenumber(self):
546
 
        """Make sure we handle lines at the beginning of the hunk"""
547
 
        patch = parse_patch(self.datafile("insert_top.patch"))
548
 
        assert (patch.pos_in_mod(0)==1)
549
 
 
550
 
def test():
551
 
    patchesTestSuite = unittest.makeSuite(PatchesTester,'test')
552
 
    runner = unittest.TextTestRunner(verbosity=0)
553
 
    return runner.run(patchesTestSuite)
554
 
    
555
 
 
556
 
if __name__ == "__main__":
557
 
    test()
558
 
# arch-tag: d1541a25-eac5-4de9-a476-08a7cecd5683