~abentley/bzrtools/bzrtools.dev

« back to all changes in this revision

Viewing changes to patches.py

  • Committer: Aaron Bentley
  • Date: 2005-09-13 22:49:40 UTC
  • mto: (147.1.21)
  • mto: This revision was merged to the branch mainline in revision 154.
  • Revision ID: abentley@panoramicfeedback.com-20050913224940-c6db07f39dd303be
Updated docs, obsoleted old executibles

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# Copyright (C) 2004, 2005 Aaron Bentley
 
2
# <aaron.bentley@utoronto.ca>
 
3
#
 
4
#    This program is free software; you can redistribute it and/or modify
 
5
#    it under the terms of the GNU General Public License as published by
 
6
#    the Free Software Foundation; either version 2 of the License, or
 
7
#    (at your option) any later version.
 
8
#
 
9
#    This program is distributed in the hope that it will be useful,
 
10
#    but WITHOUT ANY WARRANTY; without even the implied warranty of
 
11
#    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
12
#    GNU General Public License for more details.
 
13
#
 
14
#    You should have received a copy of the GNU General Public License
 
15
#    along with this program; if not, write to the Free Software
 
16
#    Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
17
 
 
18
class PatchSyntax(Exception):
 
19
    def __init__(self, msg):
 
20
        Exception.__init__(self, msg)
 
21
 
 
22
 
 
23
class MalformedPatchHeader(PatchSyntax):
 
24
    def __init__(self, desc, line):
 
25
        self.desc = desc
 
26
        self.line = line
 
27
        msg = "Malformed patch header.  %s\n%r" % (self.desc, self.line)
 
28
        PatchSyntax.__init__(self, msg)
 
29
 
 
30
class MalformedHunkHeader(PatchSyntax):
 
31
    def __init__(self, desc, line):
 
32
        self.desc = desc
 
33
        self.line = line
 
34
        msg = "Malformed hunk header.  %s\n%r" % (self.desc, self.line)
 
35
        PatchSyntax.__init__(self, msg)
 
36
 
 
37
class MalformedLine(PatchSyntax):
 
38
    def __init__(self, desc, line):
 
39
        self.desc = desc
 
40
        self.line = line
 
41
        msg = "Malformed line.  %s\n%s" % (self.desc, self.line)
 
42
        PatchSyntax.__init__(self, msg)
 
43
 
 
44
def get_patch_names(iter_lines):
 
45
    try:
 
46
        line = iter_lines.next()
 
47
        if not line.startswith("--- "):
 
48
            raise MalformedPatchHeader("No orig name", line)
 
49
        else:
 
50
            orig_name = line[4:].rstrip("\n")
 
51
    except StopIteration:
 
52
        raise MalformedPatchHeader("No orig line", "")
 
53
    try:
 
54
        line = iter_lines.next()
 
55
        if not line.startswith("+++ "):
 
56
            raise PatchSyntax("No mod name")
 
57
        else:
 
58
            mod_name = line[4:].rstrip("\n")
 
59
    except StopIteration:
 
60
        raise MalformedPatchHeader("No mod line", "")
 
61
    return (orig_name, mod_name)
 
62
 
 
63
def parse_range(textrange):
 
64
    """Parse a patch range, handling the "1" special-case
 
65
 
 
66
    :param textrange: The text to parse
 
67
    :type textrange: str
 
68
    :return: the position and range, as a tuple
 
69
    :rtype: (int, int)
 
70
    """
 
71
    tmp = textrange.split(',')
 
72
    if len(tmp) == 1:
 
73
        pos = tmp[0]
 
74
        range = "1"
 
75
    else:
 
76
        (pos, range) = tmp
 
77
    pos = int(pos)
 
78
    range = int(range)
 
79
    return (pos, range)
 
80
 
 
81
 
 
82
def hunk_from_header(line):
 
83
    if not line.startswith("@@") or not line.endswith("@@\n") \
 
84
        or not len(line) > 4:
 
85
        raise MalformedHunkHeader("Does not start and end with @@.", line)
 
86
    try:
 
87
        (orig, mod) = line[3:-4].split(" ")
 
88
    except Exception, e:
 
89
        raise MalformedHunkHeader(str(e), line)
 
90
    if not orig.startswith('-') or not mod.startswith('+'):
 
91
        raise MalformedHunkHeader("Positions don't start with + or -.", line)
 
92
    try:
 
93
        (orig_pos, orig_range) = parse_range(orig[1:])
 
94
        (mod_pos, mod_range) = parse_range(mod[1:])
 
95
    except Exception, e:
 
96
        raise MalformedHunkHeader(str(e), line)
 
97
    if mod_range < 0 or orig_range < 0:
 
98
        raise MalformedHunkHeader("Hunk range is negative", line)
 
99
    return Hunk(orig_pos, orig_range, mod_pos, mod_range)
 
100
 
 
101
 
 
102
class HunkLine:
 
103
    def __init__(self, contents):
 
104
        self.contents = contents
 
105
 
 
106
    def get_str(self, leadchar):
 
107
        if self.contents == "\n" and leadchar == " " and False:
 
108
            return "\n"
 
109
        if not self.contents.endswith('\n'):
 
110
            terminator = '\n' + NO_NL
 
111
        else:
 
112
            terminator = ''
 
113
        return leadchar + self.contents + terminator
 
114
 
 
115
 
 
116
class ContextLine(HunkLine):
 
117
    def __init__(self, contents):
 
118
        HunkLine.__init__(self, contents)
 
119
 
 
120
    def __str__(self):
 
121
        return self.get_str(" ")
 
122
 
 
123
 
 
124
class InsertLine(HunkLine):
 
125
    def __init__(self, contents):
 
126
        HunkLine.__init__(self, contents)
 
127
 
 
128
    def __str__(self):
 
129
        return self.get_str("+")
 
130
 
 
131
 
 
132
class RemoveLine(HunkLine):
 
133
    def __init__(self, contents):
 
134
        HunkLine.__init__(self, contents)
 
135
 
 
136
    def __str__(self):
 
137
        return self.get_str("-")
 
138
 
 
139
NO_NL = '\\ No newline at end of file\n'
 
140
__pychecker__="no-returnvalues"
 
141
 
 
142
def parse_line(line):
 
143
    if line.startswith("\n"):
 
144
        return ContextLine(line)
 
145
    elif line.startswith(" "):
 
146
        return ContextLine(line[1:])
 
147
    elif line.startswith("+"):
 
148
        return InsertLine(line[1:])
 
149
    elif line.startswith("-"):
 
150
        return RemoveLine(line[1:])
 
151
    elif line == NO_NL:
 
152
        return NO_NL
 
153
    else:
 
154
        raise MalformedLine("Unknown line type", line)
 
155
__pychecker__=""
 
156
 
 
157
 
 
158
class Hunk:
 
159
    def __init__(self, orig_pos, orig_range, mod_pos, mod_range):
 
160
        self.orig_pos = orig_pos
 
161
        self.orig_range = orig_range
 
162
        self.mod_pos = mod_pos
 
163
        self.mod_range = mod_range
 
164
        self.lines = []
 
165
 
 
166
    def get_header(self):
 
167
        return "@@ -%s +%s @@\n" % (self.range_str(self.orig_pos, 
 
168
                                                   self.orig_range),
 
169
                                    self.range_str(self.mod_pos, 
 
170
                                                   self.mod_range))
 
171
 
 
172
    def range_str(self, pos, range):
 
173
        """Return a file range, special-casing for 1-line files.
 
174
 
 
175
        :param pos: The position in the file
 
176
        :type pos: int
 
177
        :range: The range in the file
 
178
        :type range: int
 
179
        :return: a string in the format 1,4 except when range == pos == 1
 
180
        """
 
181
        if range == 1:
 
182
            return "%i" % pos
 
183
        else:
 
184
            return "%i,%i" % (pos, range)
 
185
 
 
186
    def __str__(self):
 
187
        lines = [self.get_header()]
 
188
        for line in self.lines:
 
189
            lines.append(str(line))
 
190
        return "".join(lines)
 
191
 
 
192
    def shift_to_mod(self, pos):
 
193
        if pos < self.orig_pos-1:
 
194
            return 0
 
195
        elif pos > self.orig_pos+self.orig_range:
 
196
            return self.mod_range - self.orig_range
 
197
        else:
 
198
            return self.shift_to_mod_lines(pos)
 
199
 
 
200
    def shift_to_mod_lines(self, pos):
 
201
        assert (pos >= self.orig_pos-1 and pos <= self.orig_pos+self.orig_range)
 
202
        position = self.orig_pos-1
 
203
        shift = 0
 
204
        for line in self.lines:
 
205
            if isinstance(line, InsertLine):
 
206
                shift += 1
 
207
            elif isinstance(line, RemoveLine):
 
208
                if position == pos:
 
209
                    return None
 
210
                shift -= 1
 
211
                position += 1
 
212
            elif isinstance(line, ContextLine):
 
213
                position += 1
 
214
            if position > pos:
 
215
                break
 
216
        return shift
 
217
 
 
218
def iter_hunks(iter_lines):
 
219
    hunk = None
 
220
    for line in iter_lines:
 
221
        if line == "\n":
 
222
            if hunk is not None:
 
223
                yield hunk
 
224
                hunk = None
 
225
            continue
 
226
        if hunk is not None:
 
227
            yield hunk
 
228
        hunk = hunk_from_header(line)
 
229
        orig_size = 0
 
230
        mod_size = 0
 
231
        while orig_size < hunk.orig_range or mod_size < hunk.mod_range:
 
232
            hunk_line = parse_line(iter_lines.next())
 
233
            hunk.lines.append(hunk_line)
 
234
            if isinstance(hunk_line, (RemoveLine, ContextLine)):
 
235
                orig_size += 1
 
236
            if isinstance(hunk_line, (InsertLine, ContextLine)):
 
237
                mod_size += 1
 
238
    if hunk is not None:
 
239
        yield hunk
 
240
 
 
241
class Patch:
 
242
    def __init__(self, oldname, newname):
 
243
        self.oldname = oldname
 
244
        self.newname = newname
 
245
        self.hunks = []
 
246
 
 
247
    def __str__(self):
 
248
        ret = self.get_header() 
 
249
        ret += "".join([str(h) for h in self.hunks])
 
250
        return ret
 
251
 
 
252
    def get_header(self):
 
253
        return "--- %s\n+++ %s\n" % (self.oldname, self.newname)
 
254
 
 
255
    def stats_str(self):
 
256
        """Return a string of patch statistics"""
 
257
        removes = 0
 
258
        inserts = 0
 
259
        for hunk in self.hunks:
 
260
            for line in hunk.lines:
 
261
                if isinstance(line, InsertLine):
 
262
                     inserts+=1;
 
263
                elif isinstance(line, RemoveLine):
 
264
                     removes+=1;
 
265
        return "%i inserts, %i removes in %i hunks" % \
 
266
            (inserts, removes, len(self.hunks))
 
267
 
 
268
    def pos_in_mod(self, position):
 
269
        newpos = position
 
270
        for hunk in self.hunks:
 
271
            shift = hunk.shift_to_mod(position)
 
272
            if shift is None:
 
273
                return None
 
274
            newpos += shift
 
275
        return newpos
 
276
            
 
277
    def iter_inserted(self):
 
278
        """Iteraties through inserted lines
 
279
        
 
280
        :return: Pair of line number, line
 
281
        :rtype: iterator of (int, InsertLine)
 
282
        """
 
283
        for hunk in self.hunks:
 
284
            pos = hunk.mod_pos - 1;
 
285
            for line in hunk.lines:
 
286
                if isinstance(line, InsertLine):
 
287
                    yield (pos, line)
 
288
                    pos += 1
 
289
                if isinstance(line, ContextLine):
 
290
                    pos += 1
 
291
 
 
292
def parse_patch(iter_lines):
 
293
    (orig_name, mod_name) = get_patch_names(iter_lines)
 
294
    patch = Patch(orig_name, mod_name)
 
295
    for hunk in iter_hunks(iter_lines):
 
296
        patch.hunks.append(hunk)
 
297
    return patch
 
298
 
 
299
 
 
300
def iter_file_patch(iter_lines):
 
301
    saved_lines = []
 
302
    for line in iter_lines:
 
303
        if line.startswith('*** '):
 
304
            continue
 
305
        elif line.startswith('--- '):
 
306
            if len(saved_lines) > 0:
 
307
                yield saved_lines
 
308
            saved_lines = []
 
309
        saved_lines.append(line)
 
310
    if len(saved_lines) > 0:
 
311
        yield saved_lines
 
312
 
 
313
 
 
314
def iter_lines_handle_nl(iter_lines):
 
315
    """
 
316
    Iterates through lines, ensuring that lines that originally had no
 
317
    terminating \n are produced without one.  This transformation may be
 
318
    applied at any point up until hunk line parsing, and is safe to apply
 
319
    repeatedly.
 
320
    """
 
321
    last_line = None
 
322
    for line in iter_lines:
 
323
        if line == NO_NL:
 
324
            assert last_line.endswith('\n')
 
325
            last_line = last_line[:-1]
 
326
            line = None
 
327
        if last_line is not None:
 
328
            yield last_line
 
329
        last_line = line
 
330
    if last_line is not None:
 
331
        yield last_line
 
332
 
 
333
 
 
334
def parse_patches(iter_lines):
 
335
    iter_lines = iter_lines_handle_nl(iter_lines)
 
336
    return [parse_patch(f.__iter__()) for f in iter_file_patch(iter_lines)]
 
337
 
 
338
 
 
339
def difference_index(atext, btext):
 
340
    """Find the indext of the first character that differs betweeen two texts
 
341
 
 
342
    :param atext: The first text
 
343
    :type atext: str
 
344
    :param btext: The second text
 
345
    :type str: str
 
346
    :return: The index, or None if there are no differences within the range
 
347
    :rtype: int or NoneType
 
348
    """
 
349
    length = len(atext)
 
350
    if len(btext) < length:
 
351
        length = len(btext)
 
352
    for i in range(length):
 
353
        if atext[i] != btext[i]:
 
354
            return i;
 
355
    return None
 
356
 
 
357
class PatchConflict(Exception):
 
358
    def __init__(self, line_no, orig_line, patch_line):
 
359
        orig = orig_line.rstrip('\n')
 
360
        patch = str(patch_line).rstrip('\n')
 
361
        msg = 'Text contents mismatch at line %d.  Original has "%s",'\
 
362
            ' but patch says it should be "%s"' % (line_no, orig, patch)
 
363
        Exception.__init__(self, msg)
 
364
 
 
365
 
 
366
def iter_patched(orig_lines, patch_lines):
 
367
    """Iterate through a series of lines with a patch applied.
 
368
    This handles a single file, and does exact, not fuzzy patching.
 
369
    """
 
370
    if orig_lines is not None:
 
371
        orig_lines = orig_lines.__iter__()
 
372
    seen_patch = []
 
373
    patch_lines = iter_lines_handle_nl(patch_lines.__iter__())
 
374
    get_patch_names(patch_lines)
 
375
    line_no = 1
 
376
    for hunk in iter_hunks(patch_lines):
 
377
        while line_no < hunk.orig_pos:
 
378
            orig_line = orig_lines.next()
 
379
            yield orig_line
 
380
            line_no += 1
 
381
        for hunk_line in hunk.lines:
 
382
            seen_patch.append(str(hunk_line))
 
383
            if isinstance(hunk_line, InsertLine):
 
384
                yield hunk_line.contents
 
385
            elif isinstance(hunk_line, (ContextLine, RemoveLine)):
 
386
                orig_line = orig_lines.next()
 
387
                if orig_line != hunk_line.contents:
 
388
                    raise PatchConflict(line_no, orig_line, "".join(seen_patch))
 
389
                if isinstance(hunk_line, ContextLine):
 
390
                    yield orig_line
 
391
                else:
 
392
                    assert isinstance(hunk_line, RemoveLine)
 
393
                line_no += 1
 
394
                    
 
395
import unittest
 
396
import os.path
 
397
class PatchesTester(unittest.TestCase):
 
398
    def datafile(self, filename):
 
399
        data_path = os.path.join(os.path.dirname(__file__), "testdata", 
 
400
                                 filename)
 
401
        return file(data_path, "rb")
 
402
 
 
403
    def testValidPatchHeader(self):
 
404
        """Parse a valid patch header"""
 
405
        lines = "--- orig/commands.py\n+++ mod/dommands.py\n".split('\n')
 
406
        (orig, mod) = get_patch_names(lines.__iter__())
 
407
        assert(orig == "orig/commands.py")
 
408
        assert(mod == "mod/dommands.py")
 
409
 
 
410
    def testInvalidPatchHeader(self):
 
411
        """Parse an invalid patch header"""
 
412
        lines = "-- orig/commands.py\n+++ mod/dommands.py".split('\n')
 
413
        self.assertRaises(MalformedPatchHeader, get_patch_names,
 
414
                          lines.__iter__())
 
415
 
 
416
    def testValidHunkHeader(self):
 
417
        """Parse a valid hunk header"""
 
418
        header = "@@ -34,11 +50,6 @@\n"
 
419
        hunk = hunk_from_header(header);
 
420
        assert (hunk.orig_pos == 34)
 
421
        assert (hunk.orig_range == 11)
 
422
        assert (hunk.mod_pos == 50)
 
423
        assert (hunk.mod_range == 6)
 
424
        assert (str(hunk) == header)
 
425
 
 
426
    def testValidHunkHeader2(self):
 
427
        """Parse a tricky, valid hunk header"""
 
428
        header = "@@ -1 +0,0 @@\n"
 
429
        hunk = hunk_from_header(header);
 
430
        assert (hunk.orig_pos == 1)
 
431
        assert (hunk.orig_range == 1)
 
432
        assert (hunk.mod_pos == 0)
 
433
        assert (hunk.mod_range == 0)
 
434
        assert (str(hunk) == header)
 
435
 
 
436
    def makeMalformed(self, header):
 
437
        self.assertRaises(MalformedHunkHeader, hunk_from_header, header)
 
438
 
 
439
    def testInvalidHeader(self):
 
440
        """Parse an invalid hunk header"""
 
441
        self.makeMalformed(" -34,11 +50,6 \n")
 
442
        self.makeMalformed("@@ +50,6 -34,11 @@\n")
 
443
        self.makeMalformed("@@ -34,11 +50,6 @@")
 
444
        self.makeMalformed("@@ -34.5,11 +50,6 @@\n")
 
445
        self.makeMalformed("@@-34,11 +50,6@@\n")
 
446
        self.makeMalformed("@@ 34,11 50,6 @@\n")
 
447
        self.makeMalformed("@@ -34,11 @@\n")
 
448
        self.makeMalformed("@@ -34,11 +50,6.5 @@\n")
 
449
        self.makeMalformed("@@ -34,11 +50,-6 @@\n")
 
450
 
 
451
    def lineThing(self,text, type):
 
452
        line = parse_line(text)
 
453
        assert(isinstance(line, type))
 
454
        assert(str(line)==text)
 
455
 
 
456
    def makeMalformedLine(self, text):
 
457
        self.assertRaises(MalformedLine, parse_line, text)
 
458
 
 
459
    def testValidLine(self):
 
460
        """Parse a valid hunk line"""
 
461
        self.lineThing(" hello\n", ContextLine)
 
462
        self.lineThing("+hello\n", InsertLine)
 
463
        self.lineThing("-hello\n", RemoveLine)
 
464
    
 
465
    def testMalformedLine(self):
 
466
        """Parse invalid valid hunk lines"""
 
467
        self.makeMalformedLine("hello\n")
 
468
    
 
469
    def compare_parsed(self, patchtext):
 
470
        lines = patchtext.splitlines(True)
 
471
        patch = parse_patch(lines.__iter__())
 
472
        pstr = str(patch)
 
473
        i = difference_index(patchtext, pstr)
 
474
        if i is not None:
 
475
            print "%i: \"%s\" != \"%s\"" % (i, patchtext[i], pstr[i])
 
476
        self.assertEqual (patchtext, str(patch))
 
477
 
 
478
    def testAll(self):
 
479
        """Test parsing a whole patch"""
 
480
        patchtext = """--- orig/commands.py
 
481
+++ mod/commands.py
 
482
@@ -1337,7 +1337,8 @@
 
483
 
 
484
     def set_title(self, command=None):
 
485
         try:
 
486
-            version = self.tree.tree_version.nonarch
 
487
+            version = pylon.alias_or_version(self.tree.tree_version, self.tree,
 
488
+                                             full=False)
 
489
         except:
 
490
             version = "[no version]"
 
491
         if command is None:
 
492
@@ -1983,7 +1984,11 @@
 
493
                                          version)
 
494
         if len(new_merges) > 0:
 
495
             if cmdutil.prompt("Log for merge"):
 
496
-                mergestuff = cmdutil.log_for_merge(tree, comp_version)
 
497
+                if cmdutil.prompt("changelog for merge"):
 
498
+                    mergestuff = "Patches applied:\\n"
 
499
+                    mergestuff += pylon.changelog_for_merge(new_merges)
 
500
+                else:
 
501
+                    mergestuff = cmdutil.log_for_merge(tree, comp_version)
 
502
                 log.description += mergestuff
 
503
         log.save()
 
504
     try:
 
505
"""
 
506
        self.compare_parsed(patchtext)
 
507
 
 
508
    def testInit(self):
 
509
        """Handle patches missing half the position, range tuple"""
 
510
        patchtext = \
 
511
"""--- orig/__init__.py
 
512
+++ mod/__init__.py
 
513
@@ -1 +1,2 @@
 
514
 __docformat__ = "restructuredtext en"
 
515
+__doc__ = An alternate Arch commandline interface
 
516
"""
 
517
        self.compare_parsed(patchtext)
 
518
        
 
519
 
 
520
 
 
521
    def testLineLookup(self):
 
522
        import sys
 
523
        """Make sure we can accurately look up mod line from orig"""
 
524
        patch = parse_patch(self.datafile("diff"))
 
525
        orig = list(self.datafile("orig"))
 
526
        mod = list(self.datafile("mod"))
 
527
        removals = []
 
528
        for i in range(len(orig)):
 
529
            mod_pos = patch.pos_in_mod(i)
 
530
            if mod_pos is None:
 
531
                removals.append(orig[i])
 
532
                continue
 
533
            assert(mod[mod_pos]==orig[i])
 
534
        rem_iter = removals.__iter__()
 
535
        for hunk in patch.hunks:
 
536
            for line in hunk.lines:
 
537
                if isinstance(line, RemoveLine):
 
538
                    next = rem_iter.next()
 
539
                    if line.contents != next:
 
540
                        sys.stdout.write(" orig:%spatch:%s" % (next,
 
541
                                         line.contents))
 
542
                    assert(line.contents == next)
 
543
        self.assertRaises(StopIteration, rem_iter.next)
 
544
 
 
545
    def testFirstLineRenumber(self):
 
546
        """Make sure we handle lines at the beginning of the hunk"""
 
547
        patch = parse_patch(self.datafile("insert_top.patch"))
 
548
        assert (patch.pos_in_mod(0)==1)
 
549
 
 
550
def test():
 
551
    patchesTestSuite = unittest.makeSuite(PatchesTester,'test')
 
552
    runner = unittest.TextTestRunner(verbosity=0)
 
553
    return runner.run(patchesTestSuite)
 
554
    
 
555
 
 
556
if __name__ == "__main__":
 
557
    test()
 
558
# arch-tag: d1541a25-eac5-4de9-a476-08a7cecd5683