~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/bundle/serializer/v08.py

  • Committer: Robert Collins
  • Date: 2006-06-26 16:23:10 UTC
  • mfrom: (1780.2.1 misc-fixen)
  • mto: This revision was merged to the branch mainline in revision 1815.
  • Revision ID: robertc@robertcollins.net-20060626162310-98f5b55b8cc19d46
(robertc) Misc minor typos and the like.

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# (C) 2005 Canonical Development Ltd
 
2
#
 
3
# This program is free software; you can redistribute it and/or modify
 
4
# it under the terms of the GNU General Public License as published by
 
5
# the Free Software Foundation; either version 2 of the License, or
 
6
# (at your option) any later version.
 
7
#
 
8
# This program is distributed in the hope that it will be useful,
 
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
11
# GNU General Public License for more details.
 
12
#
 
13
# You should have received a copy of the GNU General Public License
 
14
# along with this program; if not, write to the Free Software
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
16
 
 
17
"""Serializer factory for reading and writing bundles.
 
18
"""
 
19
 
 
20
import os
 
21
 
 
22
from bzrlib.bundle.serializer import (BundleSerializer, 
 
23
                                      BUNDLE_HEADER, 
 
24
                                      format_highres_date,
 
25
                                      unpack_highres_date,
 
26
                                     )
 
27
from bzrlib.bundle.serializer import binary_diff
 
28
from bzrlib.bundle.bundle_data import (RevisionInfo, BundleInfo, BundleTree)
 
29
from bzrlib.delta import compare_trees
 
30
from bzrlib.diff import internal_diff
 
31
import bzrlib.errors as errors
 
32
from bzrlib.osutils import pathjoin
 
33
from bzrlib.progress import DummyProgress
 
34
from bzrlib.revision import NULL_REVISION
 
35
from bzrlib.rio import RioWriter, read_stanzas
 
36
import bzrlib.ui
 
37
from bzrlib.testament import StrictTestament
 
38
from bzrlib.textfile import text_file
 
39
from bzrlib.trace import mutter
 
40
 
 
41
bool_text = {True: 'yes', False: 'no'}
 
42
 
 
43
 
 
44
class Action(object):
 
45
    """Represent an action"""
 
46
 
 
47
    def __init__(self, name, parameters=None, properties=None):
 
48
        self.name = name
 
49
        if parameters is None:
 
50
            self.parameters = []
 
51
        else:
 
52
            self.parameters = parameters
 
53
        if properties is None:
 
54
            self.properties = []
 
55
        else:
 
56
            self.properties = properties
 
57
 
 
58
    def add_property(self, name, value):
 
59
        """Add a property to the action"""
 
60
        self.properties.append((name, value))
 
61
 
 
62
    def add_bool_property(self, name, value):
 
63
        """Add a boolean property to the action"""
 
64
        self.add_property(name, bool_text[value])
 
65
 
 
66
    def write(self, to_file):
 
67
        """Write action as to a file"""
 
68
        p_texts = [' '.join([self.name]+self.parameters)]
 
69
        for prop in self.properties:
 
70
            if len(prop) == 1:
 
71
                p_texts.append(prop[0])
 
72
            else:
 
73
                try:
 
74
                    p_texts.append('%s:%s' % prop)
 
75
                except:
 
76
                    raise repr(prop)
 
77
        text = ['=== ']
 
78
        text.append(' // '.join(p_texts))
 
79
        text_line = ''.join(text).encode('utf-8')
 
80
        available = 79
 
81
        while len(text_line) > available:
 
82
            to_file.write(text_line[:available])
 
83
            text_line = text_line[available:]
 
84
            to_file.write('\n... ')
 
85
            available = 79 - len('... ')
 
86
        to_file.write(text_line+'\n')
 
87
 
 
88
 
 
89
class BundleSerializerV08(BundleSerializer):
 
90
    def read(self, f):
 
91
        """Read the rest of the bundles from the supplied file.
 
92
 
 
93
        :param f: The file to read from
 
94
        :return: A list of bundles
 
95
        """
 
96
        return BundleReader(f).info
 
97
 
 
98
    def write(self, source, revision_ids, forced_bases, f):
 
99
        """Write the bundless to the supplied files.
 
100
 
 
101
        :param source: A source for revision information
 
102
        :param revision_ids: The list of revision ids to serialize
 
103
        :param forced_bases: A dict of revision -> base that overrides default
 
104
        :param f: The file to output to
 
105
        """
 
106
        self.source = source
 
107
        self.revision_ids = revision_ids
 
108
        self.forced_bases = forced_bases
 
109
        self.to_file = f
 
110
        source.lock_read()
 
111
        try:
 
112
            self._write_main_header()
 
113
            pb = DummyProgress()
 
114
            try:
 
115
                self._write_revisions(pb)
 
116
            finally:
 
117
                pass
 
118
                #pb.finished()
 
119
        finally:
 
120
            source.unlock()
 
121
 
 
122
    def _write_main_header(self):
 
123
        """Write the header for the changes"""
 
124
        f = self.to_file
 
125
        f.write(BUNDLE_HEADER)
 
126
        f.write('0.8\n')
 
127
        f.write('#\n')
 
128
 
 
129
    def _write(self, key, value, indent=1):
 
130
        """Write out meta information, with proper indenting, etc"""
 
131
        assert indent > 0, 'indentation must be greater than 0'
 
132
        f = self.to_file
 
133
        f.write('#' + (' ' * indent))
 
134
        f.write(key.encode('utf-8'))
 
135
        if not value:
 
136
            f.write(':\n')
 
137
        elif isinstance(value, basestring):
 
138
            f.write(': ')
 
139
            f.write(value.encode('utf-8'))
 
140
            f.write('\n')
 
141
        else:
 
142
            f.write(':\n')
 
143
            for entry in value:
 
144
                f.write('#' + (' ' * (indent+2)))
 
145
                f.write(entry.encode('utf-8'))
 
146
                f.write('\n')
 
147
 
 
148
    def _write_revisions(self, pb):
 
149
        """Write the information for all of the revisions."""
 
150
 
 
151
        # Optimize for the case of revisions in order
 
152
        last_rev_id = None
 
153
        last_rev_tree = None
 
154
 
 
155
        i_max = len(self.revision_ids) 
 
156
        for i, rev_id in enumerate(self.revision_ids):
 
157
            pb.update("Generating revsion data", i, i_max)
 
158
            rev = self.source.get_revision(rev_id)
 
159
            if rev_id == last_rev_id:
 
160
                rev_tree = last_rev_tree
 
161
            else:
 
162
                base_tree = self.source.revision_tree(rev_id)
 
163
            rev_tree = self.source.revision_tree(rev_id)
 
164
            if rev_id in self.forced_bases:
 
165
                explicit_base = True
 
166
                base_id = self.forced_bases[rev_id]
 
167
                if base_id is None:
 
168
                    base_id = NULL_REVISION
 
169
            else:
 
170
                explicit_base = False
 
171
                if rev.parent_ids:
 
172
                    base_id = rev.parent_ids[-1]
 
173
                else:
 
174
                    base_id = NULL_REVISION
 
175
 
 
176
            if base_id == last_rev_id:
 
177
                base_tree = last_rev_tree
 
178
            else:
 
179
                base_tree = self.source.revision_tree(base_id)
 
180
            force_binary = (i != 0)
 
181
            self._write_revision(rev, rev_tree, base_id, base_tree, 
 
182
                                 explicit_base, force_binary)
 
183
 
 
184
            last_rev_id = base_id
 
185
            last_rev_tree = base_tree
 
186
 
 
187
    def _write_revision(self, rev, rev_tree, base_rev, base_tree, 
 
188
                        explicit_base, force_binary):
 
189
        """Write out the information for a revision."""
 
190
        def w(key, value):
 
191
            self._write(key, value, indent=1)
 
192
 
 
193
        w('message', rev.message.split('\n'))
 
194
        w('committer', rev.committer)
 
195
        w('date', format_highres_date(rev.timestamp, rev.timezone))
 
196
        self.to_file.write('\n')
 
197
 
 
198
        self._write_delta(rev_tree, base_tree, rev.revision_id, force_binary)
 
199
 
 
200
        w('revision id', rev.revision_id)
 
201
        w('sha1', StrictTestament.from_revision(self.source, 
 
202
                                                rev.revision_id).as_sha1())
 
203
        w('inventory sha1', rev.inventory_sha1)
 
204
        if rev.parent_ids:
 
205
            w('parent ids', rev.parent_ids)
 
206
        if explicit_base:
 
207
            w('base id', base_rev)
 
208
        if rev.properties:
 
209
            self._write('properties', None, indent=1)
 
210
            for name, value in rev.properties.items():
 
211
                self._write(name, value, indent=3)
 
212
        
 
213
        # Add an extra blank space at the end
 
214
        self.to_file.write('\n')
 
215
 
 
216
    def _write_action(self, name, parameters, properties=None):
 
217
        if properties is None:
 
218
            properties = []
 
219
        p_texts = ['%s:%s' % v for v in properties]
 
220
        self.to_file.write('=== ')
 
221
        self.to_file.write(' '.join([name]+parameters).encode('utf-8'))
 
222
        self.to_file.write(' // '.join(p_texts).encode('utf-8'))
 
223
        self.to_file.write('\n')
 
224
 
 
225
    def _write_delta(self, new_tree, old_tree, default_revision_id, 
 
226
                     force_binary):
 
227
        """Write out the changes between the trees."""
 
228
        DEVNULL = '/dev/null'
 
229
        old_label = ''
 
230
        new_label = ''
 
231
 
 
232
        def do_diff(file_id, old_path, new_path, action, force_binary):
 
233
            def tree_lines(tree, require_text=False):
 
234
                if file_id in tree:
 
235
                    tree_file = tree.get_file(file_id)
 
236
                    if require_text is True:
 
237
                        tree_file = text_file(tree_file)
 
238
                    return tree_file.readlines()
 
239
                else:
 
240
                    return []
 
241
 
 
242
            try:
 
243
                if force_binary:
 
244
                    raise errors.BinaryFile()
 
245
                old_lines = tree_lines(old_tree, require_text=True)
 
246
                new_lines = tree_lines(new_tree, require_text=True)
 
247
                action.write(self.to_file)
 
248
                internal_diff(old_path, old_lines, new_path, new_lines, 
 
249
                              self.to_file)
 
250
            except errors.BinaryFile:
 
251
                old_lines = tree_lines(old_tree, require_text=False)
 
252
                new_lines = tree_lines(new_tree, require_text=False)
 
253
                action.add_property('encoding', 'base64')
 
254
                action.write(self.to_file)
 
255
                binary_diff(old_path, old_lines, new_path, new_lines, 
 
256
                            self.to_file)
 
257
 
 
258
        def finish_action(action, file_id, kind, meta_modified, text_modified,
 
259
                          old_path, new_path):
 
260
            entry = new_tree.inventory[file_id]
 
261
            if entry.revision != default_revision_id:
 
262
                action.add_property('last-changed', entry.revision)
 
263
            if meta_modified:
 
264
                action.add_bool_property('executable', entry.executable)
 
265
            if text_modified and kind == "symlink":
 
266
                action.add_property('target', entry.symlink_target)
 
267
            if text_modified and kind == "file":
 
268
                do_diff(file_id, old_path, new_path, action, force_binary)
 
269
            else:
 
270
                action.write(self.to_file)
 
271
 
 
272
        delta = compare_trees(old_tree, new_tree, want_unchanged=True)
 
273
        for path, file_id, kind in delta.removed:
 
274
            action = Action('removed', [kind, path]).write(self.to_file)
 
275
 
 
276
        for path, file_id, kind in delta.added:
 
277
            action = Action('added', [kind, path], [('file-id', file_id)])
 
278
            meta_modified = (kind=='file' and 
 
279
                             new_tree.is_executable(file_id))
 
280
            finish_action(action, file_id, kind, meta_modified, True,
 
281
                          DEVNULL, path)
 
282
 
 
283
        for (old_path, new_path, file_id, kind,
 
284
             text_modified, meta_modified) in delta.renamed:
 
285
            action = Action('renamed', [kind, old_path], [(new_path,)])
 
286
            finish_action(action, file_id, kind, meta_modified, text_modified,
 
287
                          old_path, new_path)
 
288
 
 
289
        for (path, file_id, kind,
 
290
             text_modified, meta_modified) in delta.modified:
 
291
            action = Action('modified', [kind, path])
 
292
            finish_action(action, file_id, kind, meta_modified, text_modified,
 
293
                          path, path)
 
294
 
 
295
        for path, file_id, kind in delta.unchanged:
 
296
            ie = new_tree.inventory[file_id]
 
297
            new_rev = getattr(ie, 'revision', None)
 
298
            if new_rev is None:
 
299
                continue
 
300
            old_rev = getattr(old_tree.inventory[ie.file_id], 'revision', None)
 
301
            if new_rev != old_rev:
 
302
                action = Action('modified', [ie.kind, 
 
303
                                             new_tree.id2path(ie.file_id)])
 
304
                action.add_property('last-changed', ie.revision)
 
305
                action.write(self.to_file)
 
306
 
 
307
 
 
308
class BundleReader(object):
 
309
    """This class reads in a bundle from a file, and returns
 
310
    a Bundle object, which can then be applied against a tree.
 
311
    """
 
312
    def __init__(self, from_file):
 
313
        """Read in the bundle from the file.
 
314
 
 
315
        :param from_file: A file-like object (must have iterator support).
 
316
        """
 
317
        object.__init__(self)
 
318
        self.from_file = iter(from_file)
 
319
        self._next_line = None
 
320
        
 
321
        self.info = BundleInfo()
 
322
        # We put the actual inventory ids in the footer, so that the patch
 
323
        # is easier to read for humans.
 
324
        # Unfortunately, that means we need to read everything before we
 
325
        # can create a proper bundle.
 
326
        self._read()
 
327
        self._validate()
 
328
 
 
329
    def _read(self):
 
330
        self._next().next()
 
331
        while self._next_line is not None:
 
332
            if not self._read_revision_header():
 
333
                break
 
334
            if self._next_line is None:
 
335
                break
 
336
            self._read_patches()
 
337
            self._read_footer()
 
338
 
 
339
    def _validate(self):
 
340
        """Make sure that the information read in makes sense
 
341
        and passes appropriate checksums.
 
342
        """
 
343
        # Fill in all the missing blanks for the revisions
 
344
        # and generate the real_revisions list.
 
345
        self.info.complete_info()
 
346
 
 
347
    def _next(self):
 
348
        """yield the next line, but secretly
 
349
        keep 1 extra line for peeking.
 
350
        """
 
351
        for line in self.from_file:
 
352
            last = self._next_line
 
353
            self._next_line = line
 
354
            if last is not None:
 
355
                #mutter('yielding line: %r' % last)
 
356
                yield last
 
357
        last = self._next_line
 
358
        self._next_line = None
 
359
        #mutter('yielding line: %r' % last)
 
360
        yield last
 
361
 
 
362
    def _read_revision_header(self):
 
363
        found_something = False
 
364
        self.info.revisions.append(RevisionInfo(None))
 
365
        for line in self._next():
 
366
            # The bzr header is terminated with a blank line
 
367
            # which does not start with '#'
 
368
            if line is None or line == '\n':
 
369
                break
 
370
            found_something = True
 
371
            self._handle_next(line)
 
372
        if not found_something:
 
373
            # Nothing was there, so remove the added revision
 
374
            self.info.revisions.pop()
 
375
        return found_something
 
376
 
 
377
    def _read_next_entry(self, line, indent=1):
 
378
        """Read in a key-value pair
 
379
        """
 
380
        if not line.startswith('#'):
 
381
            raise MalformedHeader('Bzr header did not start with #')
 
382
        line = line[1:-1].decode('utf-8') # Remove the '#' and '\n'
 
383
        if line[:indent] == ' '*indent:
 
384
            line = line[indent:]
 
385
        if not line:
 
386
            return None, None# Ignore blank lines
 
387
 
 
388
        loc = line.find(': ')
 
389
        if loc != -1:
 
390
            key = line[:loc]
 
391
            value = line[loc+2:]
 
392
            if not value:
 
393
                value = self._read_many(indent=indent+2)
 
394
        elif line[-1:] == ':':
 
395
            key = line[:-1]
 
396
            value = self._read_many(indent=indent+2)
 
397
        else:
 
398
            raise MalformedHeader('While looking for key: value pairs,'
 
399
                    ' did not find the colon %r' % (line))
 
400
 
 
401
        key = key.replace(' ', '_')
 
402
        #mutter('found %s: %s' % (key, value))
 
403
        return key, value
 
404
 
 
405
    def _handle_next(self, line):
 
406
        if line is None:
 
407
            return
 
408
        key, value = self._read_next_entry(line, indent=1)
 
409
        mutter('_handle_next %r => %r' % (key, value))
 
410
        if key is None:
 
411
            return
 
412
 
 
413
        revision_info = self.info.revisions[-1]
 
414
        if hasattr(revision_info, key):
 
415
            if getattr(revision_info, key) is None:
 
416
                setattr(revision_info, key, value)
 
417
            else:
 
418
                raise MalformedHeader('Duplicated Key: %s' % key)
 
419
        else:
 
420
            # What do we do with a key we don't recognize
 
421
            raise MalformedHeader('Unknown Key: "%s"' % key)
 
422
    
 
423
    def _read_many(self, indent):
 
424
        """If a line ends with no entry, that means that it should be
 
425
        followed with multiple lines of values.
 
426
 
 
427
        This detects the end of the list, because it will be a line that
 
428
        does not start properly indented.
 
429
        """
 
430
        values = []
 
431
        start = '#' + (' '*indent)
 
432
 
 
433
        if self._next_line is None or self._next_line[:len(start)] != start:
 
434
            return values
 
435
 
 
436
        for line in self._next():
 
437
            values.append(line[len(start):-1].decode('utf-8'))
 
438
            if self._next_line is None or self._next_line[:len(start)] != start:
 
439
                break
 
440
        return values
 
441
 
 
442
    def _read_one_patch(self):
 
443
        """Read in one patch, return the complete patch, along with
 
444
        the next line.
 
445
 
 
446
        :return: action, lines, do_continue
 
447
        """
 
448
        #mutter('_read_one_patch: %r' % self._next_line)
 
449
        # Peek and see if there are no patches
 
450
        if self._next_line is None or self._next_line.startswith('#'):
 
451
            return None, [], False
 
452
 
 
453
        first = True
 
454
        lines = []
 
455
        for line in self._next():
 
456
            if first:
 
457
                if not line.startswith('==='):
 
458
                    raise MalformedPatches('The first line of all patches'
 
459
                        ' should be a bzr meta line "==="'
 
460
                        ': %r' % line)
 
461
                action = line[4:-1].decode('utf-8')
 
462
            elif line.startswith('... '):
 
463
                action += line[len('... '):-1].decode('utf-8')
 
464
 
 
465
            if (self._next_line is not None and 
 
466
                self._next_line.startswith('===')):
 
467
                return action, lines, True
 
468
            elif self._next_line is None or self._next_line.startswith('#'):
 
469
                return action, lines, False
 
470
 
 
471
            if first:
 
472
                first = False
 
473
            elif not line.startswith('... '):
 
474
                lines.append(line)
 
475
 
 
476
        return action, lines, False
 
477
            
 
478
    def _read_patches(self):
 
479
        do_continue = True
 
480
        revision_actions = []
 
481
        while do_continue:
 
482
            action, lines, do_continue = self._read_one_patch()
 
483
            if action is not None:
 
484
                revision_actions.append((action, lines))
 
485
        assert self.info.revisions[-1].tree_actions is None
 
486
        self.info.revisions[-1].tree_actions = revision_actions
 
487
 
 
488
    def _read_footer(self):
 
489
        """Read the rest of the meta information.
 
490
 
 
491
        :param first_line:  The previous step iterates past what it
 
492
                            can handle. That extra line is given here.
 
493
        """
 
494
        for line in self._next():
 
495
            self._handle_next(line)
 
496
            if not self._next_line.startswith('#'):
 
497
                self._next().next()
 
498
                break
 
499
            if self._next_line is None:
 
500
                break