~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/xml_serializer.py

  • Committer: Canonical.com Patch Queue Manager
  • Date: 2006-05-23 11:06:22 UTC
  • mfrom: (1704.2.28 bzr.mbp.integration)
  • Revision ID: pqm@pqm.ubuntu.com-20060523110622-5ad5c2bf9dee4fc5
(mbp) use bisect to find revisions by date

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
#! /usr/bin/env python
 
1
# -*- coding: UTF-8 -*-
2
2
 
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
28
28
    from cElementTree import (ElementTree, SubElement, Element,
29
29
                              XMLTreeBuilder, fromstring, tostring)
30
30
except ImportError:
31
 
    from warnings import warn
32
 
    warn('using slower ElementTree; consider installing cElementTree')
 
31
    mutter('WARNING: using slower ElementTree; consider installing cElementTree'
 
32
           " and make sure it's on your PYTHONPATH")
33
33
    from util.elementtree.ElementTree import (ElementTree, SubElement,
34
34
                                              Element, XMLTreeBuilder,
35
35
                                              fromstring, tostring)
36
36
 
37
 
from bzrlib.inventory import ROOT_ID, Inventory, InventoryEntry
38
 
from bzrlib.revision import Revision, RevisionReference        
39
37
from bzrlib.errors import BzrError
40
38
 
41
39
 
47
45
        self._write_element(elt, f)
48
46
 
49
47
    def write_inventory_to_string(self, inv):
50
 
        return tostring(self._pack_inventory(inv))
 
48
        return tostring(self._pack_inventory(inv)) + '\n'
51
49
 
52
50
    def read_inventory_from_string(self, xml_string):
53
51
        return self._unpack_inventory(fromstring(xml_string))
59
57
        self._write_element(self._pack_revision(rev), f)
60
58
 
61
59
    def write_revision_to_string(self, rev):
62
 
        return tostring(self._pack_revision(rev), f)
 
60
        return tostring(self._pack_revision(rev)) + '\n'
63
61
 
64
62
    def read_revision(self, f):
65
63
        return self._unpack_revision(self._read_element(f))
75
73
        return ElementTree().parse(f)
76
74
 
77
75
 
78
 
class _Serializer_v4(Serializer):
79
 
    """Version 0.0.4 serializer
80
 
 
81
 
    You should use the serialzer_v4 singleton."""
82
 
    
83
 
    __slots__ = []
84
 
    
85
 
    def _pack_inventory(self, inv):
86
 
        """Convert to XML Element"""
87
 
        e = Element('inventory')
88
 
        e.text = '\n'
89
 
        if inv.root.file_id not in (None, ROOT_ID):
90
 
            e.set('file_id', inv.root.file_id)
91
 
        for path, ie in inv.iter_entries():
92
 
            e.append(self._pack_entry(ie))
93
 
        return e
94
 
 
95
 
 
96
 
    def _pack_entry(self, ie):
97
 
        """Convert InventoryEntry to XML element"""
98
 
        e = Element('entry')
99
 
        e.set('name', ie.name)
100
 
        e.set('file_id', ie.file_id)
101
 
        e.set('kind', ie.kind)
102
 
 
103
 
        if ie.text_size != None:
104
 
            e.set('text_size', '%d' % ie.text_size)
105
 
 
106
 
        for f in ['text_id', 'text_sha1']:
107
 
            v = getattr(ie, f)
108
 
            if v != None:
109
 
                e.set(f, v)
110
 
 
111
 
        # to be conservative, we don't externalize the root pointers
112
 
        # for now, leaving them as null in the xml form.  in a future
113
 
        # version it will be implied by nested elements.
114
 
        if ie.parent_id != ROOT_ID:
115
 
            assert isinstance(ie.parent_id, basestring)
116
 
            e.set('parent_id', ie.parent_id)
117
 
 
118
 
        e.tail = '\n'
119
 
 
120
 
        return e
121
 
 
122
 
 
123
 
    def _unpack_inventory(self, elt):
124
 
        """Construct from XML Element
125
 
        """
126
 
        assert elt.tag == 'inventory'
127
 
        root_id = elt.get('file_id') or ROOT_ID
128
 
        inv = Inventory(root_id)
129
 
        for e in elt:
130
 
            ie = self._unpack_entry(e)
131
 
            if ie.parent_id == ROOT_ID:
132
 
                ie.parent_id = root_id
133
 
            inv.add(ie)
134
 
        return inv
135
 
 
136
 
 
137
 
    def _unpack_entry(self, elt):
138
 
        assert elt.tag == 'entry'
139
 
 
140
 
        ## original format inventories don't have a parent_id for
141
 
        ## nodes in the root directory, but it's cleaner to use one
142
 
        ## internally.
143
 
        parent_id = elt.get('parent_id')
144
 
        if parent_id == None:
145
 
            parent_id = ROOT_ID
146
 
 
147
 
        ie = InventoryEntry(elt.get('file_id'),
148
 
                            elt.get('name'),
149
 
                            elt.get('kind'),
150
 
                            parent_id)
151
 
        ie.text_id = elt.get('text_id')
152
 
        ie.text_sha1 = elt.get('text_sha1')
153
 
 
154
 
        ## mutter("read inventoryentry: %r" % (elt.attrib))
155
 
 
156
 
        v = elt.get('text_size')
157
 
        ie.text_size = v and int(v)
158
 
 
159
 
        return ie
160
 
 
161
 
 
162
 
    def _pack_revision(self, rev):
163
 
        """Revision object -> xml tree"""
164
 
        root = Element('revision',
165
 
                       committer = rev.committer,
166
 
                       timestamp = '%.9f' % rev.timestamp,
167
 
                       revision_id = rev.revision_id,
168
 
                       inventory_id = rev.inventory_id,
169
 
                       inventory_sha1 = rev.inventory_sha1,
170
 
                       )
171
 
        if rev.timezone:
172
 
            root.set('timezone', str(rev.timezone))
173
 
        root.text = '\n'
174
 
 
175
 
        msg = SubElement(root, 'message')
176
 
        msg.text = rev.message
177
 
        msg.tail = '\n'
178
 
 
179
 
        if rev.parents:
180
 
            pelts = SubElement(root, 'parents')
181
 
            pelts.tail = pelts.text = '\n'
182
 
            for rr in rev.parents:
183
 
                assert isinstance(rr, RevisionReference)
184
 
                p = SubElement(pelts, 'revision_ref')
185
 
                p.tail = '\n'
186
 
                assert rr.revision_id
187
 
                p.set('revision_id', rr.revision_id)
188
 
                if rr.revision_sha1:
189
 
                    p.set('revision_sha1', rr.revision_sha1)
190
 
 
191
 
        return root
192
 
 
193
 
    
194
 
    def _unpack_revision(self, elt):
195
 
        """XML Element -> Revision object"""
196
 
        
197
 
        # <changeset> is deprecated...
198
 
        if elt.tag not in ('revision', 'changeset'):
199
 
            raise BzrError("unexpected tag in revision file: %r" % elt)
200
 
 
201
 
        rev = Revision(committer = elt.get('committer'),
202
 
                       timestamp = float(elt.get('timestamp')),
203
 
                       revision_id = elt.get('revision_id'),
204
 
                       inventory_id = elt.get('inventory_id'),
205
 
                       inventory_sha1 = elt.get('inventory_sha1')
206
 
                       )
207
 
 
208
 
        precursor = elt.get('precursor')
209
 
        precursor_sha1 = elt.get('precursor_sha1')
210
 
 
211
 
        pelts = elt.find('parents')
212
 
 
213
 
        if pelts:
214
 
            for p in pelts:
215
 
                assert p.tag == 'revision_ref', \
216
 
                       "bad parent node tag %r" % p.tag
217
 
                rev_ref = RevisionReference(p.get('revision_id'),
218
 
                                            p.get('revision_sha1'))
219
 
                rev.parents.append(rev_ref)
220
 
 
221
 
            if precursor:
222
 
                # must be consistent
223
 
                prec_parent = rev.parents[0].revision_id
224
 
                assert prec_parent == precursor
225
 
        elif precursor:
226
 
            # revisions written prior to 0.0.5 have a single precursor
227
 
            # give as an attribute
228
 
            rev_ref = RevisionReference(precursor, precursor_sha1)
229
 
            rev.parents.append(rev_ref)
230
 
 
231
 
        v = elt.get('timezone')
232
 
        rev.timezone = v and int(v)
233
 
 
234
 
        rev.message = elt.findtext('message') # text of <message>
235
 
        return rev
236
 
 
237
 
 
238
 
 
239
 
 
240
 
"""singleton instance"""
241
 
serializer_v4 = _Serializer_v4()
242
 
 
 
76
# performance tuning for elementree's serialiser. THis should be
 
77
# sent upstream - RBC 20060523.
 
78
# the functions here are patched into elementree at runtime.
 
79
import elementtree.ElementTree
 
80
import re
 
81
escape_re = re.compile("[&'\"<>]")
 
82
escape_map = {
 
83
    "&":'&amp;',
 
84
    "'":"&apos;", # FIXME: overkill
 
85
    "\"":"&quot;",
 
86
    "<":"&lt;",
 
87
    ">":"&gt;",
 
88
    }
 
89
def _escape_replace(match, map=escape_map):
 
90
    return map[match.group()]
 
91
 
 
92
def _escape_attrib(text, encoding=None, replace=None):
 
93
    # escape attribute value
 
94
    try:
 
95
        if encoding:
 
96
            try:
 
97
                text = elementtree.ElementTree._encode(text, encoding)
 
98
            except UnicodeError:
 
99
                return elementtree.ElementTree._encode_entity(text)
 
100
        if replace is None:
 
101
            return escape_re.sub(_escape_replace, text)
 
102
        else:
 
103
            text = replace(text, "&", "&amp;")
 
104
            text = replace(text, "'", "&apos;") # FIXME: overkill
 
105
            text = replace(text, "\"", "&quot;")
 
106
            text = replace(text, "<", "&lt;")
 
107
            text = replace(text, ">", "&gt;")
 
108
            return text
 
109
    except (TypeError, AttributeError):
 
110
        elementtree.ElementTree._raise_serialization_error(text)
 
111
 
 
112
elementtree.ElementTree._escape_attrib = _escape_attrib
 
113
 
 
114
escape_cdata_re = re.compile("[&<>]")
 
115
escape_cdata_map = {
 
116
    "&":'&amp;',
 
117
    "<":"&lt;",
 
118
    ">":"&gt;",
 
119
    }
 
120
def _escape_cdata_replace(match, map=escape_cdata_map):
 
121
    return map[match.group()]
 
122
 
 
123
def _escape_cdata(text, encoding=None, replace=None):
 
124
    # escape character data
 
125
    try:
 
126
        if encoding:
 
127
            try:
 
128
                text = elementtree.ElementTree._encode(text, encoding)
 
129
            except UnicodeError:
 
130
                return elementtree.ElementTree._encode_entity(text)
 
131
        if replace is None:
 
132
            return escape_cdata_re.sub(_escape_cdata_replace, text)
 
133
        else:
 
134
            text = replace(text, "&", "&amp;")
 
135
            text = replace(text, "<", "&lt;")
 
136
            text = replace(text, ">", "&gt;")
 
137
            return text
 
138
    except (TypeError, AttributeError):
 
139
        elementtree.ElementTree._raise_serialization_error(text)
 
140
 
 
141
elementtree.ElementTree._escape_cdata = _escape_cdata