~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/xml_serializer.py

Committer: Martin Packman
Date: 2012-01-05 09:50:04 UTC
mfrom: (6424 +trunk)
mto: This revision was merged to the branch mainline in revision 6426.
Revision ID: martin.packman@canonical.com-20120105095004-mia9xb7y0efmto0v

Merge bzr.dev to resolve conflicts in bzrlib.builtins

files added:
bzrlib/estimate_compressed_size.py

bzrlib/plugins/po_merge

bzrlib/plugins/po_merge/README

bzrlib/plugins/po_merge/__init__.py

bzrlib/plugins/po_merge/po_merge.py

bzrlib/plugins/po_merge/tests

bzrlib/plugins/po_merge/tests/__init__.py

bzrlib/plugins/po_merge/tests/test_po_merge.py

bzrlib/smart/signals.py

bzrlib/tests/blackbox/test_export_pot.py

bzrlib/tests/blackbox/test_mkdir.py

bzrlib/tests/blackbox/test_shell_complete.py

bzrlib/tests/per_repository/test_signatures.py

bzrlib/tests/per_repository_vf/test_fileid_involved.py

bzrlib/tests/test_estimate_compressed_size.py

bzrlib/tests/test_smart_signals.py

bzrlib/tests/test_vf_search.py

bzrlib/vf_search.py

doc/developers/feature-flags.txt

doc/developers/new-config-rationale.txt

files removed:
bzrlib/help_topics/en/location-alias.txt

bzrlib/tests/per_repository/test_fileid_involved.py

files renamed:
tools/build_mo.py => bzrlib/bzr_distutils.py

bzrlib/tests/per_repository/test_merge_directive.py => bzrlib/tests/per_repository_vf/test_merge_directive.py

files modified:
Makefile

bzrlib/__init__.py

bzrlib/_annotator_py.py

bzrlib/_btree_serializer_py.py

bzrlib/_chk_map_py.py

bzrlib/_chunks_to_lines_py.py

bzrlib/_dirstate_helpers_py.py

bzrlib/_dirstate_helpers_pyx.pyx

bzrlib/_groupcompress_py.py

bzrlib/_knit_load_data_py.py

bzrlib/_known_graph_py.py

bzrlib/_patiencediff_py.py

bzrlib/_readdir_py.py

bzrlib/_rio_py.py

bzrlib/_static_tuple_py.py

bzrlib/add.py

bzrlib/annotate.py

bzrlib/api.py

bzrlib/atomicfile.py

bzrlib/bencode.py

bzrlib/bisect_multi.py

bzrlib/branch.py

bzrlib/branchbuilder.py

bzrlib/breakin.py

bzrlib/btree_index.py

bzrlib/bugtracker.py

bzrlib/builtins.py

bzrlib/bundle/__init__.py

bzrlib/bundle/apply_bundle.py

bzrlib/bundle/bundle_data.py

bzrlib/bundle/commands.py

bzrlib/bundle/serializer/__init__.py

bzrlib/bundle/serializer/v08.py

bzrlib/bundle/serializer/v09.py

bzrlib/bundle/serializer/v4.py

bzrlib/bzrdir.py

bzrlib/cache_utf8.py

bzrlib/cethread.py

bzrlib/check.py

bzrlib/chk_map.py

bzrlib/chk_serializer.py

bzrlib/chunk_writer.py

bzrlib/clean_tree.py

bzrlib/cleanup.py

bzrlib/cmd_test_script.py

bzrlib/cmd_version_info.py

bzrlib/cmdline.py

bzrlib/commands.py

bzrlib/commit.py

bzrlib/commit_signature_commands.py

bzrlib/config.py

bzrlib/conflicts.py

bzrlib/controldir.py

bzrlib/counted_lock.py

bzrlib/crash.py

bzrlib/debug.py

bzrlib/decorators.py

bzrlib/delta.py

bzrlib/diff-delta.c

bzrlib/diff.py

bzrlib/directory_service.py

bzrlib/dirstate.py

bzrlib/doc/__init__.py

bzrlib/doc/api/__init__.py

bzrlib/doc/api/branch.txt

bzrlib/doc_generate/__init__.py

bzrlib/doc_generate/autodoc_bash_completion.py

bzrlib/doc_generate/autodoc_man.py

bzrlib/doc_generate/autodoc_rstx.py

bzrlib/doc_generate/builders/__init__.py

bzrlib/doc_generate/builders/texinfo.py

bzrlib/doc_generate/conf.py

bzrlib/doc_generate/writers/__init__.py

bzrlib/doc_generate/writers/texinfo.py

bzrlib/email_message.py

bzrlib/errors.py

bzrlib/export/__init__.py

bzrlib/export/dir_exporter.py

bzrlib/export/tar_exporter.py

bzrlib/export/zip_exporter.py

bzrlib/export_pot.py

bzrlib/externalcommand.py

bzrlib/fetch.py

bzrlib/fifo_cache.py

bzrlib/filter_tree.py

bzrlib/filters/__init__.py

bzrlib/filters/eol.py

bzrlib/foreign.py

bzrlib/generate_ids.py

bzrlib/globbing.py

bzrlib/gpg.py

bzrlib/graph.py

bzrlib/groupcompress.py

bzrlib/hashcache.py

bzrlib/help.py

bzrlib/help_topics/__init__.py

bzrlib/help_topics/en/configuration.txt

bzrlib/help_topics/en/debug-flags.txt

bzrlib/help_topics/en/log-formats.txt

bzrlib/hooks.py

bzrlib/i18n.py

bzrlib/identitymap.py

bzrlib/ignores.py

bzrlib/index.py

bzrlib/info.py

bzrlib/inspect_for_copy.py

bzrlib/inter.py

bzrlib/intset.py

bzrlib/inventory.py

bzrlib/inventory_delta.py

bzrlib/iterablefile.py

bzrlib/knit.py

bzrlib/lazy_import.py

bzrlib/lazy_regex.py

bzrlib/library_state.py

bzrlib/lock.py

bzrlib/lockable_files.py

bzrlib/lockdir.py

bzrlib/log.py

bzrlib/lru_cache.py

bzrlib/lsprof.py

bzrlib/mail_client.py

bzrlib/memorytree.py

bzrlib/merge.py

bzrlib/merge3.py

bzrlib/merge_directive.py

bzrlib/mergetools.py

bzrlib/missing.py

bzrlib/msgeditor.py

bzrlib/multiparent.py

bzrlib/mutabletree.py

bzrlib/option.py

bzrlib/osutils.py

bzrlib/pack.py

bzrlib/patch.py

bzrlib/patches.py

bzrlib/patiencediff.py

bzrlib/plugin.py

bzrlib/plugins/__init__.py

bzrlib/plugins/bash_completion/__init__.py

bzrlib/plugins/bash_completion/bashcomp.py

bzrlib/plugins/bash_completion/tests/test_bashcomp.py

bzrlib/plugins/changelog_merge/__init__.py

bzrlib/plugins/changelog_merge/changelog_merge.py

bzrlib/plugins/changelog_merge/tests/test_changelog_merge.py

bzrlib/plugins/launchpad/__init__.py

bzrlib/plugins/launchpad/account.py

bzrlib/plugins/launchpad/lp_api.py

bzrlib/plugins/launchpad/lp_api_lite.py

bzrlib/plugins/launchpad/lp_directory.py

bzrlib/plugins/launchpad/lp_propose.py

bzrlib/plugins/launchpad/lp_registration.py

bzrlib/plugins/launchpad/test_lp_directory.py

bzrlib/plugins/netrc_credential_store/__init__.py

bzrlib/plugins/news_merge/__init__.py

bzrlib/plugins/news_merge/news_merge.py

bzrlib/plugins/news_merge/parser.py

bzrlib/plugins/weave_fmt/__init__.py

bzrlib/plugins/weave_fmt/branch.py

bzrlib/plugins/weave_fmt/bzrdir.py

bzrlib/plugins/weave_fmt/repository.py

bzrlib/plugins/weave_fmt/test_bzrdir.py

bzrlib/plugins/weave_fmt/test_repository.py

bzrlib/plugins/weave_fmt/test_workingtree.py

bzrlib/plugins/weave_fmt/workingtree.py

bzrlib/plugins/weave_fmt/xml4.py

bzrlib/progress.py

bzrlib/push.py

bzrlib/pyutils.py

bzrlib/reconcile.py

bzrlib/reconfigure.py

bzrlib/recordcounter.py

bzrlib/registry.py

bzrlib/remote.py

bzrlib/rename_map.py

bzrlib/repofmt/__init__.py

bzrlib/repofmt/groupcompress_repo.py

bzrlib/repofmt/knitpack_repo.py

bzrlib/repofmt/knitrepo.py

bzrlib/repofmt/pack_repo.py

bzrlib/repository.py

bzrlib/revision.py

bzrlib/revisionspec.py

bzrlib/revisiontree.py

bzrlib/rio.py

bzrlib/rules.py

bzrlib/send.py

bzrlib/serializer.py

bzrlib/shelf.py

bzrlib/shelf_ui.py

bzrlib/shellcomplete.py

bzrlib/smart/__init__.py

bzrlib/smart/branch.py

bzrlib/smart/bzrdir.py

bzrlib/smart/client.py

bzrlib/smart/medium.py

bzrlib/smart/message.py

bzrlib/smart/packrepository.py

bzrlib/smart/protocol.py

bzrlib/smart/repository.py

bzrlib/smart/request.py

bzrlib/smart/server.py

bzrlib/smart/vfs.py

bzrlib/smtp_connection.py

bzrlib/static_tuple.py

bzrlib/status.py

bzrlib/store/__init__.py

bzrlib/store/text.py

bzrlib/store/versioned/__init__.py

bzrlib/strace.py

bzrlib/switch.py

bzrlib/symbol_versioning.py

bzrlib/tag.py

bzrlib/testament.py

bzrlib/tests/TestUtil.py

bzrlib/tests/__init__.py

bzrlib/tests/blackbox/__init__.py

bzrlib/tests/blackbox/test_annotate.py

bzrlib/tests/blackbox/test_bound_branches.py

bzrlib/tests/blackbox/test_branch.py

bzrlib/tests/blackbox/test_branches.py

bzrlib/tests/blackbox/test_break_lock.py

bzrlib/tests/blackbox/test_cat.py

bzrlib/tests/blackbox/test_checkout.py

bzrlib/tests/blackbox/test_clean_tree.py

bzrlib/tests/blackbox/test_commit.py

bzrlib/tests/blackbox/test_config.py

bzrlib/tests/blackbox/test_dpush.py

bzrlib/tests/blackbox/test_exceptions.py

bzrlib/tests/blackbox/test_export.py

bzrlib/tests/blackbox/test_hooks.py

bzrlib/tests/blackbox/test_info.py

bzrlib/tests/blackbox/test_init.py

bzrlib/tests/blackbox/test_log.py

bzrlib/tests/blackbox/test_lookup_revision.py

bzrlib/tests/blackbox/test_ls.py

bzrlib/tests/blackbox/test_merge.py

bzrlib/tests/blackbox/test_merge_directive.py

bzrlib/tests/blackbox/test_missing.py

bzrlib/tests/blackbox/test_mv.py

bzrlib/tests/blackbox/test_non_ascii.py

bzrlib/tests/blackbox/test_pack.py

bzrlib/tests/blackbox/test_pull.py

bzrlib/tests/blackbox/test_push.py

bzrlib/tests/blackbox/test_re_sign.py

bzrlib/tests/blackbox/test_reconcile.py

bzrlib/tests/blackbox/test_reconfigure.py

bzrlib/tests/blackbox/test_reference.py

bzrlib/tests/blackbox/test_resolve.py

bzrlib/tests/blackbox/test_revno.py

bzrlib/tests/blackbox/test_rmbranch.py

bzrlib/tests/blackbox/test_send.py

bzrlib/tests/blackbox/test_serve.py

bzrlib/tests/blackbox/test_shared_repository.py

bzrlib/tests/blackbox/test_sign_my_commits.py

bzrlib/tests/blackbox/test_status.py

bzrlib/tests/blackbox/test_switch.py

bzrlib/tests/blackbox/test_tags.py

bzrlib/tests/blackbox/test_too_much.py

bzrlib/tests/blackbox/test_uncommit.py

bzrlib/tests/blackbox/test_update.py

bzrlib/tests/blackbox/test_upgrade.py

bzrlib/tests/blackbox/test_version_info.py

bzrlib/tests/blackbox/test_versioning.py

bzrlib/tests/features.py

bzrlib/tests/fixtures.py

bzrlib/tests/http_server.py

bzrlib/tests/matchers.py

bzrlib/tests/per_branch/__init__.py

bzrlib/tests/per_branch/test_branch.py

bzrlib/tests/per_branch/test_break_lock.py

bzrlib/tests/per_branch/test_create_checkout.py

bzrlib/tests/per_branch/test_create_clone.py

bzrlib/tests/per_branch/test_locking.py

bzrlib/tests/per_branch/test_permissions.py

bzrlib/tests/per_branch/test_pull.py

bzrlib/tests/per_branch/test_push.py

bzrlib/tests/per_branch/test_reconcile.py

bzrlib/tests/per_branch/test_revision_history.py

bzrlib/tests/per_branch/test_revision_id_to_revno.py

bzrlib/tests/per_branch/test_sprout.py

bzrlib/tests/per_branch/test_stacking.py

bzrlib/tests/per_branch/test_tags.py

bzrlib/tests/per_branch/test_update.py

bzrlib/tests/per_bzrdir/__init__.py

bzrlib/tests/per_bzrdir/test_bzrdir.py

bzrlib/tests/per_controldir/__init__.py

bzrlib/tests/per_controldir/test_controldir.py

bzrlib/tests/per_controldir/test_format.py

bzrlib/tests/per_controldir_colo/test_supported.py

bzrlib/tests/per_controldir_colo/test_unsupported.py

bzrlib/tests/per_interbranch/__init__.py

bzrlib/tests/per_interbranch/test_pull.py

bzrlib/tests/per_interbranch/test_push.py

bzrlib/tests/per_interrepository/__init__.py

bzrlib/tests/per_interrepository/test_fetch.py

bzrlib/tests/per_merger.py

bzrlib/tests/per_repository/__init__.py

bzrlib/tests/per_repository/test_check.py

bzrlib/tests/per_repository/test_commit_builder.py

bzrlib/tests/per_repository/test_fetch.py

bzrlib/tests/per_repository/test_iter_reverse_revision_history.py

bzrlib/tests/per_repository/test_repository.py

bzrlib/tests/per_repository/test_revision.py

bzrlib/tests/per_repository/test_statistics.py

bzrlib/tests/per_repository_chk/test_supported.py

bzrlib/tests/per_repository_reference/__init__.py

bzrlib/tests/per_repository_reference/test_add_inventory.py

bzrlib/tests/per_repository_reference/test_add_revision.py

bzrlib/tests/per_repository_reference/test_add_signature_text.py

bzrlib/tests/per_repository_reference/test_all_revision_ids.py

bzrlib/tests/per_repository_reference/test_break_lock.py

bzrlib/tests/per_repository_reference/test_check.py

bzrlib/tests/per_repository_reference/test_fetch.py

bzrlib/tests/per_repository_reference/test_get_record_stream.py

bzrlib/tests/per_repository_reference/test_get_rev_id_for_revno.py

bzrlib/tests/per_repository_reference/test_graph.py

bzrlib/tests/per_repository_vf/__init__.py

bzrlib/tests/per_repository_vf/test_add_inventory_by_delta.py

bzrlib/tests/per_repository_vf/test_check.py

bzrlib/tests/per_repository_vf/test_check_reconcile.py

bzrlib/tests/per_repository_vf/test_fetch.py

bzrlib/tests/per_repository_vf/test_reconcile.py

bzrlib/tests/per_transport.py

bzrlib/tests/per_tree/test_get_file_mtime.py

bzrlib/tests/per_tree/test_path_content_summary.py

bzrlib/tests/per_tree/test_test_trees.py

bzrlib/tests/per_tree/test_tree.py

bzrlib/tests/per_workingtree/__init__.py

bzrlib/tests/per_workingtree/test_add.py

bzrlib/tests/per_workingtree/test_check.py

bzrlib/tests/per_workingtree/test_executable.py

bzrlib/tests/per_workingtree/test_get_file_mtime.py

bzrlib/tests/per_workingtree/test_move.py

bzrlib/tests/per_workingtree/test_paths2ids.py

bzrlib/tests/per_workingtree/test_pull.py

bzrlib/tests/per_workingtree/test_readonly.py

bzrlib/tests/per_workingtree/test_rename_one.py

bzrlib/tests/per_workingtree/test_smart_add.py

bzrlib/tests/per_workingtree/test_workingtree.py

bzrlib/tests/script.py

bzrlib/tests/stub_sftp.py

bzrlib/tests/test__dirstate_helpers.py

bzrlib/tests/test_branch.py

bzrlib/tests/test_branchbuilder.py

bzrlib/tests/test_btree_index.py

bzrlib/tests/test_bundle.py

bzrlib/tests/test_bzrdir.py

bzrlib/tests/test_commands.py

bzrlib/tests/test_commit.py

bzrlib/tests/test_commit_merge.py

bzrlib/tests/test_config.py

bzrlib/tests/test_conflicts.py

bzrlib/tests/test_debug.py

bzrlib/tests/test_directory_service.py

bzrlib/tests/test_email_message.py

bzrlib/tests/test_errors.py

bzrlib/tests/test_export_pot.py

bzrlib/tests/test_features.py

bzrlib/tests/test_fetch.py

bzrlib/tests/test_foreign.py

bzrlib/tests/test_ftp_transport.py

bzrlib/tests/test_gpg.py

bzrlib/tests/test_graph.py

bzrlib/tests/test_help.py

bzrlib/tests/test_http.py

bzrlib/tests/test_i18n.py

bzrlib/tests/test_import_tariff.py

bzrlib/tests/test_info.py

bzrlib/tests/test_lazy_import.py

bzrlib/tests/test_lazy_regex.py

bzrlib/tests/test_lockdir.py

bzrlib/tests/test_log.py

bzrlib/tests/test_lru_cache.py

bzrlib/tests/test_mail_client.py

bzrlib/tests/test_matchers.py

bzrlib/tests/test_merge.py

bzrlib/tests/test_merge_core.py

bzrlib/tests/test_merge_directive.py

bzrlib/tests/test_missing.py

bzrlib/tests/test_msgeditor.py

bzrlib/tests/test_options.py

bzrlib/tests/test_osutils.py

bzrlib/tests/test_osutils_encodings.py

bzrlib/tests/test_pack.py

bzrlib/tests/test_permissions.py

bzrlib/tests/test_reconfigure.py

bzrlib/tests/test_remote.py

bzrlib/tests/test_repository.py

bzrlib/tests/test_revision.py

bzrlib/tests/test_revisionspec.py

bzrlib/tests/test_script.py

bzrlib/tests/test_selftest.py

bzrlib/tests/test_server.py

bzrlib/tests/test_sftp_transport.py

bzrlib/tests/test_shelf_ui.py

bzrlib/tests/test_smart.py

bzrlib/tests/test_smart_request.py

bzrlib/tests/test_smart_transport.py

bzrlib/tests/test_smtp_connection.py

bzrlib/tests/test_source.py

bzrlib/tests/test_status.py

bzrlib/tests/test_tag.py

bzrlib/tests/test_test_server.py

bzrlib/tests/test_timestamp.py

bzrlib/tests/test_trace.py

bzrlib/tests/test_transform.py

bzrlib/tests/test_transport.py

bzrlib/tests/test_ui.py

bzrlib/tests/test_urlutils.py

bzrlib/tests/test_version_info.py

bzrlib/tests/test_win32utils.py

bzrlib/tests/test_workingtree.py

bzrlib/tests/test_workingtree_4.py

bzrlib/tests/test_wsgi.py

bzrlib/tests/test_xml.py

bzrlib/tests/transport_util.py

bzrlib/textfile.py

bzrlib/textinv.py

bzrlib/textmerge.py

bzrlib/timestamp.py

bzrlib/trace.py

bzrlib/transactions.py

bzrlib/transform.py

bzrlib/transport/__init__.py

bzrlib/transport/brokenrename.py

bzrlib/transport/chroot.py

bzrlib/transport/decorator.py

bzrlib/transport/fakenfs.py

bzrlib/transport/fakevfat.py

bzrlib/transport/ftp/__init__.py

bzrlib/transport/ftp/_gssapi.py

bzrlib/transport/gio_transport.py

bzrlib/transport/http/__init__.py

bzrlib/transport/http/_pycurl.py

bzrlib/transport/http/_urllib.py

bzrlib/transport/http/_urllib2_wrappers.py

bzrlib/transport/http/ca_bundle.py

bzrlib/transport/http/response.py

bzrlib/transport/http/wsgi.py

bzrlib/transport/local.py

bzrlib/transport/log.py

bzrlib/transport/memory.py

bzrlib/transport/nosmart.py

bzrlib/transport/pathfilter.py

bzrlib/transport/readonly.py

bzrlib/transport/remote.py

bzrlib/transport/sftp.py

bzrlib/transport/ssh.py

bzrlib/transport/trace.py

bzrlib/transport/unlistable.py

bzrlib/tree.py

bzrlib/treebuilder.py

bzrlib/tsort.py

bzrlib/tuned_gzip.py

bzrlib/ui/__init__.py

bzrlib/ui/text.py

bzrlib/uncommit.py

bzrlib/upgrade.py

bzrlib/urlutils.py

bzrlib/utextwrap.py

bzrlib/util/__init__.py

bzrlib/util/_bencode_py.py

bzrlib/util/configobj/__init__.py

bzrlib/util/configobj/configobj.py

bzrlib/util/effbot/__init__.py

bzrlib/util/effbot/org/__init__.py

bzrlib/util/effbot/org/gzip_consumer.py

bzrlib/util/effbot/org/http_client.py

bzrlib/util/effbot/org/http_manager.py

bzrlib/util/elementtree/ElementTree.py

bzrlib/util/elementtree/__init__.py

bzrlib/util/simplemapi.py

bzrlib/version.py

bzrlib/version_info_formats/__init__.py

bzrlib/version_info_formats/format_custom.py

bzrlib/version_info_formats/format_python.py

bzrlib/version_info_formats/format_rio.py

bzrlib/versionedfile.py

bzrlib/vf_repository.py

bzrlib/views.py

bzrlib/weave.py

bzrlib/weavefile.py

bzrlib/win32utils.py

bzrlib/workingtree.py

bzrlib/workingtree_3.py

bzrlib/workingtree_4.py

bzrlib/xml5.py

bzrlib/xml6.py

bzrlib/xml7.py

bzrlib/xml8.py

bzrlib/xml_serializer.py

doc/developers/case-insensitive-file-systems.txt

doc/developers/configuration.txt

doc/developers/network-protocol.txt

doc/developers/plans.txt

doc/developers/releasing.txt

doc/developers/testing.txt

doc/en/_templates/index.html

doc/en/admin-guide/simple-setups.txt

doc/en/mini-tutorial/index.txt

doc/en/release-notes/bzr-2.2.txt

doc/en/release-notes/bzr-2.3.txt

doc/en/release-notes/bzr-2.4.txt

doc/en/release-notes/bzr-2.5.txt

doc/en/tutorials/using_bazaar_with_launchpad.txt

doc/en/user-guide/installing_bazaar.txt

doc/en/whats-new/whats-new-in-2.2.txt

doc/en/whats-new/whats-new-in-2.4.txt

doc/en/whats-new/whats-new-in-2.5.txt

po/bzr.pot

setup.py

tools/generate_docs.py

Show diffs side-by-side

added added

removed removed

bzrlib/xml_serializer.py

"""XML externalization support."""

from __future__ import absolute_import

# "XML is like violence: if it doesn't solve your problem, you aren't

# using enough of it." -- various

import util.elementtree as elementtree

from xml.parsers.expat import ExpatError as ParseError

from bzrlib import errors

from bzrlib import (

cache_utf8,

inventory,

lazy_regex,

errors,

)

class XMLSerializer(Serializer):

130

137

return re.subn(u'[^\x09\x0A\x0D\u0020-\uD7FF\uE000-\uFFFD]+',

131

138

lambda match: match.group(0).encode('unicode_escape'),

132

139

message)

140

141

142

def get_utf8_or_ascii(a_str, _encode_utf8=cache_utf8.encode):

143

"""Return a cached version of the string.

144

145

cElementTree will return a plain string if the XML is plain ascii. It only

146

returns Unicode when it needs to. We want to work in utf-8 strings. So if

147

cElementTree returns a plain string, we can just return the cached version.

148

If it is Unicode, then we need to encode it.

149

150

:param a_str: An 8-bit string or Unicode as returned by

151

cElementTree.Element.get()

152

:return: A utf-8 encoded 8-bit string.

153

"""

154

# This is fairly optimized because we know what cElementTree does, this is

155

# not meant as a generic function for all cases. Because it is possible for

156

# an 8-bit string to not be ascii or valid utf8.

157

if a_str.__class__ is unicode:

158

return _encode_utf8(a_str)

159

else:

160

return intern(a_str)

161

162

163

_utf8_re = lazy_regex.lazy_compile('[&<>\'\"]|[\x80-\xff]+')

164

_unicode_re = lazy_regex.lazy_compile(u'[&<>\'\"\u0080-\uffff]')

165

166

167

_xml_escape_map = {

168

"&":'&',

169

"'":"'", # FIXME: overkill

170

"\"":""",

171

"<":"<",

172

">":">",

173

}

174

175

176

def _unicode_escape_replace(match, _map=_xml_escape_map):

177

"""Replace a string of non-ascii, non XML safe characters with their escape

178

179

This will escape both Standard XML escapes, like <>"', etc.

180

As well as escaping non ascii characters, because ElementTree did.

181

This helps us remain compatible to older versions of bzr. We may change

182

our policy in the future, though.

183

"""

184

# jam 20060816 Benchmarks show that try/KeyError is faster if you

185

# expect the entity to rarely miss. There is about a 10% difference

186

# in overall time. But if you miss frequently, then if None is much

187

# faster. For our use case, we *rarely* have a revision id, file id

188

# or path name that is unicode. So use try/KeyError.

189

try:

190

return _map[match.group()]

191

except KeyError:

192

return "&#%d;" % ord(match.group())

193

194

195

def _utf8_escape_replace(match, _map=_xml_escape_map):

196

"""Escape utf8 characters into XML safe ones.

197

198

This uses 2 tricks. It is either escaping "standard" characters, like "&<>,

199

or it is handling characters with the high-bit set. For ascii characters,

200

we just lookup the replacement in the dictionary. For everything else, we

201

decode back into Unicode, and then use the XML escape code.

202

"""

203

try:

204

return _map[match.group()]

205

except KeyError:

206

return ''.join('&#%d;' % ord(uni_chr)

207

for uni_chr in match.group().decode('utf8'))

208

209

210

_to_escaped_map = {}

211

212

def encode_and_escape(unicode_or_utf8_str, _map=_to_escaped_map):

213

"""Encode the string into utf8, and escape invalid XML characters"""

214

# We frequently get entities we have not seen before, so it is better

215

# to check if None, rather than try/KeyError

216

text = _map.get(unicode_or_utf8_str)

217

if text is None:

218

if unicode_or_utf8_str.__class__ is unicode:

219

# The alternative policy is to do a regular UTF8 encoding

220

# and then escape only XML meta characters.

221

# Performance is equivalent once you use cache_utf8. *However*

222

# this makes the serialized texts incompatible with old versions

223

# of bzr. So no net gain. (Perhaps the read code would handle utf8

224

# better than entity escapes, but cElementTree seems to do just fine

225

# either way)

226

text = str(_unicode_re.sub(_unicode_escape_replace,

227

unicode_or_utf8_str)) + '"'

228

else:

229

# Plain strings are considered to already be in utf-8 so we do a

230

# slightly different method for escaping.

231

text = _utf8_re.sub(_utf8_escape_replace,

232

unicode_or_utf8_str) + '"'

233

_map[unicode_or_utf8_str] = text

234

return text

235

236

237

def _clear_cache():

238

"""Clean out the unicode => escaped map"""

239

_to_escaped_map.clear()

240

241

242

def unpack_inventory_entry(elt, entry_cache=None, return_from_cache=False):

243

elt_get = elt.get

244

file_id = elt_get('file_id')

245

revision = elt_get('revision')

246

# Check and see if we have already unpacked this exact entry

247

# Some timings for "repo.revision_trees(last_100_revs)"

248

# bzr mysql

249

# unmodified 4.1s 40.8s

250

# using lru 3.5s

251

# using fifo 2.83s 29.1s

252

# lru._cache 2.8s

253

# dict 2.75s 26.8s

254

# inv.add 2.5s 26.0s

255

# no_copy 2.00s 20.5s

256

# no_c,dict 1.95s 18.0s

257

# Note that a cache of 10k nodes is more than sufficient to hold all of

258

# the inventory for the last 100 revs for bzr, but not for mysql (20k

259

# is enough for mysql, which saves the same 2s as using a dict)

260

261

# Breakdown of mysql using time.clock()

262

# 4.1s 2 calls to element.get for file_id, revision_id

263

# 4.5s cache_hit lookup

264

# 7.1s InventoryFile.copy()

265

# 2.4s InventoryDirectory.copy()

266

# 0.4s decoding unique entries

267

# 1.6s decoding entries after FIFO fills up

268

# 0.8s Adding nodes to FIFO (including flushes)

269

# 0.1s cache miss lookups

270

# Using an LRU cache

271

# 4.1s 2 calls to element.get for file_id, revision_id

272

# 9.9s cache_hit lookup

273

# 10.8s InventoryEntry.copy()

274

# 0.3s cache miss lookus

275

# 1.2s decoding entries

276

# 1.0s adding nodes to LRU

277

if entry_cache is not None and revision is not None:

278

key = (file_id, revision)

279

try:

280

# We copy it, because some operations may mutate it

281

cached_ie = entry_cache[key]

282

except KeyError:

283

pass

284

else:

285

# Only copying directory entries drops us 2.85s => 2.35s

286

if return_from_cache:

287

if cached_ie.kind == 'directory':

288

return cached_ie.copy()

289

return cached_ie

290

return cached_ie.copy()

291

292

kind = elt.tag

293

if not inventory.InventoryEntry.versionable_kind(kind):

294

raise AssertionError('unsupported entry kind %s' % kind)

295

296

file_id = get_utf8_or_ascii(file_id)

297

if revision is not None:

298

revision = get_utf8_or_ascii(revision)

299

parent_id = elt_get('parent_id')

300

if parent_id is not None:

301

parent_id = get_utf8_or_ascii(parent_id)

302

303

if kind == 'directory':

304

ie = inventory.InventoryDirectory(file_id,

305

elt_get('name'),

306

parent_id)

307

elif kind == 'file':

308

ie = inventory.InventoryFile(file_id,

309

elt_get('name'),

310

parent_id)

311

ie.text_sha1 = elt_get('text_sha1')

312

if elt_get('executable') == 'yes':

313

ie.executable = True

314

v = elt_get('text_size')

315

ie.text_size = v and int(v)

316

elif kind == 'symlink':

317

ie = inventory.InventoryLink(file_id,

318

elt_get('name'),

319

parent_id)

320

ie.symlink_target = elt_get('symlink_target')

321

else:

322

raise errors.UnsupportedInventoryKind(kind)

323

ie.revision = revision

324

if revision is not None and entry_cache is not None:

325

# We cache a copy() because callers like to mutate objects, and

326

# that would cause the item in cache to mutate as well.

327

# This has a small effect on many-inventory performance, because

328

# the majority fraction is spent in cache hits, not misses.

329

entry_cache[key] = ie.copy()

330

331

return ie

332

333

334

def unpack_inventory_flat(elt, format_num, unpack_entry,

335

entry_cache=None, return_from_cache=False):

336

"""Unpack a flat XML inventory.

337

338

:param elt: XML element for the inventory

339

:param format_num: Expected format number

340

:param unpack_entry: Function for unpacking inventory entries

341

:return: An inventory

342

:raise UnexpectedInventoryFormat: When unexpected elements or data is

343

encountered

344

"""

345

if elt.tag != 'inventory':

346

raise errors.UnexpectedInventoryFormat('Root tag is %r' % elt.tag)

347

format = elt.get('format')

348

if format != format_num:

349

raise errors.UnexpectedInventoryFormat('Invalid format version %r'

350

% format)

351

revision_id = elt.get('revision_id')

352

if revision_id is not None:

353

revision_id = cache_utf8.encode(revision_id)

354

inv = inventory.Inventory(root_id=None, revision_id=revision_id)

355

for e in elt:

356

ie = unpack_entry(e, entry_cache, return_from_cache)

357

inv.add(ie)

358

return inv

359

360

361

def serialize_inventory_flat(inv, append, root_id, supported_kinds, working):

362

"""Serialize an inventory to a flat XML file.

363

364

:param inv: Inventory to serialize

365

:param append: Function for writing a line of output

366

:param working: If True skip history data - text_sha1, text_size,

367

reference_revision, symlink_target. self._check_revisions(inv)

368

"""

369

entries = inv.iter_entries()

370

# Skip the root

371

root_path, root_ie = entries.next()

372

for path, ie in entries:

373

if ie.parent_id != root_id:

374

parent_str = ' parent_id="'

375

parent_id = encode_and_escape(ie.parent_id)

376

else:

377

parent_str = ''

378

parent_id = ''

379

if ie.kind == 'file':

380

if ie.executable:

381

executable = ' executable="yes"'

382

else:

383

executable = ''

384

if not working:

385

append('<file%s file_id="%s name="%s%s%s revision="%s '

386

'text_sha1="%s" text_size="%d" />\n' % (

387

executable, encode_and_escape(ie.file_id),

388

encode_and_escape(ie.name), parent_str, parent_id,

389

encode_and_escape(ie.revision), ie.text_sha1,

390

ie.text_size))

391

else:

392

append('<file%s file_id="%s name="%s%s%s />\n' % (

393

executable, encode_and_escape(ie.file_id),

394

encode_and_escape(ie.name), parent_str, parent_id))

395

elif ie.kind == 'directory':

396

if not working:

397

append('<directory file_id="%s name="%s%s%s revision="%s '

398

'/>\n' % (

399

encode_and_escape(ie.file_id),

400

encode_and_escape(ie.name),

401

parent_str, parent_id,

402

encode_and_escape(ie.revision)))

403

else:

404

append('<directory file_id="%s name="%s%s%s />\n' % (

405

encode_and_escape(ie.file_id),

406

encode_and_escape(ie.name),

407

parent_str, parent_id))

408

elif ie.kind == 'symlink':

409

if not working:

410

append('<symlink file_id="%s name="%s%s%s revision="%s '

411

'symlink_target="%s />\n' % (

412

encode_and_escape(ie.file_id),

413

encode_and_escape(ie.name),

414

parent_str, parent_id,

415

encode_and_escape(ie.revision),

416

encode_and_escape(ie.symlink_target)))

417

else:

418

append('<symlink file_id="%s name="%s%s%s />\n' % (

419

encode_and_escape(ie.file_id),

420

encode_and_escape(ie.name),

421

parent_str, parent_id))

422

elif ie.kind == 'tree-reference':

423

if ie.kind not in supported_kinds:

424

raise errors.UnsupportedInventoryKind(ie.kind)

425

if not working:

426

append('<tree-reference file_id="%s name="%s%s%s '

427

'revision="%s reference_revision="%s />\n' % (

428

encode_and_escape(ie.file_id),

429

encode_and_escape(ie.name),

430

parent_str, parent_id,

431

encode_and_escape(ie.revision),

432

encode_and_escape(ie.reference_revision)))

433

else:

434

append('<tree-reference file_id="%s name="%s%s%s />\n' % (

435

encode_and_escape(ie.file_id),

436

encode_and_escape(ie.name),

437

parent_str, parent_id))

438

else:

439

raise errors.UnsupportedInventoryKind(ie.kind)

440

append('</inventory>\n')

Older »