~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/urlutils.py

Committer: John Arbash Meinel
Date: 2007-04-28 15:04:17 UTC
mfrom: (2466 +trunk)
mto: This revision was merged to the branch mainline in revision 2566.
Revision ID: john@arbash-meinel.com-20070428150417-trp3pi0pzd411pu4

[merge] bzr.dev 2466

files added:
bzrlib/breakin.py

bzrlib/bugtracker.py

bzrlib/remote.py

bzrlib/smart/branch.py

bzrlib/smart/bzrdir.py

bzrlib/smart/client.py

bzrlib/smart/repository.py

bzrlib/tests/blackbox/test_breakin.py

bzrlib/tests/branch_implementations/test_get_revision_id_to_revno_map.py

bzrlib/tests/branch_implementations/test_revision_id_to_revno.py

bzrlib/tests/test_bugtracker.py

bzrlib/tests/test_help.py

bzrlib/tests/test_remote.py

bzrlib/tests/test_smart.py

bzrlib/tests/workingtree_implementations/test_remove.py

man1

files removed:
build-api

bzrlib/tests/test_doc_generate.py

files modified:
HACKING

Makefile

NEWS

bzrlib/annotate.py

bzrlib/branch.py

bzrlib/builtins.py

bzrlib/bundle/bundle_data.py

bzrlib/bundle/serializer/v08.py

bzrlib/bzrdir.py

bzrlib/commands.py

bzrlib/config.py

bzrlib/delta.py

bzrlib/dirstate.py

bzrlib/errors.py

bzrlib/fetch.py

bzrlib/help.py

bzrlib/help_topics.py

bzrlib/lockable_files.py

bzrlib/lockdir.py

bzrlib/log.py

bzrlib/memorytree.py

bzrlib/mutabletree.py

bzrlib/option.py

bzrlib/osutils.py

bzrlib/plugin.py

bzrlib/plugins/launchpad/__init__.py

bzrlib/repository.py

bzrlib/revisionspec.py

bzrlib/smart/__init__.py

bzrlib/smart/medium.py

bzrlib/smart/protocol.py

bzrlib/smart/request.py

bzrlib/smart/server.py

bzrlib/smart/vfs.py

bzrlib/tag.py

bzrlib/tests/HTTPTestUtil.py

bzrlib/tests/HttpServer.py

bzrlib/tests/TestUtil.py

bzrlib/tests/__init__.py

bzrlib/tests/blackbox/__init__.py

bzrlib/tests/blackbox/test_commit.py

bzrlib/tests/blackbox/test_debug.py

bzrlib/tests/blackbox/test_help.py

bzrlib/tests/blackbox/test_info.py

bzrlib/tests/blackbox/test_log.py

bzrlib/tests/blackbox/test_mv.py

bzrlib/tests/blackbox/test_remove.py

bzrlib/tests/blackbox/test_selftest.py

bzrlib/tests/blackbox/test_serve.py

bzrlib/tests/blackbox/test_status.py

bzrlib/tests/blackbox/test_too_much.py

bzrlib/tests/branch_implementations/__init__.py

bzrlib/tests/branch_implementations/test_bound_sftp.py

bzrlib/tests/branch_implementations/test_branch.py

bzrlib/tests/branch_implementations/test_create_checkout.py

bzrlib/tests/branch_implementations/test_locking.py

bzrlib/tests/branch_implementations/test_parent.py

bzrlib/tests/branch_implementations/test_permissions.py

bzrlib/tests/branch_implementations/test_push.py

bzrlib/tests/branch_implementations/test_tags.py

bzrlib/tests/bzrdir_implementations/__init__.py

bzrlib/tests/bzrdir_implementations/test_bzrdir.py

bzrlib/tests/intertree_implementations/test_compare.py

bzrlib/tests/lock_helpers.py

bzrlib/tests/repository_implementations/__init__.py

bzrlib/tests/repository_implementations/test_repository.py

bzrlib/tests/test_branch.py

bzrlib/tests/test_bundle.py

bzrlib/tests/test_commands.py

bzrlib/tests/test_dirstate.py

bzrlib/tests/test_errors.py

bzrlib/tests/test_ftp_transport.py

bzrlib/tests/test_http.py

bzrlib/tests/test_lockable_files.py

bzrlib/tests/test_log.py

bzrlib/tests/test_merge_directive.py

bzrlib/tests/test_options.py

bzrlib/tests/test_plugins.py

bzrlib/tests/test_selftest.py

bzrlib/tests/test_smart_transport.py

bzrlib/tests/test_timestamp.py

bzrlib/tests/test_transport.py

bzrlib/tests/test_transport_implementations.py

bzrlib/tests/test_ui.py

bzrlib/tests/test_urlutils.py

bzrlib/tests/test_workingtree_4.py

bzrlib/tests/test_wsgi.py

bzrlib/tests/tree_implementations/__init__.py

bzrlib/tests/tree_implementations/test_inv.py

bzrlib/tests/tree_implementations/test_test_trees.py

bzrlib/tests/tree_implementations/test_walkdirs.py

bzrlib/tests/workingtree_implementations/__init__.py

bzrlib/tests/workingtree_implementations/test_move.py

bzrlib/tests/workingtree_implementations/test_walkdirs.py

bzrlib/timestamp.py

bzrlib/transport/__init__.py

bzrlib/transport/ftp.py

bzrlib/transport/http/__init__.py

bzrlib/transport/http/_urllib.py

bzrlib/transport/http/_urllib2_wrappers.py

bzrlib/transport/http/wsgi.py

bzrlib/transport/local.py

bzrlib/transport/memory.py

bzrlib/transport/readonly.py

bzrlib/transport/remote.py

bzrlib/transport/sftp.py

bzrlib/tsort.py

bzrlib/urlutils.py

bzrlib/workingtree.py

bzrlib/workingtree_4.py

doc/configuration.txt

doc/server.txt

setup.py *

tools/doc_generate/autodoc_man.py

tools/doc_generate/autodoc_rstx.py

Show diffs side-by-side

added added

removed removed

bzrlib/urlutils.py

290

291

292

_url_scheme_re = re.compile(r'^(?P<scheme>[^:/]{2,})://(?P<path>.*)$')

293

_url_hex_escapes_re = re.compile(r'(%[0-9a-fA-F]{2})')

294

295

296

def _unescape_safe_chars(matchobj):

297

"""re.sub callback to convert hex-escapes to plain characters (if safe).

298

299

e.g. '%7E' will be converted to '~'.

300

"""

301

hex_digits = matchobj.group(0)[1:]

302

char = chr(int(hex_digits, 16))

303

if char in _url_dont_escape_characters:

304

return char

305

else:

306

return matchobj.group(0).upper()

293

307

294

308

295

309

def normalize_url(url):

296

310

"""Make sure that a path string is in fully normalized URL form.

297

311

298

This handles URLs which have unicode characters, spaces,

312

This handles URLs which have unicode characters, spaces,

299

313

special characters, etc.

300

314

301

315

It has two basic modes of operation, depending on whether the

314

328

m = _url_scheme_re.match(url)

315

329

if not m:

316

330

return local_path_to_url(url)

331

scheme = m.group('scheme')

332

path = m.group('path')

317

333

if not isinstance(url, unicode):

318

334

for c in url:

319

335

if c not in _url_safe_characters:

320

336

raise errors.InvalidURL(url, 'URLs can only contain specific'

321

337

' safe characters (not %r)' % c)

322

return url

338

path = _url_hex_escapes_re.sub(_unescape_safe_chars, path)

339

return str(scheme + '://' + ''.join(path))

340

323

341

# We have a unicode (hybrid) url

324

scheme = m.group('scheme')

325

path = list(m.group('path'))

342

path_chars = list(path)

326

343

327

for i in xrange(len(path)):

328

if path[i] not in _url_safe_characters:

329

chars = path[i].encode('utf-8')

330

path[i] = ''.join(['%%%02X' % ord(c) for c in path[i].encode('utf-8')])

331

return str(scheme + '://' + ''.join(path))

344

for i in xrange(len(path_chars)):

345

if path_chars[i] not in _url_safe_characters:

346

chars = path_chars[i].encode('utf-8')

347

path_chars[i] = ''.join(

348

['%%%02X' % ord(c) for c in path_chars[i].encode('utf-8')])

349

path = ''.join(path_chars)

350

path = _url_hex_escapes_re.sub(_unescape_safe_chars, path)

351

return str(scheme + '://' + path)

332

352

333

353

334

354

def relative_url(base, other):

514

534

#These entries get mapped to themselves

515

535

_hex_display_map.update((hex,'%'+hex) for hex in _no_decode_hex)

516

536

537

# These characters shouldn't be percent-encoded, and it's always safe to

538

# unencode them if they are.

539

_url_dont_escape_characters = set(

540

"abcdefghijklmnopqrstuvwxyz" # Lowercase alpha

541

"ABCDEFGHIJKLMNOPQRSTUVWXYZ" # Uppercase alpha

542

"0123456789" # Numbers

543

"-._~" # Unreserved characters

544

)

545

517

546

# These characters should not be escaped

518

547

_url_safe_characters = set(

519

548

"abcdefghijklmnopqrstuvwxyz" # Lowercase alpha

Older »