~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/transport/http/__init__.py

Committer: Alexander Belchenko
Date: 2006-07-30 07:02:22 UTC
mfrom: (1897 +trunk)
mto: (1711.2.111 jam-integration)
mto: This revision was merged to the branch mainline in revision 1906.
Revision ID: bialix@ukr.net-20060730070222-43d32b9b36d9316b

merge bzr.dev

files added:
bzrlib/ignores.py

bzrlib/revisiontree.py

bzrlib/tests/blackbox/test_ls.py

bzrlib/tests/intertree_implementations

bzrlib/tests/intertree_implementations/__init__.py

bzrlib/tests/intertree_implementations/test_compare.py

bzrlib/tests/test_http_response.py

bzrlib/tests/test_ignores.py

bzrlib/tests/test_tree.py

bzrlib/tests/tree_implementations

bzrlib/tests/tree_implementations/__init__.py

bzrlib/tests/tree_implementations/test_test_trees.py

bzrlib/tests/workingtree_implementations/test_changes_from.py

bzrlib/transport/http/_pycurl_errors.py

bzrlib/transport/http/response.py

files removed:
bzrlib/tests/test_emptytree.py

files modified:
HACKING

NEWS

bzrlib/__init__.py

bzrlib/atomicfile.py

bzrlib/branch.py

bzrlib/builtins.py

bzrlib/bundle/serializer/__init__.py

bzrlib/bundle/serializer/v08.py

bzrlib/bzrdir.py

bzrlib/check.py

bzrlib/commands.py

bzrlib/commit.py

bzrlib/config.py

bzrlib/conflicts.py

bzrlib/decorators.py

bzrlib/delta.py

bzrlib/diff.py

bzrlib/doc/__init__.py

bzrlib/doc/api/__init__.py

bzrlib/errors.py

bzrlib/export/__init__.py

bzrlib/export/dir_exporter.py

bzrlib/export/tar_exporter.py

bzrlib/export/zip_exporter.py

bzrlib/externalcommand.py

bzrlib/fetch.py

bzrlib/graph.py

bzrlib/hashcache.py

bzrlib/help.py

bzrlib/info.py

bzrlib/inter.py

bzrlib/intset.py

bzrlib/inventory.py

bzrlib/knit.py

bzrlib/lock.py

bzrlib/lockable_files.py

bzrlib/lockdir.py

bzrlib/log.py

bzrlib/merge.py

bzrlib/merge3.py

bzrlib/missing.py

bzrlib/msgeditor.py

bzrlib/option.py

bzrlib/plugin.py

bzrlib/repository.py

bzrlib/revision.py

bzrlib/revisionspec.py

bzrlib/sign_my_commits.py

bzrlib/status.py

bzrlib/store/__init__.py

bzrlib/store/text.py

bzrlib/store/versioned/__init__.py

bzrlib/symbol_versioning.py

bzrlib/testament.py

bzrlib/tests/HTTPTestUtil.py

bzrlib/tests/__init__.py

bzrlib/tests/blackbox/__init__.py

bzrlib/tests/blackbox/test_add.py

bzrlib/tests/blackbox/test_added.py

bzrlib/tests/blackbox/test_ancestry.py

bzrlib/tests/blackbox/test_annotate.py

bzrlib/tests/blackbox/test_bound_branches.py

bzrlib/tests/blackbox/test_break_lock.py

bzrlib/tests/blackbox/test_cat.py

bzrlib/tests/blackbox/test_checkout.py

bzrlib/tests/blackbox/test_commit.py

bzrlib/tests/blackbox/test_conflicts.py

bzrlib/tests/blackbox/test_diff.py

bzrlib/tests/blackbox/test_export.py

bzrlib/tests/blackbox/test_find_merge_base.py

bzrlib/tests/blackbox/test_help.py

bzrlib/tests/blackbox/test_ignore.py

bzrlib/tests/blackbox/test_info.py

bzrlib/tests/blackbox/test_init.py

bzrlib/tests/blackbox/test_log.py

bzrlib/tests/blackbox/test_merge.py

bzrlib/tests/blackbox/test_non_ascii.py

bzrlib/tests/blackbox/test_outside_wt.py

bzrlib/tests/blackbox/test_pull.py

bzrlib/tests/blackbox/test_push.py

bzrlib/tests/blackbox/test_re_sign.py

bzrlib/tests/blackbox/test_reconcile.py

bzrlib/tests/blackbox/test_revision_history.py

bzrlib/tests/blackbox/test_revision_info.py

bzrlib/tests/blackbox/test_revno.py

bzrlib/tests/blackbox/test_selftest.py

bzrlib/tests/blackbox/test_sign_my_commits.py

bzrlib/tests/blackbox/test_status.py

bzrlib/tests/blackbox/test_too_much.py

bzrlib/tests/blackbox/test_uncommit.py

bzrlib/tests/blackbox/test_update.py

bzrlib/tests/blackbox/test_upgrade.py

bzrlib/tests/blackbox/test_versioning.py

bzrlib/tests/branch_implementations/__init__.py

bzrlib/tests/branch_implementations/test_bound_sftp.py

bzrlib/tests/branch_implementations/test_branch.py

bzrlib/tests/branch_implementations/test_break_lock.py

bzrlib/tests/branch_implementations/test_parent.py

bzrlib/tests/branch_implementations/test_permissions.py

bzrlib/tests/branch_implementations/test_pull.py

bzrlib/tests/bzrdir_implementations/__init__.py

bzrlib/tests/bzrdir_implementations/test_bzrdir.py

bzrlib/tests/interrepository_implementations/__init__.py

bzrlib/tests/interrepository_implementations/test_interrepository.py

bzrlib/tests/repository_implementations/__init__.py

bzrlib/tests/repository_implementations/test_break_lock.py

bzrlib/tests/repository_implementations/test_fileid_involved.py

bzrlib/tests/repository_implementations/test_reconcile.py

bzrlib/tests/repository_implementations/test_repository.py

bzrlib/tests/revisionstore_implementations/test_all.py

bzrlib/tests/stub_sftp.py

bzrlib/tests/test_ancestry.py

bzrlib/tests/test_bad_files.py

bzrlib/tests/test_bundle.py

bzrlib/tests/test_command.py

bzrlib/tests/test_commit.py

bzrlib/tests/test_commit_merge.py

bzrlib/tests/test_config.py

bzrlib/tests/test_conflicts.py

bzrlib/tests/test_decorators.py

bzrlib/tests/test_doc_generate.py

bzrlib/tests/test_escaped_store.py

bzrlib/tests/test_fetch.py

bzrlib/tests/test_hashcache.py

bzrlib/tests/test_http.py

bzrlib/tests/test_inv.py

bzrlib/tests/test_knit.py

bzrlib/tests/test_lockable_files.py

bzrlib/tests/test_lockdir.py

bzrlib/tests/test_merge3.py

bzrlib/tests/test_permissions.py

bzrlib/tests/test_plugins.py

bzrlib/tests/test_read_bundle.py

bzrlib/tests/test_reconcile.py

bzrlib/tests/test_revision.py

bzrlib/tests/test_revisionnamespaces.py

bzrlib/tests/test_revisiontree.py

bzrlib/tests/test_selftest.py

bzrlib/tests/test_setup.py

bzrlib/tests/test_sftp_transport.py

bzrlib/tests/test_smart_add.py

bzrlib/tests/test_status.py

bzrlib/tests/test_store.py

bzrlib/tests/test_symbol_versioning.py

bzrlib/tests/test_transform.py

bzrlib/tests/test_transport.py

bzrlib/tests/test_transport_implementations.py

bzrlib/tests/test_versionedfile.py

bzrlib/tests/test_weave.py

bzrlib/tests/test_workingtree.py

bzrlib/tests/test_xml.py

bzrlib/tests/treeshape.py

bzrlib/tests/workingtree_implementations/__init__.py

bzrlib/tests/workingtree_implementations/test_basis_inventory.py

bzrlib/tests/workingtree_implementations/test_executable.py

bzrlib/tests/workingtree_implementations/test_is_ignored.py

bzrlib/tests/workingtree_implementations/test_locking.py

bzrlib/tests/workingtree_implementations/test_workingtree.py

bzrlib/textinv.py

bzrlib/transform.py

bzrlib/transport/__init__.py

bzrlib/transport/decorator.py

bzrlib/transport/fakenfs.py

bzrlib/transport/fakevfat.py

bzrlib/transport/ftp.py

bzrlib/transport/http/__init__.py

bzrlib/transport/http/_pycurl.py

bzrlib/transport/http/_urllib.py

bzrlib/transport/local.py

bzrlib/transport/memory.py

bzrlib/transport/readonly.py

bzrlib/transport/sftp.py

bzrlib/tree.py

bzrlib/ui/__init__.py

bzrlib/ui/text.py

bzrlib/uncommit.py

bzrlib/versionedfile.py

bzrlib/weave.py

bzrlib/weave_commands.py

bzrlib/weavefile.py

bzrlib/workingtree.py

bzrlib/xml4.py

bzrlib/xml5.py

bzrlib/xml_serializer.py

contrib/newinventory.py

doc/tutorial.txt

generate_docs.py

tools/convertfile.py

tools/convertinv.py

tools/doc_generate/__init__.py

tools/doc_generate/autodoc_bash_completion.py

tools/doc_generate/autodoc_man.py

tools/doc_generate/autodoc_rstx.py

tools/history2revfiles.py

tools/weavebench.py

Show diffs side-by-side

added added

removed removed

bzrlib/transport/http/__init__.py

There are separate implementation modules for each http client implementation.

"""

from collections import deque

from cStringIO import StringIO

import errno

import mimetools

import os

import posixpath

import re

import urllib

from warnings import warn

from bzrlib.transport import Transport, register_transport, Server

# TODO: load these only when running http tests

import BaseHTTPServer, SimpleHTTPServer, socket, time

import threading

from bzrlib import errors

from bzrlib.errors import (TransportNotPossible, NoSuchFile,

TransportError, ConnectionError, InvalidURL)

from bzrlib.branch import Branch

from bzrlib.trace import mutter

# TODO: load these only when running http tests

import BaseHTTPServer, SimpleHTTPServer, socket, time

import threading

from bzrlib.transport import Transport, register_transport, Server

from bzrlib.transport.http.response import (HttpMultipartRangeResponse,

HttpRangeResponse)

from bzrlib.ui import ui_factory

return url

def _extract_headers(header_text, url):

"""Extract the mapping for an rfc2822 header

This is a helper function for the test suite and for _pycurl.

(urllib already parses the headers for us)

In the case that there are multiple headers inside the file,

the last one is returned.

:param header_text: A string of header information.

This expects that the first line of a header will always be HTTP ...

:param url: The url we are parsing, so we can raise nice errors

:return: mimetools.Message object, which basically acts like a case

insensitive dictionary.

"""

first_header = True

remaining = header_text

if not remaining:

raise errors.InvalidHttpResponse(url, 'Empty headers')

while remaining:

100

header_file = StringIO(remaining)

101

first_line = header_file.readline()

102

if not first_line.startswith('HTTP'):

103

if first_header: # The first header *must* start with HTTP

104

raise errors.InvalidHttpResponse(url,

105

'Opening header line did not start with HTTP: %s'

106

% (first_line,))

107

assert False, 'Opening header line was not HTTP'

108

else:

109

break # We are done parsing

110

first_header = False

111

m = mimetools.Message(header_file)

112

113

# mimetools.Message parses the first header up to a blank line

114

# So while there is remaining data, it probably means there is

115

# another header to be parsed.

116

# Get rid of any preceeding whitespace, which if it is all whitespace

117

# will get rid of everything.

118

remaining = header_file.read().lstrip()

119

return m

120

121

122

class HttpTransportBase(Transport):

123

"""Base class for http implementations.

124

195

243

:param offsets: A list of (offset, size) tuples.

196

244

:param return: A list or generator of (offset, data) tuples

197

245

"""

198

# Ideally we would pass one big request asking for all the ranges in

199

# one go; however then the server will give a multipart mime response

200

# back, and we can't parse them yet. So instead we just get one range

201

# per region, and try to coallesce the regions as much as possible.

202

203

# The read-coallescing code is not quite regular enough to have a

204

# single driver routine and

205

# helper method in Transport.

206

def do_combined_read(combined_offsets):

207

# read one coalesced block

208

total_size = 0

209

for offset, size in combined_offsets:

210

total_size += size

211

mutter('readv coalesced %d reads.', len(combined_offsets))

212

offset = combined_offsets[0][0]

213

byte_range = (offset, offset + total_size - 1)

214

code, result_file = self._get(relpath, [byte_range])

215

if code == 206:

216

for off, size in combined_offsets:

217

result_bytes = result_file.read(size)

218

assert len(result_bytes) == size

219

yield off, result_bytes

220

elif code == 200:

221

data = result_file.read(offset + total_size)[offset:offset + total_size]

222

pos = 0

223

for offset, size in combined_offsets:

224

yield offset, data[pos:pos + size]

225

pos += size

226

del data

227

if not len(offsets):

228

return

229

pending_offsets = deque(offsets)

230

combined_offsets = []

231

while len(pending_offsets):

232

offset, size = pending_offsets.popleft()

233

if not combined_offsets:

234

combined_offsets = [[offset, size]]

246

ranges = self.offsets_to_ranges(offsets)

247

mutter('http readv of %s collapsed %s offsets => %s',

248

relpath, len(offsets), ranges)

249

code, f = self._get(relpath, ranges)

250

for start, size in offsets:

251

f.seek(start, (start < 0) and 2 or 0)

252

start = f.tell()

253

data = f.read(size)

254

assert len(data) == size

255

yield start, data

256

257

@staticmethod

258

def offsets_to_ranges(offsets):

259

"""Turn a list of offsets and sizes into a list of byte ranges.

260

261

:param offsets: A list of tuples of (start, size). An empty list

262

is not accepted.

263

:return: a list of inclusive byte ranges (start, end)

264

Adjacent ranges will be combined.

265

"""

266

# Make sure we process sorted offsets

267

offsets = sorted(offsets)

268

269

prev_end = None

270

combined = []

271

272

for start, size in offsets:

273

end = start + size - 1

274

if prev_end is None:

275

combined.append([start, end])

276

elif start <= prev_end + 1:

277

combined[-1][1] = end

235

278

else:

236

if (len (combined_offsets) < 500 and

237

combined_offsets[-1][0] + combined_offsets[-1][1] == offset):

238

# combatible offset:

239

combined_offsets.append([offset, size])

240

else:

241

# incompatible, or over the threshold issue a read and yield

242

pending_offsets.appendleft((offset, size))

243

for result in do_combined_read(combined_offsets):

244

yield result

245

combined_offsets = []

246

# whatever is left is a single coalesced request

247

if len(combined_offsets):

248

for result in do_combined_read(combined_offsets):

249

yield result

279

combined.append([start, end])

280

prev_end = end

281

282

return combined

250

283

251

284

def put(self, relpath, f, mode=None):

252

285

"""Copy the file-like or string object into the location.

343

376

else:

344

377

return self.__class__(self.abspath(offset))

345

378

379

@staticmethod

380

def range_header(ranges, tail_amount):

381

"""Turn a list of bytes ranges into a HTTP Range header value.

382

383

:param offsets: A list of byte ranges, (start, end). An empty list

384

is not accepted.

385

386

:return: HTTP range header string.

387

"""

388

strings = []

389

for start, end in ranges:

390

strings.append('%d-%d' % (start, end))

391

392

if tail_amount:

393

strings.append('-%d' % tail_amount)

394

395

return ','.join(strings)

396

397

346

398

#---------------- test server facilities ----------------

347

399

# TODO: load these only when running tests

348

400

435

487

RequestHandlerClass)

436

488

self.test_case = test_case

437

489

490

438

491

class HttpServer(Server):

439

492

"""A test server for http transports."""

440

493

Older »