~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to doc/developers/network-protocol.txt

  • Committer: John Arbash Meinel
  • Author(s): Mark Hammond
  • Date: 2008-09-09 17:02:21 UTC
  • mto: This revision was merged to the branch mainline in revision 3697.
  • Revision ID: john@arbash-meinel.com-20080909170221-svim3jw2mrz0amp3
An updated transparent icon for bzr.

Show diffs side-by-side

added added

removed removed

Lines of Context:
2
2
Network Protocol
3
3
================
4
4
 
5
 
:Date: 2009-01-07
 
5
:Date: 2007-09-03
6
6
 
7
7
 
8
8
.. contents::
11
11
Overview
12
12
========
13
13
 
14
 
The smart protocol provides a way to send requests and corresponding
 
14
The smart protocol provides a way to send a requests and corresponding
15
15
responses to communicate with a remote bzr process.
16
16
 
17
17
Layering
28
28
read which marks end-of-file.  For HTTP server environment there is no
29
29
end-of-stream because each request coming into the server is independent.
30
30
 
31
 
So we need a wrapper around pipes and sockets to separate out requests
 
31
So we need a wrapper around pipes and sockets to seperate out requests
32
32
from substrate and this will give us a single model which is consistent
33
33
for HTTP, sockets and pipes.
34
34
 
103
103
The domain logic is in `bzrlib.remote`: `RemoteBzrDir`, `RemoteBranch`,
104
104
and so on.
105
105
 
106
 
There is also a plain file-level transport that calls remote methods to
 
106
There is also an plain file-level transport that calls remote methods to
107
107
manipulate files on the server in `bzrlib.transport.remote`.
108
108
 
109
109
Protocol description
172
172
 
173
173
An extension to version two allows streamed bodies.  A streamed body looks
174
174
a lot like HTTP's chunked encoding::
175
 
 
 
175
 
176
176
  STREAMED_BODY := "chunked" NEWLINE CHUNKS TERMINATOR
177
177
  CHUNKS := CHUNK [CHUNKS]
178
178
  CHUNK := HEX_LENGTH CHUNK_CONTENT
179
179
  HEX_LENGTH := HEX_DIGITS NEWLINE
180
180
  CHUNK_CONTENT := bytes
181
 
 
 
181
  
182
182
  TERMINATOR := SUCCESS_TERMINATOR | ERROR_TERMINATOR
183
183
  SUCCESS_TERMINATOR := 'END' NEWLINE
184
184
  ERROR_TERMINATOR := 'ERR' NEWLINE CHUNKS SUCCESS_TERMINATOR
201
201
-------------
202
202
 
203
203
.. note::
204
 
 
 
204
  
205
205
  For some discussion of the requirements that led to this new protocol
206
206
  version, see `bug #83935`_.
207
207
 
221
221
 
222
222
The underlying message format is::
223
223
 
224
 
  MESSAGE := MAGIC NEWLINE HEADERS CONTENTS END_MESSAGE
225
 
  MAGIC := "bzr message 3 (bzr 1.6)"
 
224
  MESSAGE := "bzr message 3 (bzr 1.6)" NEWLINE HEADERS MESSAGE_PARTS
226
225
  HEADERS := LENGTH_PREFIX bencoded_dict
227
 
  END_MESSAGE := "e"
 
226
  MESSAGE_PARTS := MESSAGE_PART [MORE_MESSAGE_PARTS]
 
227
  MORE_MESSAGE_PARTS := END_MESSAGE_PARTS | MESSAGE_PARTS
 
228
  END_MESSAGE_PARTS := "e"
228
229
 
229
 
  BODY := MESSAGE_PART+
230
230
  MESSAGE_PART := ONE_BYTE | STRUCTURE | BYTES
231
231
  ONE_BYTE := "o" byte
232
232
  STRUCTURE := "s" LENGTH_PREFIX bencoded_structure
233
233
  BYTES := "b" LENGTH_PREFIX bytes
234
234
 
235
 
(Where ``+`` indicates one or more.)
236
 
 
237
235
This format allows an arbitrary sequence of message parts to be encoded
238
 
in a single message.  The contents of a MESSAGE have a higher-level
239
 
message, but knowing just this amount of data it's possible to
240
 
deserialize and consume a message, so that implementations can respond to
241
 
messages sent by later versions.
 
236
in a single message.
242
237
 
243
238
Headers
244
239
~~~~~~~
259
254
describes how such messages are encoded.  All requests and responses
260
255
defined by earlier protocol versions must be encoded in this way.
261
256
 
262
 
Conventional requests will send a CONTENTS of ::
263
 
 
264
 
  CONV_REQ := ARGS SINGLE_OR_STREAMED_BODY?
265
 
  SINGLE_OR_STREAMED_BODY := BYTES
266
 
        | BYTES+ TRAILER
267
 
 
268
 
  ARGS := STRUCTURE(argument_tuple)
269
 
  TRAILER := SUCCESS_STATUS | ERROR
270
 
  SUCCESS_STATUS := ONE_BYTE("S")
271
 
  ERROR := ONE_BYTE("E") STRUCTURE(argument_tuple)
272
 
 
273
 
Conventional responses will send CONTENTS of ::
274
 
 
275
 
  CONV_RESP := RESP_STATUS ARGS SINGLE_OR_STREAMED_BODY?
276
 
  RESP_STATUS := ONE_BYTE("S") | ONE_BYTE("E")
277
 
 
278
 
If the RESP_STATUS is success ("S"), the arguments are the
279
 
method-dependent result.
280
 
 
281
 
For errors (where the Status byte of a response or a streamed body is
282
 
"E"), the situation is analagous to requests.  The first item in the
283
 
encoded sequence must be a string of the error name.  The other arguments
284
 
supply details about the error, and their number and types will depend on
285
 
the type of error (as identified by the error name).
286
 
 
287
 
Note that the streamed body from version two is now just multiple
 
257
Conventional requests will send a sequence of:
 
258
 
 
259
* Arguments (a STRUCTURE of a tuple)
 
260
 
 
261
* (Optional) body
 
262
 
 
263
  * Single body (BYTES), or
 
264
 
 
265
  * Streamed body (multiple BYTES parts), followed by a status (ONE_BYTE)
 
266
 
 
267
    * if status is "E", followed by an Error (STRUCTURE)
 
268
 
 
269
Conventional responses will send a sequence of:
 
270
 
 
271
* Status (ONE_BYTE)
 
272
 
 
273
* Arguments (a STRUCTURE of a tuple)
 
274
 
 
275
* (Optional) body
 
276
 
 
277
  * Single body (BYTES), or
 
278
 
 
279
  * Streamed body (multiple BYTES parts), followed by a status (ONE_BYTE)
 
280
 
 
281
    * if status is "E", followed by an Error (STRUCTURE)
 
282
 
 
283
In all cases, the ONE_BYTE status is either "S" for Success or "E" for
 
284
Error.  Note that the streamed body from version two is now just multiple
288
285
BYTES parts.
289
286
 
290
 
The end of the request or response is indicated by the lower-level
291
 
END_MESSAGE.  If there's only one BYTES element in the body, the TRAILER
292
 
may or may not be present, depending on whether it was sent as a single
293
 
chunk or as a stream that happens to have one element.
294
 
 
295
 
  *(Discussion)* The success marker at the end of a streamed body seems
296
 
  redundant; it doesn't have space for any arguments, and the end of the
297
 
  body is marked anyhow by the end of the message.  Recipients shouldn't
298
 
  take any action on it, though they should map an error into raising an
299
 
  error locally.
300
 
 
301
 
  1.10 clients don't assert that they get a status byte at the end of the
302
 
  message.  They will complain (in
303
 
  ``ConventionalResponseHandler.byte_part_received``) if they get an
304
 
  initial success and then another byte part with no intervening bytes.
305
 
  If we stop sending the final success message and only flag errors
306
 
  they'll only get one if the error is detected after streaming starts but
307
 
  before any bytes are actually sent.  Possibly we should wait until at
308
 
  least the first chunk is ready before declaring success.
309
 
 
310
287
For new methods, these sequences are just a convention and may be varied
311
288
if appropriate for a particular request or response.  However, each
312
289
request should at least start with a STRUCTURE encoding the arguments
315
292
bencoded.  As a result, unlike previous protocol versions, arguments in
316
293
this version are 8-bit clean.)
317
294
 
318
 
  (Discussion) We're discussing having the byte segments be not just a
319
 
  method for sending a stream across the network, but actually having them
320
 
  be preserved in the RPC from end to end.  This may be useful when
321
 
  there's an iterator on one side feeding in to an iterator on the other,
322
 
  if it avoids doing chunking and byte-counting at two levels, and if
323
 
  those iterators are a natural place to get good granularity.  Also, for
324
 
  cases like ``insert_record_stream`` the server can't do much with the
325
 
  data until it gets a whole chunk, and so it'll be natural and efficient
326
 
  for it to be called with one chunk at a time.
327
 
 
328
 
  On the other hand, there may be times when we've got some bytes from the
329
 
  network but not a full chunk, and it might be worthwhile to pass it up.
330
 
  If we promise to preserve chunks, then to do this we'd need two separate
331
 
  streaming interfaces: "we got a chunk" and "we got some bytes but not
332
 
  yet a full chunk".  For ``insert_record_stream`` the second might not be
333
 
  useful, but it might be good when writing to a file where any number of
334
 
  bytes can be processed.
335
 
 
336
 
  If we promise to preserve chunks, it'll tend to make some RPCs work only
337
 
  in chunks, and others just on whole blocks, and we can't so easily
338
 
  migrate RPCs from one to the other transparently to older
339
 
  implementations.
340
 
 
341
 
  The data inside those chunks will be serialized anyhow, and possibly the
342
 
  data inside them will already be able to be serialized apart without
343
 
  understanding the chunks.  Also, we might want to use these formats e.g.
344
 
  for pack files or in bundles, and so they don't particularly need
345
 
  lower-level chunking.  So the current (unmerged, unstable) record stream
346
 
  serialization turns each record into a bencoded tuple and it'd be
347
 
  feasible to parse one tuple at a time from a byte stream that contains a
348
 
  sequence of them.
349
 
 
350
 
  So we've decided that the chunks won't be semantic, and code should not
351
 
  count on them being preserved from client to server.
352
 
 
353
 
Early error returns
354
 
~~~~~~~~~~~~~~~~~~~
355
 
 
356
 
  *(Discussion)* It would be nice if the server could notify the client of
357
 
  errors even before a streaming request has finished.  This could cover
358
 
  situtaions such as the server not understanding the request, it being
359
 
  unable to open the requested location, or it finding that some of the
360
 
  revisions being sent are not actually needed.
361
 
 
362
 
  Especially in the last case, we'd like to be able to gracefully notice
363
 
  the condition while the client is writing, and then have it adapt its
364
 
  behaviour.  In any case, we don't want to have drop and restart the
365
 
  network stream.
366
 
 
367
 
  It should be possible for the client to finish its current chunk and
368
 
  then its message, possibly with an error to cancel what's already been
369
 
  sent.
370
 
 
371
 
  This relies on the client being able to read back from the server while
372
 
  it's writing.  This is technically difficult for HTTP but feasible over
373
 
  a socket or SSH.
374
 
 
375
 
  We'd need a clean way to pass this back to the request method, even
376
 
  though it's presumably in the middle of doing its body iterator.
377
 
  Possibly the body iterator could be manually given a reference to the
378
 
  request object, and it can poll it to see if there's a response.
379
 
 
380
 
  Perhaps we need to distinguish error conditions, which should turn into
381
 
  a client-side error regardless of the request code, from early success,
382
 
  which should be handled only if the request code specifically wants to
383
 
  do it.
384
 
 
385
 
Full-duplex operation
386
 
~~~~~~~~~~~~~~~~~~~~~
387
 
 
388
 
  Code not geared to do pipelined requests, and this might require doing
389
 
  asynchrony within bzrlib.  We might want to either go fully pipelined
390
 
  and asynchronous, but there might be a profitable middle ground.
391
 
 
392
 
  The particular case where duplex communication would be good is in
393
 
  working towards the common points in the graphs between the client and
394
 
  server: we want to send speculatively, but detect as soon as they've
395
 
  matched up.
396
 
 
397
 
  So we could for instance have a synchronous core, but rely on the OS
398
 
  network buffering to allow us to work on batches of say 64kB.  We can
399
 
  also pipeline requests and responses, without allowing for them
400
 
  happening out of order, or mixed requests happening at the same time.
401
 
 
402
 
  Wonder how our network performance would have turned out now if we'd
403
 
  done full-duplex from the start, and ignored hpss over HTTP.  We have
404
 
  pretty good (read-only) HTTP support just over dumb HTTP, and that may be
405
 
  better for many users.
406
 
 
407
 
 
408
 
 
409
 
APIs
410
 
====
411
 
 
412
 
On the client, the bzrlib code is "in charge": when it makes a request, or
413
 
asks from data from the network, that causes network IO.  The server is
414
 
event driven: the network code tells the response handler when data has
415
 
been received, and it takes back a Response object from the request
416
 
handler that is then polled for body stream data.
 
295
For errors (where the Status byte of a response or a streamed body is
 
296
"E"), the situation is analagous to requests.  The first item in the
 
297
encoded sequence must be a string of the error name.  The other arguments
 
298
supply details about the error, and their number and types will depend on
 
299
the type of error (as identified by the error name).
417
300
 
418
301
Paths
419
302
=====
422
305
that includes any repository that might need to be referenced, and the
423
306
client needs to know about a root directory beyond which it cannot ascend.
424
307
 
425
 
Servers run over SSH will typically want to be able to access any path the
 
308
Servers run over ssh will typically want to be able to access any path the
426
309
user can access.  Public servers on the other hand (which might be over
427
 
HTTP, SSH or TCP) will typically want to restrict access to only a
 
310
http, ssh or tcp) will typically want to restrict access to only a
428
311
particular directory and its children, so will want to do a software
429
312
virtual root at that level.  In other words they'll want to rewrite
430
313
incoming paths to be under that level (and prevent escaping using ../
431
314
tricks).  The default implementation in bzrlib does this using the
432
315
`bzrlib.transport.chroot` module.
433
316
 
434
 
URLs that include ~ are passed across to the server verbatim and the
435
 
server can expand them.  The default implementation in bzrlib does this
436
 
using `bzrlib.transport.pathfilter` and `os.path.expanduser`, taking care
437
 
to respect the virtual root.
 
317
URLs that include ~ should probably be passed across to the server
 
318
verbatim and the server can expand them.  This will proably not be
 
319
meaningful when limited to a directory?  See `bug 109143`_.
438
320
 
439
 
Paths in request arguments are UTF-8 encoded, except for the legacy VFS
440
 
requests which expect escaped (`bzrlib.urlutils.escape`) paths.
 
321
.. _bug 109143: https://bugs.launchpad.net/bzr/+bug/109143
441
322
 
442
323
 
443
324
Requests