~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/smart/repository.py

  • Committer: Martin Pool
  • Date: 2009-09-14 01:48:28 UTC
  • mfrom: (4685 +trunk)
  • mto: This revision was merged to the branch mainline in revision 4688.
  • Revision ID: mbp@sourcefrog.net-20090914014828-ydr9rlkdfq2sv57z
Merge news

Show diffs side-by-side

added added

removed removed

Lines of Context:
30
30
    graph,
31
31
    osutils,
32
32
    pack,
 
33
    versionedfile,
33
34
    )
34
35
from bzrlib.bzrdir import BzrDir
35
36
from bzrlib.smart.request import (
39
40
    )
40
41
from bzrlib.repository import _strip_NULL_ghosts, network_format_registry
41
42
from bzrlib import revision as _mod_revision
42
 
from bzrlib.versionedfile import NetworkRecordStream, record_to_fulltext_bytes
 
43
from bzrlib.versionedfile import (
 
44
    NetworkRecordStream,
 
45
    record_to_fulltext_bytes,
 
46
    )
43
47
 
44
48
 
45
49
class SmartServerRepositoryRequest(SmartServerRequest):
414
418
            repository.
415
419
        """
416
420
        self._to_format = network_format_registry.get(to_network_name)
 
421
        if self._should_fake_unknown():
 
422
            return FailedSmartServerResponse(
 
423
                ('UnknownMethod', 'Repository.get_stream'))
417
424
        return None # Signal that we want a body.
418
425
 
 
426
    def _should_fake_unknown(self):
 
427
        """Return True if we should return UnknownMethod to the client.
 
428
        
 
429
        This is a workaround for bugs in pre-1.19 clients that claim to
 
430
        support receiving streams of CHK repositories.  The pre-1.19 client
 
431
        expects inventory records to be serialized in the format defined by
 
432
        to_network_name, but in pre-1.19 (at least) that format definition
 
433
        tries to use the xml5 serializer, which does not correctly handle
 
434
        rich-roots.  After 1.19 the client can also accept inventory-deltas
 
435
        (which avoids this issue), and those clients will use the
 
436
        Repository.get_stream_1.19 verb instead of this one.
 
437
        So: if this repository is CHK, and the to_format doesn't match,
 
438
        we should just fake an UnknownSmartMethod error so that the client
 
439
        will fallback to VFS, rather than sending it a stream we know it
 
440
        cannot handle.
 
441
        """
 
442
        from_format = self._repository._format
 
443
        to_format = self._to_format
 
444
        if not from_format.supports_chks:
 
445
            # Source not CHK: that's ok
 
446
            return False
 
447
        if (to_format.supports_chks and
 
448
            from_format.repository_class is to_format.repository_class and
 
449
            from_format._serializer == to_format._serializer):
 
450
            # Source is CHK, but target matches: that's ok
 
451
            # (e.g. 2a->2a, or CHK2->2a)
 
452
            return False
 
453
        # Source is CHK, and target is not CHK or incompatible CHK.  We can't
 
454
        # generate a compatible stream.
 
455
        return True
 
456
 
419
457
    def do_body(self, body_bytes):
420
458
        repository = self._repository
421
459
        repository.lock_read()
451
489
            repository.unlock()
452
490
 
453
491
 
 
492
class SmartServerRepositoryGetStream_1_19(SmartServerRepositoryGetStream):
 
493
 
 
494
    def _should_fake_unknown(self):
 
495
        """Returns False; we don't need to workaround bugs in 1.19+ clients."""
 
496
        return False
 
497
 
 
498
 
454
499
def _stream_to_byte_stream(stream, src_format):
455
500
    """Convert a record stream to a self delimited byte stream."""
456
501
    pack_writer = pack.ContainerSerialiser()
460
505
        for record in substream:
461
506
            if record.storage_kind in ('chunked', 'fulltext'):
462
507
                serialised = record_to_fulltext_bytes(record)
 
508
            elif record.storage_kind == 'inventory-delta':
 
509
                serialised = record_to_inventory_delta_bytes(record)
463
510
            elif record.storage_kind == 'absent':
464
511
                raise ValueError("Absent factory for %s" % (record.key,))
465
512
            else:
472
519
    yield pack_writer.end()
473
520
 
474
521
 
 
522
class _ByteStreamDecoder(object):
 
523
    """Helper for _byte_stream_to_stream.
 
524
 
 
525
    The expected usage of this class is via the function _byte_stream_to_stream
 
526
    which creates a _ByteStreamDecoder, pops off the stream format and then
 
527
    yields the output of record_stream(), the main entry point to
 
528
    _ByteStreamDecoder.
 
529
 
 
530
    Broadly this class has to unwrap two layers of iterators:
 
531
    (type, substream)
 
532
    (substream details)
 
533
 
 
534
    This is complicated by wishing to return type, iterator_for_type, but
 
535
    getting the data for iterator_for_type when we find out type: we can't
 
536
    simply pass a generator down to the NetworkRecordStream parser, instead
 
537
    we have a little local state to seed each NetworkRecordStream instance,
 
538
    and gather the type that we'll be yielding.
 
539
 
 
540
    :ivar byte_stream: The byte stream being decoded.
 
541
    :ivar stream_decoder: A pack parser used to decode the bytestream
 
542
    :ivar current_type: The current type, used to join adjacent records of the
 
543
        same type into a single stream.
 
544
    :ivar first_bytes: The first bytes to give the next NetworkRecordStream.
 
545
    """
 
546
 
 
547
    def __init__(self, byte_stream):
 
548
        """Create a _ByteStreamDecoder."""
 
549
        self.stream_decoder = pack.ContainerPushParser()
 
550
        self.current_type = None
 
551
        self.first_bytes = None
 
552
        self.byte_stream = byte_stream
 
553
 
 
554
    def iter_stream_decoder(self):
 
555
        """Iterate the contents of the pack from stream_decoder."""
 
556
        # dequeue pending items
 
557
        for record in self.stream_decoder.read_pending_records():
 
558
            yield record
 
559
        # Pull bytes of the wire, decode them to records, yield those records.
 
560
        for bytes in self.byte_stream:
 
561
            self.stream_decoder.accept_bytes(bytes)
 
562
            for record in self.stream_decoder.read_pending_records():
 
563
                yield record
 
564
 
 
565
    def iter_substream_bytes(self):
 
566
        if self.first_bytes is not None:
 
567
            yield self.first_bytes
 
568
            # If we run out of pack records, single the outer layer to stop.
 
569
            self.first_bytes = None
 
570
        for record in self.iter_pack_records:
 
571
            record_names, record_bytes = record
 
572
            record_name, = record_names
 
573
            substream_type = record_name[0]
 
574
            if substream_type != self.current_type:
 
575
                # end of a substream, seed the next substream.
 
576
                self.current_type = substream_type
 
577
                self.first_bytes = record_bytes
 
578
                return
 
579
            yield record_bytes
 
580
 
 
581
    def record_stream(self):
 
582
        """Yield substream_type, substream from the byte stream."""
 
583
        self.seed_state()
 
584
        # Make and consume sub generators, one per substream type:
 
585
        while self.first_bytes is not None:
 
586
            substream = NetworkRecordStream(self.iter_substream_bytes())
 
587
            # after substream is fully consumed, self.current_type is set to
 
588
            # the next type, and self.first_bytes is set to the matching bytes.
 
589
            yield self.current_type, substream.read()
 
590
 
 
591
    def seed_state(self):
 
592
        """Prepare the _ByteStreamDecoder to decode from the pack stream."""
 
593
        # Set a single generator we can use to get data from the pack stream.
 
594
        self.iter_pack_records = self.iter_stream_decoder()
 
595
        # Seed the very first subiterator with content; after this each one
 
596
        # seeds the next.
 
597
        list(self.iter_substream_bytes())
 
598
 
 
599
 
475
600
def _byte_stream_to_stream(byte_stream):
476
601
    """Convert a byte stream into a format and a stream.
477
602
 
478
603
    :param byte_stream: A bytes iterator, as output by _stream_to_byte_stream.
479
604
    :return: (RepositoryFormat, stream_generator)
480
605
    """
481
 
    stream_decoder = pack.ContainerPushParser()
482
 
    def record_stream():
483
 
        """Closure to return the substreams."""
484
 
        # May have fully parsed records already.
485
 
        for record in stream_decoder.read_pending_records():
486
 
            record_names, record_bytes = record
487
 
            record_name, = record_names
488
 
            substream_type = record_name[0]
489
 
            substream = NetworkRecordStream([record_bytes])
490
 
            yield substream_type, substream.read()
491
 
        for bytes in byte_stream:
492
 
            stream_decoder.accept_bytes(bytes)
493
 
            for record in stream_decoder.read_pending_records():
494
 
                record_names, record_bytes = record
495
 
                record_name, = record_names
496
 
                substream_type = record_name[0]
497
 
                substream = NetworkRecordStream([record_bytes])
498
 
                yield substream_type, substream.read()
 
606
    decoder = _ByteStreamDecoder(byte_stream)
499
607
    for bytes in byte_stream:
500
 
        stream_decoder.accept_bytes(bytes)
501
 
        for record in stream_decoder.read_pending_records(max=1):
 
608
        decoder.stream_decoder.accept_bytes(bytes)
 
609
        for record in decoder.stream_decoder.read_pending_records(max=1):
502
610
            record_names, src_format_name = record
503
611
            src_format = network_format_registry.get(src_format_name)
504
 
            return src_format, record_stream()
 
612
            return src_format, decoder.record_stream()
505
613
 
506
614
 
507
615
class SmartServerRepositoryUnlock(SmartServerRepositoryRequest):
650
758
            return SuccessfulSmartServerResponse(('ok', ))
651
759
 
652
760
 
 
761
class SmartServerRepositoryInsertStream_1_19(SmartServerRepositoryInsertStreamLocked):
 
762
    """Insert a record stream from a RemoteSink into a repository.
 
763
 
 
764
    Same as SmartServerRepositoryInsertStreamLocked, except:
 
765
     - the lock token argument is optional
 
766
     - servers that implement this verb accept 'inventory-delta' records in the
 
767
       stream.
 
768
 
 
769
    New in 1.19.
 
770
    """
 
771
 
 
772
    def do_repository_request(self, repository, resume_tokens, lock_token=None):
 
773
        """StreamSink.insert_stream for a remote repository."""
 
774
        SmartServerRepositoryInsertStreamLocked.do_repository_request(
 
775
            self, repository, resume_tokens, lock_token)
 
776
 
 
777
 
653
778
class SmartServerRepositoryInsertStream(SmartServerRepositoryInsertStreamLocked):
654
779
    """Insert a record stream from a RemoteSink into an unlocked repository.
655
780