~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/smart/repository.py

  • Committer: John Arbash Meinel
  • Date: 2009-03-06 20:42:40 UTC
  • mto: This revision was merged to the branch mainline in revision 4088.
  • Revision ID: john@arbash-meinel.com-20090306204240-mzjavv31z3gu1x7i
Fix a small bug in setup.py when an extension fails to build

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2006, 2007, 2010 Canonical Ltd
 
1
# Copyright (C) 2006, 2007 Canonical Ltd
2
2
#
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
12
12
#
13
13
# You should have received a copy of the GNU General Public License
14
14
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
16
 
17
17
"""Server-side repository related request implmentations."""
18
18
 
19
19
import bz2
20
20
import os
21
21
import Queue
 
22
import struct
22
23
import sys
23
24
import tarfile
24
25
import tempfile
25
26
import threading
26
27
 
27
28
from bzrlib import (
28
 
    bencode,
29
29
    errors,
30
 
    graph,
31
30
    osutils,
32
31
    pack,
33
 
    ui,
34
 
    versionedfile,
35
32
    )
36
33
from bzrlib.bzrdir import BzrDir
37
34
from bzrlib.smart.request import (
41
38
    )
42
39
from bzrlib.repository import _strip_NULL_ghosts, network_format_registry
43
40
from bzrlib import revision as _mod_revision
44
 
from bzrlib.versionedfile import (
45
 
    NetworkRecordStream,
46
 
    record_to_fulltext_bytes,
47
 
    )
 
41
from bzrlib.util import bencode
 
42
from bzrlib.versionedfile import NetworkRecordStream, record_to_fulltext_bytes
48
43
 
49
44
 
50
45
class SmartServerRepositoryRequest(SmartServerRequest):
75
70
        # is expected)
76
71
        return None
77
72
 
78
 
    def recreate_search(self, repository, search_bytes, discard_excess=False):
79
 
        """Recreate a search from its serialised form.
80
 
 
81
 
        :param discard_excess: If True, and the search refers to data we don't
82
 
            have, just silently accept that fact - the verb calling
83
 
            recreate_search trusts that clients will look for missing things
84
 
            they expected and get it from elsewhere.
85
 
        """
86
 
        lines = search_bytes.split('\n')
87
 
        if lines[0] == 'ancestry-of':
88
 
            heads = lines[1:]
89
 
            search_result = graph.PendingAncestryResult(heads, repository)
90
 
            return search_result, None
91
 
        elif lines[0] == 'search':
92
 
            return self.recreate_search_from_recipe(repository, lines[1:],
93
 
                discard_excess=discard_excess)
94
 
        else:
95
 
            return (None, FailedSmartServerResponse(('BadSearch',)))
96
 
 
97
 
    def recreate_search_from_recipe(self, repository, lines,
98
 
        discard_excess=False):
99
 
        """Recreate a specific revision search (vs a from-tip search).
100
 
 
101
 
        :param discard_excess: If True, and the search refers to data we don't
102
 
            have, just silently accept that fact - the verb calling
103
 
            recreate_search trusts that clients will look for missing things
104
 
            they expected and get it from elsewhere.
105
 
        """
 
73
    def recreate_search(self, repository, recipe_bytes):
 
74
        lines = recipe_bytes.split('\n')
106
75
        start_keys = set(lines[0].split(' '))
107
76
        exclude_keys = set(lines[1].split(' '))
108
77
        revision_count = int(lines[2])
117
86
                    break
118
87
                search.stop_searching_any(exclude_keys.intersection(next_revs))
119
88
            search_result = search.get_result()
120
 
            if (not discard_excess and
121
 
                search_result.get_recipe()[3] != revision_count):
 
89
            if search_result.get_recipe()[2] != revision_count:
122
90
                # we got back a different amount of data than expected, this
123
91
                # gets reported as NoSuchRevision, because less revisions
124
92
                # indicates missing revisions, and more should never happen as
125
93
                # the excludes list considers ghosts and ensures that ghost
126
94
                # filling races are not a problem.
127
95
                return (None, FailedSmartServerResponse(('NoSuchRevision',)))
128
 
            return (search_result, None)
 
96
            return (search, None)
129
97
        finally:
130
98
            repository.unlock()
131
99
 
155
123
        from revision_ids is returned. The verb takes a body containing the
156
124
        current search state, see do_body for details.
157
125
 
158
 
        If 'include-missing:' is in revision_ids, ghosts encountered in the
159
 
        graph traversal for getting parent data are included in the result with
160
 
        a prefix of 'missing:'.
161
 
 
162
126
        :param repository: The repository to query in.
163
127
        :param revision_ids: The utf8 encoded revision_id to answer for.
164
128
        """
183
147
    def _do_repository_request(self, body_bytes):
184
148
        repository = self._repository
185
149
        revision_ids = set(self._revision_ids)
186
 
        include_missing = 'include-missing:' in revision_ids
187
 
        if include_missing:
188
 
            revision_ids.remove('include-missing:')
189
 
        body_lines = body_bytes.split('\n')
190
 
        search_result, error = self.recreate_search_from_recipe(
191
 
            repository, body_lines)
 
150
        search, error = self.recreate_search(repository, body_bytes)
192
151
        if error is not None:
193
152
            return error
194
153
        # TODO might be nice to start up the search again; but thats not
195
154
        # written or tested yet.
196
 
        client_seen_revs = set(search_result.get_keys())
 
155
        client_seen_revs = set(search.get_result().get_keys())
197
156
        # Always include the requested ids.
198
157
        client_seen_revs.difference_update(revision_ids)
199
158
        lines = []
206
165
        while next_revs:
207
166
            queried_revs.update(next_revs)
208
167
            parent_map = repo_graph.get_parent_map(next_revs)
209
 
            current_revs = next_revs
210
168
            next_revs = set()
211
 
            for revision_id in current_revs:
212
 
                missing_rev = False
213
 
                parents = parent_map.get(revision_id)
214
 
                if parents is not None:
215
 
                    # adjust for the wire
216
 
                    if parents == (_mod_revision.NULL_REVISION,):
217
 
                        parents = ()
218
 
                    # prepare the next query
219
 
                    next_revs.update(parents)
220
 
                    encoded_id = revision_id
221
 
                else:
222
 
                    missing_rev = True
223
 
                    encoded_id = "missing:" + revision_id
224
 
                    parents = []
225
 
                if (revision_id not in client_seen_revs and
226
 
                    (not missing_rev or include_missing)):
 
169
            for revision_id, parents in parent_map.iteritems():
 
170
                # adjust for the wire
 
171
                if parents == (_mod_revision.NULL_REVISION,):
 
172
                    parents = ()
 
173
                # prepare the next query
 
174
                next_revs.update(parents)
 
175
                if revision_id not in client_seen_revs:
227
176
                    # Client does not have this revision, give it to it.
228
177
                    # add parents to the result
229
 
                    result[encoded_id] = parents
 
178
                    result[revision_id] = parents
230
179
                    # Approximate the serialized cost of this revision_id.
231
 
                    size_so_far += 2 + len(encoded_id) + sum(map(len, parents))
 
180
                    size_so_far += 2 + len(revision_id) + sum(map(len, parents))
232
181
            # get all the directly asked for parents, and then flesh out to
233
182
            # 64K (compressed) or so. We do one level of depth at a time to
234
183
            # stay in sync with the client. The 250000 magic number is
288
237
        return SuccessfulSmartServerResponse(('ok', ), '\n'.join(lines))
289
238
 
290
239
 
291
 
class SmartServerRepositoryGetRevIdForRevno(SmartServerRepositoryReadLocked):
292
 
 
293
 
    def do_readlocked_repository_request(self, repository, revno,
294
 
            known_pair):
295
 
        """Find the revid for a given revno, given a known revno/revid pair.
296
 
        
297
 
        New in 1.17.
298
 
        """
299
 
        try:
300
 
            found_flag, result = repository.get_rev_id_for_revno(revno, known_pair)
301
 
        except errors.RevisionNotPresent, err:
302
 
            if err.revision_id != known_pair[1]:
303
 
                raise AssertionError(
304
 
                    'get_rev_id_for_revno raised RevisionNotPresent for '
305
 
                    'non-initial revision: ' + err.revision_id)
306
 
            return FailedSmartServerResponse(
307
 
                ('nosuchrevision', err.revision_id))
308
 
        if found_flag:
309
 
            return SuccessfulSmartServerResponse(('ok', result))
310
 
        else:
311
 
            earliest_revno, earliest_revid = result
312
 
            return SuccessfulSmartServerResponse(
313
 
                ('history-incomplete', earliest_revno, earliest_revid))
314
 
 
315
 
 
316
240
class SmartServerRequestHasRevision(SmartServerRepositoryRequest):
317
241
 
318
242
    def do_repository_request(self, repository, revision_id):
419
343
            repository.
420
344
        """
421
345
        self._to_format = network_format_registry.get(to_network_name)
422
 
        if self._should_fake_unknown():
423
 
            return FailedSmartServerResponse(
424
 
                ('UnknownMethod', 'Repository.get_stream'))
425
346
        return None # Signal that we want a body.
426
347
 
427
 
    def _should_fake_unknown(self):
428
 
        """Return True if we should return UnknownMethod to the client.
429
 
        
430
 
        This is a workaround for bugs in pre-1.19 clients that claim to
431
 
        support receiving streams of CHK repositories.  The pre-1.19 client
432
 
        expects inventory records to be serialized in the format defined by
433
 
        to_network_name, but in pre-1.19 (at least) that format definition
434
 
        tries to use the xml5 serializer, which does not correctly handle
435
 
        rich-roots.  After 1.19 the client can also accept inventory-deltas
436
 
        (which avoids this issue), and those clients will use the
437
 
        Repository.get_stream_1.19 verb instead of this one.
438
 
        So: if this repository is CHK, and the to_format doesn't match,
439
 
        we should just fake an UnknownSmartMethod error so that the client
440
 
        will fallback to VFS, rather than sending it a stream we know it
441
 
        cannot handle.
442
 
        """
443
 
        from_format = self._repository._format
444
 
        to_format = self._to_format
445
 
        if not from_format.supports_chks:
446
 
            # Source not CHK: that's ok
447
 
            return False
448
 
        if (to_format.supports_chks and
449
 
            from_format.repository_class is to_format.repository_class and
450
 
            from_format._serializer == to_format._serializer):
451
 
            # Source is CHK, but target matches: that's ok
452
 
            # (e.g. 2a->2a, or CHK2->2a)
453
 
            return False
454
 
        # Source is CHK, and target is not CHK or incompatible CHK.  We can't
455
 
        # generate a compatible stream.
456
 
        return True
457
 
 
458
348
    def do_body(self, body_bytes):
459
349
        repository = self._repository
460
350
        repository.lock_read()
461
351
        try:
462
 
            search_result, error = self.recreate_search(repository, body_bytes,
463
 
                discard_excess=True)
 
352
            search, error = self.recreate_search(repository, body_bytes)
464
353
            if error is not None:
465
354
                repository.unlock()
466
355
                return error
 
356
            search = search.get_result()
467
357
            source = repository._get_source(self._to_format)
468
 
            stream = source.get_stream(search_result)
 
358
            stream = source.get_stream(search)
469
359
        except Exception:
470
360
            exc_info = sys.exc_info()
471
361
            try:
490
380
            repository.unlock()
491
381
 
492
382
 
493
 
class SmartServerRepositoryGetStream_1_19(SmartServerRepositoryGetStream):
494
 
 
495
 
    def _should_fake_unknown(self):
496
 
        """Returns False; we don't need to workaround bugs in 1.19+ clients."""
497
 
        return False
498
 
 
499
 
 
500
383
def _stream_to_byte_stream(stream, src_format):
501
384
    """Convert a record stream to a self delimited byte stream."""
502
385
    pack_writer = pack.ContainerSerialiser()
503
386
    yield pack_writer.begin()
504
387
    yield pack_writer.bytes_record(src_format.network_name(), '')
505
388
    for substream_type, substream in stream:
506
 
        if substream_type == 'inventory-deltas':
507
 
            # This doesn't feel like the ideal place to issue this warning;
508
 
            # however we don't want to do it in the Repository that's
509
 
            # generating the stream, because that might be on the server.
510
 
            # Instead we try to observe it as the stream goes by.
511
 
            ui.ui_factory.warn_cross_format_fetch(src_format,
512
 
                '(remote)')
513
389
        for record in substream:
514
390
            if record.storage_kind in ('chunked', 'fulltext'):
515
391
                serialised = record_to_fulltext_bytes(record)
516
 
            elif record.storage_kind == 'inventory-delta':
517
 
                serialised = record_to_inventory_delta_bytes(record)
518
 
            elif record.storage_kind == 'absent':
519
 
                raise ValueError("Absent factory for %s" % (record.key,))
520
392
            else:
521
393
                serialised = record.get_bytes_as(record.storage_kind)
522
394
            if serialised:
527
399
    yield pack_writer.end()
528
400
 
529
401
 
530
 
class _ByteStreamDecoder(object):
531
 
    """Helper for _byte_stream_to_stream.
532
 
 
533
 
    The expected usage of this class is via the function _byte_stream_to_stream
534
 
    which creates a _ByteStreamDecoder, pops off the stream format and then
535
 
    yields the output of record_stream(), the main entry point to
536
 
    _ByteStreamDecoder.
537
 
 
538
 
    Broadly this class has to unwrap two layers of iterators:
539
 
    (type, substream)
540
 
    (substream details)
541
 
 
542
 
    This is complicated by wishing to return type, iterator_for_type, but
543
 
    getting the data for iterator_for_type when we find out type: we can't
544
 
    simply pass a generator down to the NetworkRecordStream parser, instead
545
 
    we have a little local state to seed each NetworkRecordStream instance,
546
 
    and gather the type that we'll be yielding.
547
 
 
548
 
    :ivar byte_stream: The byte stream being decoded.
549
 
    :ivar stream_decoder: A pack parser used to decode the bytestream
550
 
    :ivar current_type: The current type, used to join adjacent records of the
551
 
        same type into a single stream.
552
 
    :ivar first_bytes: The first bytes to give the next NetworkRecordStream.
553
 
    """
554
 
 
555
 
    def __init__(self, byte_stream):
556
 
        """Create a _ByteStreamDecoder."""
557
 
        self.stream_decoder = pack.ContainerPushParser()
558
 
        self.current_type = None
559
 
        self.first_bytes = None
560
 
        self.byte_stream = byte_stream
561
 
 
562
 
    def iter_stream_decoder(self):
563
 
        """Iterate the contents of the pack from stream_decoder."""
564
 
        # dequeue pending items
565
 
        for record in self.stream_decoder.read_pending_records():
566
 
            yield record
567
 
        # Pull bytes of the wire, decode them to records, yield those records.
568
 
        for bytes in self.byte_stream:
569
 
            self.stream_decoder.accept_bytes(bytes)
570
 
            for record in self.stream_decoder.read_pending_records():
571
 
                yield record
572
 
 
573
 
    def iter_substream_bytes(self):
574
 
        if self.first_bytes is not None:
575
 
            yield self.first_bytes
576
 
            # If we run out of pack records, single the outer layer to stop.
577
 
            self.first_bytes = None
578
 
        for record in self.iter_pack_records:
579
 
            record_names, record_bytes = record
580
 
            record_name, = record_names
581
 
            substream_type = record_name[0]
582
 
            if substream_type != self.current_type:
583
 
                # end of a substream, seed the next substream.
584
 
                self.current_type = substream_type
585
 
                self.first_bytes = record_bytes
586
 
                return
587
 
            yield record_bytes
588
 
 
589
 
    def record_stream(self):
590
 
        """Yield substream_type, substream from the byte stream."""
591
 
        self.seed_state()
592
 
        # Make and consume sub generators, one per substream type:
593
 
        while self.first_bytes is not None:
594
 
            substream = NetworkRecordStream(self.iter_substream_bytes())
595
 
            # after substream is fully consumed, self.current_type is set to
596
 
            # the next type, and self.first_bytes is set to the matching bytes.
597
 
            yield self.current_type, substream.read()
598
 
 
599
 
    def seed_state(self):
600
 
        """Prepare the _ByteStreamDecoder to decode from the pack stream."""
601
 
        # Set a single generator we can use to get data from the pack stream.
602
 
        self.iter_pack_records = self.iter_stream_decoder()
603
 
        # Seed the very first subiterator with content; after this each one
604
 
        # seeds the next.
605
 
        list(self.iter_substream_bytes())
606
 
 
607
 
 
608
402
def _byte_stream_to_stream(byte_stream):
609
403
    """Convert a byte stream into a format and a stream.
610
404
 
611
405
    :param byte_stream: A bytes iterator, as output by _stream_to_byte_stream.
612
406
    :return: (RepositoryFormat, stream_generator)
613
407
    """
614
 
    decoder = _ByteStreamDecoder(byte_stream)
 
408
    stream_decoder = pack.ContainerPushParser()
 
409
    def record_stream():
 
410
        """Closure to return the substreams."""
 
411
        # May have fully parsed records already.
 
412
        for record in stream_decoder.read_pending_records():
 
413
            record_names, record_bytes = record
 
414
            record_name, = record_names
 
415
            substream_type = record_name[0]
 
416
            substream = NetworkRecordStream([record_bytes])
 
417
            yield substream_type, substream.read()
 
418
        for bytes in byte_stream:
 
419
            stream_decoder.accept_bytes(bytes)
 
420
            for record in stream_decoder.read_pending_records():
 
421
                record_names, record_bytes = record
 
422
                record_name, = record_names
 
423
                substream_type = record_name[0]
 
424
                substream = NetworkRecordStream([record_bytes])
 
425
                yield substream_type, substream.read()
615
426
    for bytes in byte_stream:
616
 
        decoder.stream_decoder.accept_bytes(bytes)
617
 
        for record in decoder.stream_decoder.read_pending_records(max=1):
 
427
        stream_decoder.accept_bytes(bytes)
 
428
        for record in stream_decoder.read_pending_records(max=1):
618
429
            record_names, src_format_name = record
619
430
            src_format = network_format_registry.get(src_format_name)
620
 
            return src_format, decoder.record_stream()
 
431
            return src_format, record_stream()
621
432
 
622
433
 
623
434
class SmartServerRepositoryUnlock(SmartServerRepositoryRequest):
701
512
            tarball.close()
702
513
 
703
514
 
704
 
class SmartServerRepositoryInsertStreamLocked(SmartServerRepositoryRequest):
 
515
class SmartServerRepositoryInsertStream(SmartServerRepositoryRequest):
705
516
    """Insert a record stream from a RemoteSink into a repository.
706
517
 
707
518
    This gets bytes pushed to it by the network infrastructure and turns that
708
519
    into a bytes iterator using a thread. That is then processed by
709
520
    _byte_stream_to_stream.
710
 
 
711
 
    New in 1.14.
712
521
    """
713
522
 
714
 
    def do_repository_request(self, repository, resume_tokens, lock_token):
 
523
    def do_repository_request(self, repository, resume_tokens):
715
524
        """StreamSink.insert_stream for a remote repository."""
716
 
        repository.lock_write(token=lock_token)
717
 
        self.do_insert_stream_request(repository, resume_tokens)
718
 
 
719
 
    def do_insert_stream_request(self, repository, resume_tokens):
 
525
        repository.lock_write()
720
526
        tokens = [token for token in resume_tokens.split(' ') if token]
721
527
        self.tokens = tokens
722
528
        self.repository = repository
764
570
        else:
765
571
            self.repository.unlock()
766
572
            return SuccessfulSmartServerResponse(('ok', ))
767
 
 
768
 
 
769
 
class SmartServerRepositoryInsertStream_1_19(SmartServerRepositoryInsertStreamLocked):
770
 
    """Insert a record stream from a RemoteSink into a repository.
771
 
 
772
 
    Same as SmartServerRepositoryInsertStreamLocked, except:
773
 
     - the lock token argument is optional
774
 
     - servers that implement this verb accept 'inventory-delta' records in the
775
 
       stream.
776
 
 
777
 
    New in 1.19.
778
 
    """
779
 
 
780
 
    def do_repository_request(self, repository, resume_tokens, lock_token=None):
781
 
        """StreamSink.insert_stream for a remote repository."""
782
 
        SmartServerRepositoryInsertStreamLocked.do_repository_request(
783
 
            self, repository, resume_tokens, lock_token)
784
 
 
785
 
 
786
 
class SmartServerRepositoryInsertStream(SmartServerRepositoryInsertStreamLocked):
787
 
    """Insert a record stream from a RemoteSink into an unlocked repository.
788
 
 
789
 
    This is the same as SmartServerRepositoryInsertStreamLocked, except it
790
 
    takes no lock_tokens; i.e. it works with an unlocked (or lock-free, e.g.
791
 
    like pack format) repository.
792
 
 
793
 
    New in 1.13.
794
 
    """
795
 
 
796
 
    def do_repository_request(self, repository, resume_tokens):
797
 
        """StreamSink.insert_stream for a remote repository."""
798
 
        repository.lock_write()
799
 
        self.do_insert_stream_request(repository, resume_tokens)
800
 
 
801