~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/knit.py

  • Committer: John Arbash Meinel
  • Date: 2009-07-08 23:10:47 UTC
  • mto: This revision was merged to the branch mainline in revision 4522.
  • Revision ID: john@arbash-meinel.com-20090708231047-8zlppczwumi0e0hp
Remove some assert statements.

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2006-2010 Canonical Ltd
 
1
# Copyright (C) 2005, 2006, 2007, 2008 Canonical Ltd
2
2
#
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
69
69
    lru_cache,
70
70
    pack,
71
71
    progress,
72
 
    static_tuple,
73
72
    trace,
74
73
    tsort,
75
74
    tuned_gzip,
76
 
    ui,
77
75
    )
78
76
""")
79
77
from bzrlib import (
1047
1045
    def get_annotator(self):
1048
1046
        return _KnitAnnotator(self)
1049
1047
 
1050
 
    def check(self, progress_bar=None, keys=None):
 
1048
    def check(self, progress_bar=None):
1051
1049
        """See VersionedFiles.check()."""
1052
 
        if keys is None:
1053
 
            return self._logical_check()
1054
 
        else:
1055
 
            # At the moment, check does not extra work over get_record_stream
1056
 
            return self.get_record_stream(keys, 'unordered', True)
1057
 
 
1058
 
    def _logical_check(self):
1059
1050
        # This doesn't actually test extraction of everything, but that will
1060
1051
        # impact 'bzr check' substantially, and needs to be integrated with
1061
1052
        # care. However, it does check for the obvious problem of a delta with
1192
1183
        generator = _VFContentMapGenerator(self, [key])
1193
1184
        return generator._get_content(key)
1194
1185
 
1195
 
    def get_known_graph_ancestry(self, keys):
1196
 
        """Get a KnownGraph instance with the ancestry of keys."""
1197
 
        parent_map, missing_keys = self._index.find_ancestry(keys)
1198
 
        for fallback in self._fallback_vfs:
1199
 
            if not missing_keys:
1200
 
                break
1201
 
            (f_parent_map, f_missing_keys) = fallback._index.find_ancestry(
1202
 
                                                missing_keys)
1203
 
            parent_map.update(f_parent_map)
1204
 
            missing_keys = f_missing_keys
1205
 
        kg = _mod_graph.KnownGraph(parent_map)
1206
 
        return kg
1207
 
 
1208
1186
    def get_parent_map(self, keys):
1209
1187
        """Get a map of the graph parents of keys.
1210
1188
 
1511
1489
                                                                non_local_keys,
1512
1490
                                                                positions):
1513
1491
                generator = _VFContentMapGenerator(self, keys, non_local_keys,
1514
 
                                                   global_map,
1515
 
                                                   ordering=ordering)
 
1492
                                                   global_map)
1516
1493
                for record in generator.get_record_stream():
1517
1494
                    yield record
1518
1495
        else:
1520
1497
                if source is parent_maps[0]:
1521
1498
                    # this KnitVersionedFiles
1522
1499
                    records = [(key, positions[key][1]) for key in keys]
1523
 
                    for key, raw_data in self._read_records_iter_unchecked(records):
 
1500
                    for key, raw_data, sha1 in self._read_records_iter_raw(records):
1524
1501
                        (record_details, index_memo, _) = positions[key]
1525
1502
                        yield KnitContentFactory(key, global_map[key],
1526
 
                            record_details, None, raw_data, self._factory.annotated, None)
 
1503
                            record_details, sha1, raw_data, self._factory.annotated, None)
1527
1504
                else:
1528
1505
                    vf = self._fallback_vfs[parent_maps.index(source) - 1]
1529
1506
                    for record in vf.get_record_stream(keys, ordering,
1598
1575
        # key = basis_parent, value = index entry to add
1599
1576
        buffered_index_entries = {}
1600
1577
        for record in stream:
1601
 
            kind = record.storage_kind
1602
 
            if kind.startswith('knit-') and kind.endswith('-gz'):
1603
 
                # Check that the ID in the header of the raw knit bytes matches
1604
 
                # the record metadata.
1605
 
                raw_data = record._raw_record
1606
 
                df, rec = self._parse_record_header(record.key, raw_data)
1607
 
                df.close()
1608
1578
            buffered = False
1609
1579
            parents = record.parents
1610
1580
            if record.storage_kind in delta_types:
1712
1682
            # There were index entries buffered at the end of the stream,
1713
1683
            # So these need to be added (if the index supports holding such
1714
1684
            # entries for later insertion)
1715
 
            all_entries = []
1716
1685
            for key in buffered_index_entries:
1717
1686
                index_entries = buffered_index_entries[key]
1718
 
                all_entries.extend(index_entries)
1719
 
            self._index.add_records(
1720
 
                all_entries, missing_compression_parents=True)
 
1687
                self._index.add_records(index_entries,
 
1688
                    missing_compression_parents=True)
1721
1689
 
1722
1690
    def get_missing_compression_parent_keys(self):
1723
1691
        """Return an iterable of keys of missing compression parents.
1756
1724
        :return: An iterator over (line, key).
1757
1725
        """
1758
1726
        if pb is None:
1759
 
            pb = ui.ui_factory.nested_progress_bar()
 
1727
            pb = progress.DummyProgress()
1760
1728
        keys = set(keys)
1761
1729
        total = len(keys)
1762
1730
        done = False
2025
1993
class _ContentMapGenerator(object):
2026
1994
    """Generate texts or expose raw deltas for a set of texts."""
2027
1995
 
2028
 
    def __init__(self, ordering='unordered'):
2029
 
        self._ordering = ordering
2030
 
 
2031
1996
    def _get_content(self, key):
2032
1997
        """Get the content object for key."""
2033
1998
        # Note that _get_content is only called when the _ContentMapGenerator
2067
2032
            # Loop over fallback repositories asking them for texts - ignore
2068
2033
            # any missing from a particular fallback.
2069
2034
            for record in source.get_record_stream(missing_keys,
2070
 
                self._ordering, True):
 
2035
                'unordered', True):
2071
2036
                if record.storage_kind == 'absent':
2072
2037
                    # Not in thie particular stream, may be in one of the
2073
2038
                    # other fallback vfs objects.
2205
2170
    """Content map generator reading from a VersionedFiles object."""
2206
2171
 
2207
2172
    def __init__(self, versioned_files, keys, nonlocal_keys=None,
2208
 
        global_map=None, raw_record_map=None, ordering='unordered'):
 
2173
        global_map=None, raw_record_map=None):
2209
2174
        """Create a _ContentMapGenerator.
2210
2175
 
2211
2176
        :param versioned_files: The versioned files that the texts are being
2219
2184
        :param raw_record_map: A unparsed raw record map to use for answering
2220
2185
            contents.
2221
2186
        """
2222
 
        _ContentMapGenerator.__init__(self, ordering=ordering)
2223
2187
        # The vf to source data from
2224
2188
        self.vf = versioned_files
2225
2189
        # The keys desired
2369
2333
    FLAGS is a comma separated list of flags about the record. Values include
2370
2334
        no-eol, line-delta, fulltext.
2371
2335
    BYTE_OFFSET is the ascii representation of the byte offset in the data file
2372
 
        that the compressed data starts at.
 
2336
        that the the compressed data starts at.
2373
2337
    LENGTH is the ascii representation of the length of the data file.
2374
2338
    PARENT_ID a utf-8 revision id prefixed by a '.' that is a parent of
2375
2339
        REVISION_ID.
2584
2548
        except KeyError:
2585
2549
            raise RevisionNotPresent(key, self)
2586
2550
 
2587
 
    def find_ancestry(self, keys):
2588
 
        """See CombinedGraphIndex.find_ancestry()"""
2589
 
        prefixes = set(key[:-1] for key in keys)
2590
 
        self._load_prefixes(prefixes)
2591
 
        result = {}
2592
 
        parent_map = {}
2593
 
        missing_keys = set()
2594
 
        pending_keys = list(keys)
2595
 
        # This assumes that keys will not reference parents in a different
2596
 
        # prefix, which is accurate so far.
2597
 
        while pending_keys:
2598
 
            key = pending_keys.pop()
2599
 
            if key in parent_map:
2600
 
                continue
2601
 
            prefix = key[:-1]
2602
 
            try:
2603
 
                suffix_parents = self._kndx_cache[prefix][0][key[-1]][4]
2604
 
            except KeyError:
2605
 
                missing_keys.add(key)
2606
 
            else:
2607
 
                parent_keys = tuple([prefix + (suffix,)
2608
 
                                     for suffix in suffix_parents])
2609
 
                parent_map[key] = parent_keys
2610
 
                pending_keys.extend([p for p in parent_keys
2611
 
                                        if p not in parent_map])
2612
 
        return parent_map, missing_keys
2613
 
 
2614
2551
    def get_parent_map(self, keys):
2615
2552
        """Get a map of the parents of keys.
2616
2553
 
2788
2725
 
2789
2726
class _KeyRefs(object):
2790
2727
 
2791
 
    def __init__(self, track_new_keys=False):
 
2728
    def __init__(self):
2792
2729
        # dict mapping 'key' to 'set of keys referring to that key'
2793
2730
        self.refs = {}
2794
 
        if track_new_keys:
2795
 
            # set remembering all new keys
2796
 
            self.new_keys = set()
2797
 
        else:
2798
 
            self.new_keys = None
2799
 
 
2800
 
    def clear(self):
2801
 
        if self.refs:
2802
 
            self.refs.clear()
2803
 
        if self.new_keys:
2804
 
            self.new_keys.clear()
2805
2731
 
2806
2732
    def add_references(self, key, refs):
2807
2733
        # Record the new references
2814
2740
        # Discard references satisfied by the new key
2815
2741
        self.add_key(key)
2816
2742
 
2817
 
    def get_new_keys(self):
2818
 
        return self.new_keys
2819
 
    
2820
2743
    def get_unsatisfied_refs(self):
2821
2744
        return self.refs.iterkeys()
2822
2745
 
2823
 
    def _satisfy_refs_for_key(self, key):
 
2746
    def add_key(self, key):
2824
2747
        try:
2825
2748
            del self.refs[key]
2826
2749
        except KeyError:
2827
2750
            # No keys depended on this key.  That's ok.
2828
2751
            pass
2829
2752
 
2830
 
    def add_key(self, key):
2831
 
        # satisfy refs for key, and remember that we've seen this key.
2832
 
        self._satisfy_refs_for_key(key)
2833
 
        if self.new_keys is not None:
2834
 
            self.new_keys.add(key)
2835
 
 
2836
 
    def satisfy_refs_for_keys(self, keys):
 
2753
    def add_keys(self, keys):
2837
2754
        for key in keys:
2838
 
            self._satisfy_refs_for_key(key)
 
2755
            self.add_key(key)
2839
2756
 
2840
2757
    def get_referrers(self):
2841
2758
        result = set()
2946
2863
        if not random_id:
2947
2864
            present_nodes = self._get_entries(keys)
2948
2865
            for (index, key, value, node_refs) in present_nodes:
2949
 
                parents = node_refs[:1]
2950
 
                # Sometimes these are passed as a list rather than a tuple
2951
 
                passed = static_tuple.as_tuples(keys[key])
2952
 
                passed_parents = passed[1][:1]
2953
2866
                if (value[0] != keys[key][0][0] or
2954
 
                    parents != passed_parents):
2955
 
                    node_refs = static_tuple.as_tuples(node_refs)
 
2867
                    node_refs[:1] != keys[key][1][:1]):
2956
2868
                    raise KnitCorrupt(self, "inconsistent details in add_records"
2957
 
                        ": %s %s" % ((value, node_refs), passed))
 
2869
                        ": %s %s" % ((value, node_refs), keys[key]))
2958
2870
                del keys[key]
2959
2871
        result = []
2960
2872
        if self._parents:
3008
2920
        # If updating this, you should also update
3009
2921
        # groupcompress._GCGraphIndex.get_missing_parents
3010
2922
        # We may have false positives, so filter those out.
3011
 
        self._key_dependencies.satisfy_refs_for_keys(
 
2923
        self._key_dependencies.add_keys(
3012
2924
            self.get_parent_map(self._key_dependencies.get_unsatisfied_refs()))
3013
2925
        return frozenset(self._key_dependencies.get_unsatisfied_refs())
3014
2926
 
3125
3037
            options.append('no-eol')
3126
3038
        return options
3127
3039
 
3128
 
    def find_ancestry(self, keys):
3129
 
        """See CombinedGraphIndex.find_ancestry()"""
3130
 
        return self._graph_index.find_ancestry(keys, 0)
3131
 
 
3132
3040
    def get_parent_map(self, keys):
3133
3041
        """Get a map of the parents of keys.
3134
3042
 
3708
3616
                    to_process.extend(self._process_pending(key))
3709
3617
 
3710
3618
try:
3711
 
    from bzrlib._knit_load_data_pyx import _load_data_c as _load_data
3712
 
except ImportError, e:
3713
 
    osutils.failed_to_load_extension(e)
 
3619
    from bzrlib._knit_load_data_c import _load_data_c as _load_data
 
3620
except ImportError:
3714
3621
    from bzrlib._knit_load_data_py import _load_data_py as _load_data