~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/tests/test_btree_index.py

NEWS section template into a separate file

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2008 Canonical Ltd
 
1
# Copyright (C) 2008, 2009 Canonical Ltd
2
2
#
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
23
23
from bzrlib import (
24
24
    btree_index,
25
25
    errors,
 
26
    fifo_cache,
 
27
    lru_cache,
 
28
    osutils,
26
29
    tests,
27
30
    )
28
31
from bzrlib.tests import (
980
983
            ])
981
984
        self.assertEqual(set([]), index.external_references(0))
982
985
 
 
986
    def test__find_ancestors_one_page(self):
 
987
        key1 = ('key-1',)
 
988
        key2 = ('key-2',)
 
989
        index = self.make_index(ref_lists=1, key_elements=1, nodes=[
 
990
            (key1, 'value', ([key2],)),
 
991
            (key2, 'value', ([],)),
 
992
            ])
 
993
        parent_map = {}
 
994
        missing_keys = set()
 
995
        search_keys = index._find_ancestors([key1], 0, parent_map, missing_keys)
 
996
        self.assertEqual({key1: (key2,), key2: ()}, parent_map)
 
997
        self.assertEqual(set(), missing_keys)
 
998
        self.assertEqual(set(), search_keys)
 
999
 
 
1000
    def test__find_ancestors_one_page_w_missing(self):
 
1001
        key1 = ('key-1',)
 
1002
        key2 = ('key-2',)
 
1003
        key3 = ('key-3',)
 
1004
        index = self.make_index(ref_lists=1, key_elements=1, nodes=[
 
1005
            (key1, 'value', ([key2],)),
 
1006
            (key2, 'value', ([],)),
 
1007
            ])
 
1008
        parent_map = {}
 
1009
        missing_keys = set()
 
1010
        search_keys = index._find_ancestors([key2, key3], 0, parent_map,
 
1011
                                            missing_keys)
 
1012
        self.assertEqual({key2: ()}, parent_map)
 
1013
        # we know that key3 is missing because we read the page that it would
 
1014
        # otherwise be on
 
1015
        self.assertEqual(set([key3]), missing_keys)
 
1016
        self.assertEqual(set(), search_keys)
 
1017
 
 
1018
    def test__find_ancestors_one_parent_missing(self):
 
1019
        key1 = ('key-1',)
 
1020
        key2 = ('key-2',)
 
1021
        key3 = ('key-3',)
 
1022
        index = self.make_index(ref_lists=1, key_elements=1, nodes=[
 
1023
            (key1, 'value', ([key2],)),
 
1024
            (key2, 'value', ([key3],)),
 
1025
            ])
 
1026
        parent_map = {}
 
1027
        missing_keys = set()
 
1028
        search_keys = index._find_ancestors([key1], 0, parent_map,
 
1029
                                            missing_keys)
 
1030
        self.assertEqual({key1: (key2,), key2: (key3,)}, parent_map)
 
1031
        self.assertEqual(set(), missing_keys)
 
1032
        # all we know is that key3 wasn't present on the page we were reading
 
1033
        # but if you look, the last key is key2 which comes before key3, so we
 
1034
        # don't know whether key3 would land on this page or not.
 
1035
        self.assertEqual(set([key3]), search_keys)
 
1036
        search_keys = index._find_ancestors(search_keys, 0, parent_map,
 
1037
                                            missing_keys)
 
1038
        # passing it back in, we are sure it is 'missing'
 
1039
        self.assertEqual({key1: (key2,), key2: (key3,)}, parent_map)
 
1040
        self.assertEqual(set([key3]), missing_keys)
 
1041
        self.assertEqual(set([]), search_keys)
 
1042
 
 
1043
    def test__find_ancestors_dont_search_known(self):
 
1044
        key1 = ('key-1',)
 
1045
        key2 = ('key-2',)
 
1046
        key3 = ('key-3',)
 
1047
        index = self.make_index(ref_lists=1, key_elements=1, nodes=[
 
1048
            (key1, 'value', ([key2],)),
 
1049
            (key2, 'value', ([key3],)),
 
1050
            (key3, 'value', ([],)),
 
1051
            ])
 
1052
        # We already know about key2, so we won't try to search for key3
 
1053
        parent_map = {key2: (key3,)}
 
1054
        missing_keys = set()
 
1055
        search_keys = index._find_ancestors([key1], 0, parent_map,
 
1056
                                            missing_keys)
 
1057
        self.assertEqual({key1: (key2,), key2: (key3,)}, parent_map)
 
1058
        self.assertEqual(set(), missing_keys)
 
1059
        self.assertEqual(set(), search_keys)
 
1060
 
 
1061
    def test__find_ancestors_multiple_pages(self):
 
1062
        # We need to use enough keys that we actually cause a split
 
1063
        start_time = 1249671539
 
1064
        email = "joebob@example.com"
 
1065
        nodes = []
 
1066
        ref_lists = ((),)
 
1067
        rev_keys = []
 
1068
        for i in xrange(400):
 
1069
            rev_id = '%s-%s-%s' % (email,
 
1070
                                   osutils.compact_date(start_time + i),
 
1071
                                   osutils.rand_chars(16))
 
1072
            rev_key = (rev_id,)
 
1073
            nodes.append((rev_key, 'value', ref_lists))
 
1074
            # We have a ref 'list' of length 1, with a list of parents, with 1
 
1075
            # parent which is a key
 
1076
            ref_lists = ((rev_key,),)
 
1077
            rev_keys.append(rev_key)
 
1078
        index = self.make_index(ref_lists=1, key_elements=1, nodes=nodes)
 
1079
        self.assertEqual(400, index.key_count())
 
1080
        self.assertEqual(3, len(index._row_offsets))
 
1081
        nodes = dict(index._read_nodes([1, 2]))
 
1082
        l1 = nodes[1]
 
1083
        l2 = nodes[2]
 
1084
        min_l2_key = l2.min_key
 
1085
        max_l1_key = l1.max_key
 
1086
        self.assertTrue(max_l1_key < min_l2_key)
 
1087
        parents_min_l2_key = l2.keys[min_l2_key][1][0]
 
1088
        self.assertEqual((l1.max_key,), parents_min_l2_key)
 
1089
        # Now, whatever key we select that would fall on the second page,
 
1090
        # should give us all the parents until the page break
 
1091
        key_idx = rev_keys.index(min_l2_key)
 
1092
        next_key = rev_keys[key_idx+1]
 
1093
        # So now when we get the parent map, we should get the key we are
 
1094
        # looking for, min_l2_key, and then a reference to go look for the
 
1095
        # parent of that key
 
1096
        parent_map = {}
 
1097
        missing_keys = set()
 
1098
        search_keys = index._find_ancestors([next_key], 0, parent_map,
 
1099
                                            missing_keys)
 
1100
        self.assertEqual([min_l2_key, next_key], sorted(parent_map))
 
1101
        self.assertEqual(set(), missing_keys)
 
1102
        self.assertEqual(set([max_l1_key]), search_keys)
 
1103
        parent_map = {}
 
1104
        search_keys = index._find_ancestors([max_l1_key], 0, parent_map,
 
1105
                                            missing_keys)
 
1106
        self.assertEqual(sorted(l1.keys), sorted(parent_map))
 
1107
        self.assertEqual(set(), missing_keys)
 
1108
        self.assertEqual(set(), search_keys)
 
1109
 
 
1110
    def test__find_ancestors_empty_index(self):
 
1111
        index = self.make_index(ref_lists=1, key_elements=1, nodes=[])
 
1112
        parent_map = {}
 
1113
        missing_keys = set()
 
1114
        search_keys = index._find_ancestors([('one',), ('two',)], 0, parent_map,
 
1115
                                            missing_keys)
 
1116
        self.assertEqual(set(), search_keys)
 
1117
        self.assertEqual({}, parent_map)
 
1118
        self.assertEqual(set([('one',), ('two',)]), missing_keys)
 
1119
 
 
1120
    def test_supports_unlimited_cache(self):
 
1121
        builder = btree_index.BTreeBuilder(reference_lists=0, key_elements=1)
 
1122
        # We need enough nodes to cause a page split (so we have both an
 
1123
        # internal node and a couple leaf nodes. 500 seems to be enough.)
 
1124
        nodes = self.make_nodes(500, 1, 0)
 
1125
        for node in nodes:
 
1126
            builder.add_node(*node)
 
1127
        stream = builder.finish()
 
1128
        trans = get_transport(self.get_url())
 
1129
        size = trans.put_file('index', stream)
 
1130
        index = btree_index.BTreeGraphIndex(trans, 'index', size)
 
1131
        self.assertEqual(500, index.key_count())
 
1132
        # We have an internal node
 
1133
        self.assertEqual(2, len(index._row_lengths))
 
1134
        # We have at least 2 leaf nodes
 
1135
        self.assertTrue(index._row_lengths[-1] >= 2)
 
1136
        self.assertIsInstance(index._leaf_node_cache, lru_cache.LRUCache)
 
1137
        self.assertEqual(btree_index._NODE_CACHE_SIZE,
 
1138
                         index._leaf_node_cache._max_cache)
 
1139
        self.assertIsInstance(index._internal_node_cache, fifo_cache.FIFOCache)
 
1140
        self.assertEqual(100, index._internal_node_cache._max_cache)
 
1141
        # No change if unlimited_cache=False is passed
 
1142
        index = btree_index.BTreeGraphIndex(trans, 'index', size,
 
1143
                                            unlimited_cache=False)
 
1144
        self.assertIsInstance(index._leaf_node_cache, lru_cache.LRUCache)
 
1145
        self.assertEqual(btree_index._NODE_CACHE_SIZE,
 
1146
                         index._leaf_node_cache._max_cache)
 
1147
        self.assertIsInstance(index._internal_node_cache, fifo_cache.FIFOCache)
 
1148
        self.assertEqual(100, index._internal_node_cache._max_cache)
 
1149
        index = btree_index.BTreeGraphIndex(trans, 'index', size,
 
1150
                                            unlimited_cache=True)
 
1151
        self.assertIsInstance(index._leaf_node_cache, dict)
 
1152
        self.assertIs(type(index._internal_node_cache), dict)
 
1153
        # Exercise the lookup code
 
1154
        entries = set(index.iter_entries([n[0] for n in nodes]))
 
1155
        self.assertEqual(500, len(entries))
 
1156
 
983
1157
 
984
1158
class TestBTreeNodes(BTreeTestCase):
985
1159