~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/dirstate.py

  • Committer: Canonical.com Patch Queue Manager
  • Date: 2007-11-04 18:51:39 UTC
  • mfrom: (2961.1.1 trunk)
  • Revision ID: pqm@pqm.ubuntu.com-20071104185139-kaio3sneodg2kp71
Authentication ring implementation (read-only)

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2006, 2007, 2008 Canonical Ltd
 
1
# Copyright (C) 2006, 2007 Canonical Ltd
2
2
#
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
212
212
import zlib
213
213
 
214
214
from bzrlib import (
215
 
    cache_utf8,
216
215
    debug,
217
216
    errors,
218
217
    inventory,
250
249
 
251
250
    A dirstate is a specialised data structure for managing local working
252
251
    tree state information. Its not yet well defined whether it is platform
253
 
    specific, and if it is how we detect/parameterize that.
 
252
    specific, and if it is how we detect/parameterise that.
254
253
 
255
254
    Dirstates use the usual lock_write, lock_read and unlock mechanisms.
256
255
    Unlike most bzr disk formats, DirStates must be locked for reading, using
306
305
    def __init__(self, path):
307
306
        """Create a  DirState object.
308
307
 
 
308
        Attributes of note:
 
309
 
 
310
        :attr _root_entrie: The root row of the directory/file information,
 
311
            - contains the path to / - '', ''
 
312
            - kind of 'directory',
 
313
            - the file id of the root in utf8
 
314
            - size of 0
 
315
            - a packed state
 
316
            - and no sha information.
309
317
        :param path: The path at which the dirstate file on disk should live.
310
318
        """
311
319
        # _header_state and _dirblock_state represent the current state
321
329
        # modified states.
322
330
        self._header_state = DirState.NOT_IN_MEMORY
323
331
        self._dirblock_state = DirState.NOT_IN_MEMORY
324
 
        # If true, an error has been detected while updating the dirstate, and 
325
 
        # for safety we're not going to commit to disk.
326
 
        self._changes_aborted = False
327
332
        self._dirblocks = []
328
333
        self._ghosts = []
329
334
        self._parents = []
393
398
        # faster than three separate encodes.
394
399
        utf8path = (dirname + '/' + basename).strip('/').encode('utf8')
395
400
        dirname, basename = osutils.split(utf8path)
396
 
        # uses __class__ for speed; the check is needed for safety
397
 
        if file_id.__class__ is not str:
398
 
            raise AssertionError(
399
 
                "must be a utf8 file_id not %s" % (type(file_id), ))
 
401
        assert file_id.__class__ == str, \
 
402
            "must be a utf8 file_id not %s" % (type(file_id))
400
403
        # Make sure the file_id does not exist in this tree
401
404
        file_id_entry = self._get_entry(0, fileid_utf8=file_id)
402
405
        if file_id_entry != (None, None):
458
461
        if not present:
459
462
            block.insert(entry_index, entry_data)
460
463
        else:
461
 
            if block[entry_index][1][0][0] != 'a':
462
 
                raise AssertionError(" %r(%r) already added" % (basename, file_id))
 
464
            assert block[entry_index][1][0][0] == 'a', " %r(%r) already added" % (basename, file_id)
463
465
            block[entry_index][1][0] = entry_data[1][0]
464
466
 
465
467
        if kind == 'directory':
484
486
        # If _dirblock_state was in memory, we should just return info from
485
487
        # there, this function is only meant to handle when we want to read
486
488
        # part of the disk.
487
 
        if self._dirblock_state != DirState.NOT_IN_MEMORY:
488
 
            raise AssertionError("bad dirblock state %r" % self._dirblock_state)
 
489
        assert self._dirblock_state == DirState.NOT_IN_MEMORY
489
490
 
490
491
        # The disk representation is generally info + '\0\n\0' at the end. But
491
492
        # for bisecting, it is easier to treat this as '\0' + info + '\0\n'
677
678
        # If _dirblock_state was in memory, we should just return info from
678
679
        # there, this function is only meant to handle when we want to read
679
680
        # part of the disk.
680
 
        if self._dirblock_state != DirState.NOT_IN_MEMORY:
681
 
            raise AssertionError("bad dirblock state %r" % self._dirblock_state)
 
681
        assert self._dirblock_state == DirState.NOT_IN_MEMORY
 
682
 
682
683
        # The disk representation is generally info + '\0\n\0' at the end. But
683
684
        # for bisecting, it is easier to treat this as '\0' + info + '\0\n'
684
685
        # Because it means we can sync on the '\n'
898
899
            processed_dirs.update(pending_dirs)
899
900
        return found
900
901
 
901
 
    def _discard_merge_parents(self):
902
 
        """Discard any parents trees beyond the first.
903
 
        
904
 
        Note that if this fails the dirstate is corrupted.
905
 
 
906
 
        After this function returns the dirstate contains 2 trees, neither of
907
 
        which are ghosted.
908
 
        """
909
 
        self._read_header_if_needed()
910
 
        parents = self.get_parent_ids()
911
 
        if len(parents) < 1:
912
 
            return
913
 
        # only require all dirblocks if we are doing a full-pass removal.
914
 
        self._read_dirblocks_if_needed()
915
 
        dead_patterns = set([('a', 'r'), ('a', 'a'), ('r', 'r'), ('r', 'a')])
916
 
        def iter_entries_removable():
917
 
            for block in self._dirblocks:
918
 
                deleted_positions = []
919
 
                for pos, entry in enumerate(block[1]):
920
 
                    yield entry
921
 
                    if (entry[1][0][0], entry[1][1][0]) in dead_patterns:
922
 
                        deleted_positions.append(pos)
923
 
                if deleted_positions:
924
 
                    if len(deleted_positions) == len(block[1]):
925
 
                        del block[1][:]
926
 
                    else:
927
 
                        for pos in reversed(deleted_positions):
928
 
                            del block[1][pos]
929
 
        # if the first parent is a ghost:
930
 
        if parents[0] in self.get_ghosts():
931
 
            empty_parent = [DirState.NULL_PARENT_DETAILS]
932
 
            for entry in iter_entries_removable():
933
 
                entry[1][1:] = empty_parent
934
 
        else:
935
 
            for entry in iter_entries_removable():
936
 
                del entry[1][2:]
937
 
 
938
 
        self._ghosts = []
939
 
        self._parents = [parents[0]]
940
 
        self._dirblock_state = DirState.IN_MEMORY_MODIFIED
941
 
        self._header_state = DirState.IN_MEMORY_MODIFIED
942
 
 
943
902
    def _empty_parent_info(self):
944
903
        return [DirState.NULL_PARENT_DETAILS] * (len(self._parents) -
945
904
                                                    len(self._ghosts))
971
930
        # the basename of the directory must be the end of its full name.
972
931
        if not (parent_block_index == -1 and
973
932
            parent_block_index == -1 and dirname == ''):
974
 
            if not dirname.endswith(
975
 
                    self._dirblocks[parent_block_index][1][parent_row_index][0][1]):
976
 
                raise AssertionError("bad dirname %r" % dirname)
 
933
            assert dirname.endswith(
 
934
                self._dirblocks[parent_block_index][1][parent_row_index][0][1])
977
935
        block_index, present = self._find_block_index_from_key((dirname, '', ''))
978
936
        if not present:
979
937
            ## In future, when doing partial parsing, this should load and 
991
949
            to prevent unneeded overhead when callers have a sorted list already.
992
950
        :return: Nothing.
993
951
        """
994
 
        if new_entries[0][0][0:2] != ('', ''):
995
 
            raise AssertionError(
996
 
                "Missing root row %r" % (new_entries[0][0],))
 
952
        assert new_entries[0][0][0:2] == ('', ''), \
 
953
            "Missing root row %r" % (new_entries[0][0],)
997
954
        # The two blocks here are deliberate: the root block and the 
998
955
        # contents-of-root block.
999
956
        self._dirblocks = [('', []), ('', [])]
1021
978
        # The above loop leaves the "root block" entries mixed with the
1022
979
        # "contents-of-root block". But we don't want an if check on
1023
980
        # all entries, so instead we just fix it up here.
1024
 
        if self._dirblocks[1] != ('', []):
1025
 
            raise ValueError("bad dirblock start %r" % (self._dirblocks[1],))
 
981
        assert self._dirblocks[1] == ('', [])
1026
982
        root_block = []
1027
983
        contents_of_root_block = []
1028
984
        for entry in self._dirblocks[0][1]:
1173
1129
            raise
1174
1130
        return result
1175
1131
 
1176
 
    def update_by_delta(self, delta):
1177
 
        """Apply an inventory delta to the dirstate for tree 0
1178
 
 
1179
 
        :param delta: An inventory delta.  See Inventory.apply_delta for
1180
 
            details.
1181
 
        """
1182
 
        self._read_dirblocks_if_needed()
1183
 
        insertions = {}
1184
 
        removals = {}
1185
 
        for old_path, new_path, file_id, inv_entry in sorted(delta, reverse=True):
1186
 
            if (file_id in insertions) or (file_id in removals):
1187
 
                raise AssertionError("repeated file id in delta %r" % (file_id,))
1188
 
            if old_path is not None:
1189
 
                old_path = old_path.encode('utf-8')
1190
 
                removals[file_id] = old_path
1191
 
            if new_path is not None:
1192
 
                new_path = new_path.encode('utf-8')
1193
 
                dirname, basename = osutils.split(new_path)
1194
 
                key = (dirname, basename, file_id)
1195
 
                minikind = DirState._kind_to_minikind[inv_entry.kind]
1196
 
                if minikind == 't':
1197
 
                    fingerprint = inv_entry.reference_revision
1198
 
                else:
1199
 
                    fingerprint = ''
1200
 
                insertions[file_id] = (key, minikind, inv_entry.executable,
1201
 
                                       fingerprint, new_path)
1202
 
            # Transform moves into delete+add pairs
1203
 
            if None not in (old_path, new_path):
1204
 
                for child in self._iter_child_entries(0, old_path):
1205
 
                    if child[0][2] in insertions or child[0][2] in removals:
1206
 
                        continue
1207
 
                    child_dirname = child[0][0]
1208
 
                    child_basename = child[0][1]
1209
 
                    minikind = child[1][0][0]
1210
 
                    fingerprint = child[1][0][4]
1211
 
                    executable = child[1][0][3]
1212
 
                    old_child_path = osutils.pathjoin(child[0][0],
1213
 
                                                      child[0][1])
1214
 
                    removals[child[0][2]] = old_child_path
1215
 
                    child_suffix = child_dirname[len(old_path):]
1216
 
                    new_child_dirname = (new_path + child_suffix)
1217
 
                    key = (new_child_dirname, child_basename, child[0][2])
1218
 
                    new_child_path = os.path.join(new_child_dirname,
1219
 
                                                  child_basename)
1220
 
                    insertions[child[0][2]] = (key, minikind, executable,
1221
 
                                               fingerprint, new_child_path)
1222
 
        self._apply_removals(removals.values())
1223
 
        self._apply_insertions(insertions.values())
1224
 
 
1225
 
    def _apply_removals(self, removals):
1226
 
        for path in sorted(removals, reverse=True):
1227
 
            dirname, basename = osutils.split(path)
1228
 
            block_i, entry_i, d_present, f_present = \
1229
 
                self._get_block_entry_index(dirname, basename, 0)
1230
 
            entry = self._dirblocks[block_i][1][entry_i]
1231
 
            self._make_absent(entry)
1232
 
            # See if we have a malformed delta: deleting a directory must not
1233
 
            # leave crud behind. This increases the number of bisects needed
1234
 
            # substantially, but deletion or renames of large numbers of paths
1235
 
            # is rare enough it shouldn't be an issue (famous last words?) RBC
1236
 
            # 20080730.
1237
 
            block_i, entry_i, d_present, f_present = \
1238
 
                self._get_block_entry_index(path, '', 0)
1239
 
            if d_present:
1240
 
                # The dir block is still present in the dirstate; this could
1241
 
                # be due to it being in a parent tree, or a corrupt delta.
1242
 
                for child_entry in self._dirblocks[block_i][1]:
1243
 
                    if child_entry[1][0][0] not in ('r', 'a'):
1244
 
                        raise errors.InconsistentDelta(path, entry[0][2],
1245
 
                            "The file id was deleted but its children were "
1246
 
                            "not deleted.")
1247
 
 
1248
 
    def _apply_insertions(self, adds):
1249
 
        for key, minikind, executable, fingerprint, path_utf8 in sorted(adds):
1250
 
            self.update_minimal(key, minikind, executable, fingerprint,
1251
 
                                path_utf8=path_utf8)
1252
 
 
1253
 
    def update_basis_by_delta(self, delta, new_revid):
1254
 
        """Update the parents of this tree after a commit.
1255
 
 
1256
 
        This gives the tree one parent, with revision id new_revid. The
1257
 
        inventory delta is applied to the current basis tree to generate the
1258
 
        inventory for the parent new_revid, and all other parent trees are
1259
 
        discarded.
1260
 
 
1261
 
        Note that an exception during the operation of this method will leave
1262
 
        the dirstate in a corrupt state where it should not be saved.
1263
 
 
1264
 
        Finally, we expect all changes to be synchronising the basis tree with
1265
 
        the working tree.
1266
 
 
1267
 
        :param new_revid: The new revision id for the trees parent.
1268
 
        :param delta: An inventory delta (see apply_inventory_delta) describing
1269
 
            the changes from the current left most parent revision to new_revid.
1270
 
        """
1271
 
        self._read_dirblocks_if_needed()
1272
 
        self._discard_merge_parents()
1273
 
        if self._ghosts != []:
1274
 
            raise NotImplementedError(self.update_basis_by_delta)
1275
 
        if len(self._parents) == 0:
1276
 
            # setup a blank tree, the most simple way.
1277
 
            empty_parent = DirState.NULL_PARENT_DETAILS
1278
 
            for entry in self._iter_entries():
1279
 
                entry[1].append(empty_parent)
1280
 
            self._parents.append(new_revid)
1281
 
 
1282
 
        self._parents[0] = new_revid
1283
 
 
1284
 
        delta = sorted(delta, reverse=True)
1285
 
        adds = []
1286
 
        changes = []
1287
 
        deletes = []
1288
 
        # The paths this function accepts are unicode and must be encoded as we
1289
 
        # go.
1290
 
        encode = cache_utf8.encode
1291
 
        inv_to_entry = self._inv_entry_to_details
1292
 
        # delta is now (deletes, changes), (adds) in reverse lexographical
1293
 
        # order.
1294
 
        # deletes in reverse lexographic order are safe to process in situ.
1295
 
        # renames are not, as a rename from any path could go to a path
1296
 
        # lexographically lower, so we transform renames into delete, add pairs,
1297
 
        # expanding them recursively as needed.
1298
 
        # At the same time, to reduce interface friction we convert the input
1299
 
        # inventory entries to dirstate.
1300
 
        root_only = ('', '')
1301
 
        for old_path, new_path, file_id, inv_entry in delta:
1302
 
            if old_path is None:
1303
 
                adds.append((None, encode(new_path), file_id,
1304
 
                    inv_to_entry(inv_entry), True))
1305
 
            elif new_path is None:
1306
 
                deletes.append((encode(old_path), None, file_id, None, True))
1307
 
            elif (old_path, new_path) != root_only:
1308
 
                # Renames:
1309
 
                # Because renames must preserve their children we must have
1310
 
                # processed all relocations and removes before hand. The sort
1311
 
                # order ensures we've examined the child paths, but we also
1312
 
                # have to execute the removals, or the split to an add/delete
1313
 
                # pair will result in the deleted item being reinserted, or
1314
 
                # renamed items being reinserted twice - and possibly at the
1315
 
                # wrong place. Splitting into a delete/add pair also simplifies
1316
 
                # the handling of entries with ('f', ...), ('r' ...) because
1317
 
                # the target of the 'r' is old_path here, and we add that to
1318
 
                # deletes, meaning that the add handler does not need to check
1319
 
                # for 'r' items on every pass.
1320
 
                self._update_basis_apply_deletes(deletes)
1321
 
                deletes = []
1322
 
                new_path_utf8 = encode(new_path)
1323
 
                # Split into an add/delete pair recursively.
1324
 
                adds.append((None, new_path_utf8, file_id,
1325
 
                    inv_to_entry(inv_entry), False))
1326
 
                # Expunge deletes that we've seen so that deleted/renamed
1327
 
                # children of a rename directory are handled correctly.
1328
 
                new_deletes = reversed(list(self._iter_child_entries(1,
1329
 
                    encode(old_path))))
1330
 
                # Remove the current contents of the tree at orig_path, and
1331
 
                # reinsert at the correct new path.
1332
 
                for entry in new_deletes:
1333
 
                    if entry[0][0]:
1334
 
                        source_path = entry[0][0] + '/' + entry[0][1]
1335
 
                    else:
1336
 
                        source_path = entry[0][1]
1337
 
                    if new_path_utf8:
1338
 
                        target_path = new_path_utf8 + source_path[len(old_path):]
1339
 
                    else:
1340
 
                        if old_path == '':
1341
 
                            raise AssertionError("cannot rename directory to"
1342
 
                                " itself")
1343
 
                        target_path = source_path[len(old_path) + 1:]
1344
 
                    adds.append((None, target_path, entry[0][2], entry[1][1], False))
1345
 
                    deletes.append(
1346
 
                        (source_path, target_path, entry[0][2], None, False))
1347
 
                deletes.append(
1348
 
                    (encode(old_path), new_path, file_id, None, False))
1349
 
            else:
1350
 
                # changes to just the root should not require remove/insertion
1351
 
                # of everything.
1352
 
                changes.append((encode(old_path), encode(new_path), file_id,
1353
 
                    inv_to_entry(inv_entry)))
1354
 
 
1355
 
        # Finish expunging deletes/first half of renames.
1356
 
        self._update_basis_apply_deletes(deletes)
1357
 
        # Reinstate second half of renames and new paths.
1358
 
        self._update_basis_apply_adds(adds)
1359
 
        # Apply in-situ changes.
1360
 
        self._update_basis_apply_changes(changes)
1361
 
 
1362
 
        self._dirblock_state = DirState.IN_MEMORY_MODIFIED
1363
 
        self._header_state = DirState.IN_MEMORY_MODIFIED
1364
 
        self._id_index = None
1365
 
        return
1366
 
 
1367
 
    def _update_basis_apply_adds(self, adds):
1368
 
        """Apply a sequence of adds to tree 1 during update_basis_by_delta.
1369
 
 
1370
 
        They may be adds, or renames that have been split into add/delete
1371
 
        pairs.
1372
 
 
1373
 
        :param adds: A sequence of adds. Each add is a tuple:
1374
 
            (None, new_path_utf8, file_id, (entry_details), real_add). real_add
1375
 
            is False when the add is the second half of a remove-and-reinsert
1376
 
            pair created to handle renames and deletes.
1377
 
        """
1378
 
        # Adds are accumulated partly from renames, so can be in any input
1379
 
        # order - sort it.
1380
 
        adds.sort()
1381
 
        # adds is now in lexographic order, which places all parents before
1382
 
        # their children, so we can process it linearly.
1383
 
        absent = 'ar'
1384
 
        for old_path, new_path, file_id, new_details, real_add in adds:
1385
 
            # the entry for this file_id must be in tree 0.
1386
 
            entry = self._get_entry(0, file_id, new_path)
1387
 
            if entry[0] is None or entry[0][2] != file_id:
1388
 
                self._changes_aborted = True
1389
 
                raise errors.InconsistentDelta(new_path, file_id,
1390
 
                    'working tree does not contain new entry')
1391
 
            if real_add and entry[1][1][0] not in absent:
1392
 
                self._changes_aborted = True
1393
 
                raise errors.InconsistentDelta(new_path, file_id,
1394
 
                    'The entry was considered to be a genuinely new record,'
1395
 
                    ' but there was already an old record for it.')
1396
 
            # We don't need to update the target of an 'r' because the handling
1397
 
            # of renames turns all 'r' situations into a delete at the original
1398
 
            # location.
1399
 
            entry[1][1] = new_details
1400
 
 
1401
 
    def _update_basis_apply_changes(self, changes):
1402
 
        """Apply a sequence of changes to tree 1 during update_basis_by_delta.
1403
 
 
1404
 
        :param adds: A sequence of changes. Each change is a tuple:
1405
 
            (path_utf8, path_utf8, file_id, (entry_details))
1406
 
        """
1407
 
        absent = 'ar'
1408
 
        for old_path, new_path, file_id, new_details in changes:
1409
 
            # the entry for this file_id must be in tree 0.
1410
 
            entry = self._get_entry(0, file_id, new_path)
1411
 
            if entry[0] is None or entry[0][2] != file_id:
1412
 
                self._changes_aborted = True
1413
 
                raise errors.InconsistentDelta(new_path, file_id,
1414
 
                    'working tree does not contain new entry')
1415
 
            if (entry[1][0][0] in absent or
1416
 
                entry[1][1][0] in absent):
1417
 
                self._changes_aborted = True
1418
 
                raise errors.InconsistentDelta(new_path, file_id,
1419
 
                    'changed considered absent')
1420
 
            entry[1][1] = new_details
1421
 
 
1422
 
    def _update_basis_apply_deletes(self, deletes):
1423
 
        """Apply a sequence of deletes to tree 1 during update_basis_by_delta.
1424
 
 
1425
 
        They may be deletes, or renames that have been split into add/delete
1426
 
        pairs.
1427
 
 
1428
 
        :param deletes: A sequence of deletes. Each delete is a tuple:
1429
 
            (old_path_utf8, new_path_utf8, file_id, None, real_delete).
1430
 
            real_delete is True when the desired outcome is an actual deletion
1431
 
            rather than the rename handling logic temporarily deleting a path
1432
 
            during the replacement of a parent.
1433
 
        """
1434
 
        null = DirState.NULL_PARENT_DETAILS
1435
 
        for old_path, new_path, file_id, _, real_delete in deletes:
1436
 
            if real_delete != (new_path is None):
1437
 
                raise AssertionError("bad delete delta")
1438
 
            # the entry for this file_id must be in tree 1.
1439
 
            dirname, basename = osutils.split(old_path)
1440
 
            block_index, entry_index, dir_present, file_present = \
1441
 
                self._get_block_entry_index(dirname, basename, 1)
1442
 
            if not file_present:
1443
 
                self._changes_aborted = True
1444
 
                raise errors.InconsistentDelta(old_path, file_id,
1445
 
                    'basis tree does not contain removed entry')
1446
 
            entry = self._dirblocks[block_index][1][entry_index]
1447
 
            if entry[0][2] != file_id:
1448
 
                self._changes_aborted = True
1449
 
                raise errors.InconsistentDelta(old_path, file_id,
1450
 
                    'mismatched file_id in tree 1')
1451
 
            if real_delete:
1452
 
                if entry[1][0][0] != 'a':
1453
 
                    self._changes_aborted = True
1454
 
                    raise errors.InconsistentDelta(old_path, file_id,
1455
 
                            'This was marked as a real delete, but the WT state'
1456
 
                            ' claims that it still exists and is versioned.')
1457
 
                del self._dirblocks[block_index][1][entry_index]
1458
 
            else:
1459
 
                if entry[1][0][0] == 'a':
1460
 
                    self._changes_aborted = True
1461
 
                    raise errors.InconsistentDelta(old_path, file_id,
1462
 
                        'The entry was considered a rename, but the source path'
1463
 
                        ' is marked as absent.')
1464
 
                    # For whatever reason, we were asked to rename an entry
1465
 
                    # that was originally marked as deleted. This could be
1466
 
                    # because we are renaming the parent directory, and the WT
1467
 
                    # current state has the file marked as deleted.
1468
 
                elif entry[1][0][0] == 'r':
1469
 
                    # implement the rename
1470
 
                    del self._dirblocks[block_index][1][entry_index]
1471
 
                else:
1472
 
                    # it is being resurrected here, so blank it out temporarily.
1473
 
                    self._dirblocks[block_index][1][entry_index][1][1] = null
1474
 
 
1475
1132
    def update_entry(self, entry, abspath, stat_value,
1476
1133
                     _stat_to_minikind=_stat_to_minikind,
1477
1134
                     _pack_stat=pack_stat):
1731
1388
        # linear search through entries at this path to find the one
1732
1389
        # requested.
1733
1390
        while entry_index < len(block) and block[entry_index][0][1] == basename:
1734
 
            if block[entry_index][1][tree_index][0] not in 'ar':
1735
 
                # neither absent or relocated
 
1391
            if block[entry_index][1][tree_index][0] not in \
 
1392
                       ('a', 'r'): # absent, relocated
1736
1393
                return block_index, entry_index, True, True
1737
1394
            entry_index += 1
1738
1395
        return block_index, entry_index, True, False
1755
1412
        """
1756
1413
        self._read_dirblocks_if_needed()
1757
1414
        if path_utf8 is not None:
1758
 
            if type(path_utf8) is not str:
1759
 
                raise AssertionError('path_utf8 is not a str: %s %s'
1760
 
                    % (type(path_utf8), path_utf8))
 
1415
            assert path_utf8.__class__ == str, ('path_utf8 is not a str: %s %s'
 
1416
                % (type(path_utf8), path_utf8))
1761
1417
            # path lookups are faster
1762
1418
            dirname, basename = osutils.split(path_utf8)
1763
1419
            block_index, entry_index, dir_present, file_present = \
1765
1421
            if not file_present:
1766
1422
                return None, None
1767
1423
            entry = self._dirblocks[block_index][1][entry_index]
1768
 
            if not (entry[0][2] and entry[1][tree_index][0] not in ('a', 'r')):
1769
 
                raise AssertionError('unversioned entry?')
 
1424
            assert entry[0][2] and entry[1][tree_index][0] not in ('a', 'r'), 'unversioned entry?!?!'
1770
1425
            if fileid_utf8:
1771
1426
                if entry[0][2] != fileid_utf8:
1772
 
                    self._changes_aborted = True
1773
1427
                    raise errors.BzrError('integrity error ? : mismatching'
1774
1428
                                          ' tree_index, file_id and path')
1775
1429
            return entry
1776
1430
        else:
 
1431
            assert fileid_utf8 is not None
1777
1432
            possible_keys = self._get_id_index().get(fileid_utf8, None)
1778
1433
            if not possible_keys:
1779
1434
                return None, None
1798
1453
                    if entry[1][tree_index][0] == 'a':
1799
1454
                        # there is no home for this entry in this tree
1800
1455
                        return None, None
1801
 
                    if entry[1][tree_index][0] != 'r':
1802
 
                        raise AssertionError(
1803
 
                            "entry %r has invalid minikind %r for tree %r" \
1804
 
                            % (entry,
1805
 
                               entry[1][tree_index][0],
1806
 
                               tree_index))
 
1456
                    assert entry[1][tree_index][0] == 'r', \
 
1457
                        "entry %r has invalid minikind %r for tree %r" \
 
1458
                        % (entry,
 
1459
                           entry[1][tree_index][0],
 
1460
                           tree_index)
1807
1461
                    real_path = entry[1][tree_index][1]
1808
1462
                    return self._get_entry(tree_index, fileid_utf8=fileid_utf8,
1809
1463
                        path_utf8=real_path)
1841
1495
            raise
1842
1496
        return result
1843
1497
 
1844
 
    @staticmethod
1845
 
    def _inv_entry_to_details(inv_entry):
 
1498
    def _inv_entry_to_details(self, inv_entry):
1846
1499
        """Convert an inventory entry (from a revision tree) to state details.
1847
1500
 
1848
1501
        :param inv_entry: An inventory entry whose sha1 and link targets can be
1853
1506
        kind = inv_entry.kind
1854
1507
        minikind = DirState._kind_to_minikind[kind]
1855
1508
        tree_data = inv_entry.revision
 
1509
        assert tree_data, 'empty revision for the inv_entry %s.' % \
 
1510
            inv_entry.file_id
1856
1511
        if kind == 'directory':
1857
1512
            fingerprint = ''
1858
1513
            size = 0
1859
1514
            executable = False
1860
1515
        elif kind == 'symlink':
1861
 
            # We don't support non-ascii targets for symlinks yet.
1862
 
            fingerprint = str(inv_entry.symlink_target or '')
 
1516
            fingerprint = inv_entry.symlink_target or ''
1863
1517
            size = 0
1864
1518
            executable = False
1865
1519
        elif kind == 'file':
1874
1528
            raise Exception("can't pack %s" % inv_entry)
1875
1529
        return (minikind, fingerprint, size, executable, tree_data)
1876
1530
 
1877
 
    def _iter_child_entries(self, tree_index, path_utf8):
1878
 
        """Iterate over all the entries that are children of path_utf.
1879
 
 
1880
 
        This only returns entries that are present (not in 'a', 'r') in 
1881
 
        tree_index. tree_index data is not refreshed, so if tree 0 is used,
1882
 
        results may differ from that obtained if paths were statted to
1883
 
        determine what ones were directories.
1884
 
 
1885
 
        Asking for the children of a non-directory will return an empty
1886
 
        iterator.
1887
 
        """
1888
 
        pending_dirs = []
1889
 
        next_pending_dirs = [path_utf8]
1890
 
        absent = 'ar'
1891
 
        while next_pending_dirs:
1892
 
            pending_dirs = next_pending_dirs
1893
 
            next_pending_dirs = []
1894
 
            for path in pending_dirs:
1895
 
                block_index, present = self._find_block_index_from_key(
1896
 
                    (path, '', ''))
1897
 
                if block_index == 0:
1898
 
                    block_index = 1
1899
 
                    if len(self._dirblocks) == 1:
1900
 
                        # asked for the children of the root with no other
1901
 
                        # contents.
1902
 
                        return
1903
 
                if not present:
1904
 
                    # children of a non-directory asked for.
1905
 
                    continue
1906
 
                block = self._dirblocks[block_index]
1907
 
                for entry in block[1]:
1908
 
                    kind = entry[1][tree_index][0]
1909
 
                    if kind not in absent:
1910
 
                        yield entry
1911
 
                    if kind == 'd':
1912
 
                        if entry[0][0]:
1913
 
                            path = entry[0][0] + '/' + entry[0][1]
1914
 
                        else:
1915
 
                            path = entry[0][1]
1916
 
                        next_pending_dirs.append(path)
1917
 
    
1918
1531
    def _iter_entries(self):
1919
1532
        """Iterate over all the entries in the dirstate.
1920
1533
 
1992
1605
        parent_line = self._state_file.readline()
1993
1606
        info = parent_line.split('\0')
1994
1607
        num_parents = int(info[0])
 
1608
        assert num_parents == len(info)-2, 'incorrect parent info line'
1995
1609
        self._parents = info[1:-1]
 
1610
 
1996
1611
        ghost_line = self._state_file.readline()
1997
1612
        info = ghost_line.split('\0')
1998
1613
        num_ghosts = int(info[1])
 
1614
        assert num_ghosts == len(info)-3, 'incorrect ghost info line'
1999
1615
        self._ghosts = info[2:-1]
2000
1616
        self._header_state = DirState.IN_MEMORY_UNMODIFIED
2001
1617
        self._end_of_header = self._state_file.tell()
2018
1634
        and their ids. Followed by a newline.
2019
1635
        """
2020
1636
        header = self._state_file.readline()
2021
 
        if header != DirState.HEADER_FORMAT_3:
2022
 
            raise errors.BzrError(
2023
 
                'invalid header line: %r' % (header,))
 
1637
        assert header == DirState.HEADER_FORMAT_3, \
 
1638
            'invalid header line: %r' % (header,)
2024
1639
        crc_line = self._state_file.readline()
2025
 
        if not crc_line.startswith('crc32: '):
2026
 
            raise errors.BzrError('missing crc32 checksum: %r' % crc_line)
 
1640
        assert crc_line.startswith('crc32: '), 'missing crc32 checksum'
2027
1641
        self.crc_expected = int(crc_line[len('crc32: '):-1])
2028
1642
        num_entries_line = self._state_file.readline()
2029
 
        if not num_entries_line.startswith('num_entries: '):
2030
 
            raise errors.BzrError('missing num_entries line')
 
1643
        assert num_entries_line.startswith('num_entries: '), 'missing num_entries line'
2031
1644
        self._num_entries = int(num_entries_line[len('num_entries: '):-1])
2032
1645
 
2033
1646
    def sha1_from_stat(self, path, stat_result, _pack_stat=pack_stat):
2058
1671
        start over, to allow for fine grained read lock duration, so 'status'
2059
1672
        wont block 'commit' - for example.
2060
1673
        """
2061
 
        if self._changes_aborted:
2062
 
            # Should this be a warning? For now, I'm expecting that places that
2063
 
            # mark it inconsistent will warn, making a warning here redundant.
2064
 
            trace.mutter('Not saving DirState because '
2065
 
                    '_changes_aborted is set.')
2066
 
            return
2067
1674
        if (self._header_state == DirState.IN_MEMORY_MODIFIED or
2068
1675
            self._dirblock_state == DirState.IN_MEMORY_MODIFIED):
2069
1676
 
2121
1728
        :param new_id: The new id to assign to the path. This must be a utf8
2122
1729
            file id (not unicode, and not None).
2123
1730
        """
 
1731
        assert new_id.__class__ == str, \
 
1732
            "path_id %r is not a plain string" % (new_id,)
2124
1733
        self._read_dirblocks_if_needed()
2125
1734
        if len(path):
2126
1735
            # TODO: logic not written
2191
1800
        # one: the current tree
2192
1801
        for entry in self._iter_entries():
2193
1802
            # skip entries not in the current tree
2194
 
            if entry[1][0][0] in 'ar': # absent, relocated
 
1803
            if entry[1][0][0] in ('a', 'r'): # absent, relocated
2195
1804
                continue
2196
1805
            by_path[entry[0]] = [entry[1][0]] + \
2197
1806
                [DirState.NULL_PARENT_DETAILS] * parent_count
2327
1936
                return None
2328
1937
        while current_new or current_old:
2329
1938
            # skip entries in old that are not really there
2330
 
            if current_old and current_old[1][0][0] in 'ar':
 
1939
            if current_old and current_old[1][0][0] in ('r', 'a'):
2331
1940
                # relocated or absent
2332
1941
                current_old = advance(old_iterator)
2333
1942
                continue
2409
2018
        all_remaining_keys = set()
2410
2019
        # Dont check the working tree, because it's going.
2411
2020
        for details in current_old[1][1:]:
2412
 
            if details[0] not in 'ar': # absent, relocated
 
2021
            if details[0] not in ('a', 'r'): # absent, relocated
2413
2022
                all_remaining_keys.add(current_old[0])
2414
2023
            elif details[0] == 'r': # relocated
2415
2024
                # record the key for the real path.
2422
2031
            # Remove it, its meaningless.
2423
2032
            block = self._find_block(current_old[0])
2424
2033
            entry_index, present = self._find_entry_index(current_old[0], block[1])
2425
 
            if not present:
2426
 
                raise AssertionError('could not find entry for %s' % (current_old,))
 
2034
            assert present, 'could not find entry for %s' % (current_old,)
2427
2035
            block[1].pop(entry_index)
2428
2036
            # if we have an id_index in use, remove this key from it for this id.
2429
2037
            if self._id_index is not None:
2435
2043
        for update_key in all_remaining_keys:
2436
2044
            update_block_index, present = \
2437
2045
                self._find_block_index_from_key(update_key)
2438
 
            if not present:
2439
 
                raise AssertionError('could not find block for %s' % (update_key,))
 
2046
            assert present, 'could not find block for %s' % (update_key,)
2440
2047
            update_entry_index, present = \
2441
2048
                self._find_entry_index(update_key, self._dirblocks[update_block_index][1])
2442
 
            if not present:
2443
 
                raise AssertionError('could not find entry for %s' % (update_key,))
 
2049
            assert present, 'could not find entry for %s' % (update_key,)
2444
2050
            update_tree_details = self._dirblocks[update_block_index][1][update_entry_index][1]
2445
2051
            # it must not be absent at the moment
2446
 
            if update_tree_details[0][0] == 'a': # absent
2447
 
                raise AssertionError('bad row %r' % (update_tree_details,))
 
2052
            assert update_tree_details[0][0] != 'a' # absent
2448
2053
            update_tree_details[0] = DirState.NULL_PARENT_DETAILS
2449
2054
        self._dirblock_state = DirState.IN_MEMORY_MODIFIED
2450
2055
        return last_reference
2498
2103
                    # the test for existing kinds is different: this can be
2499
2104
                    # factored out to a helper though.
2500
2105
                    other_block_index, present = self._find_block_index_from_key(other_key)
2501
 
                    if not present:
2502
 
                        raise AssertionError('could not find block for %s' % (other_key,))
 
2106
                    assert present, 'could not find block for %s' % (other_key,)
2503
2107
                    other_entry_index, present = self._find_entry_index(other_key,
2504
2108
                                            self._dirblocks[other_block_index][1])
2505
 
                    if not present:
2506
 
                        raise AssertionError('could not find entry for %s' % (other_key,))
2507
 
                    if path_utf8 is None:
2508
 
                        raise AssertionError('no path')
 
2109
                    assert present, 'could not find entry for %s' % (other_key,)
 
2110
                    assert path_utf8 is not None
2509
2111
                    self._dirblocks[other_block_index][1][other_entry_index][1][0] = \
2510
2112
                        ('r', path_utf8, 0, False, '')
2511
2113
 
2517
2119
                    # records.
2518
2120
                    update_block_index, present = \
2519
2121
                        self._find_block_index_from_key(other_key)
2520
 
                    if not present:
2521
 
                        raise AssertionError('could not find block for %s' % (other_key,))
 
2122
                    assert present, 'could not find block for %s' % (other_key,)
2522
2123
                    update_entry_index, present = \
2523
2124
                        self._find_entry_index(other_key, self._dirblocks[update_block_index][1])
2524
 
                    if not present:
2525
 
                        raise AssertionError('could not find entry for %s' % (other_key,))
 
2125
                    assert present, 'could not find entry for %s' % (other_key,)
2526
2126
                    update_details = self._dirblocks[update_block_index][1][update_entry_index][1][lookup_index]
2527
 
                    if update_details[0] in 'ar': # relocated, absent
 
2127
                    if update_details[0] in ('r', 'a'): # relocated, absent
2528
2128
                        # its a pointer or absent in lookup_index's tree, use
2529
2129
                        # it as is.
2530
2130
                        new_entry[1].append(update_details)
2546
2146
            # we may have passed entries in the state with this file id already
2547
2147
            # that were absent - where parent entries are - and they need to be
2548
2148
            # converted to relocated.
2549
 
            if path_utf8 is None:
2550
 
                raise AssertionError('no path')
 
2149
            assert path_utf8 is not None
2551
2150
            for entry_key in id_index.setdefault(key[2], set()):
2552
2151
                # TODO:PROFILING: It might be faster to just update
2553
2152
                # rather than checking if we need to, and then overwrite
2558
2157
                    # This is the vertical axis in the matrix, all pointing
2559
2158
                    # to the real path.
2560
2159
                    block_index, present = self._find_block_index_from_key(entry_key)
2561
 
                    if not present:
2562
 
                        raise AssertionError('not present: %r', entry_key)
 
2160
                    assert present
2563
2161
                    entry_index, present = self._find_entry_index(entry_key, self._dirblocks[block_index][1])
2564
 
                    if not present:
2565
 
                        raise AssertionError('not present: %r', entry_key)
 
2162
                    assert present
2566
2163
                    self._dirblocks[block_index][1][entry_index][1][0] = \
2567
2164
                        ('r', path_utf8, 0, False, '')
2568
2165
        # add a containing dirblock if needed.
2599
2196
            if not self._dirblocks[0][0] == '':
2600
2197
                raise AssertionError(
2601
2198
                    "dirblocks don't start with root block:\n" + \
2602
 
                    pformat(self._dirblocks))
 
2199
                    pformat(dirblocks))
2603
2200
        if len(self._dirblocks) > 1:
2604
2201
            if not self._dirblocks[1][0] == '':
2605
2202
                raise AssertionError(
2606
2203
                    "dirblocks missing root directory:\n" + \
2607
 
                    pformat(self._dirblocks))
 
2204
                    pformat(dirblocks))
2608
2205
        # the dirblocks are sorted by their path components, name, and dir id
2609
2206
        dir_names = [d[0].split('/')
2610
2207
                for d in self._dirblocks[1:]]
2628
2225
                    "dirblock for %r is not sorted:\n%s" % \
2629
2226
                    (dirblock[0], pformat(dirblock)))
2630
2227
 
 
2228
 
2631
2229
        def check_valid_parent():
2632
2230
            """Check that the current entry has a valid parent.
2633
2231
 
2668
2266
                "wrong number of entry details for row\n%s" \
2669
2267
                ",\nexpected %d" % \
2670
2268
                (pformat(entry), tree_count))
2671
 
            absent_positions = 0
2672
2269
            for tree_index, tree_state in enumerate(entry[1]):
2673
2270
                this_tree_map = id_path_maps[tree_index]
2674
2271
                minikind = tree_state[0]
2675
 
                if minikind in 'ar':
2676
 
                    absent_positions += 1
2677
2272
                # have we seen this id before in this column?
2678
2273
                if file_id in this_tree_map:
2679
 
                    previous_path, previous_loc = this_tree_map[file_id]
 
2274
                    previous_path = this_tree_map[file_id]
2680
2275
                    # any later mention of this file must be consistent with
2681
2276
                    # what was said before
2682
2277
                    if minikind == 'a':
2696
2291
                        # pointed to by a relocation, which must point here
2697
2292
                        if previous_path != this_path:
2698
2293
                            raise AssertionError(
2699
 
                                "entry %r inconsistent with previous path %r "
2700
 
                                "seen at %r" %
2701
 
                                (entry, previous_path, previous_loc))
 
2294
                            "entry %r inconsistent with previous path %r" % \
 
2295
                            (entry, previous_path))
2702
2296
                        check_valid_parent()
2703
2297
                else:
2704
2298
                    if minikind == 'a':
2705
2299
                        # absent; should not occur anywhere else
2706
 
                        this_tree_map[file_id] = None, this_path
 
2300
                        this_tree_map[file_id] = None
2707
2301
                    elif minikind == 'r':
2708
2302
                        # relocation, must occur at expected location 
2709
 
                        this_tree_map[file_id] = tree_state[1], this_path
 
2303
                        this_tree_map[file_id] = tree_state[1]
2710
2304
                    else:
2711
 
                        this_tree_map[file_id] = this_path, this_path
 
2305
                        this_tree_map[file_id] = this_path
2712
2306
                        check_valid_parent()
2713
 
            if absent_positions == tree_count:
2714
 
                raise AssertionError(
2715
 
                    "entry %r has no data for any tree." % (entry,))
2716
2307
 
2717
2308
    def _wipe_state(self):
2718
2309
        """Forget all state information about the dirstate."""
2719
2310
        self._header_state = DirState.NOT_IN_MEMORY
2720
2311
        self._dirblock_state = DirState.NOT_IN_MEMORY
2721
 
        self._changes_aborted = False
2722
2312
        self._parents = []
2723
2313
        self._ghosts = []
2724
2314
        self._dirblocks = []