~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/check.py

  • Committer: mbp at sourcefrog
  • Date: 2005-03-21 22:29:49 UTC
  • Revision ID: mbp@sourcefrog.net-20050321222949-232c2093a6eadd80
fixup doctest for new module structure

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
#! /usr/bin/python
 
2
 
 
3
 
1
4
# Copyright (C) 2004, 2005 by Martin Pool
2
5
# Copyright (C) 2005 by Canonical Ltd
3
6
 
 
7
 
4
8
# This program is free software; you can redistribute it and/or modify
5
9
# it under the terms of the GNU General Public License as published by
6
10
# the Free Software Foundation; either version 2 of the License, or
20
24
######################################################################
21
25
# consistency checks
22
26
 
23
 
def check(branch, progress=True):
24
 
    import sys
25
 
 
26
 
    from bzrlib.trace import mutter
27
 
    from bzrlib.errors import BzrCheckError
28
 
    from bzrlib.osutils import fingerprint_file
29
 
    
30
 
    out = sys.stdout
31
 
 
32
 
    # TODO: factor out
33
 
    if not (hasattr(out, 'isatty') and out.isatty()):
34
 
        progress=False
35
 
 
36
 
    if progress:
37
 
        def p(m):
38
 
            mutter('checking ' + m)
39
 
            out.write('\rchecking: %-50.50s' % m)
40
 
            out.flush()
41
 
    else:
42
 
        def p(m):
43
 
            mutter('checking ' + m)
44
 
 
45
 
    p('history of %r' % branch.base)
46
 
    last_ptr = None
47
 
    checked_revs = {}
48
 
    
49
 
    history = branch.revision_history()
50
 
    revno = 0
51
 
    revcount = len(history)
52
 
 
53
 
    checked_texts = {}
54
 
    
55
 
    for rid in history:
56
 
        revno += 1
57
 
        p('revision %d/%d' % (revno, revcount))
58
 
        mutter('    revision {%s}' % rid)
59
 
        rev = branch.get_revision(rid)
60
 
        if rev.revision_id != rid:
61
 
            raise BzrCheckError('wrong internal revision id in revision {%s}' % rid)
62
 
        if rev.precursor != last_ptr:
63
 
            raise BzrCheckError('mismatched precursor in revision {%s}' % rid)
64
 
        last_ptr = rid
65
 
        if rid in checked_revs:
66
 
            raise BzrCheckError('repeated revision {%s}' % rid)
67
 
        checked_revs[rid] = True
68
 
 
69
 
        ## TODO: Check all the required fields are present on the revision.
70
 
 
71
 
        inv = branch.get_inventory(rev.inventory_id)
72
 
        seen_ids = {}
73
 
        seen_names = {}
74
 
 
75
 
        p('revision %d/%d file ids' % (revno, revcount))
76
 
        for file_id in inv:
77
 
            if file_id in seen_ids:
78
 
                raise BzrCheckError('duplicated file_id {%s} in inventory for revision {%s}'
79
 
                        % (file_id, rid))
80
 
            seen_ids[file_id] = True
81
 
 
82
 
        i = 0
83
 
        len_inv = len(inv)
84
 
        for file_id in inv:
85
 
            i += 1
86
 
            if (i % 100) == 0:
87
 
                p('revision %d/%d file text %d/%d' % (revno, revcount, i, len_inv))
88
 
 
89
 
            ie = inv[file_id]
90
 
 
91
 
            if ie.parent_id != None:
92
 
                if ie.parent_id not in seen_ids:
93
 
                    raise BzrCheckError('missing parent {%s} in inventory for revision {%s}'
94
 
                            % (ie.parent_id, rid))
95
 
 
96
 
            if ie.kind == 'file':
97
 
                if ie.text_id in checked_texts:
98
 
                    fp = checked_texts[ie.text_id]
99
 
                else:
100
 
                    if not ie.text_id in branch.text_store:
101
 
                        raise BzrCheckError('text {%s} not in text_store' % ie.text_id)
102
 
 
103
 
                    tf = branch.text_store[ie.text_id]
104
 
                    fp = fingerprint_file(tf)
105
 
                    checked_texts[ie.text_id] = fp
106
 
 
107
 
                if ie.text_size != fp['size']:
108
 
                    raise BzrCheckError('text {%s} wrong size' % ie.text_id)
109
 
                if ie.text_sha1 != fp['sha1']:
110
 
                    raise BzrCheckError('text {%s} wrong sha1' % ie.text_id)
111
 
            elif ie.kind == 'directory':
112
 
                if ie.text_sha1 != None or ie.text_size != None or ie.text_id != None:
113
 
                    raise BzrCheckError('directory {%s} has text in revision {%s}'
114
 
                            % (file_id, rid))
115
 
 
116
 
        p('revision %d/%d file paths' % (revno, revcount))
117
 
        for path, ie in inv.iter_entries():
118
 
            if path in seen_names:
119
 
                raise BzrCheckError('duplicated path %r in inventory for revision {%s}' % (path, revid))
120
 
            seen_names[path] = True
121
 
 
122
 
 
123
 
    p('done')
124
 
    if progress:
125
 
        print 
126
 
    print 'checked %d revisions, %d file texts' % (revcount, len(checked_texts))
 
27
def check():
 
28
    """Consistency check of tree."""
 
29
    assert_in_tree()
 
30
    mutter("checking tree")
 
31
    check_patches_exist()
 
32
    check_patch_chaining()
 
33
    check_patch_uniqueness()
 
34
    check_inventory()
 
35
    mutter("tree looks OK")
 
36
    ## TODO: Check that previous-inventory and previous-manifest
 
37
    ## are the same as those stored in the previous changeset.
 
38
 
 
39
    ## TODO: Check all patches present in patch directory are
 
40
    ## mentioned in patch history; having an orphaned patch only gives
 
41
    ## a warning.
 
42
 
 
43
    ## TODO: Check cached data is consistent with data reconstructed
 
44
    ## from scratch.
 
45
 
 
46
    ## TODO: Check no control files are versioned.
 
47
 
 
48
    ## TODO: Check that the before-hash of each file in a later
 
49
    ## revision matches the after-hash in the previous revision to
 
50
    ## touch it.
 
51
 
 
52
 
 
53
def check_inventory():
 
54
    mutter("checking inventory file and ids...")
 
55
    seen_ids = Set()
 
56
    seen_names = Set()
 
57
    
 
58
    for l in controlfile('inventory').readlines():
 
59
        parts = l.split()
 
60
        if len(parts) != 2:
 
61
            bailout("malformed inventory line: " + `l`)
 
62
        file_id, name = parts
 
63
        
 
64
        if file_id in seen_ids:
 
65
            bailout("duplicated file id " + file_id)
 
66
        seen_ids.add(file_id)
 
67
 
 
68
        if name in seen_names:
 
69
            bailout("duplicated file name in inventory: " + quotefn(name))
 
70
        seen_names.add(name)
 
71
        
 
72
        if is_control_file(name):
 
73
            raise BzrError("control file %s present in inventory" % quotefn(name))
 
74
 
 
75
 
 
76
def check_patches_exist():
 
77
    """Check constraint of current version: all patches exist"""
 
78
    mutter("checking all patches are present...")
 
79
    for pid in revision_history():
 
80
        read_patch_header(pid)
 
81
 
 
82
 
 
83
def check_patch_chaining():
 
84
    """Check ancestry of patches and history file is consistent"""
 
85
    mutter("checking patch chaining...")
 
86
    prev = None
 
87
    for pid in revision_history():
 
88
        log_prev = read_patch_header(pid).precursor
 
89
        if log_prev != prev:
 
90
            bailout("inconsistent precursor links on " + pid)
 
91
        prev = pid
 
92
 
 
93
 
 
94
def check_patch_uniqueness():
 
95
    """Make sure no patch is listed twice in the history.
 
96
 
 
97
    This should be implied by having correct ancestry but I'll check it
 
98
    anyhow."""
 
99
    mutter("checking history for duplicates...")
 
100
    seen = Set()
 
101
    for pid in revision_history():
 
102
        if pid in seen:
 
103
            bailout("patch " + pid + " appears twice in history")
 
104
        seen.add(pid)
 
105
        
127
106