~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/check.py

  • Committer: Martin Pool
  • Date: 2005-03-12 08:54:12 UTC
  • Revision ID: mbp@sourcefrog.net-20050312085412-13373aa129ccbad3
doc: notes on implementing codeville-style merge on
top of a weave; looks nice but opens a can of worms

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
#! /usr/bin/python
 
2
 
 
3
 
1
4
# Copyright (C) 2004, 2005 by Martin Pool
2
5
# Copyright (C) 2005 by Canonical Ltd
3
6
 
 
7
 
4
8
# This program is free software; you can redistribute it and/or modify
5
9
# it under the terms of the GNU General Public License as published by
6
10
# the Free Software Foundation; either version 2 of the License, or
15
19
# along with this program; if not, write to the Free Software
16
20
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
17
21
 
18
 
import bzrlib.ui
19
 
from bzrlib.trace import note, warning
20
 
 
21
 
def _update_store_entry(obj, obj_id, branch, store_name, store):
22
 
    """This is just a meta-function, which handles both revision entries
23
 
    and inventory entries.
24
 
    """
25
 
    from bzrlib.trace import mutter
26
 
    import tempfile, os, errno
27
 
    from osutils import rename
28
 
    obj_tmp = tempfile.TemporaryFile()
29
 
    obj.write_xml(obj_tmp)
30
 
    obj_tmp.seek(0)
31
 
 
32
 
    tmpfd, tmp_path = tempfile.mkstemp(prefix=obj_id, suffix='.gz',
33
 
        dir=branch.controlfilename(store_name))
34
 
    os.close(tmpfd)
35
 
    try:
36
 
        orig_obj_path = branch.controlfilename([store_name, obj_id+'.gz'])
37
 
        # Remove the old entry out of the way
38
 
        rename(orig_obj_path, tmp_path)
39
 
        try:
40
 
            # TODO: We may need to handle the case where the old
41
 
            # entry was not compressed (and thus did not end with .gz)
42
 
 
43
 
            store.add(obj_tmp, obj_id) # Add the new one
44
 
            os.remove(tmp_path) # Remove the old name
45
 
            mutter('    Updated %s entry {%s}' % (store_name, obj_id))
46
 
        except:
47
 
            # On any exception, restore the old entry
48
 
            rename(tmp_path, orig_obj_path)
49
 
            raise
50
 
    finally:
51
 
        if os.path.exists(tmp_path):
52
 
            # Unfortunately, the next command might throw
53
 
            # an exception, which will mask a previous exception.
54
 
            os.remove(tmp_path)
55
 
        obj_tmp.close()
56
 
 
57
 
def _update_revision_entry(rev, branch):
58
 
    """After updating the values in a revision, make sure to
59
 
    write out the data, but try to do it in an atomic manner.
60
 
 
61
 
    :param rev:    The Revision object to store
62
 
    :param branch: The Branch object where this Revision is to be stored.
63
 
    """
64
 
    _update_store_entry(rev, rev.revision_id, branch,
65
 
            'revision-store', branch.revision_store)
66
 
 
67
 
def _update_inventory_entry(inv, inv_id, branch):
68
 
    """When an inventory has been modified (such as by adding a unique tree root)
69
 
    this atomically re-generates the file.
70
 
 
71
 
    :param inv:     The Inventory
72
 
    :param inv_id:  The inventory id for this inventory
73
 
    :param branch:  The Branch where this entry will be stored.
74
 
    """
75
 
    _update_store_entry(inv, inv_id, branch,
76
 
            'inventory-store', branch.inventory_store)
77
 
 
78
 
 
79
 
def check(branch):
80
 
    """Run consistency checks on a branch.
81
 
 
82
 
    TODO: Also check non-mainline revisions mentioned as parents.
83
 
 
84
 
    TODO: Check for extra files in the control directory.
85
 
    """
86
 
    from bzrlib.trace import mutter
87
 
    from bzrlib.errors import BzrCheckError, NoSuchRevision
88
 
    from bzrlib.osutils import fingerprint_file
89
 
    from bzrlib.inventory import ROOT_ID
90
 
    from bzrlib.branch import gen_root_id
91
 
 
92
 
    branch.lock_read()
93
 
 
94
 
    try:
95
 
        last_rev_id = None
96
 
 
97
 
        missing_inventory_sha_cnt = 0
98
 
        missing_revision_sha_cnt = 0
99
 
        missing_revision_cnt = 0
100
 
 
101
 
        history = branch.revision_history()
102
 
        revno = 0
103
 
        revcount = len(history)
104
 
        mismatch_inv_id = []
105
 
 
106
 
        # for all texts checked, text_id -> sha1
107
 
        checked_texts = {}
108
 
 
109
 
        progress = bzrlib.ui.ui_factory.progress_bar()
110
 
 
111
 
        for rev_id in history:
112
 
            revno += 1
113
 
            progress.update('checking revision', revno, revcount)
114
 
            # mutter('    revision {%s}' % rev_id)
115
 
            rev = branch.get_revision(rev_id)
116
 
            if rev.revision_id != rev_id:
117
 
                raise BzrCheckError('wrong internal revision id in revision {%s}'
118
 
                                    % rev_id)
119
 
 
120
 
            # check the previous history entry is a parent of this entry
121
 
            if rev.parents:
122
 
                if last_rev_id is None:
123
 
                    raise BzrCheckError("revision {%s} has %d parents, but is the "
124
 
                                        "start of the branch"
125
 
                                        % (rev_id, len(rev.parents)))
126
 
                for prr in rev.parents:
127
 
                    if prr.revision_id == last_rev_id:
128
 
                        break
129
 
                else:
130
 
                    raise BzrCheckError("previous revision {%s} not listed among "
131
 
                                        "parents of {%s}"
132
 
                                        % (last_rev_id, rev_id))
133
 
 
134
 
                for prr in rev.parents:
135
 
                    if prr.revision_sha1 is None:
136
 
                        missing_revision_sha_cnt += 1
137
 
                        continue
138
 
                    prid = prr.revision_id
139
 
                    
140
 
                    try:
141
 
                        actual_sha = branch.get_revision_sha1(prid)
142
 
                    except NoSuchRevision:
143
 
                        missing_revision_cnt += 1
144
 
                        mutter("parent {%s} of {%s} not present in store",
145
 
                               prid, rev_id)
146
 
                        continue
147
 
                        
148
 
                    if prr.revision_sha1 != actual_sha:
149
 
                        raise BzrCheckError("mismatched revision sha1 for "
150
 
                                            "parent {%s} of {%s}: %s vs %s"
151
 
                                            % (prid, rev_id,
152
 
                                               prr.revision_sha1, actual_sha))
153
 
            elif last_rev_id:
154
 
                raise BzrCheckError("revision {%s} has no parents listed but preceded "
155
 
                                    "by {%s}"
156
 
                                    % (rev_id, last_rev_id))
157
 
 
158
 
            if rev.inventory_id != rev_id:
159
 
                mismatch_inv_id.append(rev_id)
160
 
 
161
 
            ## TODO: Check all the required fields are present on the revision.
162
 
 
163
 
            if rev.inventory_sha1:
164
 
                inv_sha1 = branch.get_inventory_sha1(rev.inventory_id)
165
 
                if inv_sha1 != rev.inventory_sha1:
166
 
                    raise BzrCheckError('Inventory sha1 hash doesn\'t match'
167
 
                        ' value in revision {%s}' % rev_id)
168
 
            else:
169
 
                missing_inventory_sha_cnt += 1
170
 
                mutter("no inventory_sha1 on revision {%s}" % rev_id)
171
 
 
172
 
            inv = branch.get_inventory(rev.inventory_id)
173
 
            seen_ids = {}
174
 
            seen_names = {}
175
 
 
176
 
            ## p('revision %d/%d file ids' % (revno, revcount))
177
 
            for file_id in inv:
178
 
                if file_id in seen_ids:
179
 
                    raise BzrCheckError('duplicated file_id {%s} '
180
 
                                        'in inventory for revision {%s}'
181
 
                                        % (file_id, rev_id))
182
 
                seen_ids[file_id] = True
183
 
 
184
 
            i = 0
185
 
            for file_id in inv:
186
 
                i += 1
187
 
                if i & 31 == 0:
188
 
                    progress.tick()
189
 
 
190
 
                ie = inv[file_id]
191
 
 
192
 
                if ie.parent_id != None:
193
 
                    if ie.parent_id not in seen_ids:
194
 
                        raise BzrCheckError('missing parent {%s} in inventory for revision {%s}'
195
 
                                % (ie.parent_id, rev_id))
196
 
 
197
 
                if ie.kind == 'file':
198
 
                    if ie.text_id in checked_texts:
199
 
                        fp = checked_texts[ie.text_id]
200
 
                    else:
201
 
                        if not ie.text_id in branch.text_store:
202
 
                            raise BzrCheckError('text {%s} not in text_store' % ie.text_id)
203
 
 
204
 
                        tf = branch.text_store[ie.text_id]
205
 
                        fp = fingerprint_file(tf)
206
 
                        checked_texts[ie.text_id] = fp
207
 
 
208
 
                    if ie.text_size != fp['size']:
209
 
                        raise BzrCheckError('text {%s} wrong size' % ie.text_id)
210
 
                    if ie.text_sha1 != fp['sha1']:
211
 
                        raise BzrCheckError('text {%s} wrong sha1' % ie.text_id)
212
 
                elif ie.kind == 'directory':
213
 
                    if ie.text_sha1 != None or ie.text_size != None or ie.text_id != None:
214
 
                        raise BzrCheckError('directory {%s} has text in revision {%s}'
215
 
                                % (file_id, rev_id))
216
 
 
217
 
            progress.tick()
218
 
            for path, ie in inv.iter_entries():
219
 
                if path in seen_names:
220
 
                    raise BzrCheckError('duplicated path %s '
221
 
                                        'in inventory for revision {%s}'
222
 
                                        % (path, rev_id))
223
 
            seen_names[path] = True
224
 
            last_rev_id = rev_id
225
 
 
226
 
    finally:
227
 
        branch.unlock()
228
 
 
229
 
    progress.clear()
230
 
 
231
 
    note('checked %d revisions, %d file texts' % (revcount, len(checked_texts)))
 
22
 
 
23
 
 
24
######################################################################
 
25
# consistency checks
 
26
 
 
27
def check():
 
28
    """Consistency check of tree."""
 
29
    assert_in_tree()
 
30
    mutter("checking tree")
 
31
    check_patches_exist()
 
32
    check_patch_chaining()
 
33
    check_patch_uniqueness()
 
34
    check_inventory()
 
35
    mutter("tree looks OK")
 
36
    ## TODO: Check that previous-inventory and previous-manifest
 
37
    ## are the same as those stored in the previous changeset.
 
38
 
 
39
    ## TODO: Check all patches present in patch directory are
 
40
    ## mentioned in patch history; having an orphaned patch only gives
 
41
    ## a warning.
 
42
 
 
43
    ## TODO: Check cached data is consistent with data reconstructed
 
44
    ## from scratch.
 
45
 
 
46
    ## TODO: Check no control files are versioned.
 
47
 
 
48
    ## TODO: Check that the before-hash of each file in a later
 
49
    ## revision matches the after-hash in the previous revision to
 
50
    ## touch it.
 
51
 
 
52
 
 
53
def check_inventory():
 
54
    mutter("checking inventory file and ids...")
 
55
    seen_ids = Set()
 
56
    seen_names = Set()
232
57
    
233
 
    if missing_inventory_sha_cnt:
234
 
        note('%d revisions are missing inventory_sha1' % missing_inventory_sha_cnt)
235
 
 
236
 
    if missing_revision_sha_cnt:
237
 
        note('%d parent links are missing revision_sha1' % missing_revision_sha_cnt)
238
 
 
239
 
    if missing_revision_cnt:
240
 
        note('%d revisions are mentioned but not present' % missing_revision_cnt)
241
 
 
242
 
    if missing_revision_cnt:
243
 
        print '%d revisions are mentioned but not present' % missing_revision_cnt
244
 
 
245
 
    # stub this out for now because the main bzr branch has references
246
 
    # to revisions that aren't present in the store -- mbp 20050804
247
 
#    if (missing_inventory_sha_cnt
248
 
#        or missing_revision_sha_cnt):
249
 
#        print '  (use "bzr upgrade" to fix them)'
250
 
 
251
 
    if mismatch_inv_id:
252
 
        warning('%d revisions have mismatched inventory ids:' % len(mismatch_inv_id))
253
 
        for rev_id in mismatch_inv_id:
254
 
            warning('  %s', rev_id)
 
58
    for l in controlfile('inventory').readlines():
 
59
        parts = l.split()
 
60
        if len(parts) != 2:
 
61
            bailout("malformed inventory line: " + `l`)
 
62
        file_id, name = parts
 
63
        
 
64
        if file_id in seen_ids:
 
65
            bailout("duplicated file id " + file_id)
 
66
        seen_ids.add(file_id)
 
67
 
 
68
        if name in seen_names:
 
69
            bailout("duplicated file name in inventory: " + quotefn(name))
 
70
        seen_names.add(name)
 
71
        
 
72
        if is_control_file(name):
 
73
            raise BzrError("control file %s present in inventory" % quotefn(name))
 
74
 
 
75
 
 
76
def check_patches_exist():
 
77
    """Check constraint of current version: all patches exist"""
 
78
    mutter("checking all patches are present...")
 
79
    for pid in revision_history():
 
80
        read_patch_header(pid)
 
81
 
 
82
 
 
83
def check_patch_chaining():
 
84
    """Check ancestry of patches and history file is consistent"""
 
85
    mutter("checking patch chaining...")
 
86
    prev = None
 
87
    for pid in revision_history():
 
88
        log_prev = read_patch_header(pid).precursor
 
89
        if log_prev != prev:
 
90
            bailout("inconsistent precursor links on " + pid)
 
91
        prev = pid
 
92
 
 
93
 
 
94
def check_patch_uniqueness():
 
95
    """Make sure no patch is listed twice in the history.
 
96
 
 
97
    This should be implied by having correct ancestry but I'll check it
 
98
    anyhow."""
 
99
    mutter("checking history for duplicates...")
 
100
    seen = Set()
 
101
    for pid in revision_history():
 
102
        if pid in seen:
 
103
            bailout("patch " + pid + " appears twice in history")
 
104
        seen.add(pid)
 
105
        
 
106