~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/check.py

  • Committer: Robert Collins
  • Date: 2005-08-25 01:16:45 UTC
  • mto: (974.1.50) (1185.1.10) (1092.3.1)
  • mto: This revision was merged to the branch mainline in revision 1139.
  • Revision ID: robertc@robertcollins.net-20050825011645-d05861385ffcab32
test adding lists of paths

Show diffs side-by-side

added added

removed removed

Lines of Context:
15
15
# along with this program; if not, write to the Free Software
16
16
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
17
17
 
18
 
 
19
 
 
20
 
######################################################################
21
 
# consistency checks
22
 
 
23
 
import sys
24
 
from sets import Set
25
 
 
26
 
import bzrlib
27
 
from trace import mutter
28
 
from errors import bailout
29
 
import osutils
30
 
 
31
 
def check(branch, progress=True):
32
 
    out = sys.stdout
33
 
 
34
 
    if progress:
35
 
        def p(m):
36
 
            mutter('checking ' + m)
37
 
            out.write('\rchecking: %-50.50s' % m)
38
 
            out.flush()
39
 
    else:
40
 
        def p(m):
41
 
            mutter('checking ' + m)
42
 
 
43
 
    p('history of %r' % branch.base)
44
 
    last_ptr = None
45
 
    checked_revs = Set()
46
 
    
47
 
    history = branch.revision_history()
48
 
    revno = 0
49
 
    revcount = len(history)
50
 
 
51
 
    checked_texts = {}
52
 
    
53
 
    for rid in history:
54
 
        revno += 1
55
 
        p('revision %d/%d' % (revno, revcount))
56
 
        mutter('    revision {%s}' % rid)
57
 
        rev = branch.get_revision(rid)
58
 
        if rev.revision_id != rid:
59
 
            bailout('wrong internal revision id in revision {%s}' % rid)
60
 
        if rev.precursor != last_ptr:
61
 
            bailout('mismatched precursor in revision {%s}' % rid)
62
 
        last_ptr = rid
63
 
        if rid in checked_revs:
64
 
            bailout('repeated revision {%s}' % rid)
65
 
        checked_revs.add(rid)
66
 
 
67
 
        ## TODO: Check all the required fields are present on the revision.
68
 
 
69
 
        inv = branch.get_inventory(rev.inventory_id)
70
 
        seen_ids = Set()
71
 
        seen_names = Set()
72
 
 
73
 
        p('revision %d/%d file ids' % (revno, revcount))
74
 
        for file_id in inv:
75
 
            if file_id in seen_ids:
76
 
                bailout('duplicated file_id {%s} in inventory for revision {%s}'
77
 
                        % (file_id, revid))
78
 
            seen_ids.add(file_id)
79
 
 
80
 
        i = 0
81
 
        len_inv = len(inv)
82
 
        for file_id in inv:
83
 
            i += 1
84
 
            if (i % 100) == 0:
85
 
                p('revision %d/%d file text %d/%d' % (revno, revcount, i, len_inv))
86
 
 
87
 
            ie = inv[file_id]
88
 
 
89
 
            if ie.parent_id != None:
90
 
                if ie.parent_id not in seen_ids:
91
 
                    bailout('missing parent {%s} in inventory for revision {%s}'
92
 
                            % (ie.parent_id, revid))
93
 
 
94
 
            if ie.kind == 'file':
95
 
                if ie.text_id in checked_texts:
96
 
                    fp = checked_texts[ie.text_id]
 
18
import bzrlib.ui
 
19
 
 
20
def _update_store_entry(obj, obj_id, branch, store_name, store):
 
21
    """This is just a meta-function, which handles both revision entries
 
22
    and inventory entries.
 
23
    """
 
24
    from bzrlib.trace import mutter
 
25
    import tempfile, os, errno
 
26
    from osutils import rename
 
27
    obj_tmp = tempfile.TemporaryFile()
 
28
    obj.write_xml(obj_tmp)
 
29
    obj_tmp.seek(0)
 
30
 
 
31
    tmpfd, tmp_path = tempfile.mkstemp(prefix=obj_id, suffix='.gz',
 
32
        dir=branch.controlfilename(store_name))
 
33
    os.close(tmpfd)
 
34
    try:
 
35
        orig_obj_path = branch.controlfilename([store_name, obj_id+'.gz'])
 
36
        # Remove the old entry out of the way
 
37
        rename(orig_obj_path, tmp_path)
 
38
        try:
 
39
            # TODO: We may need to handle the case where the old
 
40
            # entry was not compressed (and thus did not end with .gz)
 
41
 
 
42
            store.add(obj_tmp, obj_id) # Add the new one
 
43
            os.remove(tmp_path) # Remove the old name
 
44
            mutter('    Updated %s entry {%s}' % (store_name, obj_id))
 
45
        except:
 
46
            # On any exception, restore the old entry
 
47
            rename(tmp_path, orig_obj_path)
 
48
            raise
 
49
    finally:
 
50
        if os.path.exists(tmp_path):
 
51
            # Unfortunately, the next command might throw
 
52
            # an exception, which will mask a previous exception.
 
53
            os.remove(tmp_path)
 
54
        obj_tmp.close()
 
55
 
 
56
def _update_revision_entry(rev, branch):
 
57
    """After updating the values in a revision, make sure to
 
58
    write out the data, but try to do it in an atomic manner.
 
59
 
 
60
    :param rev:    The Revision object to store
 
61
    :param branch: The Branch object where this Revision is to be stored.
 
62
    """
 
63
    _update_store_entry(rev, rev.revision_id, branch,
 
64
            'revision-store', branch.revision_store)
 
65
 
 
66
def _update_inventory_entry(inv, inv_id, branch):
 
67
    """When an inventory has been modified (such as by adding a unique tree root)
 
68
    this atomically re-generates the file.
 
69
 
 
70
    :param inv:     The Inventory
 
71
    :param inv_id:  The inventory id for this inventory
 
72
    :param branch:  The Branch where this entry will be stored.
 
73
    """
 
74
    _update_store_entry(inv, inv_id, branch,
 
75
            'inventory-store', branch.inventory_store)
 
76
 
 
77
 
 
78
def check(branch):
 
79
    """Run consistency checks on a branch.
 
80
 
 
81
    TODO: Also check non-mainline revisions mentioned as parents.
 
82
 
 
83
    TODO: Check for extra files in the control directory.
 
84
    """
 
85
    from bzrlib.trace import mutter
 
86
    from bzrlib.errors import BzrCheckError
 
87
    from bzrlib.osutils import fingerprint_file
 
88
    from bzrlib.inventory import ROOT_ID
 
89
    from bzrlib.branch import gen_root_id
 
90
 
 
91
    branch.lock_read()
 
92
 
 
93
    try:
 
94
        last_rev_id = None
 
95
 
 
96
        missing_inventory_sha_cnt = 0
 
97
        missing_revision_sha_cnt = 0
 
98
 
 
99
        history = branch.revision_history()
 
100
        revno = 0
 
101
        revcount = len(history)
 
102
        mismatch_inv_id = []
 
103
 
 
104
        # for all texts checked, text_id -> sha1
 
105
        checked_texts = {}
 
106
 
 
107
        progress = bzrlib.ui.ui_factory.progress_bar()
 
108
 
 
109
        for rev_id in history:
 
110
            revno += 1
 
111
            progress.update('checking revision', revno, revcount)
 
112
            # mutter('    revision {%s}' % rev_id)
 
113
            rev = branch.get_revision(rev_id)
 
114
            if rev.revision_id != rev_id:
 
115
                raise BzrCheckError('wrong internal revision id in revision {%s}'
 
116
                                    % rev_id)
 
117
 
 
118
            # check the previous history entry is a parent of this entry
 
119
            if rev.parents:
 
120
                if last_rev_id is None:
 
121
                    raise BzrCheckError("revision {%s} has %d parents, but is the "
 
122
                                        "start of the branch"
 
123
                                        % (rev_id, len(rev.parents)))
 
124
                for prr in rev.parents:
 
125
                    if prr.revision_id == last_rev_id:
 
126
                        break
97
127
                else:
98
 
                    if not ie.text_id in branch.text_store:
99
 
                        bailout('text {%s} not in text_store' % ie.text_id)
100
 
 
101
 
                    tf = branch.text_store[ie.text_id]
102
 
                    fp = osutils.fingerprint_file(tf)
103
 
                    checked_texts[ie.text_id] = fp
104
 
 
105
 
                if ie.text_size != fp['size']:
106
 
                    bailout('text {%s} wrong size' % ie.text_id)
107
 
                if ie.text_sha1 != fp['sha1']:
108
 
                    bailout('text {%s} wrong sha1' % ie.text_id)
109
 
            elif ie.kind == 'directory':
110
 
                if ie.text_sha1 != None or ie.text_size != None or ie.text_id != None:
111
 
                    bailout('directory {%s} has text in revision {%s}'
112
 
                            % (file_id, revid))
113
 
 
114
 
        p('revision %d/%d file paths' % (revno, revcount))
115
 
        for path, ie in inv.iter_entries():
116
 
            if path in seen_names:
117
 
                bailout('duplicated path %r in inventory for revision {%s}' % (path, revid))
118
 
            seen_names.add(path)
119
 
 
120
 
 
121
 
    p('done')
122
 
    if progress:
123
 
        print 
124
 
 
125
 
 
 
128
                    raise BzrCheckError("previous revision {%s} not listed among "
 
129
                                        "parents of {%s}"
 
130
                                        % (last_rev_id, rev_id))
 
131
 
 
132
                for prr in rev.parents:
 
133
                    if prr.revision_sha1 is None:
 
134
                        missing_revision_sha_cnt += 1
 
135
                        continue
 
136
                    prid = prr.revision_id
 
137
                    actual_sha = branch.get_revision_sha1(prid)
 
138
                    if prr.revision_sha1 != actual_sha:
 
139
                        raise BzrCheckError("mismatched revision sha1 for "
 
140
                                            "parent {%s} of {%s}: %s vs %s"
 
141
                                            % (prid, rev_id,
 
142
                                               prr.revision_sha1, actual_sha))
 
143
            elif last_rev_id:
 
144
                raise BzrCheckError("revision {%s} has no parents listed but preceded "
 
145
                                    "by {%s}"
 
146
                                    % (rev_id, last_rev_id))
 
147
 
 
148
            if rev.inventory_id != rev_id:
 
149
                mismatch_inv_id.append(rev_id)
 
150
 
 
151
            ## TODO: Check all the required fields are present on the revision.
 
152
 
 
153
            if rev.inventory_sha1:
 
154
                inv_sha1 = branch.get_inventory_sha1(rev.inventory_id)
 
155
                if inv_sha1 != rev.inventory_sha1:
 
156
                    raise BzrCheckError('Inventory sha1 hash doesn\'t match'
 
157
                        ' value in revision {%s}' % rev_id)
 
158
            else:
 
159
                missing_inventory_sha_cnt += 1
 
160
                mutter("no inventory_sha1 on revision {%s}" % rev_id)
 
161
 
 
162
            inv = branch.get_inventory(rev.inventory_id)
 
163
            seen_ids = {}
 
164
            seen_names = {}
 
165
 
 
166
            ## p('revision %d/%d file ids' % (revno, revcount))
 
167
            for file_id in inv:
 
168
                if file_id in seen_ids:
 
169
                    raise BzrCheckError('duplicated file_id {%s} '
 
170
                                        'in inventory for revision {%s}'
 
171
                                        % (file_id, rev_id))
 
172
                seen_ids[file_id] = True
 
173
 
 
174
            i = 0
 
175
            for file_id in inv:
 
176
                i += 1
 
177
                if i & 31 == 0:
 
178
                    progress.tick()
 
179
 
 
180
                ie = inv[file_id]
 
181
 
 
182
                if ie.parent_id != None:
 
183
                    if ie.parent_id not in seen_ids:
 
184
                        raise BzrCheckError('missing parent {%s} in inventory for revision {%s}'
 
185
                                % (ie.parent_id, rev_id))
 
186
 
 
187
                if ie.kind == 'file':
 
188
                    if ie.text_id in checked_texts:
 
189
                        fp = checked_texts[ie.text_id]
 
190
                    else:
 
191
                        if not ie.text_id in branch.text_store:
 
192
                            raise BzrCheckError('text {%s} not in text_store' % ie.text_id)
 
193
 
 
194
                        tf = branch.text_store[ie.text_id]
 
195
                        fp = fingerprint_file(tf)
 
196
                        checked_texts[ie.text_id] = fp
 
197
 
 
198
                    if ie.text_size != fp['size']:
 
199
                        raise BzrCheckError('text {%s} wrong size' % ie.text_id)
 
200
                    if ie.text_sha1 != fp['sha1']:
 
201
                        raise BzrCheckError('text {%s} wrong sha1' % ie.text_id)
 
202
                elif ie.kind == 'directory':
 
203
                    if ie.text_sha1 != None or ie.text_size != None or ie.text_id != None:
 
204
                        raise BzrCheckError('directory {%s} has text in revision {%s}'
 
205
                                % (file_id, rev_id))
 
206
 
 
207
            progress.tick()
 
208
            for path, ie in inv.iter_entries():
 
209
                if path in seen_names:
 
210
                    raise BzrCheckError('duplicated path %s '
 
211
                                        'in inventory for revision {%s}'
 
212
                                        % (path, rev_id))
 
213
            seen_names[path] = True
 
214
            last_rev_id = rev_id
 
215
 
 
216
    finally:
 
217
        branch.unlock()
 
218
 
 
219
    progress.clear()
 
220
 
 
221
    print 'checked %d revisions, %d file texts' % (revcount, len(checked_texts))
 
222
    
 
223
    if missing_inventory_sha_cnt:
 
224
        print '%d revisions are missing inventory_sha1' % missing_inventory_sha_cnt
 
225
 
 
226
    if missing_revision_sha_cnt:
 
227
        print '%d parent links are missing revision_sha1' % missing_revision_sha_cnt
 
228
 
 
229
    # stub this out for now because the main bzr branch has references
 
230
    # to revisions that aren't present in the store -- mbp 20050804
 
231
#    if (missing_inventory_sha_cnt
 
232
#        or missing_revision_sha_cnt):
 
233
#        print '  (use "bzr upgrade" to fix them)'
 
234
 
 
235
    if mismatch_inv_id:
 
236
        print '%d revisions have mismatched inventory ids:' % len(mismatch_inv_id)
 
237
        for rev_id in mismatch_inv_id:
 
238
            print '  ', rev_id