~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/hashcache.py

MergeĀ fromĀ jam-storage.

Show diffs side-by-side

added added

removed removed

Lines of Context:
23
23
# TODO: Perhaps return more details on the file to avoid statting it
24
24
# again: nonexistent, file type, size, etc
25
25
 
 
26
# TODO: Perhaps use a Python pickle instead of a text file; might be faster.
 
27
 
26
28
 
27
29
 
28
30
CACHE_HEADER = "### bzr hashcache v5\n"
29
31
 
30
32
import os, stat, time
 
33
import sha
31
34
 
32
35
from bzrlib.osutils import sha_file
33
36
from bzrlib.trace import mutter, warning
34
 
 
35
 
 
 
37
from bzrlib.atomicfile import AtomicFile
 
38
from bzrlib.osutils import pathjoin
 
39
 
 
40
 
 
41
FP_MODE_COLUMN = 5
36
42
 
37
43
def _fingerprint(abspath):
38
44
    try:
47
53
    # we discard any high precision because it's not reliable; perhaps we
48
54
    # could do better on some systems?
49
55
    return (fs.st_size, long(fs.st_mtime),
50
 
            long(fs.st_ctime), fs.st_ino, fs.st_dev)
 
56
            long(fs.st_ctime), fs.st_ino, fs.st_dev, fs.st_mode)
51
57
 
52
58
 
53
59
class HashCache(object):
96
102
        self.update_count = 0
97
103
        self._cache = {}
98
104
 
99
 
 
100
105
    def cache_file_name(self):
101
 
        return os.sep.join([self.basedir, '.bzr', 'stat-cache'])
102
 
 
103
 
 
104
 
 
 
106
        # FIXME: duplicate path logic here, this should be 
 
107
        # something like 'branch.controlfile'.
 
108
        return pathjoin(self.basedir, '.bzr', 'stat-cache')
105
109
 
106
110
    def clear(self):
107
111
        """Discard all cached information.
122
126
        prep.sort()
123
127
        
124
128
        for inum, path, cache_entry in prep:
125
 
            abspath = os.sep.join([self.basedir, path])
 
129
            abspath = pathjoin(self.basedir, path)
126
130
            fp = _fingerprint(abspath)
127
131
            self.stat_count += 1
128
132
            
135
139
                del self._cache[path]
136
140
 
137
141
 
138
 
 
139
142
    def get_sha1(self, path):
140
143
        """Return the sha1 of a file.
141
144
        """
142
 
        abspath = os.sep.join([self.basedir, path])
 
145
        abspath = pathjoin(self.basedir, path)
143
146
        self.stat_count += 1
144
147
        file_fp = _fingerprint(abspath)
145
148
        
161
164
            return cache_sha1
162
165
        
163
166
        self.miss_count += 1
164
 
        digest = sha_file(file(abspath, 'rb', buffering=65000))
 
167
 
 
168
 
 
169
        mode = file_fp[FP_MODE_COLUMN]
 
170
        if stat.S_ISREG(mode):
 
171
            digest = sha_file(file(abspath, 'rb', buffering=65000))
 
172
        elif stat.S_ISLNK(mode):
 
173
            link_target = os.readlink(abspath)
 
174
            digest = sha.new(os.readlink(abspath)).hexdigest()
 
175
        else:
 
176
            raise BzrError("file %r: unknown file stat mode: %o"%(abspath,mode))
165
177
 
166
178
        now = int(time.time())
167
179
        if file_fp[1] >= now or file_fp[2] >= now:
177
189
            self.update_count += 1
178
190
            self.needs_write = True
179
191
            self._cache[path] = (digest, file_fp)
180
 
        
181
192
        return digest
182
193
        
183
 
 
184
 
 
185
 
 
186
194
    def write(self):
187
195
        """Write contents of cache to file."""
188
 
        from atomicfile import AtomicFile
189
 
 
190
196
        outf = AtomicFile(self.cache_file_name(), 'wb')
191
197
        try:
192
198
            print >>outf, CACHE_HEADER,
205
211
        finally:
206
212
            if not outf.closed:
207
213
                outf.abort()
208
 
        
209
 
 
210
214
 
211
215
    def read(self):
212
216
        """Reinstate cache from file.
221
225
        try:
222
226
            inf = file(fn, 'rb', buffering=65000)
223
227
        except IOError, e:
224
 
            mutter("failed to open %s: %s" % (fn, e))
 
228
            mutter("failed to open %s: %s", fn, e)
 
229
            # better write it now so it is valid
 
230
            self.needs_write = True
225
231
            return
226
232
 
227
233
 
228
234
        hdr = inf.readline()
229
235
        if hdr != CACHE_HEADER:
230
 
            mutter('cache header marker not found at top of %s; discarding cache'
231
 
                   % fn)
 
236
            mutter('cache header marker not found at top of %s;'
 
237
                   ' discarding cache', fn)
 
238
            self.needs_write = True
232
239
            return
233
240
 
234
241
        for l in inf:
240
247
 
241
248
            pos += 3
242
249
            fields = l[pos:].split(' ')
243
 
            if len(fields) != 6:
 
250
            if len(fields) != 7:
244
251
                warning("bad line in hashcache: %r" % l)
245
252
                continue
246
253