~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/store.py

  • Committer: Martin Pool
  • Date: 2005-07-11 05:45:11 UTC
  • Revision ID: mbp@sourcefrog.net-20050711054511-aab2162e0f02dc64
- small optimization for weave extract

- show progressbar during weave check

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# Copyright (C) 2005 by Canonical Development Ltd
 
2
 
 
3
# This program is free software; you can redistribute it and/or modify
 
4
# it under the terms of the GNU General Public License as published by
 
5
# the Free Software Foundation; either version 2 of the License, or
 
6
# (at your option) any later version.
 
7
 
 
8
# This program is distributed in the hope that it will be useful,
 
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
11
# GNU General Public License for more details.
 
12
 
 
13
# You should have received a copy of the GNU General Public License
 
14
# along with this program; if not, write to the Free Software
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
16
 
 
17
"""
 
18
Stores are the main data-storage mechanism for Bazaar-NG.
 
19
 
 
20
A store is a simple write-once container indexed by a universally
 
21
unique ID.
 
22
"""
 
23
 
 
24
import os, tempfile, types, osutils, gzip, errno
 
25
from stat import ST_SIZE
 
26
from StringIO import StringIO
 
27
from trace import mutter
 
28
 
 
29
######################################################################
 
30
# stores
 
31
 
 
32
class StoreError(Exception):
 
33
    pass
 
34
 
 
35
 
 
36
class ImmutableStore(object):
 
37
    """Store that holds files indexed by unique names.
 
38
 
 
39
    Files can be added, but not modified once they are in.  Typically
 
40
    the hash is used as the name, or something else known to be unique,
 
41
    such as a UUID.
 
42
 
 
43
    >>> st = ImmutableScratchStore()
 
44
 
 
45
    >>> st.add(StringIO('hello'), 'aa')
 
46
    >>> 'aa' in st
 
47
    True
 
48
    >>> 'foo' in st
 
49
    False
 
50
 
 
51
    You are not allowed to add an id that is already present.
 
52
 
 
53
    Entries can be retrieved as files, which may then be read.
 
54
 
 
55
    >>> st.add(StringIO('goodbye'), '123123')
 
56
    >>> st['123123'].read()
 
57
    'goodbye'
 
58
 
 
59
    TODO: Atomic add by writing to a temporary file and renaming.
 
60
 
 
61
    In bzr 0.0.5 and earlier, files within the store were marked
 
62
    readonly on disk.  This is no longer done but existing stores need
 
63
    to be accomodated.
 
64
    """
 
65
 
 
66
    def __init__(self, basedir):
 
67
        self._basedir = basedir
 
68
 
 
69
    def _path(self, id):
 
70
        if '\\' in id or '/' in id:
 
71
            raise ValueError("invalid store id %r" % id)
 
72
        return os.path.join(self._basedir, id)
 
73
 
 
74
    def __repr__(self):
 
75
        return "%s(%r)" % (self.__class__.__name__, self._basedir)
 
76
 
 
77
    def add(self, f, fileid, compressed=True):
 
78
        """Add contents of a file into the store.
 
79
 
 
80
        f -- An open file, or file-like object."""
 
81
        # FIXME: Only works on files that will fit in memory
 
82
        
 
83
        from bzrlib.atomicfile import AtomicFile
 
84
        
 
85
        mutter("add store entry %r" % (fileid))
 
86
        if isinstance(f, types.StringTypes):
 
87
            content = f
 
88
        else:
 
89
            content = f.read()
 
90
            
 
91
        p = self._path(fileid)
 
92
        if os.access(p, os.F_OK) or os.access(p + '.gz', os.F_OK):
 
93
            raise BzrError("store %r already contains id %r" % (self._basedir, fileid))
 
94
 
 
95
        fn = p
 
96
        if compressed:
 
97
            fn = fn + '.gz'
 
98
            
 
99
        af = AtomicFile(fn, 'wb')
 
100
        try:
 
101
            if compressed:
 
102
                gf = gzip.GzipFile(mode='wb', fileobj=af)
 
103
                gf.write(content)
 
104
                gf.close()
 
105
            else:
 
106
                af.write(content)
 
107
            af.commit()
 
108
        finally:
 
109
            af.close()
 
110
 
 
111
 
 
112
    def copy_multi(self, other, ids):
 
113
        """Copy texts for ids from other into self.
 
114
 
 
115
        If an id is present in self, it is skipped.  A count of copied
 
116
        ids is returned, which may be less than len(ids).
 
117
        """
 
118
        from bzrlib.progress import ProgressBar
 
119
        pb = ProgressBar()
 
120
        pb.update('preparing to copy')
 
121
        to_copy = [id for id in ids if id not in self]
 
122
        if isinstance(other, ImmutableStore):
 
123
            return self.copy_multi_immutable(other, to_copy, pb)
 
124
        count = 0
 
125
        for id in to_copy:
 
126
            count += 1
 
127
            pb.update('copy', count, len(to_copy))
 
128
            self.add(other[id], id)
 
129
        assert count == len(to_copy)
 
130
        pb.clear()
 
131
        return count
 
132
 
 
133
 
 
134
    def copy_multi_immutable(self, other, to_copy, pb):
 
135
        from shutil import copyfile
 
136
        count = 0
 
137
        for id in to_copy:
 
138
            p = self._path(id)
 
139
            other_p = other._path(id)
 
140
            try:
 
141
                copyfile(other_p, p)
 
142
            except IOError, e:
 
143
                if e.errno == errno.ENOENT:
 
144
                    copyfile(other_p+".gz", p+".gz")
 
145
                else:
 
146
                    raise
 
147
            
 
148
            count += 1
 
149
            pb.update('copy', count, len(to_copy))
 
150
        assert count == len(to_copy)
 
151
        pb.clear()
 
152
        return count
 
153
    
 
154
 
 
155
    def __contains__(self, fileid):
 
156
        """"""
 
157
        p = self._path(fileid)
 
158
        return (os.access(p, os.R_OK)
 
159
                or os.access(p + '.gz', os.R_OK))
 
160
 
 
161
    # TODO: Guard against the same thing being stored twice, compressed and uncompresse
 
162
 
 
163
    def __iter__(self):
 
164
        for f in os.listdir(self._basedir):
 
165
            if f[-3:] == '.gz':
 
166
                # TODO: case-insensitive?
 
167
                yield f[:-3]
 
168
            else:
 
169
                yield f
 
170
 
 
171
    def __len__(self):
 
172
        return len(os.listdir(self._basedir))
 
173
 
 
174
    def __getitem__(self, fileid):
 
175
        """Returns a file reading from a particular entry."""
 
176
        p = self._path(fileid)
 
177
        try:
 
178
            return gzip.GzipFile(p + '.gz', 'rb')
 
179
        except IOError, e:
 
180
            if e.errno == errno.ENOENT:
 
181
                return file(p, 'rb')
 
182
            else:
 
183
                raise e
 
184
 
 
185
    def total_size(self):
 
186
        """Return (count, bytes)
 
187
 
 
188
        This is the (compressed) size stored on disk, not the size of
 
189
        the content."""
 
190
        total = 0
 
191
        count = 0
 
192
        for fid in self:
 
193
            count += 1
 
194
            p = self._path(fid)
 
195
            try:
 
196
                total += os.stat(p)[ST_SIZE]
 
197
            except OSError:
 
198
                total += os.stat(p + '.gz')[ST_SIZE]
 
199
                
 
200
        return count, total
 
201
 
 
202
 
 
203
 
 
204
 
 
205
class ImmutableScratchStore(ImmutableStore):
 
206
    """Self-destructing test subclass of ImmutableStore.
 
207
 
 
208
    The Store only exists for the lifetime of the Python object.
 
209
 Obviously you should not put anything precious in it.
 
210
    """
 
211
    def __init__(self):
 
212
        ImmutableStore.__init__(self, tempfile.mkdtemp())
 
213
 
 
214
    def __del__(self):
 
215
        for f in os.listdir(self._basedir):
 
216
            fpath = os.path.join(self._basedir, f)
 
217
            # needed on windows, and maybe some other filesystems
 
218
            os.chmod(fpath, 0600)
 
219
            os.remove(fpath)
 
220
        os.rmdir(self._basedir)
 
221
        mutter("%r destroyed" % self)