~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/store/text.py

  • Committer: Robert Collins
  • Date: 2005-10-11 08:05:45 UTC
  • mto: This revision was merged to the branch mainline in revision 1444.
  • Revision ID: robertc@lifelesslap.robertcollins.net-20051011080545-daa592731b2c0a15
make selftest -v show the elapsed time for each test run.

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2005 Canonical Ltd
2
 
#
 
1
# Copyright (C) 2005 by Canonical Development Ltd
 
2
 
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
5
5
# the Free Software Foundation; either version 2 of the License, or
6
6
# (at your option) any later version.
7
 
#
 
7
 
8
8
# This program is distributed in the hope that it will be useful,
9
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
10
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
11
11
# GNU General Public License for more details.
12
 
#
 
12
 
13
13
# You should have received a copy of the GNU General Public License
14
14
# along with this program; if not, write to the Free Software
15
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
16
 
17
 
"""A store that keeps the full text of every version.
 
17
"""
 
18
A store that keeps the full text of every version.
18
19
 
19
20
This store keeps uncompressed versions of the full text. It does not
20
21
do any sort of delta compression.
21
22
"""
22
23
 
23
 
import os
 
24
import os, tempfile
 
25
 
24
26
import bzrlib.store
 
27
from bzrlib.store import hash_prefix
25
28
from bzrlib.trace import mutter
26
 
from bzrlib.errors import BzrError, NoSuchFile, FileExists
 
29
from bzrlib.errors import BzrError, FileExists
27
30
 
28
 
import gzip
29
31
from cStringIO import StringIO
 
32
from stat import ST_SIZE
30
33
 
31
34
 
32
35
class TextStore(bzrlib.store.TransportStore):
39
42
    Files are stored uncompressed, with no delta compression.
40
43
    """
41
44
 
42
 
    def _add_compressed(self, fn, f):
43
 
        from cStringIO import StringIO
44
 
        from bzrlib.osutils import pumpfile
 
45
    def __init__(self, transport, prefixed=False):
 
46
        super(TextStore, self).__init__(transport)
 
47
        self._prefixed = prefixed
 
48
 
 
49
    def _check_fileid(self, fileid):
 
50
        if not isinstance(fileid, basestring):
 
51
            raise TypeError('Fileids should be a string type: %s %r' % (type(fileid), fileid))
 
52
        if '\\' in fileid or '/' in fileid:
 
53
            raise ValueError("invalid store id %r" % fileid)
 
54
 
 
55
    def _relpath(self, fileid):
 
56
        self._check_fileid(fileid)
 
57
        if self._prefixed:
 
58
            return hash_prefix(fileid) + fileid
 
59
        else:
 
60
            return fileid
 
61
 
 
62
    def add(self, f, fileid):
 
63
        """Add contents of a file into the store.
 
64
 
 
65
        f -- A file-like object, or string
 
66
        """
 
67
        mutter("add store entry %r" % (fileid))
 
68
            
 
69
        fn = self._relpath(fileid)
 
70
        if self._transport.has(fn):
 
71
            raise BzrError("store %r already contains id %r" % (self._transport.base, fileid))
 
72
 
 
73
        if self._prefixed:
 
74
            try:
 
75
                self._transport.mkdir(hash_prefix(fileid))
 
76
            except FileExists:
 
77
                pass
 
78
 
 
79
        self._transport.put(fn, f)
 
80
 
 
81
    def __contains__(self, fileid):
 
82
        """"""
 
83
        fn = self._relpath(fileid)
 
84
        return self._transport.has(fn)
 
85
 
 
86
    def has(self, fileids, pb=None):
 
87
        """Return True/False for each entry in fileids.
 
88
 
 
89
        :param fileids: A List or generator yielding file ids.
 
90
        :return: A generator or list returning True/False for each entry.
 
91
        """
 
92
        relpaths = (self._relpath(fid) for fid in fileids)
 
93
        return self._transport.has_multi(relpaths, pb=pb)
 
94
 
 
95
    def get(self, fileids, permit_failure=False, pb=None):
 
96
        """Return a set of files, one for each requested entry.
45
97
        
46
 
        if isinstance(f, basestring):
47
 
            f = StringIO(f)
48
 
            
49
 
        sio = StringIO()
50
 
        gf = gzip.GzipFile(mode='wb', fileobj=sio)
51
 
        # if pumpfile handles files that don't fit in ram,
52
 
        # so will this function
53
 
        pumpfile(f, gf)
54
 
        gf.close()
55
 
        sio.seek(0)
56
 
        self._try_put(fn, sio)
57
 
 
58
 
    def _add(self, fn, f):
59
 
        if self._compressed:
60
 
            self._add_compressed(fn, f)
61
 
        else:
62
 
            self._try_put(fn, f)
63
 
 
64
 
    def _try_put(self, fn, f):
65
 
        try:
66
 
            self._transport.put_file(fn, f, mode=self._file_mode)
67
 
        except NoSuchFile:
68
 
            if not self._prefixed:
69
 
                raise
70
 
            try:
71
 
                self._transport.mkdir(os.path.dirname(fn), mode=self._dir_mode)
72
 
            except FileExists:
73
 
                pass
74
 
            self._transport.put_file(fn, f, mode=self._file_mode)
75
 
 
76
 
    def _get(self, fn):
77
 
        if fn.endswith('.gz'):
78
 
            return self._get_compressed(fn)
79
 
        else:
80
 
            return self._transport.get(fn)
81
 
 
82
 
    def _copy_one(self, fileid, suffix, other, pb):
83
 
        # TODO: Once the copy_to interface is improved to allow a source
84
 
        #       and destination targets, then we can always do the copy
85
 
        #       as long as other is a TextStore
86
 
        if not (isinstance(other, TextStore)
87
 
            and other._prefixed == self._prefixed):
88
 
            return super(TextStore, self)._copy_one(fileid, suffix, other, pb)
89
 
 
90
 
        mutter('_copy_one: %r, %r', fileid, suffix)
91
 
        path = other._get_name(fileid, suffix)
92
 
        if path is None:
93
 
            raise KeyError(fileid + '-' + str(suffix))
94
 
 
95
 
        try:
96
 
            result = other._transport.copy_to([path], self._transport,
97
 
                                              mode=self._file_mode)
98
 
        except NoSuchFile:
99
 
            if not self._prefixed:
100
 
                raise
101
 
            try:
102
 
                self._transport.mkdir(self.hash_prefix(fileid)[:-1], mode=self._dir_mode)
103
 
            except FileExists:
104
 
                pass
105
 
            result = other._transport.copy_to([path], self._transport,
106
 
                                              mode=self._file_mode)
107
 
 
108
 
        if result != 1:
109
 
            raise BzrError('Unable to copy file: %r' % (path,))
110
 
 
111
 
    def _get_compressed(self, filename):
112
 
        """Returns a file reading from a particular entry."""
113
 
        f = self._transport.get(filename)
114
 
        # gzip.GzipFile.read() requires a tell() function
115
 
        # but some transports return objects that cannot seek
116
 
        # so buffer them in a StringIO instead
117
 
        if getattr(f, 'tell', None) is not None:
118
 
            return gzip.GzipFile(mode='rb', fileobj=f)
119
 
        else:
120
 
            from cStringIO import StringIO
121
 
            sio = StringIO(f.read())
122
 
            return gzip.GzipFile(mode='rb', fileobj=sio)
 
98
        TODO: Write some tests to make sure that permit_failure is
 
99
              handled correctly.
 
100
 
 
101
        TODO: What should the exception be for a missing file?
 
102
              KeyError, or NoSuchFile?
 
103
        """
 
104
 
 
105
        # This next code gets a bit hairy because it can allow
 
106
        # to not request a file which doesn't seem to exist.
 
107
        # Also, the same fileid may be requested twice, so we
 
108
        # can't just build up a map.
 
109
        rel_paths = [self._relpath(fid) for fid in fileids]
 
110
        is_requested = []
 
111
 
 
112
        if permit_failure:
 
113
            existing_paths = []
 
114
            for path, has in zip(rel_paths,
 
115
                    self._transport.has_multi(rel_paths)):
 
116
                if has:
 
117
                    existing_paths.append(path)
 
118
                    is_requested.append(True)
 
119
                else:
 
120
                    is_requested.append(False)
 
121
            #mutter('Retrieving %s out of %s' % (existing_paths, rel_paths))
 
122
        else:
 
123
            #mutter('Retrieving all %s' % (rel_paths, ))
 
124
            existing_paths = rel_paths
 
125
            is_requested = [True for x in rel_paths]
 
126
 
 
127
        count = 0
 
128
        for f in self._transport.get_multi(existing_paths, pb=pb):
 
129
            assert count < len(is_requested)
 
130
            while not is_requested[count]:
 
131
                yield None
 
132
                count += 1
 
133
            yield f
 
134
            count += 1
 
135
 
 
136
        while count < len(is_requested):
 
137
            yield None
 
138
            count += 1
 
139
 
 
140
    def __iter__(self):
 
141
        for relpath, st in self._iter_relpaths():
 
142
            yield os.path.basename(relpath)
 
143
 
 
144
    def __len__(self):
 
145
        return len(list(self._iter_relpath()))
 
146
 
 
147
    def total_size(self):
 
148
        """Return (count, bytes)
 
149
 
 
150
        This is the (compressed) size stored on disk, not the size of
 
151
        the content."""
 
152
        total = 0
 
153
        count = 0
 
154
        for relpath, st in self._iter_relpaths():
 
155
            count += 1
 
156
            total += st[ST_SIZE]
 
157
                
 
158
        return count, total
 
159
 
 
160
 
 
161
class ScratchTextStore(TextStore):
 
162
    """Self-destructing test subclass of TextStore.
 
163
 
 
164
    The Store only exists for the lifetime of the Python object.
 
165
    Obviously you should not put anything precious in it.
 
166
    """
 
167
    def __init__(self):
 
168
        from transport import transport
 
169
        super(ScratchTextStore, self).__init__(transport(tempfile.mkdtemp()))
 
170
 
 
171
    def __del__(self):
 
172
        self._transport.delete_multi(self._transport.list_dir('.'))
 
173
        os.rmdir(self._transport.base)
 
174
        mutter("%r destroyed" % self)
 
175