~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/store/weave.py

  • Committer: Robert Collins
  • Date: 2005-10-17 11:56:54 UTC
  • mfrom: (1185.16.59)
  • Revision ID: robertc@robertcollins.net-20051017115654-662239e1587524a8
mergeĀ fromĀ martin.

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2005, 2006 Canonical Ltd
2
 
#
 
1
#! /usr/bin/python
 
2
 
 
3
# Copyright (C) 2005 Canonical Ltd
 
4
 
3
5
# This program is free software; you can redistribute it and/or modify
4
6
# it under the terms of the GNU General Public License as published by
5
7
# the Free Software Foundation; either version 2 of the License, or
6
8
# (at your option) any later version.
7
 
#
 
9
 
8
10
# This program is distributed in the hope that it will be useful,
9
11
# but WITHOUT ANY WARRANTY; without even the implied warranty of
10
12
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
11
13
# GNU General Public License for more details.
12
 
#
 
14
 
13
15
# You should have received a copy of the GNU General Public License
14
16
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
 
17
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
18
 
17
19
# XXX: Some consideration of the problems that might occur if there are
18
20
# files whose id differs only in case.  That should probably be forbidden.
19
21
 
20
22
 
 
23
from cStringIO import StringIO
21
24
import os
22
 
from warnings import warn
 
25
import errno
23
26
 
24
 
from bzrlib import (
25
 
    errors,
26
 
    osutils,
27
 
    )
28
 
from bzrlib.store import TransportStore
 
27
from bzrlib.weavefile import read_weave, write_weave_v5
 
28
from bzrlib.weave import Weave
 
29
from bzrlib.store import TransportStore, hash_prefix
 
30
from bzrlib.atomicfile import AtomicFile
 
31
from bzrlib.errors import NoSuchFile, FileExists
29
32
from bzrlib.trace import mutter
30
 
import bzrlib.ui
31
 
 
32
 
 
33
 
class VersionedFileStore(TransportStore):
34
 
    """Collection of many versioned files in a transport."""
35
 
 
36
 
    # TODO: Rather than passing versionedfile_kwargs, perhaps pass in a
37
 
    # transport factory callable?
38
 
    def __init__(self, transport, prefixed=False, precious=False,
39
 
                 dir_mode=None, file_mode=None,
40
 
                 versionedfile_class=None,
41
 
                 versionedfile_kwargs={},
42
 
                 escaped=False):
43
 
        super(VersionedFileStore, self).__init__(transport,
44
 
                dir_mode=dir_mode, file_mode=file_mode,
45
 
                prefixed=prefixed, compressed=False, escaped=escaped)
 
33
 
 
34
 
 
35
class WeaveStore(TransportStore):
 
36
    """Collection of several weave files in a directory.
 
37
 
 
38
    This has some shortcuts for reading and writing them.
 
39
    """
 
40
    FILE_SUFFIX = '.weave'
 
41
 
 
42
    def __init__(self, transport, prefixed=False, precious=False):
 
43
        self._transport = transport
 
44
        self._prefixed = prefixed
46
45
        self._precious = precious
47
 
        self._versionedfile_class = versionedfile_class
48
 
        self._versionedfile_kwargs = versionedfile_kwargs
49
 
        # Used for passing get_scope to versioned file constructors;
50
 
        self.get_scope = None
51
46
 
52
47
    def filename(self, file_id):
53
48
        """Return the path relative to the transport root."""
54
 
        return self._relpath(file_id)
 
49
        if self._prefixed:
 
50
            return hash_prefix(file_id) + file_id + WeaveStore.FILE_SUFFIX
 
51
        else:
 
52
            return file_id + WeaveStore.FILE_SUFFIX
55
53
 
56
54
    def __iter__(self):
57
 
        suffixes = self._versionedfile_class.get_suffixes()
58
 
        ids = set()
59
 
        for relpath in self._iter_files_recursive():
60
 
            for suffix in suffixes:
61
 
                if relpath.endswith(suffix):
62
 
                    # TODO: use standard remove_suffix function
63
 
                    escaped_id = os.path.basename(relpath[:-len(suffix)])
64
 
                    file_id = self._mapper.unmap(escaped_id)[0]
65
 
                    if file_id not in ids:
66
 
                        ids.add(file_id)
67
 
                        yield file_id
68
 
                    break # only one suffix can match
69
 
 
70
 
    def has_id(self, file_id):
71
 
        suffixes = self._versionedfile_class.get_suffixes()
72
 
        filename = self.filename(file_id)
73
 
        for suffix in suffixes:
74
 
            if not self._transport.has(filename + suffix):
75
 
                return False
76
 
        return True
77
 
 
78
 
    def get_empty(self, file_id, transaction):
79
 
        """Get an empty weave, which implies deleting the existing one first."""
80
 
        if self.has_id(file_id):
81
 
            self.delete(file_id, transaction)
82
 
        return self.get_weave_or_empty(file_id, transaction)
83
 
 
84
 
    def delete(self, file_id, transaction):
85
 
        """Remove file_id from the store."""
86
 
        suffixes = self._versionedfile_class.get_suffixes()
87
 
        filename = self.filename(file_id)
88
 
        for suffix in suffixes:
89
 
            self._transport.delete(filename + suffix)
 
55
        l = len(WeaveStore.FILE_SUFFIX)
 
56
        for relpath in self._transport.iter_files_recursive():
 
57
            if relpath.endswith(WeaveStore.FILE_SUFFIX):
 
58
                yield os.path.basename(relpath[:-l])
 
59
 
 
60
    def has_id(self, fileid):
 
61
        return self._transport.has(self.filename(fileid))
90
62
 
91
63
    def _get(self, file_id):
92
64
        return self._transport.get(self.filename(file_id))
93
65
 
94
66
    def _put(self, file_id, f):
95
 
        fn = self.filename(file_id)
96
 
        try:
97
 
            return self._transport.put_file(fn, f, mode=self._file_mode)
98
 
        except errors.NoSuchFile:
99
 
            if not self._prefixed:
100
 
                raise
101
 
            self._transport.mkdir(os.path.dirname(fn), mode=self._dir_mode)
102
 
            return self._transport.put_file(fn, f, mode=self._file_mode)
103
 
 
104
 
    def get_weave(self, file_id, transaction, _filename=None):
105
 
        """Return the VersionedFile for file_id.
106
 
 
107
 
        :param _filename: filename that would be returned from self.filename for
108
 
        file_id. This is used to reduce duplicate filename calculations when
109
 
        using 'get_weave_or_empty'. FOR INTERNAL USE ONLY.
110
 
        """
111
 
        if _filename is None:
112
 
            _filename = self.filename(file_id)
113
 
        if transaction.writeable():
114
 
            w = self._versionedfile_class(_filename, self._transport, self._file_mode,
115
 
                get_scope=self.get_scope, **self._versionedfile_kwargs)
116
 
        else:
117
 
            w = self._versionedfile_class(_filename,
118
 
                                          self._transport,
119
 
                                          self._file_mode,
120
 
                                          create=False,
121
 
                                          access_mode='r',
122
 
                                          get_scope=self.get_scope,
123
 
                                          **self._versionedfile_kwargs)
 
67
        if self._prefixed:
 
68
            try:
 
69
                self._transport.mkdir(hash_prefix(file_id))
 
70
            except FileExists:
 
71
                pass
 
72
        return self._transport.put(self.filename(file_id), f)
 
73
 
 
74
    def get_weave(self, file_id, transaction):
 
75
        weave = transaction.map.find_weave(file_id)
 
76
        if weave:
 
77
            mutter("cache hit in %s for %s", self, file_id)
 
78
            return weave
 
79
        w = read_weave(self._get(file_id))
 
80
        transaction.map.add_weave(file_id, w)
 
81
        transaction.register_clean(w, precious=self._precious)
124
82
        return w
125
83
 
126
 
    def _make_new_versionedfile(self, file_id, transaction,
127
 
        known_missing=False, _filename=None):
128
 
        """Make a new versioned file.
129
 
 
130
 
        :param _filename: filename that would be returned from self.filename for
131
 
        file_id. This is used to reduce duplicate filename calculations when
132
 
        using 'get_weave_or_empty'. FOR INTERNAL USE ONLY.
133
 
        """
134
 
        if not known_missing and self.has_id(file_id):
135
 
            self.delete(file_id, transaction)
136
 
        if _filename is None:
137
 
            _filename = self.filename(file_id)
138
 
        try:
139
 
            # we try without making the directory first because thats optimising
140
 
            # for the common case.
141
 
            weave = self._versionedfile_class(_filename, self._transport, self._file_mode, create=True,
142
 
                get_scope=self.get_scope, **self._versionedfile_kwargs)
143
 
        except errors.NoSuchFile:
144
 
            if not self._prefixed:
145
 
                # unexpected error - NoSuchFile is expected to be raised on a
146
 
                # missing dir only and that only occurs when we are prefixed.
147
 
                raise
148
 
            dirname = osutils.dirname(_filename)
149
 
            self._transport.mkdir(dirname, mode=self._dir_mode)
150
 
            weave = self._versionedfile_class(_filename, self._transport,
151
 
                                              self._file_mode, create=True,
152
 
                                              get_scope=self.get_scope,
153
 
                                              **self._versionedfile_kwargs)
154
 
        return weave
155
 
 
 
84
    def get_lines(self, file_id, rev_id, transaction):
 
85
        """Return text from a particular version of a weave.
 
86
 
 
87
        Returned as a list of lines."""
 
88
        w = self.get_weave(file_id, transaction)
 
89
        return w.get(w.lookup(rev_id))
 
90
    
156
91
    def get_weave_or_empty(self, file_id, transaction):
157
 
        """Return a weave, or an empty one if it doesn't exist."""
158
 
        # This is typically used from 'commit' and 'fetch/push/pull' where
159
 
        # we scan across many versioned files once. As such the small overhead
160
 
        # of calculating the filename before doing a cache lookup is more than
161
 
        # compensated for by not calculating the filename when making new
162
 
        # versioned files.
163
 
        _filename = self.filename(file_id)
 
92
        """Return a weave, or an empty one if it doesn't exist.""" 
164
93
        try:
165
 
            return self.get_weave(file_id, transaction, _filename=_filename)
166
 
        except errors.NoSuchFile:
167
 
            weave = self._make_new_versionedfile(file_id, transaction,
168
 
                known_missing=True, _filename=_filename)
 
94
            return self.get_weave(file_id, transaction)
 
95
        except NoSuchFile:
 
96
            weave = Weave(weave_name=file_id)
 
97
            transaction.map.add_weave(file_id, weave)
 
98
            transaction.register_clean(weave, precious=self._precious)
169
99
            return weave
170
100
 
171
 
    def _put_weave(self, file_id, weave, transaction):
172
 
        """Preserved here for upgrades-to-weaves to use."""
173
 
        myweave = self._make_new_versionedfile(file_id, transaction)
174
 
        myweave.insert_record_stream(weave.get_record_stream(
175
 
            [(version,) for version in weave.versions()],
176
 
            'topological', False))
177
 
 
178
 
    def copy_all_ids(self, store_from, pb=None, from_transaction=None,
179
 
                     to_transaction=None):
180
 
        """Copy all the file ids from store_from into self."""
181
 
        if from_transaction is None:
182
 
            warn("Please pass from_transaction into "
183
 
                 "versioned_store.copy_all_ids.", stacklevel=2)
184
 
        if to_transaction is None:
185
 
            warn("Please pass to_transaction into "
186
 
                 "versioned_store.copy_all_ids.", stacklevel=2)
187
 
        if not store_from.listable():
188
 
            raise errors.UnlistableStore(store_from)
189
 
        ids = []
190
 
        for count, file_id in enumerate(store_from):
191
 
            if pb:
192
 
                pb.update('listing files', count, count)
193
 
            ids.append(file_id)
194
 
        if pb:
195
 
            pb.clear()
196
 
        mutter('copy_all ids: %r', ids)
197
 
        self.copy_multi(store_from, ids, pb=pb,
198
 
                        from_transaction=from_transaction,
199
 
                        to_transaction=to_transaction)
200
 
 
201
 
    def copy_multi(self, from_store, file_ids, pb=None, from_transaction=None,
202
 
                   to_transaction=None):
203
 
        """Copy all the versions for multiple file_ids from from_store.
204
 
 
205
 
        :param from_transaction: required current transaction in from_store.
206
 
        """
207
 
        from bzrlib.transactions import PassThroughTransaction
208
 
        if from_transaction is None:
209
 
            warn("VersionedFileStore.copy_multi without a from_transaction parameter "
210
 
                 "is deprecated. Please provide a from_transaction.",
211
 
                 DeprecationWarning,
212
 
                 stacklevel=2)
213
 
            # we are reading one object - caching is irrelevant.
214
 
            from_transaction = PassThroughTransaction()
215
 
        if to_transaction is None:
216
 
            warn("VersionedFileStore.copy_multi without a to_transaction parameter "
217
 
                 "is deprecated. Please provide a to_transaction.",
218
 
                 DeprecationWarning,
219
 
                 stacklevel=2)
220
 
            # we are copying single objects, and there may be open tranasactions
221
 
            # so again with the passthrough
222
 
            to_transaction = PassThroughTransaction()
223
 
        pb = bzrlib.ui.ui_factory.nested_progress_bar()
224
 
        try:
225
 
            for count, f in enumerate(file_ids):
226
 
                mutter("copy weave {%s} into %s", f, self)
227
 
                pb.update('copy', count, len(file_ids))
228
 
                # if we have it in cache, its faster.
229
 
                # joining is fast with knits, and bearable for weaves -
230
 
                # indeed the new case can be optimised if needed.
231
 
                target = self._make_new_versionedfile(f, to_transaction)
232
 
                source = from_store.get_weave(f, from_transaction)
233
 
                target.insert_record_stream(source.get_record_stream(
234
 
                    [(version,) for version in source.versions()],
235
 
                    'topological', False))
236
 
        finally:
237
 
            pb.finished()
238
 
 
239
 
    def total_size(self):
240
 
        count, bytes =  super(VersionedFileStore, self).total_size()
241
 
        return (count / len(self._versionedfile_class.get_suffixes())), bytes
 
101
    def put_weave(self, file_id, weave, transaction):
 
102
        """Write back a modified weave"""
 
103
        transaction.register_dirty(weave)
 
104
        # TODO FOR WRITE TRANSACTIONS: this should be done in a callback
 
105
        # from the transaction, when it decides to save.
 
106
        sio = StringIO()
 
107
        write_weave_v5(weave, sio)
 
108
        sio.seek(0)
 
109
        self._put(file_id, sio)
 
110
 
 
111
    def add_text(self, file_id, rev_id, new_lines, parents, transaction):
 
112
        w = self.get_weave_or_empty(file_id, transaction)
 
113
        parent_idxs = map(w.lookup, parents)
 
114
        w.add(rev_id, parent_idxs, new_lines)
 
115
        self.put_weave(file_id, w, transaction)
 
116
        
 
117
    def add_identical_text(self, file_id, old_rev_id, new_rev_id, parents,
 
118
                           transaction):
 
119
        w = self.get_weave_or_empty(file_id, transaction)
 
120
        parent_idxs = map(w.lookup, parents)
 
121
        w.add_identical(old_rev_id, new_rev_id, parent_idxs)
 
122
        self.put_weave(file_id, w, transaction)
 
123
     
 
124
    def copy_multi(self, from_store, file_ids):
 
125
        assert isinstance(from_store, WeaveStore)
 
126
        for f in file_ids:
 
127
            mutter("copy weave {%s} into %s", f, self)
 
128
            self._put(f, from_store._get(f))