~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/repofmt/weaverepo.py

  • Committer: John Arbash Meinel
  • Date: 2007-10-10 21:18:06 UTC
  • mto: This revision was merged to the branch mainline in revision 2909.
  • Revision ID: john@arbash-meinel.com-20071010211806-2j9rg6wzrqh7yy4u
Switch from __new__ to __init__ to avoid potential pyrex upgrade problems.

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2007-2010 Canonical Ltd
 
1
# Copyright (C) 2005, 2006, 2007 Canonical Ltd
2
2
#
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
12
12
#
13
13
# You should have received a copy of the GNU General Public License
14
14
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
16
 
17
17
"""Deprecated weave-based repository formats.
18
18
 
20
20
ghosts.
21
21
"""
22
22
 
23
 
import os
24
 
from cStringIO import StringIO
25
 
import urllib
 
23
from StringIO import StringIO
26
24
 
27
 
from bzrlib.lazy_import import lazy_import
28
 
lazy_import(globals(), """
29
 
from bzrlib import (
30
 
    xml5,
31
 
    graph as _mod_graph,
32
 
    )
33
 
""")
34
25
from bzrlib import (
35
26
    bzrdir,
36
27
    debug,
39
30
    lockdir,
40
31
    osutils,
41
32
    revision as _mod_revision,
42
 
    trace,
43
 
    urlutils,
44
 
    versionedfile,
45
33
    weave,
46
34
    weavefile,
 
35
    xml5,
47
36
    )
48
37
from bzrlib.decorators import needs_read_lock, needs_write_lock
49
38
from bzrlib.repository import (
50
39
    CommitBuilder,
51
 
    MetaDirVersionedFileRepository,
 
40
    MetaDirRepository,
52
41
    MetaDirRepositoryFormat,
53
42
    Repository,
54
43
    RepositoryFormat,
55
44
    )
56
45
from bzrlib.store.text import TextStore
57
 
from bzrlib.tuned_gzip import GzipFile, bytes_to_gzip
58
 
from bzrlib.versionedfile import (
59
 
    AbsentContentFactory,
60
 
    FulltextContentFactory,
61
 
    VersionedFiles,
62
 
    )
 
46
from bzrlib.trace import mutter
63
47
 
64
48
 
65
49
class AllInOneRepository(Repository):
66
50
    """Legacy support - the repository behaviour for all-in-one branches."""
67
51
 
68
 
    @property
69
 
    def _serializer(self):
70
 
        return xml5.serializer_v5
71
 
 
72
 
    def _escape(self, file_or_path):
73
 
        if not isinstance(file_or_path, basestring):
74
 
            file_or_path = '/'.join(file_or_path)
75
 
        if file_or_path == '':
76
 
            return u''
77
 
        return urlutils.escape(osutils.safe_unicode(file_or_path))
78
 
 
79
 
    def __init__(self, _format, a_bzrdir):
 
52
    _serializer = xml5.serializer_v5
 
53
 
 
54
    def __init__(self, _format, a_bzrdir, _revision_store, control_store, text_store):
80
55
        # we reuse one control files instance.
81
 
        dir_mode = a_bzrdir._get_dir_mode()
82
 
        file_mode = a_bzrdir._get_file_mode()
 
56
        dir_mode = a_bzrdir._control_files._dir_mode
 
57
        file_mode = a_bzrdir._control_files._file_mode
83
58
 
84
59
        def get_store(name, compressed=True, prefixed=False):
85
60
            # FIXME: This approach of assuming stores are all entirely compressed
86
 
            # or entirely uncompressed is tidy, but breaks upgrade from
87
 
            # some existing branches where there's a mixture; we probably
 
61
            # or entirely uncompressed is tidy, but breaks upgrade from 
 
62
            # some existing branches where there's a mixture; we probably 
88
63
            # still want the option to look for both.
89
 
            relpath = self._escape(name)
90
 
            store = TextStore(a_bzrdir.transport.clone(relpath),
 
64
            relpath = a_bzrdir._control_files._escape(name)
 
65
            store = TextStore(a_bzrdir._control_files._transport.clone(relpath),
91
66
                              prefixed=prefixed, compressed=compressed,
92
67
                              dir_mode=dir_mode,
93
68
                              file_mode=file_mode)
94
69
            return store
95
70
 
96
71
        # not broken out yet because the controlweaves|inventory_store
97
 
        # and texts bits are still different.
 
72
        # and text_store | weave_store bits are still different.
98
73
        if isinstance(_format, RepositoryFormat4):
99
 
            # cannot remove these - there is still no consistent api
 
74
            # cannot remove these - there is still no consistent api 
100
75
            # which allows access to this old info.
101
76
            self.inventory_store = get_store('inventory-store')
102
 
            self._text_store = get_store('text-store')
103
 
        super(AllInOneRepository, self).__init__(_format, a_bzrdir, a_bzrdir._control_files)
 
77
            text_store = get_store('text-store')
 
78
        super(AllInOneRepository, self).__init__(_format, a_bzrdir, a_bzrdir._control_files, _revision_store, control_store, text_store)
104
79
 
105
80
    @needs_read_lock
106
81
    def _all_possible_ids(self):
107
82
        """Return all the possible revisions that we could find."""
108
83
        if 'evil' in debug.debug_flags:
109
 
            trace.mutter_callsite(
110
 
                3, "_all_possible_ids scales with size of history.")
111
 
        return [key[-1] for key in self.inventories.keys()]
 
84
            mutter_callsite(3, "_all_possible_ids scales with size of history.")
 
85
        return self.get_inventory_weave().versions()
112
86
 
113
87
    @needs_read_lock
114
88
    def _all_revision_ids(self):
115
 
        """Returns a list of all the revision ids in the repository.
 
89
        """Returns a list of all the revision ids in the repository. 
116
90
 
117
 
        These are in as much topological order as the underlying store can
 
91
        These are in as much topological order as the underlying store can 
118
92
        present: for weaves ghosts may lead to a lack of correctness until
119
93
        the reweave updates the parents list.
120
94
        """
121
 
        return [key[-1] for key in self.revisions.keys()]
122
 
 
123
 
    def _activate_new_inventory(self):
124
 
        """Put a replacement inventory.new into use as inventories."""
125
 
        # Copy the content across
126
 
        t = self.bzrdir._control_files._transport
127
 
        t.copy('inventory.new.weave', 'inventory.weave')
128
 
        # delete the temp inventory
129
 
        t.delete('inventory.new.weave')
130
 
        # Check we can parse the new weave properly as a sanity check
131
 
        self.inventories.keys()
132
 
 
133
 
    def _backup_inventory(self):
134
 
        t = self.bzrdir._control_files._transport
135
 
        t.copy('inventory.weave', 'inventory.backup.weave')
136
 
 
137
 
    def _temp_inventories(self):
138
 
        t = self.bzrdir._control_files._transport
139
 
        return self._format._get_inventories(t, self, 'inventory.new')
 
95
        if self._revision_store.text_store.listable():
 
96
            return self._revision_store.all_revision_ids(self.get_transaction())
 
97
        result = self._all_possible_ids()
 
98
        # TODO: jam 20070210 Ensure that _all_possible_ids returns non-unicode
 
99
        #       ids. (It should, since _revision_store's API should change to
 
100
        #       return utf8 revision_ids)
 
101
        return self._eliminate_revisions_not_present(result)
 
102
 
 
103
    def _check_revision_parents(self, revision, inventory):
 
104
        """Private to Repository and Fetch.
 
105
        
 
106
        This checks the parentage of revision in an inventory weave for 
 
107
        consistency and is only applicable to inventory-weave-for-ancestry
 
108
        using repository formats & fetchers.
 
109
        """
 
110
        weave_parents = inventory.get_parents(revision.revision_id)
 
111
        weave_names = inventory.versions()
 
112
        for parent_id in revision.parent_ids:
 
113
            if parent_id in weave_names:
 
114
                # this parent must not be a ghost.
 
115
                if not parent_id in weave_parents:
 
116
                    # but it is a ghost
 
117
                    raise errors.CorruptRepository(self)
140
118
 
141
119
    def get_commit_builder(self, branch, parents, config, timestamp=None,
142
120
                           timezone=None, committer=None, revprops=None,
143
121
                           revision_id=None):
144
122
        self._check_ascii_revisionid(revision_id, self.get_commit_builder)
145
 
        result = CommitBuilder(self, parents, config, timestamp, timezone,
 
123
        result = WeaveCommitBuilder(self, parents, config, timestamp, timezone,
146
124
                              committer, revprops, revision_id)
147
125
        self.start_write_group()
148
126
        return result
150
128
    @needs_read_lock
151
129
    def get_revisions(self, revision_ids):
152
130
        revs = self._get_revisions(revision_ids)
 
131
        # weave corruption can lead to absent revision markers that should be
 
132
        # present.
 
133
        # the following test is reasonably cheap (it needs a single weave read)
 
134
        # and the weave is cached in read transactions. In write transactions
 
135
        # it is not cached but typically we only read a small number of
 
136
        # revisions. For knits when they are introduced we will probably want
 
137
        # to ensure that caching write transactions are in use.
 
138
        inv = self.get_inventory_weave()
 
139
        for rev in revs:
 
140
            self._check_revision_parents(rev, inv)
153
141
        return revs
154
142
 
155
 
    def _inventory_add_lines(self, revision_id, parents, lines,
156
 
        check_content=True):
157
 
        """Store lines in inv_vf and return the sha1 of the inventory."""
158
 
        present_parents = self.get_graph().get_parent_map(parents)
159
 
        final_parents = []
160
 
        for parent in parents:
161
 
            if parent in present_parents:
162
 
                final_parents.append((parent,))
163
 
        return self.inventories.add_lines((revision_id,), final_parents, lines,
164
 
            check_content=check_content)[0]
 
143
    @needs_read_lock
 
144
    def get_revision_graph(self, revision_id=None):
 
145
        """Return a dictionary containing the revision graph.
 
146
        
 
147
        :param revision_id: The revision_id to get a graph from. If None, then
 
148
        the entire revision graph is returned. This is a deprecated mode of
 
149
        operation and will be removed in the future.
 
150
        :return: a dictionary of revision_id->revision_parents_list.
 
151
        """
 
152
        if 'evil' in debug.debug_flags:
 
153
            mutter_callsite(2,
 
154
                "get_revision_graph scales with size of history.")
 
155
        # special case NULL_REVISION
 
156
        if revision_id == _mod_revision.NULL_REVISION:
 
157
            return {}
 
158
        a_weave = self.get_inventory_weave()
 
159
        all_revisions = self._eliminate_revisions_not_present(
 
160
                                a_weave.versions())
 
161
        entire_graph = dict([(node, tuple(a_weave.get_parents(node))) for 
 
162
                             node in all_revisions])
 
163
        if revision_id is None:
 
164
            return entire_graph
 
165
        elif revision_id not in entire_graph:
 
166
            raise errors.NoSuchRevision(self, revision_id)
 
167
        else:
 
168
            # add what can be reached from revision_id
 
169
            result = {}
 
170
            pending = set([revision_id])
 
171
            while len(pending) > 0:
 
172
                node = pending.pop()
 
173
                result[node] = entire_graph[node]
 
174
                for revision_id in result[node]:
 
175
                    if revision_id not in result:
 
176
                        pending.add(revision_id)
 
177
            return result
165
178
 
 
179
    @needs_read_lock
166
180
    def is_shared(self):
167
181
        """AllInOne repositories cannot be shared."""
168
182
        return False
177
191
        :param new_value: True to restore the default, False to disable making
178
192
                          working trees.
179
193
        """
180
 
        raise errors.RepositoryUpgradeRequired(self.user_url)
181
 
 
 
194
        raise NotImplementedError(self.set_make_working_trees)
 
195
    
182
196
    def make_working_trees(self):
183
197
        """Returns the policy for making working trees on new branches."""
184
198
        return True
185
199
 
186
 
    def revision_graph_can_have_wrong_parents(self):
187
 
        # XXX: This is an old format that we don't support full checking on, so
188
 
        # just claim that checking for this inconsistency is not required.
189
 
        return False
190
 
 
191
 
 
192
 
class WeaveMetaDirRepository(MetaDirVersionedFileRepository):
 
200
 
 
201
class WeaveMetaDirRepository(MetaDirRepository):
193
202
    """A subclass of MetaDirRepository to set weave specific policy."""
194
203
 
195
 
    def __init__(self, _format, a_bzrdir, control_files):
196
 
        super(WeaveMetaDirRepository, self).__init__(_format, a_bzrdir, control_files)
197
 
        self._serializer = _format._serializer
 
204
    _serializer = xml5.serializer_v5
198
205
 
199
206
    @needs_read_lock
200
207
    def _all_possible_ids(self):
201
208
        """Return all the possible revisions that we could find."""
202
209
        if 'evil' in debug.debug_flags:
203
 
            trace.mutter_callsite(
204
 
                3, "_all_possible_ids scales with size of history.")
205
 
        return [key[-1] for key in self.inventories.keys()]
 
210
            mutter_callsite(3, "_all_possible_ids scales with size of history.")
 
211
        return self.get_inventory_weave().versions()
206
212
 
207
213
    @needs_read_lock
208
214
    def _all_revision_ids(self):
209
 
        """Returns a list of all the revision ids in the repository.
 
215
        """Returns a list of all the revision ids in the repository. 
210
216
 
211
 
        These are in as much topological order as the underlying store can
 
217
        These are in as much topological order as the underlying store can 
212
218
        present: for weaves ghosts may lead to a lack of correctness until
213
219
        the reweave updates the parents list.
214
220
        """
215
 
        return [key[-1] for key in self.revisions.keys()]
216
 
 
217
 
    def _activate_new_inventory(self):
218
 
        """Put a replacement inventory.new into use as inventories."""
219
 
        # Copy the content across
220
 
        t = self._transport
221
 
        t.copy('inventory.new.weave', 'inventory.weave')
222
 
        # delete the temp inventory
223
 
        t.delete('inventory.new.weave')
224
 
        # Check we can parse the new weave properly as a sanity check
225
 
        self.inventories.keys()
226
 
 
227
 
    def _backup_inventory(self):
228
 
        t = self._transport
229
 
        t.copy('inventory.weave', 'inventory.backup.weave')
230
 
 
231
 
    def _temp_inventories(self):
232
 
        t = self._transport
233
 
        return self._format._get_inventories(t, self, 'inventory.new')
 
221
        if self._revision_store.text_store.listable():
 
222
            return self._revision_store.all_revision_ids(self.get_transaction())
 
223
        result = self._all_possible_ids()
 
224
        # TODO: jam 20070210 Ensure that _all_possible_ids returns non-unicode
 
225
        #       ids. (It should, since _revision_store's API should change to
 
226
        #       return utf8 revision_ids)
 
227
        return self._eliminate_revisions_not_present(result)
 
228
 
 
229
    def _check_revision_parents(self, revision, inventory):
 
230
        """Private to Repository and Fetch.
 
231
        
 
232
        This checks the parentage of revision in an inventory weave for 
 
233
        consistency and is only applicable to inventory-weave-for-ancestry
 
234
        using repository formats & fetchers.
 
235
        """
 
236
        weave_parents = inventory.get_parents(revision.revision_id)
 
237
        weave_names = inventory.versions()
 
238
        for parent_id in revision.parent_ids:
 
239
            if parent_id in weave_names:
 
240
                # this parent must not be a ghost.
 
241
                if not parent_id in weave_parents:
 
242
                    # but it is a ghost
 
243
                    raise errors.CorruptRepository(self)
234
244
 
235
245
    def get_commit_builder(self, branch, parents, config, timestamp=None,
236
246
                           timezone=None, committer=None, revprops=None,
237
247
                           revision_id=None):
238
248
        self._check_ascii_revisionid(revision_id, self.get_commit_builder)
239
 
        result = CommitBuilder(self, parents, config, timestamp, timezone,
 
249
        result = WeaveCommitBuilder(self, parents, config, timestamp, timezone,
240
250
                              committer, revprops, revision_id)
241
251
        self.start_write_group()
242
252
        return result
244
254
    @needs_read_lock
245
255
    def get_revision(self, revision_id):
246
256
        """Return the Revision object for a named revision"""
 
257
        # TODO: jam 20070210 get_revision_reconcile should do this for us
247
258
        r = self.get_revision_reconcile(revision_id)
 
259
        # weave corruption can lead to absent revision markers that should be
 
260
        # present.
 
261
        # the following test is reasonably cheap (it needs a single weave read)
 
262
        # and the weave is cached in read transactions. In write transactions
 
263
        # it is not cached but typically we only read a small number of
 
264
        # revisions. For knits when they are introduced we will probably want
 
265
        # to ensure that caching write transactions are in use.
 
266
        inv = self.get_inventory_weave()
 
267
        self._check_revision_parents(r, inv)
248
268
        return r
249
269
 
250
 
    def _inventory_add_lines(self, revision_id, parents, lines,
251
 
        check_content=True):
252
 
        """Store lines in inv_vf and return the sha1 of the inventory."""
253
 
        present_parents = self.get_graph().get_parent_map(parents)
254
 
        final_parents = []
255
 
        for parent in parents:
256
 
            if parent in present_parents:
257
 
                final_parents.append((parent,))
258
 
        return self.inventories.add_lines((revision_id,), final_parents, lines,
259
 
            check_content=check_content)[0]
260
 
 
261
 
    def revision_graph_can_have_wrong_parents(self):
262
 
        return False
 
270
    @needs_read_lock
 
271
    def get_revision_graph(self, revision_id=None):
 
272
        """Return a dictionary containing the revision graph.
 
273
        
 
274
        :param revision_id: The revision_id to get a graph from. If None, then
 
275
        the entire revision graph is returned. This is a deprecated mode of
 
276
        operation and will be removed in the future.
 
277
        :return: a dictionary of revision_id->revision_parents_list.
 
278
        """
 
279
        if 'evil' in debug.debug_flags:
 
280
            mutter_callsite(3,
 
281
                "get_revision_graph scales with size of history.")
 
282
        # special case NULL_REVISION
 
283
        if revision_id == _mod_revision.NULL_REVISION:
 
284
            return {}
 
285
        a_weave = self.get_inventory_weave()
 
286
        all_revisions = self._eliminate_revisions_not_present(
 
287
                                a_weave.versions())
 
288
        entire_graph = dict([(node, tuple(a_weave.get_parents(node))) for 
 
289
                             node in all_revisions])
 
290
        if revision_id is None:
 
291
            return entire_graph
 
292
        elif revision_id not in entire_graph:
 
293
            raise errors.NoSuchRevision(self, revision_id)
 
294
        else:
 
295
            # add what can be reached from revision_id
 
296
            result = {}
 
297
            pending = set([revision_id])
 
298
            while len(pending) > 0:
 
299
                node = pending.pop()
 
300
                result[node] = entire_graph[node]
 
301
                for revision_id in result[node]:
 
302
                    if revision_id not in result:
 
303
                        pending.add(revision_id)
 
304
            return result
263
305
 
264
306
 
265
307
class PreSplitOutRepositoryFormat(RepositoryFormat):
267
309
 
268
310
    rich_root_data = False
269
311
    supports_tree_reference = False
270
 
    supports_ghosts = False
271
 
    supports_external_lookups = False
272
 
    supports_chks = False
273
 
    _fetch_order = 'topological'
274
 
    _fetch_reconcile = True
275
 
    fast_deltas = False
276
312
 
277
313
    def initialize(self, a_bzrdir, shared=False, _internal=False):
278
 
        """Create a weave repository."""
 
314
        """Create a weave repository.
 
315
        
 
316
        TODO: when creating split out bzr branch formats, move this to a common
 
317
        base for Format5, Format6. or something like that.
 
318
        """
279
319
        if shared:
280
320
            raise errors.IncompatibleFormat(self, a_bzrdir._format)
281
321
 
282
322
        if not _internal:
283
323
            # always initialized when the bzrdir is.
284
324
            return self.open(a_bzrdir, _found=True)
285
 
 
 
325
        
286
326
        # Create an empty weave
287
327
        sio = StringIO()
288
328
        weavefile.write_weave_v5(weave.Weave(), sio)
289
329
        empty_weave = sio.getvalue()
290
330
 
291
 
        trace.mutter('creating repository in %s.', a_bzrdir.transport.base)
292
 
 
 
331
        mutter('creating repository in %s.', a_bzrdir.transport.base)
 
332
        dirs = ['revision-store', 'weaves']
 
333
        files = [('inventory.weave', StringIO(empty_weave)),
 
334
                 ]
 
335
        
293
336
        # FIXME: RBC 20060125 don't peek under the covers
294
337
        # NB: no need to escape relative paths that are url safe.
295
338
        control_files = lockable_files.LockableFiles(a_bzrdir.transport,
296
 
            'branch-lock', lockable_files.TransportLock)
 
339
                                'branch-lock', lockable_files.TransportLock)
297
340
        control_files.create_lock()
298
341
        control_files.lock_write()
299
 
        transport = a_bzrdir.transport
 
342
        control_files._transport.mkdir_multi(dirs,
 
343
                mode=control_files._dir_mode)
300
344
        try:
301
 
            transport.mkdir_multi(['revision-store', 'weaves'],
302
 
                mode=a_bzrdir._get_dir_mode())
303
 
            transport.put_bytes_non_atomic('inventory.weave', empty_weave,
304
 
                mode=a_bzrdir._get_file_mode())
 
345
            for file, content in files:
 
346
                control_files.put(file, content)
305
347
        finally:
306
348
            control_files.unlock()
307
 
        repository = self.open(a_bzrdir, _found=True)
308
 
        self._run_post_repo_init_hooks(repository, a_bzrdir, shared)
309
 
        return repository
 
349
        return self.open(a_bzrdir, _found=True)
 
350
 
 
351
    def _get_control_store(self, repo_transport, control_files):
 
352
        """Return the control store for this repository."""
 
353
        return self._get_versioned_file_store('',
 
354
                                              repo_transport,
 
355
                                              control_files,
 
356
                                              prefixed=False)
 
357
 
 
358
    def _get_text_store(self, transport, control_files):
 
359
        """Get a store for file texts for this format."""
 
360
        raise NotImplementedError(self._get_text_store)
310
361
 
311
362
    def open(self, a_bzrdir, _found=False):
312
363
        """See RepositoryFormat.open()."""
316
367
 
317
368
        repo_transport = a_bzrdir.get_repository_transport(None)
318
369
        control_files = a_bzrdir._control_files
319
 
        result = AllInOneRepository(_format=self, a_bzrdir=a_bzrdir)
320
 
        result.revisions = self._get_revisions(repo_transport, result)
321
 
        result.signatures = self._get_signatures(repo_transport, result)
322
 
        result.inventories = self._get_inventories(repo_transport, result)
323
 
        result.texts = self._get_texts(repo_transport, result)
324
 
        result.chk_bytes = None
325
 
        return result
 
370
        text_store = self._get_text_store(repo_transport, control_files)
 
371
        control_store = self._get_control_store(repo_transport, control_files)
 
372
        _revision_store = self._get_revision_store(repo_transport, control_files)
 
373
        return AllInOneRepository(_format=self,
 
374
                                  a_bzrdir=a_bzrdir,
 
375
                                  _revision_store=_revision_store,
 
376
                                  control_store=control_store,
 
377
                                  text_store=text_store)
 
378
 
 
379
    def check_conversion_target(self, target_format):
 
380
        pass
326
381
 
327
382
 
328
383
class RepositoryFormat4(PreSplitOutRepositoryFormat):
339
394
 
340
395
    _matchingbzrdir = bzrdir.BzrDirFormat4()
341
396
 
 
397
    def __init__(self):
 
398
        super(RepositoryFormat4, self).__init__()
 
399
 
342
400
    def get_format_description(self):
343
401
        """See RepositoryFormat.get_format_description()."""
344
402
        return "Repository format 4"
351
409
        """Format 4 is not supported.
352
410
 
353
411
        It is not supported because the model changed from 4 to 5 and the
354
 
        conversion logic is expensive - so doing it on the fly was not
 
412
        conversion logic is expensive - so doing it on the fly was not 
355
413
        feasible.
356
414
        """
357
415
        return False
358
416
 
359
 
    def _get_inventories(self, repo_transport, repo, name='inventory'):
360
 
        # No inventories store written so far.
 
417
    def _get_control_store(self, repo_transport, control_files):
 
418
        """Format 4 repositories have no formal control store at this point.
 
419
        
 
420
        This will cause any control-file-needing apis to fail - this is desired.
 
421
        """
361
422
        return None
362
 
 
363
 
    def _get_revisions(self, repo_transport, repo):
 
423
    
 
424
    def _get_revision_store(self, repo_transport, control_files):
 
425
        """See RepositoryFormat._get_revision_store()."""
364
426
        from bzrlib.xml4 import serializer_v4
365
 
        return RevisionTextStore(repo_transport.clone('revision-store'),
366
 
            serializer_v4, True, versionedfile.PrefixMapper(),
367
 
            repo.is_locked, repo.is_write_locked)
368
 
 
369
 
    def _get_signatures(self, repo_transport, repo):
370
 
        return SignatureTextStore(repo_transport.clone('revision-store'),
371
 
            False, versionedfile.PrefixMapper(),
372
 
            repo.is_locked, repo.is_write_locked)
373
 
 
374
 
    def _get_texts(self, repo_transport, repo):
375
 
        return None
 
427
        return self._get_text_rev_store(repo_transport,
 
428
                                        control_files,
 
429
                                        'revision-store',
 
430
                                        serializer=serializer_v4)
 
431
 
 
432
    def _get_text_store(self, transport, control_files):
 
433
        """See RepositoryFormat._get_text_store()."""
376
434
 
377
435
 
378
436
class RepositoryFormat5(PreSplitOutRepositoryFormat):
386
444
 
387
445
    _versionedfile_class = weave.WeaveFile
388
446
    _matchingbzrdir = bzrdir.BzrDirFormat5()
389
 
    @property
390
 
    def _serializer(self):
391
 
        return xml5.serializer_v5
 
447
 
 
448
    def __init__(self):
 
449
        super(RepositoryFormat5, self).__init__()
392
450
 
393
451
    def get_format_description(self):
394
452
        """See RepositoryFormat.get_format_description()."""
395
453
        return "Weave repository format 5"
396
454
 
397
 
    def network_name(self):
398
 
        """The network name for this format is the control dirs disk label."""
399
 
        return self._matchingbzrdir.get_format_string()
400
 
 
401
 
    def _get_inventories(self, repo_transport, repo, name='inventory'):
402
 
        mapper = versionedfile.ConstantMapper(name)
403
 
        return versionedfile.ThunkedVersionedFiles(repo_transport,
404
 
            weave.WeaveFile, mapper, repo.is_locked)
405
 
 
406
 
    def _get_revisions(self, repo_transport, repo):
407
 
        return RevisionTextStore(repo_transport.clone('revision-store'),
408
 
            xml5.serializer_v5, False, versionedfile.PrefixMapper(),
409
 
            repo.is_locked, repo.is_write_locked)
410
 
 
411
 
    def _get_signatures(self, repo_transport, repo):
412
 
        return SignatureTextStore(repo_transport.clone('revision-store'),
413
 
            False, versionedfile.PrefixMapper(),
414
 
            repo.is_locked, repo.is_write_locked)
415
 
 
416
 
    def _get_texts(self, repo_transport, repo):
417
 
        mapper = versionedfile.PrefixMapper()
418
 
        base_transport = repo_transport.clone('weaves')
419
 
        return versionedfile.ThunkedVersionedFiles(base_transport,
420
 
            weave.WeaveFile, mapper, repo.is_locked)
 
455
    def _get_revision_store(self, repo_transport, control_files):
 
456
        """See RepositoryFormat._get_revision_store()."""
 
457
        """Return the revision store object for this a_bzrdir."""
 
458
        return self._get_text_rev_store(repo_transport,
 
459
                                        control_files,
 
460
                                        'revision-store',
 
461
                                        compressed=False)
 
462
 
 
463
    def _get_text_store(self, transport, control_files):
 
464
        """See RepositoryFormat._get_text_store()."""
 
465
        return self._get_versioned_file_store('weaves', transport, control_files, prefixed=False)
421
466
 
422
467
 
423
468
class RepositoryFormat6(PreSplitOutRepositoryFormat):
431
476
 
432
477
    _versionedfile_class = weave.WeaveFile
433
478
    _matchingbzrdir = bzrdir.BzrDirFormat6()
434
 
    @property
435
 
    def _serializer(self):
436
 
        return xml5.serializer_v5
 
479
 
 
480
    def __init__(self):
 
481
        super(RepositoryFormat6, self).__init__()
437
482
 
438
483
    def get_format_description(self):
439
484
        """See RepositoryFormat.get_format_description()."""
440
485
        return "Weave repository format 6"
441
486
 
442
 
    def network_name(self):
443
 
        """The network name for this format is the control dirs disk label."""
444
 
        return self._matchingbzrdir.get_format_string()
445
 
 
446
 
    def _get_inventories(self, repo_transport, repo, name='inventory'):
447
 
        mapper = versionedfile.ConstantMapper(name)
448
 
        return versionedfile.ThunkedVersionedFiles(repo_transport,
449
 
            weave.WeaveFile, mapper, repo.is_locked)
450
 
 
451
 
    def _get_revisions(self, repo_transport, repo):
452
 
        return RevisionTextStore(repo_transport.clone('revision-store'),
453
 
            xml5.serializer_v5, False, versionedfile.HashPrefixMapper(),
454
 
            repo.is_locked, repo.is_write_locked)
455
 
 
456
 
    def _get_signatures(self, repo_transport, repo):
457
 
        return SignatureTextStore(repo_transport.clone('revision-store'),
458
 
            False, versionedfile.HashPrefixMapper(),
459
 
            repo.is_locked, repo.is_write_locked)
460
 
 
461
 
    def _get_texts(self, repo_transport, repo):
462
 
        mapper = versionedfile.HashPrefixMapper()
463
 
        base_transport = repo_transport.clone('weaves')
464
 
        return versionedfile.ThunkedVersionedFiles(base_transport,
465
 
            weave.WeaveFile, mapper, repo.is_locked)
 
487
    def _get_revision_store(self, repo_transport, control_files):
 
488
        """See RepositoryFormat._get_revision_store()."""
 
489
        return self._get_text_rev_store(repo_transport,
 
490
                                        control_files,
 
491
                                        'revision-store',
 
492
                                        compressed=False,
 
493
                                        prefixed=True)
 
494
 
 
495
    def _get_text_store(self, transport, control_files):
 
496
        """See RepositoryFormat._get_text_store()."""
 
497
        return self._get_versioned_file_store('weaves', transport, control_files)
466
498
 
467
499
 
468
500
class RepositoryFormat7(MetaDirRepositoryFormat):
478
510
    """
479
511
 
480
512
    _versionedfile_class = weave.WeaveFile
481
 
    supports_ghosts = False
482
 
    supports_chks = False
483
513
 
484
 
    _fetch_order = 'topological'
485
 
    _fetch_reconcile = True
486
 
    fast_deltas = False
487
 
    @property
488
 
    def _serializer(self):
489
 
        return xml5.serializer_v5
 
514
    def _get_control_store(self, repo_transport, control_files):
 
515
        """Return the control store for this repository."""
 
516
        return self._get_versioned_file_store('',
 
517
                                              repo_transport,
 
518
                                              control_files,
 
519
                                              prefixed=False)
490
520
 
491
521
    def get_format_string(self):
492
522
        """See RepositoryFormat.get_format_string()."""
496
526
        """See RepositoryFormat.get_format_description()."""
497
527
        return "Weave repository format 7"
498
528
 
499
 
    def _get_inventories(self, repo_transport, repo, name='inventory'):
500
 
        mapper = versionedfile.ConstantMapper(name)
501
 
        return versionedfile.ThunkedVersionedFiles(repo_transport,
502
 
            weave.WeaveFile, mapper, repo.is_locked)
503
 
 
504
 
    def _get_revisions(self, repo_transport, repo):
505
 
        return RevisionTextStore(repo_transport.clone('revision-store'),
506
 
            xml5.serializer_v5, True, versionedfile.HashPrefixMapper(),
507
 
            repo.is_locked, repo.is_write_locked)
508
 
 
509
 
    def _get_signatures(self, repo_transport, repo):
510
 
        return SignatureTextStore(repo_transport.clone('revision-store'),
511
 
            True, versionedfile.HashPrefixMapper(),
512
 
            repo.is_locked, repo.is_write_locked)
513
 
 
514
 
    def _get_texts(self, repo_transport, repo):
515
 
        mapper = versionedfile.HashPrefixMapper()
516
 
        base_transport = repo_transport.clone('weaves')
517
 
        return versionedfile.ThunkedVersionedFiles(base_transport,
518
 
            weave.WeaveFile, mapper, repo.is_locked)
 
529
    def check_conversion_target(self, target_format):
 
530
        pass
 
531
 
 
532
    def _get_revision_store(self, repo_transport, control_files):
 
533
        """See RepositoryFormat._get_revision_store()."""
 
534
        return self._get_text_rev_store(repo_transport,
 
535
                                        control_files,
 
536
                                        'revision-store',
 
537
                                        compressed=False,
 
538
                                        prefixed=True,
 
539
                                        )
 
540
 
 
541
    def _get_text_store(self, transport, control_files):
 
542
        """See RepositoryFormat._get_text_store()."""
 
543
        return self._get_versioned_file_store('weaves',
 
544
                                              transport,
 
545
                                              control_files)
519
546
 
520
547
    def initialize(self, a_bzrdir, shared=False):
521
548
        """Create a weave repository.
528
555
        weavefile.write_weave_v5(weave.Weave(), sio)
529
556
        empty_weave = sio.getvalue()
530
557
 
531
 
        trace.mutter('creating repository in %s.', a_bzrdir.transport.base)
 
558
        mutter('creating repository in %s.', a_bzrdir.transport.base)
532
559
        dirs = ['revision-store', 'weaves']
533
 
        files = [('inventory.weave', StringIO(empty_weave)),
 
560
        files = [('inventory.weave', StringIO(empty_weave)), 
534
561
                 ]
535
562
        utf8_files = [('format', self.get_format_string())]
536
 
 
 
563
 
537
564
        self._upload_blank_content(a_bzrdir, dirs, files, utf8_files, shared)
538
565
        return self.open(a_bzrdir=a_bzrdir, _found=True)
539
566
 
540
567
    def open(self, a_bzrdir, _found=False, _override_transport=None):
541
568
        """See RepositoryFormat.open().
542
 
 
 
569
        
543
570
        :param _override_transport: INTERNAL USE ONLY. Allows opening the
544
571
                                    repository at a slightly different url
545
572
                                    than normal. I.e. during 'upgrade'.
546
573
        """
547
574
        if not _found:
548
575
            format = RepositoryFormat.find_format(a_bzrdir)
 
576
            assert format.__class__ ==  self.__class__
549
577
        if _override_transport is not None:
550
578
            repo_transport = _override_transport
551
579
        else:
552
580
            repo_transport = a_bzrdir.get_repository_transport(None)
553
581
        control_files = lockable_files.LockableFiles(repo_transport,
554
582
                                'lock', lockdir.LockDir)
555
 
        result = WeaveMetaDirRepository(_format=self, a_bzrdir=a_bzrdir,
556
 
            control_files=control_files)
557
 
        result.revisions = self._get_revisions(repo_transport, result)
558
 
        result.signatures = self._get_signatures(repo_transport, result)
559
 
        result.inventories = self._get_inventories(repo_transport, result)
560
 
        result.texts = self._get_texts(repo_transport, result)
561
 
        result.chk_bytes = None
562
 
        result._transport = repo_transport
563
 
        return result
564
 
 
565
 
 
566
 
class TextVersionedFiles(VersionedFiles):
567
 
    """Just-a-bunch-of-files based VersionedFile stores."""
568
 
 
569
 
    def __init__(self, transport, compressed, mapper, is_locked, can_write):
570
 
        self._compressed = compressed
571
 
        self._transport = transport
572
 
        self._mapper = mapper
573
 
        if self._compressed:
574
 
            self._ext = '.gz'
575
 
        else:
576
 
            self._ext = ''
577
 
        self._is_locked = is_locked
578
 
        self._can_write = can_write
579
 
 
580
 
    def add_lines(self, key, parents, lines):
581
 
        """Add a revision to the store."""
582
 
        if not self._is_locked():
583
 
            raise errors.ObjectNotLocked(self)
584
 
        if not self._can_write():
585
 
            raise errors.ReadOnlyError(self)
586
 
        if '/' in key[-1]:
587
 
            raise ValueError('bad idea to put / in %r' % (key,))
588
 
        text = ''.join(lines)
589
 
        if self._compressed:
590
 
            text = bytes_to_gzip(text)
591
 
        path = self._map(key)
592
 
        self._transport.put_bytes_non_atomic(path, text, create_parent_dir=True)
593
 
 
594
 
    def insert_record_stream(self, stream):
595
 
        adapters = {}
596
 
        for record in stream:
597
 
            # Raise an error when a record is missing.
598
 
            if record.storage_kind == 'absent':
599
 
                raise errors.RevisionNotPresent([record.key[0]], self)
600
 
            # adapt to non-tuple interface
601
 
            if record.storage_kind == 'fulltext':
602
 
                self.add_lines(record.key, None,
603
 
                    osutils.split_lines(record.get_bytes_as('fulltext')))
604
 
            else:
605
 
                adapter_key = record.storage_kind, 'fulltext'
606
 
                try:
607
 
                    adapter = adapters[adapter_key]
608
 
                except KeyError:
609
 
                    adapter_factory = adapter_registry.get(adapter_key)
610
 
                    adapter = adapter_factory(self)
611
 
                    adapters[adapter_key] = adapter
612
 
                lines = osutils.split_lines(adapter.get_bytes(
613
 
                    record, record.get_bytes_as(record.storage_kind)))
614
 
                try:
615
 
                    self.add_lines(record.key, None, lines)
616
 
                except RevisionAlreadyPresent:
617
 
                    pass
618
 
 
619
 
    def _load_text(self, key):
620
 
        if not self._is_locked():
621
 
            raise errors.ObjectNotLocked(self)
622
 
        path = self._map(key)
623
 
        try:
624
 
            text = self._transport.get_bytes(path)
625
 
            compressed = self._compressed
626
 
        except errors.NoSuchFile:
627
 
            if self._compressed:
628
 
                # try without the .gz
629
 
                path = path[:-3]
630
 
                try:
631
 
                    text = self._transport.get_bytes(path)
632
 
                    compressed = False
633
 
                except errors.NoSuchFile:
634
 
                    return None
635
 
            else:
636
 
                return None
637
 
        if compressed:
638
 
            text = GzipFile(mode='rb', fileobj=StringIO(text)).read()
639
 
        return text
640
 
 
641
 
    def _map(self, key):
642
 
        return self._mapper.map(key) + self._ext
643
 
 
644
 
 
645
 
class RevisionTextStore(TextVersionedFiles):
646
 
    """Legacy thunk for format 4 repositories."""
647
 
 
648
 
    def __init__(self, transport, serializer, compressed, mapper, is_locked,
649
 
        can_write):
650
 
        """Create a RevisionTextStore at transport with serializer."""
651
 
        TextVersionedFiles.__init__(self, transport, compressed, mapper,
652
 
            is_locked, can_write)
653
 
        self._serializer = serializer
654
 
 
655
 
    def _load_text_parents(self, key):
656
 
        text = self._load_text(key)
657
 
        if text is None:
658
 
            return None, None
659
 
        parents = self._serializer.read_revision_from_string(text).parent_ids
660
 
        return text, tuple((parent,) for parent in parents)
661
 
 
662
 
    def get_parent_map(self, keys):
663
 
        result = {}
664
 
        for key in keys:
665
 
            parents = self._load_text_parents(key)[1]
666
 
            if parents is None:
667
 
                continue
668
 
            result[key] = parents
669
 
        return result
670
 
 
671
 
    def get_known_graph_ancestry(self, keys):
672
 
        """Get a KnownGraph instance with the ancestry of keys."""
673
 
        keys = self.keys()
674
 
        parent_map = self.get_parent_map(keys)
675
 
        kg = _mod_graph.KnownGraph(parent_map)
676
 
        return kg
677
 
 
678
 
    def get_record_stream(self, keys, sort_order, include_delta_closure):
679
 
        for key in keys:
680
 
            text, parents = self._load_text_parents(key)
681
 
            if text is None:
682
 
                yield AbsentContentFactory(key)
683
 
            else:
684
 
                yield FulltextContentFactory(key, parents, None, text)
685
 
 
686
 
    def keys(self):
687
 
        if not self._is_locked():
688
 
            raise errors.ObjectNotLocked(self)
689
 
        relpaths = set()
690
 
        for quoted_relpath in self._transport.iter_files_recursive():
691
 
            relpath = urllib.unquote(quoted_relpath)
692
 
            path, ext = os.path.splitext(relpath)
693
 
            if ext == '.gz':
694
 
                relpath = path
695
 
            if not relpath.endswith('.sig'):
696
 
                relpaths.add(relpath)
697
 
        paths = list(relpaths)
698
 
        return set([self._mapper.unmap(path) for path in paths])
699
 
 
700
 
 
701
 
class SignatureTextStore(TextVersionedFiles):
702
 
    """Legacy thunk for format 4-7 repositories."""
703
 
 
704
 
    def __init__(self, transport, compressed, mapper, is_locked, can_write):
705
 
        TextVersionedFiles.__init__(self, transport, compressed, mapper,
706
 
            is_locked, can_write)
707
 
        self._ext = '.sig' + self._ext
708
 
 
709
 
    def get_parent_map(self, keys):
710
 
        result = {}
711
 
        for key in keys:
712
 
            text = self._load_text(key)
713
 
            if text is None:
714
 
                continue
715
 
            result[key] = None
716
 
        return result
717
 
 
718
 
    def get_record_stream(self, keys, sort_order, include_delta_closure):
719
 
        for key in keys:
720
 
            text = self._load_text(key)
721
 
            if text is None:
722
 
                yield AbsentContentFactory(key)
723
 
            else:
724
 
                yield FulltextContentFactory(key, None, None, text)
725
 
 
726
 
    def keys(self):
727
 
        if not self._is_locked():
728
 
            raise errors.ObjectNotLocked(self)
729
 
        relpaths = set()
730
 
        for quoted_relpath in self._transport.iter_files_recursive():
731
 
            relpath = urllib.unquote(quoted_relpath)
732
 
            path, ext = os.path.splitext(relpath)
733
 
            if ext == '.gz':
734
 
                relpath = path
735
 
            if not relpath.endswith('.sig'):
736
 
                continue
737
 
            relpaths.add(relpath[:-4])
738
 
        paths = list(relpaths)
739
 
        return set([self._mapper.unmap(path) for path in paths])
 
583
        text_store = self._get_text_store(repo_transport, control_files)
 
584
        control_store = self._get_control_store(repo_transport, control_files)
 
585
        _revision_store = self._get_revision_store(repo_transport, control_files)
 
586
        return WeaveMetaDirRepository(_format=self,
 
587
            a_bzrdir=a_bzrdir,
 
588
            control_files=control_files,
 
589
            _revision_store=_revision_store,
 
590
            control_store=control_store,
 
591
            text_store=text_store)
 
592
 
 
593
 
 
594
class WeaveCommitBuilder(CommitBuilder):
 
595
    """A builder for weave based repos that don't support ghosts."""
 
596
 
 
597
    def _add_text_to_weave(self, file_id, new_lines, parents, nostore_sha):
 
598
        versionedfile = self.repository.weave_store.get_weave_or_empty(
 
599
            file_id, self.repository.get_transaction())
 
600
        result = versionedfile.add_lines(
 
601
            self._new_revision_id, parents, new_lines,
 
602
            nostore_sha=nostore_sha)[0:2]
 
603
        versionedfile.clear_cache()
 
604
        return result
 
605
 
740
606
 
741
607
_legacy_formats = [RepositoryFormat4(),
742
608
                   RepositoryFormat5(),