~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/repofmt/weaverepo.py

  • Committer: Martin Pool
  • Date: 2008-05-08 04:12:06 UTC
  • mto: This revision was merged to the branch mainline in revision 3415.
  • Revision ID: mbp@sourcefrog.net-20080508041206-tkrr8ucmcyrlzkum
Some review cleanups for assertion removal

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2007-2010 Canonical Ltd
 
1
# Copyright (C) 2005, 2006, 2007 Canonical Ltd
2
2
#
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
12
12
#
13
13
# You should have received a copy of the GNU General Public License
14
14
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
16
 
17
17
"""Deprecated weave-based repository formats.
18
18
 
20
20
ghosts.
21
21
"""
22
22
 
23
 
import os
24
 
from cStringIO import StringIO
25
 
import urllib
 
23
from StringIO import StringIO
26
24
 
27
 
from bzrlib.lazy_import import lazy_import
28
 
lazy_import(globals(), """
29
 
from bzrlib import (
30
 
    xml5,
31
 
    graph as _mod_graph,
32
 
    )
33
 
""")
34
25
from bzrlib import (
35
26
    bzrdir,
36
27
    debug,
39
30
    lockdir,
40
31
    osutils,
41
32
    revision as _mod_revision,
42
 
    trace,
43
 
    urlutils,
44
 
    versionedfile,
45
33
    weave,
46
34
    weavefile,
 
35
    xml5,
47
36
    )
48
37
from bzrlib.decorators import needs_read_lock, needs_write_lock
49
38
from bzrlib.repository import (
54
43
    RepositoryFormat,
55
44
    )
56
45
from bzrlib.store.text import TextStore
57
 
from bzrlib.tuned_gzip import GzipFile, bytes_to_gzip
58
 
from bzrlib.versionedfile import (
59
 
    AbsentContentFactory,
60
 
    FulltextContentFactory,
61
 
    VersionedFiles,
62
 
    )
 
46
from bzrlib.symbol_versioning import deprecated_method, one_four
 
47
from bzrlib.trace import mutter
63
48
 
64
49
 
65
50
class AllInOneRepository(Repository):
66
51
    """Legacy support - the repository behaviour for all-in-one branches."""
67
52
 
68
 
    @property
69
 
    def _serializer(self):
70
 
        return xml5.serializer_v5
71
 
 
72
 
    def _escape(self, file_or_path):
73
 
        if not isinstance(file_or_path, basestring):
74
 
            file_or_path = '/'.join(file_or_path)
75
 
        if file_or_path == '':
76
 
            return u''
77
 
        return urlutils.escape(osutils.safe_unicode(file_or_path))
78
 
 
79
 
    def __init__(self, _format, a_bzrdir):
 
53
    _serializer = xml5.serializer_v5
 
54
 
 
55
    def __init__(self, _format, a_bzrdir, _revision_store, control_store, text_store):
80
56
        # we reuse one control files instance.
81
 
        dir_mode = a_bzrdir._get_dir_mode()
82
 
        file_mode = a_bzrdir._get_file_mode()
 
57
        dir_mode = a_bzrdir._control_files._dir_mode
 
58
        file_mode = a_bzrdir._control_files._file_mode
83
59
 
84
60
        def get_store(name, compressed=True, prefixed=False):
85
61
            # FIXME: This approach of assuming stores are all entirely compressed
86
 
            # or entirely uncompressed is tidy, but breaks upgrade from
87
 
            # some existing branches where there's a mixture; we probably
 
62
            # or entirely uncompressed is tidy, but breaks upgrade from 
 
63
            # some existing branches where there's a mixture; we probably 
88
64
            # still want the option to look for both.
89
 
            relpath = self._escape(name)
90
 
            store = TextStore(a_bzrdir.transport.clone(relpath),
 
65
            relpath = a_bzrdir._control_files._escape(name)
 
66
            store = TextStore(a_bzrdir._control_files._transport.clone(relpath),
91
67
                              prefixed=prefixed, compressed=compressed,
92
68
                              dir_mode=dir_mode,
93
69
                              file_mode=file_mode)
94
70
            return store
95
71
 
96
72
        # not broken out yet because the controlweaves|inventory_store
97
 
        # and texts bits are still different.
 
73
        # and text_store | weave_store bits are still different.
98
74
        if isinstance(_format, RepositoryFormat4):
99
 
            # cannot remove these - there is still no consistent api
 
75
            # cannot remove these - there is still no consistent api 
100
76
            # which allows access to this old info.
101
77
            self.inventory_store = get_store('inventory-store')
102
 
            self._text_store = get_store('text-store')
103
 
        super(AllInOneRepository, self).__init__(_format, a_bzrdir, a_bzrdir._control_files)
 
78
            text_store = get_store('text-store')
 
79
        super(AllInOneRepository, self).__init__(_format, a_bzrdir, a_bzrdir._control_files, _revision_store, control_store, text_store)
 
80
        if control_store is not None:
 
81
            control_store.get_scope = self.get_transaction
 
82
        text_store.get_scope = self.get_transaction
104
83
 
105
84
    @needs_read_lock
106
85
    def _all_possible_ids(self):
107
86
        """Return all the possible revisions that we could find."""
108
87
        if 'evil' in debug.debug_flags:
109
 
            trace.mutter_callsite(
110
 
                3, "_all_possible_ids scales with size of history.")
111
 
        return [key[-1] for key in self.inventories.keys()]
 
88
            mutter_callsite(3, "_all_possible_ids scales with size of history.")
 
89
        return self.get_inventory_weave().versions()
112
90
 
113
91
    @needs_read_lock
114
92
    def _all_revision_ids(self):
115
 
        """Returns a list of all the revision ids in the repository.
 
93
        """Returns a list of all the revision ids in the repository. 
116
94
 
117
 
        These are in as much topological order as the underlying store can
 
95
        These are in as much topological order as the underlying store can 
118
96
        present: for weaves ghosts may lead to a lack of correctness until
119
97
        the reweave updates the parents list.
120
98
        """
121
 
        return [key[-1] for key in self.revisions.keys()]
122
 
 
123
 
    def _activate_new_inventory(self):
124
 
        """Put a replacement inventory.new into use as inventories."""
125
 
        # Copy the content across
126
 
        t = self.bzrdir._control_files._transport
127
 
        t.copy('inventory.new.weave', 'inventory.weave')
128
 
        # delete the temp inventory
129
 
        t.delete('inventory.new.weave')
130
 
        # Check we can parse the new weave properly as a sanity check
131
 
        self.inventories.keys()
132
 
 
133
 
    def _backup_inventory(self):
134
 
        t = self.bzrdir._control_files._transport
135
 
        t.copy('inventory.weave', 'inventory.backup.weave')
136
 
 
137
 
    def _temp_inventories(self):
138
 
        t = self.bzrdir._control_files._transport
139
 
        return self._format._get_inventories(t, self, 'inventory.new')
 
99
        if self._revision_store.text_store.listable():
 
100
            return self._revision_store.all_revision_ids(self.get_transaction())
 
101
        result = self._all_possible_ids()
 
102
        # TODO: jam 20070210 Ensure that _all_possible_ids returns non-unicode
 
103
        #       ids. (It should, since _revision_store's API should change to
 
104
        #       return utf8 revision_ids)
 
105
        return self._eliminate_revisions_not_present(result)
 
106
 
 
107
    def _check_revision_parents(self, revision, inventory):
 
108
        """Private to Repository and Fetch.
 
109
        
 
110
        This checks the parentage of revision in an inventory weave for 
 
111
        consistency and is only applicable to inventory-weave-for-ancestry
 
112
        using repository formats & fetchers.
 
113
        """
 
114
        weave_parents = inventory.get_parent_map(
 
115
            [revision.revision_id])[revision.revision_id]
 
116
        parent_map = inventory.get_parent_map(revision.parent_ids)
 
117
        for parent_id in revision.parent_ids:
 
118
            if parent_id in parent_map:
 
119
                # this parent must not be a ghost.
 
120
                if not parent_id in weave_parents:
 
121
                    # but it is a ghost
 
122
                    raise errors.CorruptRepository(self)
140
123
 
141
124
    def get_commit_builder(self, branch, parents, config, timestamp=None,
142
125
                           timezone=None, committer=None, revprops=None,
143
126
                           revision_id=None):
144
127
        self._check_ascii_revisionid(revision_id, self.get_commit_builder)
145
 
        result = CommitBuilder(self, parents, config, timestamp, timezone,
 
128
        result = WeaveCommitBuilder(self, parents, config, timestamp, timezone,
146
129
                              committer, revprops, revision_id)
147
130
        self.start_write_group()
148
131
        return result
150
133
    @needs_read_lock
151
134
    def get_revisions(self, revision_ids):
152
135
        revs = self._get_revisions(revision_ids)
 
136
        # weave corruption can lead to absent revision markers that should be
 
137
        # present.
 
138
        # the following test is reasonably cheap (it needs a single weave read)
 
139
        # and the weave is cached in read transactions. In write transactions
 
140
        # it is not cached but typically we only read a small number of
 
141
        # revisions. For knits when they are introduced we will probably want
 
142
        # to ensure that caching write transactions are in use.
 
143
        inv = self.get_inventory_weave()
 
144
        for rev in revs:
 
145
            self._check_revision_parents(rev, inv)
153
146
        return revs
154
147
 
155
 
    def _inventory_add_lines(self, revision_id, parents, lines,
156
 
        check_content=True):
157
 
        """Store lines in inv_vf and return the sha1 of the inventory."""
158
 
        present_parents = self.get_graph().get_parent_map(parents)
159
 
        final_parents = []
160
 
        for parent in parents:
161
 
            if parent in present_parents:
162
 
                final_parents.append((parent,))
163
 
        return self.inventories.add_lines((revision_id,), final_parents, lines,
164
 
            check_content=check_content)[0]
165
 
 
 
148
    @deprecated_method(one_four)
 
149
    @needs_read_lock
 
150
    def get_revision_graph(self, revision_id=None):
 
151
        """Return a dictionary containing the revision graph.
 
152
        
 
153
        :param revision_id: The revision_id to get a graph from. If None, then
 
154
        the entire revision graph is returned. This is a deprecated mode of
 
155
        operation and will be removed in the future.
 
156
        :return: a dictionary of revision_id->revision_parents_list.
 
157
        """
 
158
        if 'evil' in debug.debug_flags:
 
159
            mutter_callsite(2,
 
160
                "get_revision_graph scales with size of history.")
 
161
        # special case NULL_REVISION
 
162
        if revision_id == _mod_revision.NULL_REVISION:
 
163
            return {}
 
164
        a_weave = self.get_inventory_weave()
 
165
        all_revisions = self._eliminate_revisions_not_present(
 
166
                                a_weave.versions())
 
167
        entire_graph = a_weave.get_parent_map(all_revisions)
 
168
        if revision_id is None:
 
169
            return entire_graph
 
170
        elif revision_id not in entire_graph:
 
171
            raise errors.NoSuchRevision(self, revision_id)
 
172
        else:
 
173
            # add what can be reached from revision_id
 
174
            result = {}
 
175
            pending = set([revision_id])
 
176
            while len(pending) > 0:
 
177
                node = pending.pop()
 
178
                result[node] = entire_graph[node]
 
179
                for revision_id in result[node]:
 
180
                    if revision_id not in result:
 
181
                        pending.add(revision_id)
 
182
            return result
 
183
 
 
184
    def has_revisions(self, revision_ids):
 
185
        """See Repository.has_revisions()."""
 
186
        result = set()
 
187
        transaction = self.get_transaction()
 
188
        for revision_id in revision_ids:
 
189
            if self._revision_store.has_revision_id(revision_id, transaction):
 
190
                result.add(revision_id)
 
191
        return result
 
192
 
 
193
    @needs_read_lock
166
194
    def is_shared(self):
167
195
        """AllInOne repositories cannot be shared."""
168
196
        return False
177
205
        :param new_value: True to restore the default, False to disable making
178
206
                          working trees.
179
207
        """
180
 
        raise errors.RepositoryUpgradeRequired(self.user_url)
 
208
        raise errors.RepositoryUpgradeRequired(self.bzrdir.root_transport.base)
181
209
 
182
210
    def make_working_trees(self):
183
211
        """Returns the policy for making working trees on new branches."""
192
220
class WeaveMetaDirRepository(MetaDirVersionedFileRepository):
193
221
    """A subclass of MetaDirRepository to set weave specific policy."""
194
222
 
195
 
    def __init__(self, _format, a_bzrdir, control_files):
196
 
        super(WeaveMetaDirRepository, self).__init__(_format, a_bzrdir, control_files)
197
 
        self._serializer = _format._serializer
 
223
    _serializer = xml5.serializer_v5
198
224
 
199
225
    @needs_read_lock
200
226
    def _all_possible_ids(self):
201
227
        """Return all the possible revisions that we could find."""
202
228
        if 'evil' in debug.debug_flags:
203
 
            trace.mutter_callsite(
204
 
                3, "_all_possible_ids scales with size of history.")
205
 
        return [key[-1] for key in self.inventories.keys()]
 
229
            mutter_callsite(3, "_all_possible_ids scales with size of history.")
 
230
        return self.get_inventory_weave().versions()
206
231
 
207
232
    @needs_read_lock
208
233
    def _all_revision_ids(self):
209
 
        """Returns a list of all the revision ids in the repository.
 
234
        """Returns a list of all the revision ids in the repository. 
210
235
 
211
 
        These are in as much topological order as the underlying store can
 
236
        These are in as much topological order as the underlying store can 
212
237
        present: for weaves ghosts may lead to a lack of correctness until
213
238
        the reweave updates the parents list.
214
239
        """
215
 
        return [key[-1] for key in self.revisions.keys()]
216
 
 
217
 
    def _activate_new_inventory(self):
218
 
        """Put a replacement inventory.new into use as inventories."""
219
 
        # Copy the content across
220
 
        t = self._transport
221
 
        t.copy('inventory.new.weave', 'inventory.weave')
222
 
        # delete the temp inventory
223
 
        t.delete('inventory.new.weave')
224
 
        # Check we can parse the new weave properly as a sanity check
225
 
        self.inventories.keys()
226
 
 
227
 
    def _backup_inventory(self):
228
 
        t = self._transport
229
 
        t.copy('inventory.weave', 'inventory.backup.weave')
230
 
 
231
 
    def _temp_inventories(self):
232
 
        t = self._transport
233
 
        return self._format._get_inventories(t, self, 'inventory.new')
 
240
        if self._revision_store.text_store.listable():
 
241
            return self._revision_store.all_revision_ids(self.get_transaction())
 
242
        result = self._all_possible_ids()
 
243
        # TODO: jam 20070210 Ensure that _all_possible_ids returns non-unicode
 
244
        #       ids. (It should, since _revision_store's API should change to
 
245
        #       return utf8 revision_ids)
 
246
        return self._eliminate_revisions_not_present(result)
 
247
 
 
248
    def _check_revision_parents(self, revision, inventory):
 
249
        """Private to Repository and Fetch.
 
250
        
 
251
        This checks the parentage of revision in an inventory weave for 
 
252
        consistency and is only applicable to inventory-weave-for-ancestry
 
253
        using repository formats & fetchers.
 
254
        """
 
255
        weave_parents = inventory.get_parent_map(
 
256
            [revision.revision_id])[revision.revision_id]
 
257
        parent_map = inventory.get_parent_map(revision.parent_ids)
 
258
        for parent_id in revision.parent_ids:
 
259
            if parent_id in parent_map:
 
260
                # this parent must not be a ghost.
 
261
                if not parent_id in weave_parents:
 
262
                    # but it is a ghost
 
263
                    raise errors.CorruptRepository(self)
234
264
 
235
265
    def get_commit_builder(self, branch, parents, config, timestamp=None,
236
266
                           timezone=None, committer=None, revprops=None,
237
267
                           revision_id=None):
238
268
        self._check_ascii_revisionid(revision_id, self.get_commit_builder)
239
 
        result = CommitBuilder(self, parents, config, timestamp, timezone,
 
269
        result = WeaveCommitBuilder(self, parents, config, timestamp, timezone,
240
270
                              committer, revprops, revision_id)
241
271
        self.start_write_group()
242
272
        return result
244
274
    @needs_read_lock
245
275
    def get_revision(self, revision_id):
246
276
        """Return the Revision object for a named revision"""
 
277
        # TODO: jam 20070210 get_revision_reconcile should do this for us
247
278
        r = self.get_revision_reconcile(revision_id)
 
279
        # weave corruption can lead to absent revision markers that should be
 
280
        # present.
 
281
        # the following test is reasonably cheap (it needs a single weave read)
 
282
        # and the weave is cached in read transactions. In write transactions
 
283
        # it is not cached but typically we only read a small number of
 
284
        # revisions. For knits when they are introduced we will probably want
 
285
        # to ensure that caching write transactions are in use.
 
286
        inv = self.get_inventory_weave()
 
287
        self._check_revision_parents(r, inv)
248
288
        return r
249
289
 
250
 
    def _inventory_add_lines(self, revision_id, parents, lines,
251
 
        check_content=True):
252
 
        """Store lines in inv_vf and return the sha1 of the inventory."""
253
 
        present_parents = self.get_graph().get_parent_map(parents)
254
 
        final_parents = []
255
 
        for parent in parents:
256
 
            if parent in present_parents:
257
 
                final_parents.append((parent,))
258
 
        return self.inventories.add_lines((revision_id,), final_parents, lines,
259
 
            check_content=check_content)[0]
 
290
    @deprecated_method(one_four)
 
291
    @needs_read_lock
 
292
    def get_revision_graph(self, revision_id=None):
 
293
        """Return a dictionary containing the revision graph.
 
294
        
 
295
        :param revision_id: The revision_id to get a graph from. If None, then
 
296
        the entire revision graph is returned. This is a deprecated mode of
 
297
        operation and will be removed in the future.
 
298
        :return: a dictionary of revision_id->revision_parents_list.
 
299
        """
 
300
        if 'evil' in debug.debug_flags:
 
301
            mutter_callsite(3,
 
302
                "get_revision_graph scales with size of history.")
 
303
        # special case NULL_REVISION
 
304
        if revision_id == _mod_revision.NULL_REVISION:
 
305
            return {}
 
306
        a_weave = self.get_inventory_weave()
 
307
        all_revisions = self._eliminate_revisions_not_present(
 
308
                                a_weave.versions())
 
309
        entire_graph = a_weave.get_parent_map(all_revisions)
 
310
        if revision_id is None:
 
311
            return entire_graph
 
312
        elif revision_id not in entire_graph:
 
313
            raise errors.NoSuchRevision(self, revision_id)
 
314
        else:
 
315
            # add what can be reached from revision_id
 
316
            result = {}
 
317
            pending = set([revision_id])
 
318
            while len(pending) > 0:
 
319
                node = pending.pop()
 
320
                result[node] = entire_graph[node]
 
321
                for revision_id in result[node]:
 
322
                    if revision_id not in result:
 
323
                        pending.add(revision_id)
 
324
            return result
 
325
 
 
326
    def has_revisions(self, revision_ids):
 
327
        """See Repository.has_revisions()."""
 
328
        result = set()
 
329
        transaction = self.get_transaction()
 
330
        for revision_id in revision_ids:
 
331
            if self._revision_store.has_revision_id(revision_id, transaction):
 
332
                result.add(revision_id)
 
333
        return result
260
334
 
261
335
    def revision_graph_can_have_wrong_parents(self):
 
336
        # XXX: This is an old format that we don't support full checking on, so
 
337
        # just claim that checking for this inconsistency is not required.
262
338
        return False
263
339
 
264
340
 
269
345
    supports_tree_reference = False
270
346
    supports_ghosts = False
271
347
    supports_external_lookups = False
272
 
    supports_chks = False
273
 
    _fetch_order = 'topological'
274
 
    _fetch_reconcile = True
275
 
    fast_deltas = False
276
348
 
277
349
    def initialize(self, a_bzrdir, shared=False, _internal=False):
278
350
        """Create a weave repository."""
282
354
        if not _internal:
283
355
            # always initialized when the bzrdir is.
284
356
            return self.open(a_bzrdir, _found=True)
285
 
 
 
357
        
286
358
        # Create an empty weave
287
359
        sio = StringIO()
288
360
        weavefile.write_weave_v5(weave.Weave(), sio)
289
361
        empty_weave = sio.getvalue()
290
362
 
291
 
        trace.mutter('creating repository in %s.', a_bzrdir.transport.base)
292
 
 
 
363
        mutter('creating repository in %s.', a_bzrdir.transport.base)
 
364
        dirs = ['revision-store', 'weaves']
 
365
        files = [('inventory.weave', StringIO(empty_weave)),
 
366
                 ]
 
367
        
293
368
        # FIXME: RBC 20060125 don't peek under the covers
294
369
        # NB: no need to escape relative paths that are url safe.
295
370
        control_files = lockable_files.LockableFiles(a_bzrdir.transport,
296
 
            'branch-lock', lockable_files.TransportLock)
 
371
                                'branch-lock', lockable_files.TransportLock)
297
372
        control_files.create_lock()
298
373
        control_files.lock_write()
299
 
        transport = a_bzrdir.transport
 
374
        control_files._transport.mkdir_multi(dirs,
 
375
                mode=control_files._dir_mode)
300
376
        try:
301
 
            transport.mkdir_multi(['revision-store', 'weaves'],
302
 
                mode=a_bzrdir._get_dir_mode())
303
 
            transport.put_bytes_non_atomic('inventory.weave', empty_weave,
304
 
                mode=a_bzrdir._get_file_mode())
 
377
            for file, content in files:
 
378
                control_files.put(file, content)
305
379
        finally:
306
380
            control_files.unlock()
307
 
        repository = self.open(a_bzrdir, _found=True)
308
 
        self._run_post_repo_init_hooks(repository, a_bzrdir, shared)
309
 
        return repository
 
381
        return self.open(a_bzrdir, _found=True)
 
382
 
 
383
    def _get_control_store(self, repo_transport, control_files):
 
384
        """Return the control store for this repository."""
 
385
        return self._get_versioned_file_store('',
 
386
                                              repo_transport,
 
387
                                              control_files,
 
388
                                              prefixed=False)
 
389
 
 
390
    def _get_text_store(self, transport, control_files):
 
391
        """Get a store for file texts for this format."""
 
392
        raise NotImplementedError(self._get_text_store)
310
393
 
311
394
    def open(self, a_bzrdir, _found=False):
312
395
        """See RepositoryFormat.open()."""
316
399
 
317
400
        repo_transport = a_bzrdir.get_repository_transport(None)
318
401
        control_files = a_bzrdir._control_files
319
 
        result = AllInOneRepository(_format=self, a_bzrdir=a_bzrdir)
320
 
        result.revisions = self._get_revisions(repo_transport, result)
321
 
        result.signatures = self._get_signatures(repo_transport, result)
322
 
        result.inventories = self._get_inventories(repo_transport, result)
323
 
        result.texts = self._get_texts(repo_transport, result)
324
 
        result.chk_bytes = None
325
 
        return result
 
402
        text_store = self._get_text_store(repo_transport, control_files)
 
403
        control_store = self._get_control_store(repo_transport, control_files)
 
404
        _revision_store = self._get_revision_store(repo_transport, control_files)
 
405
        return AllInOneRepository(_format=self,
 
406
                                  a_bzrdir=a_bzrdir,
 
407
                                  _revision_store=_revision_store,
 
408
                                  control_store=control_store,
 
409
                                  text_store=text_store)
 
410
 
 
411
    def check_conversion_target(self, target_format):
 
412
        pass
326
413
 
327
414
 
328
415
class RepositoryFormat4(PreSplitOutRepositoryFormat):
339
426
 
340
427
    _matchingbzrdir = bzrdir.BzrDirFormat4()
341
428
 
 
429
    def __init__(self):
 
430
        super(RepositoryFormat4, self).__init__()
 
431
 
342
432
    def get_format_description(self):
343
433
        """See RepositoryFormat.get_format_description()."""
344
434
        return "Repository format 4"
351
441
        """Format 4 is not supported.
352
442
 
353
443
        It is not supported because the model changed from 4 to 5 and the
354
 
        conversion logic is expensive - so doing it on the fly was not
 
444
        conversion logic is expensive - so doing it on the fly was not 
355
445
        feasible.
356
446
        """
357
447
        return False
358
448
 
359
 
    def _get_inventories(self, repo_transport, repo, name='inventory'):
360
 
        # No inventories store written so far.
 
449
    def _get_control_store(self, repo_transport, control_files):
 
450
        """Format 4 repositories have no formal control store at this point.
 
451
        
 
452
        This will cause any control-file-needing apis to fail - this is desired.
 
453
        """
361
454
        return None
362
 
 
363
 
    def _get_revisions(self, repo_transport, repo):
 
455
    
 
456
    def _get_revision_store(self, repo_transport, control_files):
 
457
        """See RepositoryFormat._get_revision_store()."""
364
458
        from bzrlib.xml4 import serializer_v4
365
 
        return RevisionTextStore(repo_transport.clone('revision-store'),
366
 
            serializer_v4, True, versionedfile.PrefixMapper(),
367
 
            repo.is_locked, repo.is_write_locked)
368
 
 
369
 
    def _get_signatures(self, repo_transport, repo):
370
 
        return SignatureTextStore(repo_transport.clone('revision-store'),
371
 
            False, versionedfile.PrefixMapper(),
372
 
            repo.is_locked, repo.is_write_locked)
373
 
 
374
 
    def _get_texts(self, repo_transport, repo):
375
 
        return None
 
459
        return self._get_text_rev_store(repo_transport,
 
460
                                        control_files,
 
461
                                        'revision-store',
 
462
                                        serializer=serializer_v4)
 
463
 
 
464
    def _get_text_store(self, transport, control_files):
 
465
        """See RepositoryFormat._get_text_store()."""
376
466
 
377
467
 
378
468
class RepositoryFormat5(PreSplitOutRepositoryFormat):
386
476
 
387
477
    _versionedfile_class = weave.WeaveFile
388
478
    _matchingbzrdir = bzrdir.BzrDirFormat5()
389
 
    @property
390
 
    def _serializer(self):
391
 
        return xml5.serializer_v5
 
479
 
 
480
    def __init__(self):
 
481
        super(RepositoryFormat5, self).__init__()
392
482
 
393
483
    def get_format_description(self):
394
484
        """See RepositoryFormat.get_format_description()."""
395
485
        return "Weave repository format 5"
396
486
 
397
 
    def network_name(self):
398
 
        """The network name for this format is the control dirs disk label."""
399
 
        return self._matchingbzrdir.get_format_string()
400
 
 
401
 
    def _get_inventories(self, repo_transport, repo, name='inventory'):
402
 
        mapper = versionedfile.ConstantMapper(name)
403
 
        return versionedfile.ThunkedVersionedFiles(repo_transport,
404
 
            weave.WeaveFile, mapper, repo.is_locked)
405
 
 
406
 
    def _get_revisions(self, repo_transport, repo):
407
 
        return RevisionTextStore(repo_transport.clone('revision-store'),
408
 
            xml5.serializer_v5, False, versionedfile.PrefixMapper(),
409
 
            repo.is_locked, repo.is_write_locked)
410
 
 
411
 
    def _get_signatures(self, repo_transport, repo):
412
 
        return SignatureTextStore(repo_transport.clone('revision-store'),
413
 
            False, versionedfile.PrefixMapper(),
414
 
            repo.is_locked, repo.is_write_locked)
415
 
 
416
 
    def _get_texts(self, repo_transport, repo):
417
 
        mapper = versionedfile.PrefixMapper()
418
 
        base_transport = repo_transport.clone('weaves')
419
 
        return versionedfile.ThunkedVersionedFiles(base_transport,
420
 
            weave.WeaveFile, mapper, repo.is_locked)
 
487
    def _get_revision_store(self, repo_transport, control_files):
 
488
        """See RepositoryFormat._get_revision_store()."""
 
489
        """Return the revision store object for this a_bzrdir."""
 
490
        return self._get_text_rev_store(repo_transport,
 
491
                                        control_files,
 
492
                                        'revision-store',
 
493
                                        compressed=False)
 
494
 
 
495
    def _get_text_store(self, transport, control_files):
 
496
        """See RepositoryFormat._get_text_store()."""
 
497
        return self._get_versioned_file_store('weaves', transport, control_files, prefixed=False)
421
498
 
422
499
 
423
500
class RepositoryFormat6(PreSplitOutRepositoryFormat):
431
508
 
432
509
    _versionedfile_class = weave.WeaveFile
433
510
    _matchingbzrdir = bzrdir.BzrDirFormat6()
434
 
    @property
435
 
    def _serializer(self):
436
 
        return xml5.serializer_v5
 
511
 
 
512
    def __init__(self):
 
513
        super(RepositoryFormat6, self).__init__()
437
514
 
438
515
    def get_format_description(self):
439
516
        """See RepositoryFormat.get_format_description()."""
440
517
        return "Weave repository format 6"
441
518
 
442
 
    def network_name(self):
443
 
        """The network name for this format is the control dirs disk label."""
444
 
        return self._matchingbzrdir.get_format_string()
445
 
 
446
 
    def _get_inventories(self, repo_transport, repo, name='inventory'):
447
 
        mapper = versionedfile.ConstantMapper(name)
448
 
        return versionedfile.ThunkedVersionedFiles(repo_transport,
449
 
            weave.WeaveFile, mapper, repo.is_locked)
450
 
 
451
 
    def _get_revisions(self, repo_transport, repo):
452
 
        return RevisionTextStore(repo_transport.clone('revision-store'),
453
 
            xml5.serializer_v5, False, versionedfile.HashPrefixMapper(),
454
 
            repo.is_locked, repo.is_write_locked)
455
 
 
456
 
    def _get_signatures(self, repo_transport, repo):
457
 
        return SignatureTextStore(repo_transport.clone('revision-store'),
458
 
            False, versionedfile.HashPrefixMapper(),
459
 
            repo.is_locked, repo.is_write_locked)
460
 
 
461
 
    def _get_texts(self, repo_transport, repo):
462
 
        mapper = versionedfile.HashPrefixMapper()
463
 
        base_transport = repo_transport.clone('weaves')
464
 
        return versionedfile.ThunkedVersionedFiles(base_transport,
465
 
            weave.WeaveFile, mapper, repo.is_locked)
466
 
 
 
519
    def _get_revision_store(self, repo_transport, control_files):
 
520
        """See RepositoryFormat._get_revision_store()."""
 
521
        return self._get_text_rev_store(repo_transport,
 
522
                                        control_files,
 
523
                                        'revision-store',
 
524
                                        compressed=False,
 
525
                                        prefixed=True)
 
526
 
 
527
    def _get_text_store(self, transport, control_files):
 
528
        """See RepositoryFormat._get_text_store()."""
 
529
        return self._get_versioned_file_store('weaves', transport, control_files)
467
530
 
468
531
class RepositoryFormat7(MetaDirRepositoryFormat):
469
532
    """Bzr repository 7.
479
542
 
480
543
    _versionedfile_class = weave.WeaveFile
481
544
    supports_ghosts = False
482
 
    supports_chks = False
483
545
 
484
 
    _fetch_order = 'topological'
485
 
    _fetch_reconcile = True
486
 
    fast_deltas = False
487
 
    @property
488
 
    def _serializer(self):
489
 
        return xml5.serializer_v5
 
546
    def _get_control_store(self, repo_transport, control_files):
 
547
        """Return the control store for this repository."""
 
548
        return self._get_versioned_file_store('',
 
549
                                              repo_transport,
 
550
                                              control_files,
 
551
                                              prefixed=False)
490
552
 
491
553
    def get_format_string(self):
492
554
        """See RepositoryFormat.get_format_string()."""
496
558
        """See RepositoryFormat.get_format_description()."""
497
559
        return "Weave repository format 7"
498
560
 
499
 
    def _get_inventories(self, repo_transport, repo, name='inventory'):
500
 
        mapper = versionedfile.ConstantMapper(name)
501
 
        return versionedfile.ThunkedVersionedFiles(repo_transport,
502
 
            weave.WeaveFile, mapper, repo.is_locked)
503
 
 
504
 
    def _get_revisions(self, repo_transport, repo):
505
 
        return RevisionTextStore(repo_transport.clone('revision-store'),
506
 
            xml5.serializer_v5, True, versionedfile.HashPrefixMapper(),
507
 
            repo.is_locked, repo.is_write_locked)
508
 
 
509
 
    def _get_signatures(self, repo_transport, repo):
510
 
        return SignatureTextStore(repo_transport.clone('revision-store'),
511
 
            True, versionedfile.HashPrefixMapper(),
512
 
            repo.is_locked, repo.is_write_locked)
513
 
 
514
 
    def _get_texts(self, repo_transport, repo):
515
 
        mapper = versionedfile.HashPrefixMapper()
516
 
        base_transport = repo_transport.clone('weaves')
517
 
        return versionedfile.ThunkedVersionedFiles(base_transport,
518
 
            weave.WeaveFile, mapper, repo.is_locked)
 
561
    def check_conversion_target(self, target_format):
 
562
        pass
 
563
 
 
564
    def _get_revision_store(self, repo_transport, control_files):
 
565
        """See RepositoryFormat._get_revision_store()."""
 
566
        return self._get_text_rev_store(repo_transport,
 
567
                                        control_files,
 
568
                                        'revision-store',
 
569
                                        compressed=False,
 
570
                                        prefixed=True,
 
571
                                        )
 
572
 
 
573
    def _get_text_store(self, transport, control_files):
 
574
        """See RepositoryFormat._get_text_store()."""
 
575
        return self._get_versioned_file_store('weaves',
 
576
                                              transport,
 
577
                                              control_files)
519
578
 
520
579
    def initialize(self, a_bzrdir, shared=False):
521
580
        """Create a weave repository.
528
587
        weavefile.write_weave_v5(weave.Weave(), sio)
529
588
        empty_weave = sio.getvalue()
530
589
 
531
 
        trace.mutter('creating repository in %s.', a_bzrdir.transport.base)
 
590
        mutter('creating repository in %s.', a_bzrdir.transport.base)
532
591
        dirs = ['revision-store', 'weaves']
533
 
        files = [('inventory.weave', StringIO(empty_weave)),
 
592
        files = [('inventory.weave', StringIO(empty_weave)), 
534
593
                 ]
535
594
        utf8_files = [('format', self.get_format_string())]
536
 
 
 
595
 
537
596
        self._upload_blank_content(a_bzrdir, dirs, files, utf8_files, shared)
538
597
        return self.open(a_bzrdir=a_bzrdir, _found=True)
539
598
 
540
599
    def open(self, a_bzrdir, _found=False, _override_transport=None):
541
600
        """See RepositoryFormat.open().
542
 
 
 
601
        
543
602
        :param _override_transport: INTERNAL USE ONLY. Allows opening the
544
603
                                    repository at a slightly different url
545
604
                                    than normal. I.e. during 'upgrade'.
552
611
            repo_transport = a_bzrdir.get_repository_transport(None)
553
612
        control_files = lockable_files.LockableFiles(repo_transport,
554
613
                                'lock', lockdir.LockDir)
555
 
        result = WeaveMetaDirRepository(_format=self, a_bzrdir=a_bzrdir,
556
 
            control_files=control_files)
557
 
        result.revisions = self._get_revisions(repo_transport, result)
558
 
        result.signatures = self._get_signatures(repo_transport, result)
559
 
        result.inventories = self._get_inventories(repo_transport, result)
560
 
        result.texts = self._get_texts(repo_transport, result)
561
 
        result.chk_bytes = None
562
 
        result._transport = repo_transport
563
 
        return result
564
 
 
565
 
 
566
 
class TextVersionedFiles(VersionedFiles):
567
 
    """Just-a-bunch-of-files based VersionedFile stores."""
568
 
 
569
 
    def __init__(self, transport, compressed, mapper, is_locked, can_write):
570
 
        self._compressed = compressed
571
 
        self._transport = transport
572
 
        self._mapper = mapper
573
 
        if self._compressed:
574
 
            self._ext = '.gz'
575
 
        else:
576
 
            self._ext = ''
577
 
        self._is_locked = is_locked
578
 
        self._can_write = can_write
579
 
 
580
 
    def add_lines(self, key, parents, lines):
581
 
        """Add a revision to the store."""
582
 
        if not self._is_locked():
583
 
            raise errors.ObjectNotLocked(self)
584
 
        if not self._can_write():
585
 
            raise errors.ReadOnlyError(self)
586
 
        if '/' in key[-1]:
587
 
            raise ValueError('bad idea to put / in %r' % (key,))
588
 
        text = ''.join(lines)
589
 
        if self._compressed:
590
 
            text = bytes_to_gzip(text)
591
 
        path = self._map(key)
592
 
        self._transport.put_bytes_non_atomic(path, text, create_parent_dir=True)
593
 
 
594
 
    def insert_record_stream(self, stream):
595
 
        adapters = {}
596
 
        for record in stream:
597
 
            # Raise an error when a record is missing.
598
 
            if record.storage_kind == 'absent':
599
 
                raise errors.RevisionNotPresent([record.key[0]], self)
600
 
            # adapt to non-tuple interface
601
 
            if record.storage_kind == 'fulltext':
602
 
                self.add_lines(record.key, None,
603
 
                    osutils.split_lines(record.get_bytes_as('fulltext')))
604
 
            else:
605
 
                adapter_key = record.storage_kind, 'fulltext'
606
 
                try:
607
 
                    adapter = adapters[adapter_key]
608
 
                except KeyError:
609
 
                    adapter_factory = adapter_registry.get(adapter_key)
610
 
                    adapter = adapter_factory(self)
611
 
                    adapters[adapter_key] = adapter
612
 
                lines = osutils.split_lines(adapter.get_bytes(
613
 
                    record, record.get_bytes_as(record.storage_kind)))
614
 
                try:
615
 
                    self.add_lines(record.key, None, lines)
616
 
                except RevisionAlreadyPresent:
617
 
                    pass
618
 
 
619
 
    def _load_text(self, key):
620
 
        if not self._is_locked():
621
 
            raise errors.ObjectNotLocked(self)
622
 
        path = self._map(key)
623
 
        try:
624
 
            text = self._transport.get_bytes(path)
625
 
            compressed = self._compressed
626
 
        except errors.NoSuchFile:
627
 
            if self._compressed:
628
 
                # try without the .gz
629
 
                path = path[:-3]
630
 
                try:
631
 
                    text = self._transport.get_bytes(path)
632
 
                    compressed = False
633
 
                except errors.NoSuchFile:
634
 
                    return None
635
 
            else:
636
 
                return None
637
 
        if compressed:
638
 
            text = GzipFile(mode='rb', fileobj=StringIO(text)).read()
639
 
        return text
640
 
 
641
 
    def _map(self, key):
642
 
        return self._mapper.map(key) + self._ext
643
 
 
644
 
 
645
 
class RevisionTextStore(TextVersionedFiles):
646
 
    """Legacy thunk for format 4 repositories."""
647
 
 
648
 
    def __init__(self, transport, serializer, compressed, mapper, is_locked,
649
 
        can_write):
650
 
        """Create a RevisionTextStore at transport with serializer."""
651
 
        TextVersionedFiles.__init__(self, transport, compressed, mapper,
652
 
            is_locked, can_write)
653
 
        self._serializer = serializer
654
 
 
655
 
    def _load_text_parents(self, key):
656
 
        text = self._load_text(key)
657
 
        if text is None:
658
 
            return None, None
659
 
        parents = self._serializer.read_revision_from_string(text).parent_ids
660
 
        return text, tuple((parent,) for parent in parents)
661
 
 
662
 
    def get_parent_map(self, keys):
663
 
        result = {}
664
 
        for key in keys:
665
 
            parents = self._load_text_parents(key)[1]
666
 
            if parents is None:
667
 
                continue
668
 
            result[key] = parents
669
 
        return result
670
 
 
671
 
    def get_known_graph_ancestry(self, keys):
672
 
        """Get a KnownGraph instance with the ancestry of keys."""
673
 
        keys = self.keys()
674
 
        parent_map = self.get_parent_map(keys)
675
 
        kg = _mod_graph.KnownGraph(parent_map)
676
 
        return kg
677
 
 
678
 
    def get_record_stream(self, keys, sort_order, include_delta_closure):
679
 
        for key in keys:
680
 
            text, parents = self._load_text_parents(key)
681
 
            if text is None:
682
 
                yield AbsentContentFactory(key)
683
 
            else:
684
 
                yield FulltextContentFactory(key, parents, None, text)
685
 
 
686
 
    def keys(self):
687
 
        if not self._is_locked():
688
 
            raise errors.ObjectNotLocked(self)
689
 
        relpaths = set()
690
 
        for quoted_relpath in self._transport.iter_files_recursive():
691
 
            relpath = urllib.unquote(quoted_relpath)
692
 
            path, ext = os.path.splitext(relpath)
693
 
            if ext == '.gz':
694
 
                relpath = path
695
 
            if not relpath.endswith('.sig'):
696
 
                relpaths.add(relpath)
697
 
        paths = list(relpaths)
698
 
        return set([self._mapper.unmap(path) for path in paths])
699
 
 
700
 
 
701
 
class SignatureTextStore(TextVersionedFiles):
702
 
    """Legacy thunk for format 4-7 repositories."""
703
 
 
704
 
    def __init__(self, transport, compressed, mapper, is_locked, can_write):
705
 
        TextVersionedFiles.__init__(self, transport, compressed, mapper,
706
 
            is_locked, can_write)
707
 
        self._ext = '.sig' + self._ext
708
 
 
709
 
    def get_parent_map(self, keys):
710
 
        result = {}
711
 
        for key in keys:
712
 
            text = self._load_text(key)
713
 
            if text is None:
714
 
                continue
715
 
            result[key] = None
716
 
        return result
717
 
 
718
 
    def get_record_stream(self, keys, sort_order, include_delta_closure):
719
 
        for key in keys:
720
 
            text = self._load_text(key)
721
 
            if text is None:
722
 
                yield AbsentContentFactory(key)
723
 
            else:
724
 
                yield FulltextContentFactory(key, None, None, text)
725
 
 
726
 
    def keys(self):
727
 
        if not self._is_locked():
728
 
            raise errors.ObjectNotLocked(self)
729
 
        relpaths = set()
730
 
        for quoted_relpath in self._transport.iter_files_recursive():
731
 
            relpath = urllib.unquote(quoted_relpath)
732
 
            path, ext = os.path.splitext(relpath)
733
 
            if ext == '.gz':
734
 
                relpath = path
735
 
            if not relpath.endswith('.sig'):
736
 
                continue
737
 
            relpaths.add(relpath[:-4])
738
 
        paths = list(relpaths)
739
 
        return set([self._mapper.unmap(path) for path in paths])
 
614
        text_store = self._get_text_store(repo_transport, control_files)
 
615
        control_store = self._get_control_store(repo_transport, control_files)
 
616
        _revision_store = self._get_revision_store(repo_transport, control_files)
 
617
        return WeaveMetaDirRepository(_format=self,
 
618
            a_bzrdir=a_bzrdir,
 
619
            control_files=control_files,
 
620
            _revision_store=_revision_store,
 
621
            control_store=control_store,
 
622
            text_store=text_store)
 
623
 
 
624
 
 
625
class WeaveCommitBuilder(CommitBuilder):
 
626
    """A builder for weave based repos that don't support ghosts."""
 
627
 
 
628
    def _add_text_to_weave(self, file_id, new_lines, parents, nostore_sha):
 
629
        versionedfile = self.repository.weave_store.get_weave_or_empty(
 
630
            file_id, self.repository.get_transaction())
 
631
        result = versionedfile.add_lines(
 
632
            self._new_revision_id, parents, new_lines,
 
633
            nostore_sha=nostore_sha)[0:2]
 
634
        return result
 
635
 
740
636
 
741
637
_legacy_formats = [RepositoryFormat4(),
742
638
                   RepositoryFormat5(),