~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/repofmt/weaverepo.py

  • Committer: Canonical.com Patch Queue Manager
  • Date: 2008-03-16 14:01:20 UTC
  • mfrom: (3280.2.5 integration)
  • Revision ID: pqm@pqm.ubuntu.com-20080316140120-i3yq8yr1l66m11h7
Start 1.4 development

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2007-2010 Canonical Ltd
 
1
# Copyright (C) 2005, 2006, 2007 Canonical Ltd
2
2
#
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
12
12
#
13
13
# You should have received a copy of the GNU General Public License
14
14
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
16
 
17
17
"""Deprecated weave-based repository formats.
18
18
 
20
20
ghosts.
21
21
"""
22
22
 
23
 
import os
24
 
from cStringIO import StringIO
25
 
import urllib
 
23
from StringIO import StringIO
26
24
 
27
 
from bzrlib.lazy_import import lazy_import
28
 
lazy_import(globals(), """
29
 
from bzrlib import (
30
 
    xml5,
31
 
    graph as _mod_graph,
32
 
    )
33
 
""")
34
25
from bzrlib import (
35
26
    bzrdir,
36
27
    debug,
39
30
    lockdir,
40
31
    osutils,
41
32
    revision as _mod_revision,
42
 
    trace,
43
 
    urlutils,
44
 
    versionedfile,
45
33
    weave,
46
34
    weavefile,
 
35
    xml5,
47
36
    )
48
37
from bzrlib.decorators import needs_read_lock, needs_write_lock
49
38
from bzrlib.repository import (
50
39
    CommitBuilder,
51
 
    MetaDirVersionedFileRepository,
 
40
    MetaDirRepository,
52
41
    MetaDirRepositoryFormat,
53
42
    Repository,
54
43
    RepositoryFormat,
55
44
    )
56
45
from bzrlib.store.text import TextStore
57
 
from bzrlib.tuned_gzip import GzipFile, bytes_to_gzip
58
 
from bzrlib.versionedfile import (
59
 
    AbsentContentFactory,
60
 
    FulltextContentFactory,
61
 
    VersionedFiles,
62
 
    )
 
46
from bzrlib.trace import mutter
63
47
 
64
48
 
65
49
class AllInOneRepository(Repository):
66
50
    """Legacy support - the repository behaviour for all-in-one branches."""
67
51
 
68
 
    @property
69
 
    def _serializer(self):
70
 
        return xml5.serializer_v5
71
 
 
72
 
    def _escape(self, file_or_path):
73
 
        if not isinstance(file_or_path, basestring):
74
 
            file_or_path = '/'.join(file_or_path)
75
 
        if file_or_path == '':
76
 
            return u''
77
 
        return urlutils.escape(osutils.safe_unicode(file_or_path))
78
 
 
79
 
    def __init__(self, _format, a_bzrdir):
 
52
    _serializer = xml5.serializer_v5
 
53
 
 
54
    def __init__(self, _format, a_bzrdir, _revision_store, control_store, text_store):
80
55
        # we reuse one control files instance.
81
 
        dir_mode = a_bzrdir._get_dir_mode()
82
 
        file_mode = a_bzrdir._get_file_mode()
 
56
        dir_mode = a_bzrdir._control_files._dir_mode
 
57
        file_mode = a_bzrdir._control_files._file_mode
83
58
 
84
59
        def get_store(name, compressed=True, prefixed=False):
85
60
            # FIXME: This approach of assuming stores are all entirely compressed
86
 
            # or entirely uncompressed is tidy, but breaks upgrade from
87
 
            # some existing branches where there's a mixture; we probably
 
61
            # or entirely uncompressed is tidy, but breaks upgrade from 
 
62
            # some existing branches where there's a mixture; we probably 
88
63
            # still want the option to look for both.
89
 
            relpath = self._escape(name)
90
 
            store = TextStore(a_bzrdir.transport.clone(relpath),
 
64
            relpath = a_bzrdir._control_files._escape(name)
 
65
            store = TextStore(a_bzrdir._control_files._transport.clone(relpath),
91
66
                              prefixed=prefixed, compressed=compressed,
92
67
                              dir_mode=dir_mode,
93
68
                              file_mode=file_mode)
94
69
            return store
95
70
 
96
71
        # not broken out yet because the controlweaves|inventory_store
97
 
        # and texts bits are still different.
 
72
        # and text_store | weave_store bits are still different.
98
73
        if isinstance(_format, RepositoryFormat4):
99
 
            # cannot remove these - there is still no consistent api
 
74
            # cannot remove these - there is still no consistent api 
100
75
            # which allows access to this old info.
101
76
            self.inventory_store = get_store('inventory-store')
102
 
            self._text_store = get_store('text-store')
103
 
        super(AllInOneRepository, self).__init__(_format, a_bzrdir, a_bzrdir._control_files)
 
77
            text_store = get_store('text-store')
 
78
        super(AllInOneRepository, self).__init__(_format, a_bzrdir, a_bzrdir._control_files, _revision_store, control_store, text_store)
104
79
 
105
80
    @needs_read_lock
106
81
    def _all_possible_ids(self):
107
82
        """Return all the possible revisions that we could find."""
108
83
        if 'evil' in debug.debug_flags:
109
 
            trace.mutter_callsite(
110
 
                3, "_all_possible_ids scales with size of history.")
111
 
        return [key[-1] for key in self.inventories.keys()]
 
84
            mutter_callsite(3, "_all_possible_ids scales with size of history.")
 
85
        return self.get_inventory_weave().versions()
112
86
 
113
87
    @needs_read_lock
114
88
    def _all_revision_ids(self):
115
 
        """Returns a list of all the revision ids in the repository.
 
89
        """Returns a list of all the revision ids in the repository. 
116
90
 
117
 
        These are in as much topological order as the underlying store can
 
91
        These are in as much topological order as the underlying store can 
118
92
        present: for weaves ghosts may lead to a lack of correctness until
119
93
        the reweave updates the parents list.
120
94
        """
121
 
        return [key[-1] for key in self.revisions.keys()]
122
 
 
123
 
    def _activate_new_inventory(self):
124
 
        """Put a replacement inventory.new into use as inventories."""
125
 
        # Copy the content across
126
 
        t = self.bzrdir._control_files._transport
127
 
        t.copy('inventory.new.weave', 'inventory.weave')
128
 
        # delete the temp inventory
129
 
        t.delete('inventory.new.weave')
130
 
        # Check we can parse the new weave properly as a sanity check
131
 
        self.inventories.keys()
132
 
 
133
 
    def _backup_inventory(self):
134
 
        t = self.bzrdir._control_files._transport
135
 
        t.copy('inventory.weave', 'inventory.backup.weave')
136
 
 
137
 
    def _temp_inventories(self):
138
 
        t = self.bzrdir._control_files._transport
139
 
        return self._format._get_inventories(t, self, 'inventory.new')
 
95
        if self._revision_store.text_store.listable():
 
96
            return self._revision_store.all_revision_ids(self.get_transaction())
 
97
        result = self._all_possible_ids()
 
98
        # TODO: jam 20070210 Ensure that _all_possible_ids returns non-unicode
 
99
        #       ids. (It should, since _revision_store's API should change to
 
100
        #       return utf8 revision_ids)
 
101
        return self._eliminate_revisions_not_present(result)
 
102
 
 
103
    def _check_revision_parents(self, revision, inventory):
 
104
        """Private to Repository and Fetch.
 
105
        
 
106
        This checks the parentage of revision in an inventory weave for 
 
107
        consistency and is only applicable to inventory-weave-for-ancestry
 
108
        using repository formats & fetchers.
 
109
        """
 
110
        weave_parents = inventory.get_parents(revision.revision_id)
 
111
        weave_names = inventory.versions()
 
112
        for parent_id in revision.parent_ids:
 
113
            if parent_id in weave_names:
 
114
                # this parent must not be a ghost.
 
115
                if not parent_id in weave_parents:
 
116
                    # but it is a ghost
 
117
                    raise errors.CorruptRepository(self)
140
118
 
141
119
    def get_commit_builder(self, branch, parents, config, timestamp=None,
142
120
                           timezone=None, committer=None, revprops=None,
143
121
                           revision_id=None):
144
122
        self._check_ascii_revisionid(revision_id, self.get_commit_builder)
145
 
        result = CommitBuilder(self, parents, config, timestamp, timezone,
 
123
        result = WeaveCommitBuilder(self, parents, config, timestamp, timezone,
146
124
                              committer, revprops, revision_id)
147
125
        self.start_write_group()
148
126
        return result
150
128
    @needs_read_lock
151
129
    def get_revisions(self, revision_ids):
152
130
        revs = self._get_revisions(revision_ids)
 
131
        # weave corruption can lead to absent revision markers that should be
 
132
        # present.
 
133
        # the following test is reasonably cheap (it needs a single weave read)
 
134
        # and the weave is cached in read transactions. In write transactions
 
135
        # it is not cached but typically we only read a small number of
 
136
        # revisions. For knits when they are introduced we will probably want
 
137
        # to ensure that caching write transactions are in use.
 
138
        inv = self.get_inventory_weave()
 
139
        for rev in revs:
 
140
            self._check_revision_parents(rev, inv)
153
141
        return revs
154
142
 
155
 
    def _inventory_add_lines(self, revision_id, parents, lines,
156
 
        check_content=True):
157
 
        """Store lines in inv_vf and return the sha1 of the inventory."""
158
 
        present_parents = self.get_graph().get_parent_map(parents)
159
 
        final_parents = []
160
 
        for parent in parents:
161
 
            if parent in present_parents:
162
 
                final_parents.append((parent,))
163
 
        return self.inventories.add_lines((revision_id,), final_parents, lines,
164
 
            check_content=check_content)[0]
165
 
 
 
143
    @needs_read_lock
 
144
    def get_revision_graph(self, revision_id=None):
 
145
        """Return a dictionary containing the revision graph.
 
146
        
 
147
        :param revision_id: The revision_id to get a graph from. If None, then
 
148
        the entire revision graph is returned. This is a deprecated mode of
 
149
        operation and will be removed in the future.
 
150
        :return: a dictionary of revision_id->revision_parents_list.
 
151
        """
 
152
        if 'evil' in debug.debug_flags:
 
153
            mutter_callsite(2,
 
154
                "get_revision_graph scales with size of history.")
 
155
        # special case NULL_REVISION
 
156
        if revision_id == _mod_revision.NULL_REVISION:
 
157
            return {}
 
158
        a_weave = self.get_inventory_weave()
 
159
        all_revisions = self._eliminate_revisions_not_present(
 
160
                                a_weave.versions())
 
161
        entire_graph = dict([(node, tuple(a_weave.get_parents(node))) for 
 
162
                             node in all_revisions])
 
163
        if revision_id is None:
 
164
            return entire_graph
 
165
        elif revision_id not in entire_graph:
 
166
            raise errors.NoSuchRevision(self, revision_id)
 
167
        else:
 
168
            # add what can be reached from revision_id
 
169
            result = {}
 
170
            pending = set([revision_id])
 
171
            while len(pending) > 0:
 
172
                node = pending.pop()
 
173
                result[node] = entire_graph[node]
 
174
                for revision_id in result[node]:
 
175
                    if revision_id not in result:
 
176
                        pending.add(revision_id)
 
177
            return result
 
178
 
 
179
    def has_revisions(self, revision_ids):
 
180
        """See Repository.has_revisions()."""
 
181
        result = set()
 
182
        transaction = self.get_transaction()
 
183
        for revision_id in revision_ids:
 
184
            if self._revision_store.has_revision_id(revision_id, transaction):
 
185
                result.add(revision_id)
 
186
        return result
 
187
 
 
188
    @needs_read_lock
166
189
    def is_shared(self):
167
190
        """AllInOne repositories cannot be shared."""
168
191
        return False
177
200
        :param new_value: True to restore the default, False to disable making
178
201
                          working trees.
179
202
        """
180
 
        raise errors.RepositoryUpgradeRequired(self.user_url)
181
 
 
 
203
        raise NotImplementedError(self.set_make_working_trees)
 
204
    
182
205
    def make_working_trees(self):
183
206
        """Returns the policy for making working trees on new branches."""
184
207
        return True
189
212
        return False
190
213
 
191
214
 
192
 
class WeaveMetaDirRepository(MetaDirVersionedFileRepository):
 
215
class WeaveMetaDirRepository(MetaDirRepository):
193
216
    """A subclass of MetaDirRepository to set weave specific policy."""
194
217
 
195
 
    def __init__(self, _format, a_bzrdir, control_files):
196
 
        super(WeaveMetaDirRepository, self).__init__(_format, a_bzrdir, control_files)
197
 
        self._serializer = _format._serializer
 
218
    _serializer = xml5.serializer_v5
198
219
 
199
220
    @needs_read_lock
200
221
    def _all_possible_ids(self):
201
222
        """Return all the possible revisions that we could find."""
202
223
        if 'evil' in debug.debug_flags:
203
 
            trace.mutter_callsite(
204
 
                3, "_all_possible_ids scales with size of history.")
205
 
        return [key[-1] for key in self.inventories.keys()]
 
224
            mutter_callsite(3, "_all_possible_ids scales with size of history.")
 
225
        return self.get_inventory_weave().versions()
206
226
 
207
227
    @needs_read_lock
208
228
    def _all_revision_ids(self):
209
 
        """Returns a list of all the revision ids in the repository.
 
229
        """Returns a list of all the revision ids in the repository. 
210
230
 
211
 
        These are in as much topological order as the underlying store can
 
231
        These are in as much topological order as the underlying store can 
212
232
        present: for weaves ghosts may lead to a lack of correctness until
213
233
        the reweave updates the parents list.
214
234
        """
215
 
        return [key[-1] for key in self.revisions.keys()]
216
 
 
217
 
    def _activate_new_inventory(self):
218
 
        """Put a replacement inventory.new into use as inventories."""
219
 
        # Copy the content across
220
 
        t = self._transport
221
 
        t.copy('inventory.new.weave', 'inventory.weave')
222
 
        # delete the temp inventory
223
 
        t.delete('inventory.new.weave')
224
 
        # Check we can parse the new weave properly as a sanity check
225
 
        self.inventories.keys()
226
 
 
227
 
    def _backup_inventory(self):
228
 
        t = self._transport
229
 
        t.copy('inventory.weave', 'inventory.backup.weave')
230
 
 
231
 
    def _temp_inventories(self):
232
 
        t = self._transport
233
 
        return self._format._get_inventories(t, self, 'inventory.new')
 
235
        if self._revision_store.text_store.listable():
 
236
            return self._revision_store.all_revision_ids(self.get_transaction())
 
237
        result = self._all_possible_ids()
 
238
        # TODO: jam 20070210 Ensure that _all_possible_ids returns non-unicode
 
239
        #       ids. (It should, since _revision_store's API should change to
 
240
        #       return utf8 revision_ids)
 
241
        return self._eliminate_revisions_not_present(result)
 
242
 
 
243
    def _check_revision_parents(self, revision, inventory):
 
244
        """Private to Repository and Fetch.
 
245
        
 
246
        This checks the parentage of revision in an inventory weave for 
 
247
        consistency and is only applicable to inventory-weave-for-ancestry
 
248
        using repository formats & fetchers.
 
249
        """
 
250
        weave_parents = inventory.get_parents(revision.revision_id)
 
251
        weave_names = inventory.versions()
 
252
        for parent_id in revision.parent_ids:
 
253
            if parent_id in weave_names:
 
254
                # this parent must not be a ghost.
 
255
                if not parent_id in weave_parents:
 
256
                    # but it is a ghost
 
257
                    raise errors.CorruptRepository(self)
234
258
 
235
259
    def get_commit_builder(self, branch, parents, config, timestamp=None,
236
260
                           timezone=None, committer=None, revprops=None,
237
261
                           revision_id=None):
238
262
        self._check_ascii_revisionid(revision_id, self.get_commit_builder)
239
 
        result = CommitBuilder(self, parents, config, timestamp, timezone,
 
263
        result = WeaveCommitBuilder(self, parents, config, timestamp, timezone,
240
264
                              committer, revprops, revision_id)
241
265
        self.start_write_group()
242
266
        return result
244
268
    @needs_read_lock
245
269
    def get_revision(self, revision_id):
246
270
        """Return the Revision object for a named revision"""
 
271
        # TODO: jam 20070210 get_revision_reconcile should do this for us
247
272
        r = self.get_revision_reconcile(revision_id)
 
273
        # weave corruption can lead to absent revision markers that should be
 
274
        # present.
 
275
        # the following test is reasonably cheap (it needs a single weave read)
 
276
        # and the weave is cached in read transactions. In write transactions
 
277
        # it is not cached but typically we only read a small number of
 
278
        # revisions. For knits when they are introduced we will probably want
 
279
        # to ensure that caching write transactions are in use.
 
280
        inv = self.get_inventory_weave()
 
281
        self._check_revision_parents(r, inv)
248
282
        return r
249
283
 
250
 
    def _inventory_add_lines(self, revision_id, parents, lines,
251
 
        check_content=True):
252
 
        """Store lines in inv_vf and return the sha1 of the inventory."""
253
 
        present_parents = self.get_graph().get_parent_map(parents)
254
 
        final_parents = []
255
 
        for parent in parents:
256
 
            if parent in present_parents:
257
 
                final_parents.append((parent,))
258
 
        return self.inventories.add_lines((revision_id,), final_parents, lines,
259
 
            check_content=check_content)[0]
 
284
    @needs_read_lock
 
285
    def get_revision_graph(self, revision_id=None):
 
286
        """Return a dictionary containing the revision graph.
 
287
        
 
288
        :param revision_id: The revision_id to get a graph from. If None, then
 
289
        the entire revision graph is returned. This is a deprecated mode of
 
290
        operation and will be removed in the future.
 
291
        :return: a dictionary of revision_id->revision_parents_list.
 
292
        """
 
293
        if 'evil' in debug.debug_flags:
 
294
            mutter_callsite(3,
 
295
                "get_revision_graph scales with size of history.")
 
296
        # special case NULL_REVISION
 
297
        if revision_id == _mod_revision.NULL_REVISION:
 
298
            return {}
 
299
        a_weave = self.get_inventory_weave()
 
300
        all_revisions = self._eliminate_revisions_not_present(
 
301
                                a_weave.versions())
 
302
        entire_graph = dict([(node, tuple(a_weave.get_parents(node))) for 
 
303
                             node in all_revisions])
 
304
        if revision_id is None:
 
305
            return entire_graph
 
306
        elif revision_id not in entire_graph:
 
307
            raise errors.NoSuchRevision(self, revision_id)
 
308
        else:
 
309
            # add what can be reached from revision_id
 
310
            result = {}
 
311
            pending = set([revision_id])
 
312
            while len(pending) > 0:
 
313
                node = pending.pop()
 
314
                result[node] = entire_graph[node]
 
315
                for revision_id in result[node]:
 
316
                    if revision_id not in result:
 
317
                        pending.add(revision_id)
 
318
            return result
 
319
 
 
320
    def has_revisions(self, revision_ids):
 
321
        """See Repository.has_revisions()."""
 
322
        result = set()
 
323
        transaction = self.get_transaction()
 
324
        for revision_id in revision_ids:
 
325
            if self._revision_store.has_revision_id(revision_id, transaction):
 
326
                result.add(revision_id)
 
327
        return result
260
328
 
261
329
    def revision_graph_can_have_wrong_parents(self):
 
330
        # XXX: This is an old format that we don't support full checking on, so
 
331
        # just claim that checking for this inconsistency is not required.
262
332
        return False
263
333
 
264
334
 
269
339
    supports_tree_reference = False
270
340
    supports_ghosts = False
271
341
    supports_external_lookups = False
272
 
    supports_chks = False
273
 
    _fetch_order = 'topological'
274
 
    _fetch_reconcile = True
275
 
    fast_deltas = False
276
342
 
277
343
    def initialize(self, a_bzrdir, shared=False, _internal=False):
278
344
        """Create a weave repository."""
282
348
        if not _internal:
283
349
            # always initialized when the bzrdir is.
284
350
            return self.open(a_bzrdir, _found=True)
285
 
 
 
351
        
286
352
        # Create an empty weave
287
353
        sio = StringIO()
288
354
        weavefile.write_weave_v5(weave.Weave(), sio)
289
355
        empty_weave = sio.getvalue()
290
356
 
291
 
        trace.mutter('creating repository in %s.', a_bzrdir.transport.base)
292
 
 
 
357
        mutter('creating repository in %s.', a_bzrdir.transport.base)
 
358
        dirs = ['revision-store', 'weaves']
 
359
        files = [('inventory.weave', StringIO(empty_weave)),
 
360
                 ]
 
361
        
293
362
        # FIXME: RBC 20060125 don't peek under the covers
294
363
        # NB: no need to escape relative paths that are url safe.
295
364
        control_files = lockable_files.LockableFiles(a_bzrdir.transport,
296
 
            'branch-lock', lockable_files.TransportLock)
 
365
                                'branch-lock', lockable_files.TransportLock)
297
366
        control_files.create_lock()
298
367
        control_files.lock_write()
299
 
        transport = a_bzrdir.transport
 
368
        control_files._transport.mkdir_multi(dirs,
 
369
                mode=control_files._dir_mode)
300
370
        try:
301
 
            transport.mkdir_multi(['revision-store', 'weaves'],
302
 
                mode=a_bzrdir._get_dir_mode())
303
 
            transport.put_bytes_non_atomic('inventory.weave', empty_weave,
304
 
                mode=a_bzrdir._get_file_mode())
 
371
            for file, content in files:
 
372
                control_files.put(file, content)
305
373
        finally:
306
374
            control_files.unlock()
307
 
        repository = self.open(a_bzrdir, _found=True)
308
 
        self._run_post_repo_init_hooks(repository, a_bzrdir, shared)
309
 
        return repository
 
375
        return self.open(a_bzrdir, _found=True)
 
376
 
 
377
    def _get_control_store(self, repo_transport, control_files):
 
378
        """Return the control store for this repository."""
 
379
        return self._get_versioned_file_store('',
 
380
                                              repo_transport,
 
381
                                              control_files,
 
382
                                              prefixed=False)
 
383
 
 
384
    def _get_text_store(self, transport, control_files):
 
385
        """Get a store for file texts for this format."""
 
386
        raise NotImplementedError(self._get_text_store)
310
387
 
311
388
    def open(self, a_bzrdir, _found=False):
312
389
        """See RepositoryFormat.open()."""
316
393
 
317
394
        repo_transport = a_bzrdir.get_repository_transport(None)
318
395
        control_files = a_bzrdir._control_files
319
 
        result = AllInOneRepository(_format=self, a_bzrdir=a_bzrdir)
320
 
        result.revisions = self._get_revisions(repo_transport, result)
321
 
        result.signatures = self._get_signatures(repo_transport, result)
322
 
        result.inventories = self._get_inventories(repo_transport, result)
323
 
        result.texts = self._get_texts(repo_transport, result)
324
 
        result.chk_bytes = None
325
 
        return result
 
396
        text_store = self._get_text_store(repo_transport, control_files)
 
397
        control_store = self._get_control_store(repo_transport, control_files)
 
398
        _revision_store = self._get_revision_store(repo_transport, control_files)
 
399
        return AllInOneRepository(_format=self,
 
400
                                  a_bzrdir=a_bzrdir,
 
401
                                  _revision_store=_revision_store,
 
402
                                  control_store=control_store,
 
403
                                  text_store=text_store)
 
404
 
 
405
    def check_conversion_target(self, target_format):
 
406
        pass
326
407
 
327
408
 
328
409
class RepositoryFormat4(PreSplitOutRepositoryFormat):
339
420
 
340
421
    _matchingbzrdir = bzrdir.BzrDirFormat4()
341
422
 
 
423
    def __init__(self):
 
424
        super(RepositoryFormat4, self).__init__()
 
425
 
342
426
    def get_format_description(self):
343
427
        """See RepositoryFormat.get_format_description()."""
344
428
        return "Repository format 4"
351
435
        """Format 4 is not supported.
352
436
 
353
437
        It is not supported because the model changed from 4 to 5 and the
354
 
        conversion logic is expensive - so doing it on the fly was not
 
438
        conversion logic is expensive - so doing it on the fly was not 
355
439
        feasible.
356
440
        """
357
441
        return False
358
442
 
359
 
    def _get_inventories(self, repo_transport, repo, name='inventory'):
360
 
        # No inventories store written so far.
 
443
    def _get_control_store(self, repo_transport, control_files):
 
444
        """Format 4 repositories have no formal control store at this point.
 
445
        
 
446
        This will cause any control-file-needing apis to fail - this is desired.
 
447
        """
361
448
        return None
362
 
 
363
 
    def _get_revisions(self, repo_transport, repo):
 
449
    
 
450
    def _get_revision_store(self, repo_transport, control_files):
 
451
        """See RepositoryFormat._get_revision_store()."""
364
452
        from bzrlib.xml4 import serializer_v4
365
 
        return RevisionTextStore(repo_transport.clone('revision-store'),
366
 
            serializer_v4, True, versionedfile.PrefixMapper(),
367
 
            repo.is_locked, repo.is_write_locked)
368
 
 
369
 
    def _get_signatures(self, repo_transport, repo):
370
 
        return SignatureTextStore(repo_transport.clone('revision-store'),
371
 
            False, versionedfile.PrefixMapper(),
372
 
            repo.is_locked, repo.is_write_locked)
373
 
 
374
 
    def _get_texts(self, repo_transport, repo):
375
 
        return None
 
453
        return self._get_text_rev_store(repo_transport,
 
454
                                        control_files,
 
455
                                        'revision-store',
 
456
                                        serializer=serializer_v4)
 
457
 
 
458
    def _get_text_store(self, transport, control_files):
 
459
        """See RepositoryFormat._get_text_store()."""
376
460
 
377
461
 
378
462
class RepositoryFormat5(PreSplitOutRepositoryFormat):
386
470
 
387
471
    _versionedfile_class = weave.WeaveFile
388
472
    _matchingbzrdir = bzrdir.BzrDirFormat5()
389
 
    @property
390
 
    def _serializer(self):
391
 
        return xml5.serializer_v5
 
473
 
 
474
    def __init__(self):
 
475
        super(RepositoryFormat5, self).__init__()
392
476
 
393
477
    def get_format_description(self):
394
478
        """See RepositoryFormat.get_format_description()."""
395
479
        return "Weave repository format 5"
396
480
 
397
 
    def network_name(self):
398
 
        """The network name for this format is the control dirs disk label."""
399
 
        return self._matchingbzrdir.get_format_string()
400
 
 
401
 
    def _get_inventories(self, repo_transport, repo, name='inventory'):
402
 
        mapper = versionedfile.ConstantMapper(name)
403
 
        return versionedfile.ThunkedVersionedFiles(repo_transport,
404
 
            weave.WeaveFile, mapper, repo.is_locked)
405
 
 
406
 
    def _get_revisions(self, repo_transport, repo):
407
 
        return RevisionTextStore(repo_transport.clone('revision-store'),
408
 
            xml5.serializer_v5, False, versionedfile.PrefixMapper(),
409
 
            repo.is_locked, repo.is_write_locked)
410
 
 
411
 
    def _get_signatures(self, repo_transport, repo):
412
 
        return SignatureTextStore(repo_transport.clone('revision-store'),
413
 
            False, versionedfile.PrefixMapper(),
414
 
            repo.is_locked, repo.is_write_locked)
415
 
 
416
 
    def _get_texts(self, repo_transport, repo):
417
 
        mapper = versionedfile.PrefixMapper()
418
 
        base_transport = repo_transport.clone('weaves')
419
 
        return versionedfile.ThunkedVersionedFiles(base_transport,
420
 
            weave.WeaveFile, mapper, repo.is_locked)
 
481
    def _get_revision_store(self, repo_transport, control_files):
 
482
        """See RepositoryFormat._get_revision_store()."""
 
483
        """Return the revision store object for this a_bzrdir."""
 
484
        return self._get_text_rev_store(repo_transport,
 
485
                                        control_files,
 
486
                                        'revision-store',
 
487
                                        compressed=False)
 
488
 
 
489
    def _get_text_store(self, transport, control_files):
 
490
        """See RepositoryFormat._get_text_store()."""
 
491
        return self._get_versioned_file_store('weaves', transport, control_files, prefixed=False)
421
492
 
422
493
 
423
494
class RepositoryFormat6(PreSplitOutRepositoryFormat):
431
502
 
432
503
    _versionedfile_class = weave.WeaveFile
433
504
    _matchingbzrdir = bzrdir.BzrDirFormat6()
434
 
    @property
435
 
    def _serializer(self):
436
 
        return xml5.serializer_v5
 
505
 
 
506
    def __init__(self):
 
507
        super(RepositoryFormat6, self).__init__()
437
508
 
438
509
    def get_format_description(self):
439
510
        """See RepositoryFormat.get_format_description()."""
440
511
        return "Weave repository format 6"
441
512
 
442
 
    def network_name(self):
443
 
        """The network name for this format is the control dirs disk label."""
444
 
        return self._matchingbzrdir.get_format_string()
445
 
 
446
 
    def _get_inventories(self, repo_transport, repo, name='inventory'):
447
 
        mapper = versionedfile.ConstantMapper(name)
448
 
        return versionedfile.ThunkedVersionedFiles(repo_transport,
449
 
            weave.WeaveFile, mapper, repo.is_locked)
450
 
 
451
 
    def _get_revisions(self, repo_transport, repo):
452
 
        return RevisionTextStore(repo_transport.clone('revision-store'),
453
 
            xml5.serializer_v5, False, versionedfile.HashPrefixMapper(),
454
 
            repo.is_locked, repo.is_write_locked)
455
 
 
456
 
    def _get_signatures(self, repo_transport, repo):
457
 
        return SignatureTextStore(repo_transport.clone('revision-store'),
458
 
            False, versionedfile.HashPrefixMapper(),
459
 
            repo.is_locked, repo.is_write_locked)
460
 
 
461
 
    def _get_texts(self, repo_transport, repo):
462
 
        mapper = versionedfile.HashPrefixMapper()
463
 
        base_transport = repo_transport.clone('weaves')
464
 
        return versionedfile.ThunkedVersionedFiles(base_transport,
465
 
            weave.WeaveFile, mapper, repo.is_locked)
466
 
 
 
513
    def _get_revision_store(self, repo_transport, control_files):
 
514
        """See RepositoryFormat._get_revision_store()."""
 
515
        return self._get_text_rev_store(repo_transport,
 
516
                                        control_files,
 
517
                                        'revision-store',
 
518
                                        compressed=False,
 
519
                                        prefixed=True)
 
520
 
 
521
    def _get_text_store(self, transport, control_files):
 
522
        """See RepositoryFormat._get_text_store()."""
 
523
        return self._get_versioned_file_store('weaves', transport, control_files)
467
524
 
468
525
class RepositoryFormat7(MetaDirRepositoryFormat):
469
526
    """Bzr repository 7.
479
536
 
480
537
    _versionedfile_class = weave.WeaveFile
481
538
    supports_ghosts = False
482
 
    supports_chks = False
483
539
 
484
 
    _fetch_order = 'topological'
485
 
    _fetch_reconcile = True
486
 
    fast_deltas = False
487
 
    @property
488
 
    def _serializer(self):
489
 
        return xml5.serializer_v5
 
540
    def _get_control_store(self, repo_transport, control_files):
 
541
        """Return the control store for this repository."""
 
542
        return self._get_versioned_file_store('',
 
543
                                              repo_transport,
 
544
                                              control_files,
 
545
                                              prefixed=False)
490
546
 
491
547
    def get_format_string(self):
492
548
        """See RepositoryFormat.get_format_string()."""
496
552
        """See RepositoryFormat.get_format_description()."""
497
553
        return "Weave repository format 7"
498
554
 
499
 
    def _get_inventories(self, repo_transport, repo, name='inventory'):
500
 
        mapper = versionedfile.ConstantMapper(name)
501
 
        return versionedfile.ThunkedVersionedFiles(repo_transport,
502
 
            weave.WeaveFile, mapper, repo.is_locked)
503
 
 
504
 
    def _get_revisions(self, repo_transport, repo):
505
 
        return RevisionTextStore(repo_transport.clone('revision-store'),
506
 
            xml5.serializer_v5, True, versionedfile.HashPrefixMapper(),
507
 
            repo.is_locked, repo.is_write_locked)
508
 
 
509
 
    def _get_signatures(self, repo_transport, repo):
510
 
        return SignatureTextStore(repo_transport.clone('revision-store'),
511
 
            True, versionedfile.HashPrefixMapper(),
512
 
            repo.is_locked, repo.is_write_locked)
513
 
 
514
 
    def _get_texts(self, repo_transport, repo):
515
 
        mapper = versionedfile.HashPrefixMapper()
516
 
        base_transport = repo_transport.clone('weaves')
517
 
        return versionedfile.ThunkedVersionedFiles(base_transport,
518
 
            weave.WeaveFile, mapper, repo.is_locked)
 
555
    def check_conversion_target(self, target_format):
 
556
        pass
 
557
 
 
558
    def _get_revision_store(self, repo_transport, control_files):
 
559
        """See RepositoryFormat._get_revision_store()."""
 
560
        return self._get_text_rev_store(repo_transport,
 
561
                                        control_files,
 
562
                                        'revision-store',
 
563
                                        compressed=False,
 
564
                                        prefixed=True,
 
565
                                        )
 
566
 
 
567
    def _get_text_store(self, transport, control_files):
 
568
        """See RepositoryFormat._get_text_store()."""
 
569
        return self._get_versioned_file_store('weaves',
 
570
                                              transport,
 
571
                                              control_files)
519
572
 
520
573
    def initialize(self, a_bzrdir, shared=False):
521
574
        """Create a weave repository.
528
581
        weavefile.write_weave_v5(weave.Weave(), sio)
529
582
        empty_weave = sio.getvalue()
530
583
 
531
 
        trace.mutter('creating repository in %s.', a_bzrdir.transport.base)
 
584
        mutter('creating repository in %s.', a_bzrdir.transport.base)
532
585
        dirs = ['revision-store', 'weaves']
533
 
        files = [('inventory.weave', StringIO(empty_weave)),
 
586
        files = [('inventory.weave', StringIO(empty_weave)), 
534
587
                 ]
535
588
        utf8_files = [('format', self.get_format_string())]
536
 
 
 
589
 
537
590
        self._upload_blank_content(a_bzrdir, dirs, files, utf8_files, shared)
538
591
        return self.open(a_bzrdir=a_bzrdir, _found=True)
539
592
 
540
593
    def open(self, a_bzrdir, _found=False, _override_transport=None):
541
594
        """See RepositoryFormat.open().
542
 
 
 
595
        
543
596
        :param _override_transport: INTERNAL USE ONLY. Allows opening the
544
597
                                    repository at a slightly different url
545
598
                                    than normal. I.e. during 'upgrade'.
546
599
        """
547
600
        if not _found:
548
601
            format = RepositoryFormat.find_format(a_bzrdir)
 
602
            assert format.__class__ ==  self.__class__
549
603
        if _override_transport is not None:
550
604
            repo_transport = _override_transport
551
605
        else:
552
606
            repo_transport = a_bzrdir.get_repository_transport(None)
553
607
        control_files = lockable_files.LockableFiles(repo_transport,
554
608
                                'lock', lockdir.LockDir)
555
 
        result = WeaveMetaDirRepository(_format=self, a_bzrdir=a_bzrdir,
556
 
            control_files=control_files)
557
 
        result.revisions = self._get_revisions(repo_transport, result)
558
 
        result.signatures = self._get_signatures(repo_transport, result)
559
 
        result.inventories = self._get_inventories(repo_transport, result)
560
 
        result.texts = self._get_texts(repo_transport, result)
561
 
        result.chk_bytes = None
562
 
        result._transport = repo_transport
563
 
        return result
564
 
 
565
 
 
566
 
class TextVersionedFiles(VersionedFiles):
567
 
    """Just-a-bunch-of-files based VersionedFile stores."""
568
 
 
569
 
    def __init__(self, transport, compressed, mapper, is_locked, can_write):
570
 
        self._compressed = compressed
571
 
        self._transport = transport
572
 
        self._mapper = mapper
573
 
        if self._compressed:
574
 
            self._ext = '.gz'
575
 
        else:
576
 
            self._ext = ''
577
 
        self._is_locked = is_locked
578
 
        self._can_write = can_write
579
 
 
580
 
    def add_lines(self, key, parents, lines):
581
 
        """Add a revision to the store."""
582
 
        if not self._is_locked():
583
 
            raise errors.ObjectNotLocked(self)
584
 
        if not self._can_write():
585
 
            raise errors.ReadOnlyError(self)
586
 
        if '/' in key[-1]:
587
 
            raise ValueError('bad idea to put / in %r' % (key,))
588
 
        text = ''.join(lines)
589
 
        if self._compressed:
590
 
            text = bytes_to_gzip(text)
591
 
        path = self._map(key)
592
 
        self._transport.put_bytes_non_atomic(path, text, create_parent_dir=True)
593
 
 
594
 
    def insert_record_stream(self, stream):
595
 
        adapters = {}
596
 
        for record in stream:
597
 
            # Raise an error when a record is missing.
598
 
            if record.storage_kind == 'absent':
599
 
                raise errors.RevisionNotPresent([record.key[0]], self)
600
 
            # adapt to non-tuple interface
601
 
            if record.storage_kind == 'fulltext':
602
 
                self.add_lines(record.key, None,
603
 
                    osutils.split_lines(record.get_bytes_as('fulltext')))
604
 
            else:
605
 
                adapter_key = record.storage_kind, 'fulltext'
606
 
                try:
607
 
                    adapter = adapters[adapter_key]
608
 
                except KeyError:
609
 
                    adapter_factory = adapter_registry.get(adapter_key)
610
 
                    adapter = adapter_factory(self)
611
 
                    adapters[adapter_key] = adapter
612
 
                lines = osutils.split_lines(adapter.get_bytes(
613
 
                    record, record.get_bytes_as(record.storage_kind)))
614
 
                try:
615
 
                    self.add_lines(record.key, None, lines)
616
 
                except RevisionAlreadyPresent:
617
 
                    pass
618
 
 
619
 
    def _load_text(self, key):
620
 
        if not self._is_locked():
621
 
            raise errors.ObjectNotLocked(self)
622
 
        path = self._map(key)
623
 
        try:
624
 
            text = self._transport.get_bytes(path)
625
 
            compressed = self._compressed
626
 
        except errors.NoSuchFile:
627
 
            if self._compressed:
628
 
                # try without the .gz
629
 
                path = path[:-3]
630
 
                try:
631
 
                    text = self._transport.get_bytes(path)
632
 
                    compressed = False
633
 
                except errors.NoSuchFile:
634
 
                    return None
635
 
            else:
636
 
                return None
637
 
        if compressed:
638
 
            text = GzipFile(mode='rb', fileobj=StringIO(text)).read()
639
 
        return text
640
 
 
641
 
    def _map(self, key):
642
 
        return self._mapper.map(key) + self._ext
643
 
 
644
 
 
645
 
class RevisionTextStore(TextVersionedFiles):
646
 
    """Legacy thunk for format 4 repositories."""
647
 
 
648
 
    def __init__(self, transport, serializer, compressed, mapper, is_locked,
649
 
        can_write):
650
 
        """Create a RevisionTextStore at transport with serializer."""
651
 
        TextVersionedFiles.__init__(self, transport, compressed, mapper,
652
 
            is_locked, can_write)
653
 
        self._serializer = serializer
654
 
 
655
 
    def _load_text_parents(self, key):
656
 
        text = self._load_text(key)
657
 
        if text is None:
658
 
            return None, None
659
 
        parents = self._serializer.read_revision_from_string(text).parent_ids
660
 
        return text, tuple((parent,) for parent in parents)
661
 
 
662
 
    def get_parent_map(self, keys):
663
 
        result = {}
664
 
        for key in keys:
665
 
            parents = self._load_text_parents(key)[1]
666
 
            if parents is None:
667
 
                continue
668
 
            result[key] = parents
669
 
        return result
670
 
 
671
 
    def get_known_graph_ancestry(self, keys):
672
 
        """Get a KnownGraph instance with the ancestry of keys."""
673
 
        keys = self.keys()
674
 
        parent_map = self.get_parent_map(keys)
675
 
        kg = _mod_graph.KnownGraph(parent_map)
676
 
        return kg
677
 
 
678
 
    def get_record_stream(self, keys, sort_order, include_delta_closure):
679
 
        for key in keys:
680
 
            text, parents = self._load_text_parents(key)
681
 
            if text is None:
682
 
                yield AbsentContentFactory(key)
683
 
            else:
684
 
                yield FulltextContentFactory(key, parents, None, text)
685
 
 
686
 
    def keys(self):
687
 
        if not self._is_locked():
688
 
            raise errors.ObjectNotLocked(self)
689
 
        relpaths = set()
690
 
        for quoted_relpath in self._transport.iter_files_recursive():
691
 
            relpath = urllib.unquote(quoted_relpath)
692
 
            path, ext = os.path.splitext(relpath)
693
 
            if ext == '.gz':
694
 
                relpath = path
695
 
            if not relpath.endswith('.sig'):
696
 
                relpaths.add(relpath)
697
 
        paths = list(relpaths)
698
 
        return set([self._mapper.unmap(path) for path in paths])
699
 
 
700
 
 
701
 
class SignatureTextStore(TextVersionedFiles):
702
 
    """Legacy thunk for format 4-7 repositories."""
703
 
 
704
 
    def __init__(self, transport, compressed, mapper, is_locked, can_write):
705
 
        TextVersionedFiles.__init__(self, transport, compressed, mapper,
706
 
            is_locked, can_write)
707
 
        self._ext = '.sig' + self._ext
708
 
 
709
 
    def get_parent_map(self, keys):
710
 
        result = {}
711
 
        for key in keys:
712
 
            text = self._load_text(key)
713
 
            if text is None:
714
 
                continue
715
 
            result[key] = None
716
 
        return result
717
 
 
718
 
    def get_record_stream(self, keys, sort_order, include_delta_closure):
719
 
        for key in keys:
720
 
            text = self._load_text(key)
721
 
            if text is None:
722
 
                yield AbsentContentFactory(key)
723
 
            else:
724
 
                yield FulltextContentFactory(key, None, None, text)
725
 
 
726
 
    def keys(self):
727
 
        if not self._is_locked():
728
 
            raise errors.ObjectNotLocked(self)
729
 
        relpaths = set()
730
 
        for quoted_relpath in self._transport.iter_files_recursive():
731
 
            relpath = urllib.unquote(quoted_relpath)
732
 
            path, ext = os.path.splitext(relpath)
733
 
            if ext == '.gz':
734
 
                relpath = path
735
 
            if not relpath.endswith('.sig'):
736
 
                continue
737
 
            relpaths.add(relpath[:-4])
738
 
        paths = list(relpaths)
739
 
        return set([self._mapper.unmap(path) for path in paths])
 
609
        text_store = self._get_text_store(repo_transport, control_files)
 
610
        control_store = self._get_control_store(repo_transport, control_files)
 
611
        _revision_store = self._get_revision_store(repo_transport, control_files)
 
612
        return WeaveMetaDirRepository(_format=self,
 
613
            a_bzrdir=a_bzrdir,
 
614
            control_files=control_files,
 
615
            _revision_store=_revision_store,
 
616
            control_store=control_store,
 
617
            text_store=text_store)
 
618
 
 
619
 
 
620
class WeaveCommitBuilder(CommitBuilder):
 
621
    """A builder for weave based repos that don't support ghosts."""
 
622
 
 
623
    def _add_text_to_weave(self, file_id, new_lines, parents, nostore_sha):
 
624
        versionedfile = self.repository.weave_store.get_weave_or_empty(
 
625
            file_id, self.repository.get_transaction())
 
626
        result = versionedfile.add_lines(
 
627
            self._new_revision_id, parents, new_lines,
 
628
            nostore_sha=nostore_sha)[0:2]
 
629
        versionedfile.clear_cache()
 
630
        return result
 
631
 
740
632
 
741
633
_legacy_formats = [RepositoryFormat4(),
742
634
                   RepositoryFormat5(),