~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/repofmt/knitrepo.py

  • Committer: Robert Collins
  • Date: 2009-03-03 03:27:51 UTC
  • mto: (4070.2.5 integration)
  • mto: This revision was merged to the branch mainline in revision 4075.
  • Revision ID: robertc@robertcollins.net-20090303032751-ubyfhezgjul6y5ic
Get BzrDir.cloning_metadir working.

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# Copyright (C) 2005, 2006, 2007 Canonical Ltd
 
2
#
 
3
# This program is free software; you can redistribute it and/or modify
 
4
# it under the terms of the GNU General Public License as published by
 
5
# the Free Software Foundation; either version 2 of the License, or
 
6
# (at your option) any later version.
 
7
#
 
8
# This program is distributed in the hope that it will be useful,
 
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
11
# GNU General Public License for more details.
 
12
#
 
13
# You should have received a copy of the GNU General Public License
 
14
# along with this program; if not, write to the Free Software
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
16
 
 
17
from bzrlib.lazy_import import lazy_import
 
18
lazy_import(globals(), """
 
19
from bzrlib import (
 
20
    bzrdir,
 
21
    errors,
 
22
    knit as _mod_knit,
 
23
    lockable_files,
 
24
    lockdir,
 
25
    osutils,
 
26
    revision as _mod_revision,
 
27
    transactions,
 
28
    versionedfile,
 
29
    xml5,
 
30
    xml6,
 
31
    xml7,
 
32
    )
 
33
""")
 
34
from bzrlib import (
 
35
    symbol_versioning,
 
36
    )
 
37
from bzrlib.decorators import needs_read_lock, needs_write_lock
 
38
from bzrlib.repository import (
 
39
    CommitBuilder,
 
40
    MetaDirRepository,
 
41
    MetaDirRepositoryFormat,
 
42
    RepositoryFormat,
 
43
    RootCommitBuilder,
 
44
    )
 
45
from bzrlib.trace import mutter, mutter_callsite
 
46
 
 
47
 
 
48
class _KnitParentsProvider(object):
 
49
 
 
50
    def __init__(self, knit):
 
51
        self._knit = knit
 
52
 
 
53
    def __repr__(self):
 
54
        return 'KnitParentsProvider(%r)' % self._knit
 
55
 
 
56
    @symbol_versioning.deprecated_method(symbol_versioning.one_one)
 
57
    def get_parents(self, revision_ids):
 
58
        """See graph._StackedParentsProvider.get_parents"""
 
59
        parent_map = self.get_parent_map(revision_ids)
 
60
        return [parent_map.get(r, None) for r in revision_ids]
 
61
 
 
62
    def get_parent_map(self, keys):
 
63
        """See graph._StackedParentsProvider.get_parent_map"""
 
64
        parent_map = {}
 
65
        for revision_id in keys:
 
66
            if revision_id is None:
 
67
                raise ValueError('get_parent_map(None) is not valid')
 
68
            if revision_id == _mod_revision.NULL_REVISION:
 
69
                parent_map[revision_id] = ()
 
70
            else:
 
71
                try:
 
72
                    parents = tuple(
 
73
                        self._knit.get_parents_with_ghosts(revision_id))
 
74
                except errors.RevisionNotPresent:
 
75
                    continue
 
76
                else:
 
77
                    if len(parents) == 0:
 
78
                        parents = (_mod_revision.NULL_REVISION,)
 
79
                parent_map[revision_id] = parents
 
80
        return parent_map
 
81
 
 
82
 
 
83
class _KnitsParentsProvider(object):
 
84
 
 
85
    def __init__(self, knit, prefix=()):
 
86
        """Create a parent provider for string keys mapped to tuple keys."""
 
87
        self._knit = knit
 
88
        self._prefix = prefix
 
89
 
 
90
    def __repr__(self):
 
91
        return 'KnitsParentsProvider(%r)' % self._knit
 
92
 
 
93
    def get_parent_map(self, keys):
 
94
        """See graph._StackedParentsProvider.get_parent_map"""
 
95
        parent_map = self._knit.get_parent_map(
 
96
            [self._prefix + (key,) for key in keys])
 
97
        result = {}
 
98
        for key, parents in parent_map.items():
 
99
            revid = key[-1]
 
100
            if len(parents) == 0:
 
101
                parents = (_mod_revision.NULL_REVISION,)
 
102
            else:
 
103
                parents = tuple(parent[-1] for parent in parents)
 
104
            result[revid] = parents
 
105
        for revision_id in keys:
 
106
            if revision_id == _mod_revision.NULL_REVISION:
 
107
                result[revision_id] = ()
 
108
        return result
 
109
 
 
110
 
 
111
class KnitRepository(MetaDirRepository):
 
112
    """Knit format repository."""
 
113
 
 
114
    # These attributes are inherited from the Repository base class. Setting
 
115
    # them to None ensures that if the constructor is changed to not initialize
 
116
    # them, or a subclass fails to call the constructor, that an error will
 
117
    # occur rather than the system working but generating incorrect data.
 
118
    _commit_builder_class = None
 
119
    _serializer = None
 
120
 
 
121
    def __init__(self, _format, a_bzrdir, control_files, _commit_builder_class,
 
122
        _serializer):
 
123
        MetaDirRepository.__init__(self, _format, a_bzrdir, control_files)
 
124
        self._commit_builder_class = _commit_builder_class
 
125
        self._serializer = _serializer
 
126
        self._reconcile_fixes_text_parents = True
 
127
 
 
128
    @needs_read_lock
 
129
    def _all_revision_ids(self):
 
130
        """See Repository.all_revision_ids()."""
 
131
        return [key[0] for key in self.revisions.keys()]
 
132
 
 
133
    def _activate_new_inventory(self):
 
134
        """Put a replacement inventory.new into use as inventories."""
 
135
        # Copy the content across
 
136
        t = self._transport
 
137
        t.copy('inventory.new.kndx', 'inventory.kndx')
 
138
        try:
 
139
            t.copy('inventory.new.knit', 'inventory.knit')
 
140
        except errors.NoSuchFile:
 
141
            # empty inventories knit
 
142
            t.delete('inventory.knit')
 
143
        # delete the temp inventory
 
144
        t.delete('inventory.new.kndx')
 
145
        try:
 
146
            t.delete('inventory.new.knit')
 
147
        except errors.NoSuchFile:
 
148
            # empty inventories knit
 
149
            pass
 
150
        # Force index reload (sanity check)
 
151
        self.inventories._index._reset_cache()
 
152
        self.inventories.keys()
 
153
 
 
154
    def _backup_inventory(self):
 
155
        t = self._transport
 
156
        t.copy('inventory.kndx', 'inventory.backup.kndx')
 
157
        t.copy('inventory.knit', 'inventory.backup.knit')
 
158
 
 
159
    def _move_file_id(self, from_id, to_id):
 
160
        t = self._transport.clone('knits')
 
161
        from_rel_url = self.texts._index._mapper.map((from_id, None))
 
162
        to_rel_url = self.texts._index._mapper.map((to_id, None))
 
163
        # We expect both files to always exist in this case.
 
164
        for suffix in ('.knit', '.kndx'):
 
165
            t.rename(from_rel_url + suffix, to_rel_url + suffix)
 
166
 
 
167
    def _remove_file_id(self, file_id):
 
168
        t = self._transport.clone('knits')
 
169
        rel_url = self.texts._index._mapper.map((file_id, None))
 
170
        for suffix in ('.kndx', '.knit'):
 
171
            try:
 
172
                t.delete(rel_url + suffix)
 
173
            except errors.NoSuchFile:
 
174
                pass
 
175
 
 
176
    def _temp_inventories(self):
 
177
        result = self._format._get_inventories(self._transport, self,
 
178
            'inventory.new')
 
179
        # Reconciling when the output has no revisions would result in no
 
180
        # writes - but we want to ensure there is an inventory for
 
181
        # compatibility with older clients that don't lazy-load.
 
182
        result.get_parent_map([('A',)])
 
183
        return result
 
184
 
 
185
    def fileid_involved_between_revs(self, from_revid, to_revid):
 
186
        """Find file_id(s) which are involved in the changes between revisions.
 
187
 
 
188
        This determines the set of revisions which are involved, and then
 
189
        finds all file ids affected by those revisions.
 
190
        """
 
191
        vf = self._get_revision_vf()
 
192
        from_set = set(vf.get_ancestry(from_revid))
 
193
        to_set = set(vf.get_ancestry(to_revid))
 
194
        changed = to_set.difference(from_set)
 
195
        return self._fileid_involved_by_set(changed)
 
196
 
 
197
    def fileid_involved(self, last_revid=None):
 
198
        """Find all file_ids modified in the ancestry of last_revid.
 
199
 
 
200
        :param last_revid: If None, last_revision() will be used.
 
201
        """
 
202
        if not last_revid:
 
203
            changed = set(self.all_revision_ids())
 
204
        else:
 
205
            changed = set(self.get_ancestry(last_revid))
 
206
        if None in changed:
 
207
            changed.remove(None)
 
208
        return self._fileid_involved_by_set(changed)
 
209
 
 
210
    @needs_read_lock
 
211
    def get_revision(self, revision_id):
 
212
        """Return the Revision object for a named revision"""
 
213
        revision_id = osutils.safe_revision_id(revision_id)
 
214
        return self.get_revision_reconcile(revision_id)
 
215
 
 
216
    @needs_write_lock
 
217
    def reconcile(self, other=None, thorough=False):
 
218
        """Reconcile this repository."""
 
219
        from bzrlib.reconcile import KnitReconciler
 
220
        reconciler = KnitReconciler(self, thorough=thorough)
 
221
        reconciler.reconcile()
 
222
        return reconciler
 
223
 
 
224
    def _make_parents_provider(self):
 
225
        return _KnitsParentsProvider(self.revisions)
 
226
 
 
227
    def _find_inconsistent_revision_parents(self):
 
228
        """Find revisions with different parent lists in the revision object
 
229
        and in the index graph.
 
230
 
 
231
        :returns: an iterator yielding tuples of (revison-id, parents-in-index,
 
232
            parents-in-revision).
 
233
        """
 
234
        if not self.is_locked():
 
235
            raise AssertionError()
 
236
        vf = self.revisions
 
237
        for index_version in vf.keys():
 
238
            parent_map = vf.get_parent_map([index_version])
 
239
            parents_according_to_index = tuple(parent[-1] for parent in
 
240
                parent_map[index_version])
 
241
            revision = self.get_revision(index_version[-1])
 
242
            parents_according_to_revision = tuple(revision.parent_ids)
 
243
            if parents_according_to_index != parents_according_to_revision:
 
244
                yield (index_version[-1], parents_according_to_index,
 
245
                    parents_according_to_revision)
 
246
 
 
247
    def _check_for_inconsistent_revision_parents(self):
 
248
        inconsistencies = list(self._find_inconsistent_revision_parents())
 
249
        if inconsistencies:
 
250
            raise errors.BzrCheckError(
 
251
                "Revision knit has inconsistent parents.")
 
252
 
 
253
    def revision_graph_can_have_wrong_parents(self):
 
254
        # The revision.kndx could potentially claim a revision has a different
 
255
        # parent to the revision text.
 
256
        return True
 
257
 
 
258
 
 
259
class RepositoryFormatKnit(MetaDirRepositoryFormat):
 
260
    """Bzr repository knit format (generalized).
 
261
 
 
262
    This repository format has:
 
263
     - knits for file texts and inventory
 
264
     - hash subdirectory based stores.
 
265
     - knits for revisions and signatures
 
266
     - TextStores for revisions and signatures.
 
267
     - a format marker of its own
 
268
     - an optional 'shared-storage' flag
 
269
     - an optional 'no-working-trees' flag
 
270
     - a LockDir lock
 
271
    """
 
272
 
 
273
    # Set this attribute in derived classes to control the repository class
 
274
    # created by open and initialize.
 
275
    repository_class = None
 
276
    # Set this attribute in derived classes to control the
 
277
    # _commit_builder_class that the repository objects will have passed to
 
278
    # their constructor.
 
279
    _commit_builder_class = None
 
280
    # Set this attribute in derived clases to control the _serializer that the
 
281
    # repository objects will have passed to their constructor.
 
282
    @property
 
283
    def _serializer(self):
 
284
        return xml5.serializer_v5
 
285
    # Knit based repositories handle ghosts reasonably well.
 
286
    supports_ghosts = True
 
287
    # External lookups are not supported in this format.
 
288
    supports_external_lookups = False
 
289
    _fetch_order = 'topological'
 
290
    _fetch_uses_deltas = True
 
291
 
 
292
    def _get_inventories(self, repo_transport, repo, name='inventory'):
 
293
        mapper = versionedfile.ConstantMapper(name)
 
294
        index = _mod_knit._KndxIndex(repo_transport, mapper,
 
295
            repo.get_transaction, repo.is_write_locked, repo.is_locked)
 
296
        access = _mod_knit._KnitKeyAccess(repo_transport, mapper)
 
297
        return _mod_knit.KnitVersionedFiles(index, access, annotated=False)
 
298
 
 
299
    def _get_revisions(self, repo_transport, repo):
 
300
        mapper = versionedfile.ConstantMapper('revisions')
 
301
        index = _mod_knit._KndxIndex(repo_transport, mapper,
 
302
            repo.get_transaction, repo.is_write_locked, repo.is_locked)
 
303
        access = _mod_knit._KnitKeyAccess(repo_transport, mapper)
 
304
        return _mod_knit.KnitVersionedFiles(index, access, max_delta_chain=0,
 
305
            annotated=False)
 
306
 
 
307
    def _get_signatures(self, repo_transport, repo):
 
308
        mapper = versionedfile.ConstantMapper('signatures')
 
309
        index = _mod_knit._KndxIndex(repo_transport, mapper,
 
310
            repo.get_transaction, repo.is_write_locked, repo.is_locked)
 
311
        access = _mod_knit._KnitKeyAccess(repo_transport, mapper)
 
312
        return _mod_knit.KnitVersionedFiles(index, access, max_delta_chain=0,
 
313
            annotated=False)
 
314
 
 
315
    def _get_texts(self, repo_transport, repo):
 
316
        mapper = versionedfile.HashEscapedPrefixMapper()
 
317
        base_transport = repo_transport.clone('knits')
 
318
        index = _mod_knit._KndxIndex(base_transport, mapper,
 
319
            repo.get_transaction, repo.is_write_locked, repo.is_locked)
 
320
        access = _mod_knit._KnitKeyAccess(base_transport, mapper)
 
321
        return _mod_knit.KnitVersionedFiles(index, access, max_delta_chain=200,
 
322
            annotated=True)
 
323
 
 
324
    def initialize(self, a_bzrdir, shared=False):
 
325
        """Create a knit format 1 repository.
 
326
 
 
327
        :param a_bzrdir: bzrdir to contain the new repository; must already
 
328
            be initialized.
 
329
        :param shared: If true the repository will be initialized as a shared
 
330
                       repository.
 
331
        """
 
332
        mutter('creating repository in %s.', a_bzrdir.transport.base)
 
333
        dirs = ['knits']
 
334
        files = []
 
335
        utf8_files = [('format', self.get_format_string())]
 
336
 
 
337
        self._upload_blank_content(a_bzrdir, dirs, files, utf8_files, shared)
 
338
        repo_transport = a_bzrdir.get_repository_transport(None)
 
339
        control_files = lockable_files.LockableFiles(repo_transport,
 
340
                                'lock', lockdir.LockDir)
 
341
        transaction = transactions.WriteTransaction()
 
342
        result = self.open(a_bzrdir=a_bzrdir, _found=True)
 
343
        result.lock_write()
 
344
        # the revision id here is irrelevant: it will not be stored, and cannot
 
345
        # already exist, we do this to create files on disk for older clients.
 
346
        result.inventories.get_parent_map([('A',)])
 
347
        result.revisions.get_parent_map([('A',)])
 
348
        result.signatures.get_parent_map([('A',)])
 
349
        result.unlock()
 
350
        return result
 
351
 
 
352
    def open(self, a_bzrdir, _found=False, _override_transport=None):
 
353
        """See RepositoryFormat.open().
 
354
 
 
355
        :param _override_transport: INTERNAL USE ONLY. Allows opening the
 
356
                                    repository at a slightly different url
 
357
                                    than normal. I.e. during 'upgrade'.
 
358
        """
 
359
        if not _found:
 
360
            format = RepositoryFormat.find_format(a_bzrdir)
 
361
        if _override_transport is not None:
 
362
            repo_transport = _override_transport
 
363
        else:
 
364
            repo_transport = a_bzrdir.get_repository_transport(None)
 
365
        control_files = lockable_files.LockableFiles(repo_transport,
 
366
                                'lock', lockdir.LockDir)
 
367
        repo = self.repository_class(_format=self,
 
368
                              a_bzrdir=a_bzrdir,
 
369
                              control_files=control_files,
 
370
                              _commit_builder_class=self._commit_builder_class,
 
371
                              _serializer=self._serializer)
 
372
        repo.revisions = self._get_revisions(repo_transport, repo)
 
373
        repo.signatures = self._get_signatures(repo_transport, repo)
 
374
        repo.inventories = self._get_inventories(repo_transport, repo)
 
375
        repo.texts = self._get_texts(repo_transport, repo)
 
376
        repo._transport = repo_transport
 
377
        return repo
 
378
 
 
379
 
 
380
class RepositoryFormatKnit1(RepositoryFormatKnit):
 
381
    """Bzr repository knit format 1.
 
382
 
 
383
    This repository format has:
 
384
     - knits for file texts and inventory
 
385
     - hash subdirectory based stores.
 
386
     - knits for revisions and signatures
 
387
     - TextStores for revisions and signatures.
 
388
     - a format marker of its own
 
389
     - an optional 'shared-storage' flag
 
390
     - an optional 'no-working-trees' flag
 
391
     - a LockDir lock
 
392
 
 
393
    This format was introduced in bzr 0.8.
 
394
    """
 
395
 
 
396
    repository_class = KnitRepository
 
397
    _commit_builder_class = CommitBuilder
 
398
    @property
 
399
    def _serializer(self):
 
400
        return xml5.serializer_v5
 
401
 
 
402
    def __ne__(self, other):
 
403
        return self.__class__ is not other.__class__
 
404
 
 
405
    def get_format_string(self):
 
406
        """See RepositoryFormat.get_format_string()."""
 
407
        return "Bazaar-NG Knit Repository Format 1"
 
408
 
 
409
    def get_format_description(self):
 
410
        """See RepositoryFormat.get_format_description()."""
 
411
        return "Knit repository format 1"
 
412
 
 
413
    def check_conversion_target(self, target_format):
 
414
        pass
 
415
 
 
416
 
 
417
class RepositoryFormatKnit3(RepositoryFormatKnit):
 
418
    """Bzr repository knit format 3.
 
419
 
 
420
    This repository format has:
 
421
     - knits for file texts and inventory
 
422
     - hash subdirectory based stores.
 
423
     - knits for revisions and signatures
 
424
     - TextStores for revisions and signatures.
 
425
     - a format marker of its own
 
426
     - an optional 'shared-storage' flag
 
427
     - an optional 'no-working-trees' flag
 
428
     - a LockDir lock
 
429
     - support for recording full info about the tree root
 
430
     - support for recording tree-references
 
431
    """
 
432
 
 
433
    repository_class = KnitRepository
 
434
    _commit_builder_class = RootCommitBuilder
 
435
    rich_root_data = True
 
436
    supports_tree_reference = True
 
437
    @property
 
438
    def _serializer(self):
 
439
        return xml7.serializer_v7
 
440
 
 
441
    def _get_matching_bzrdir(self):
 
442
        return bzrdir.format_registry.make_bzrdir('dirstate-with-subtree')
 
443
 
 
444
    def _ignore_setting_bzrdir(self, format):
 
445
        pass
 
446
 
 
447
    _matchingbzrdir = property(_get_matching_bzrdir, _ignore_setting_bzrdir)
 
448
 
 
449
    def check_conversion_target(self, target_format):
 
450
        if not target_format.rich_root_data:
 
451
            raise errors.BadConversionTarget(
 
452
                'Does not support rich root data.', target_format)
 
453
        if not getattr(target_format, 'supports_tree_reference', False):
 
454
            raise errors.BadConversionTarget(
 
455
                'Does not support nested trees', target_format)
 
456
 
 
457
    def get_format_string(self):
 
458
        """See RepositoryFormat.get_format_string()."""
 
459
        return "Bazaar Knit Repository Format 3 (bzr 0.15)\n"
 
460
 
 
461
    def get_format_description(self):
 
462
        """See RepositoryFormat.get_format_description()."""
 
463
        return "Knit repository format 3"
 
464
 
 
465
 
 
466
class RepositoryFormatKnit4(RepositoryFormatKnit):
 
467
    """Bzr repository knit format 4.
 
468
 
 
469
    This repository format has everything in format 3, except for
 
470
    tree-references:
 
471
     - knits for file texts and inventory
 
472
     - hash subdirectory based stores.
 
473
     - knits for revisions and signatures
 
474
     - TextStores for revisions and signatures.
 
475
     - a format marker of its own
 
476
     - an optional 'shared-storage' flag
 
477
     - an optional 'no-working-trees' flag
 
478
     - a LockDir lock
 
479
     - support for recording full info about the tree root
 
480
    """
 
481
 
 
482
    repository_class = KnitRepository
 
483
    _commit_builder_class = RootCommitBuilder
 
484
    rich_root_data = True
 
485
    supports_tree_reference = False
 
486
    @property
 
487
    def _serializer(self):
 
488
        return xml6.serializer_v6
 
489
 
 
490
    def _get_matching_bzrdir(self):
 
491
        return bzrdir.format_registry.make_bzrdir('rich-root')
 
492
 
 
493
    def _ignore_setting_bzrdir(self, format):
 
494
        pass
 
495
 
 
496
    _matchingbzrdir = property(_get_matching_bzrdir, _ignore_setting_bzrdir)
 
497
 
 
498
    def check_conversion_target(self, target_format):
 
499
        if not target_format.rich_root_data:
 
500
            raise errors.BadConversionTarget(
 
501
                'Does not support rich root data.', target_format)
 
502
 
 
503
    def get_format_string(self):
 
504
        """See RepositoryFormat.get_format_string()."""
 
505
        return 'Bazaar Knit Repository Format 4 (bzr 1.0)\n'
 
506
 
 
507
    def get_format_description(self):
 
508
        """See RepositoryFormat.get_format_description()."""
 
509
        return "Knit repository format 4"