~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/repofmt/knitrepo.py

Merge bzr.dev and tree-file-ids-as-tuples.

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# Copyright (C) 2007-2010 Canonical Ltd
 
2
#
 
3
# This program is free software; you can redistribute it and/or modify
 
4
# it under the terms of the GNU General Public License as published by
 
5
# the Free Software Foundation; either version 2 of the License, or
 
6
# (at your option) any later version.
 
7
#
 
8
# This program is distributed in the hope that it will be useful,
 
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
11
# GNU General Public License for more details.
 
12
#
 
13
# You should have received a copy of the GNU General Public License
 
14
# along with this program; if not, write to the Free Software
 
15
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
 
16
 
 
17
from __future__ import absolute_import
 
18
 
 
19
from bzrlib.lazy_import import lazy_import
 
20
lazy_import(globals(), """
 
21
import itertools
 
22
 
 
23
from bzrlib import (
 
24
    bzrdir,
 
25
    errors,
 
26
    knit as _mod_knit,
 
27
    lockable_files,
 
28
    lockdir,
 
29
    osutils,
 
30
    revision as _mod_revision,
 
31
    trace,
 
32
    transactions,
 
33
    versionedfile,
 
34
    xml5,
 
35
    xml6,
 
36
    xml7,
 
37
    )
 
38
""")
 
39
from bzrlib.decorators import needs_read_lock, needs_write_lock
 
40
from bzrlib.repository import (
 
41
    InterRepository,
 
42
    IsInWriteGroupError,
 
43
    RepositoryFormatMetaDir,
 
44
    )
 
45
from bzrlib.vf_repository import (
 
46
    InterSameDataRepository,
 
47
    MetaDirVersionedFileRepository,
 
48
    MetaDirVersionedFileRepositoryFormat,
 
49
    VersionedFileCommitBuilder,
 
50
    VersionedFileRootCommitBuilder,
 
51
    )
 
52
from bzrlib import symbol_versioning
 
53
 
 
54
 
 
55
class _KnitParentsProvider(object):
 
56
 
 
57
    def __init__(self, knit):
 
58
        self._knit = knit
 
59
 
 
60
    def __repr__(self):
 
61
        return 'KnitParentsProvider(%r)' % self._knit
 
62
 
 
63
    def get_parent_map(self, keys):
 
64
        """See graph.StackedParentsProvider.get_parent_map"""
 
65
        parent_map = {}
 
66
        for revision_id in keys:
 
67
            if revision_id is None:
 
68
                raise ValueError('get_parent_map(None) is not valid')
 
69
            if revision_id == _mod_revision.NULL_REVISION:
 
70
                parent_map[revision_id] = ()
 
71
            else:
 
72
                try:
 
73
                    parents = tuple(
 
74
                        self._knit.get_parents_with_ghosts(revision_id))
 
75
                except errors.RevisionNotPresent:
 
76
                    continue
 
77
                else:
 
78
                    if len(parents) == 0:
 
79
                        parents = (_mod_revision.NULL_REVISION,)
 
80
                parent_map[revision_id] = parents
 
81
        return parent_map
 
82
 
 
83
 
 
84
class _KnitsParentsProvider(object):
 
85
 
 
86
    def __init__(self, knit, prefix=()):
 
87
        """Create a parent provider for string keys mapped to tuple keys."""
 
88
        self._knit = knit
 
89
        self._prefix = prefix
 
90
 
 
91
    def __repr__(self):
 
92
        return 'KnitsParentsProvider(%r)' % self._knit
 
93
 
 
94
    def get_parent_map(self, keys):
 
95
        """See graph.StackedParentsProvider.get_parent_map"""
 
96
        parent_map = self._knit.get_parent_map(
 
97
            [self._prefix + (key,) for key in keys])
 
98
        result = {}
 
99
        for key, parents in parent_map.items():
 
100
            revid = key[-1]
 
101
            if len(parents) == 0:
 
102
                parents = (_mod_revision.NULL_REVISION,)
 
103
            else:
 
104
                parents = tuple(parent[-1] for parent in parents)
 
105
            result[revid] = parents
 
106
        for revision_id in keys:
 
107
            if revision_id == _mod_revision.NULL_REVISION:
 
108
                result[revision_id] = ()
 
109
        return result
 
110
 
 
111
 
 
112
class KnitRepository(MetaDirVersionedFileRepository):
 
113
    """Knit format repository."""
 
114
 
 
115
    # These attributes are inherited from the Repository base class. Setting
 
116
    # them to None ensures that if the constructor is changed to not initialize
 
117
    # them, or a subclass fails to call the constructor, that an error will
 
118
    # occur rather than the system working but generating incorrect data.
 
119
    _commit_builder_class = None
 
120
    _serializer = None
 
121
 
 
122
    def __init__(self, _format, a_bzrdir, control_files, _commit_builder_class,
 
123
        _serializer):
 
124
        super(KnitRepository, self).__init__(_format, a_bzrdir, control_files)
 
125
        self._commit_builder_class = _commit_builder_class
 
126
        self._serializer = _serializer
 
127
        self._reconcile_fixes_text_parents = True
 
128
 
 
129
    @needs_read_lock
 
130
    def _all_revision_ids(self):
 
131
        """See Repository.all_revision_ids()."""
 
132
        return [key[0] for key in self.revisions.keys()]
 
133
 
 
134
    def _activate_new_inventory(self):
 
135
        """Put a replacement inventory.new into use as inventories."""
 
136
        # Copy the content across
 
137
        t = self._transport
 
138
        t.copy('inventory.new.kndx', 'inventory.kndx')
 
139
        try:
 
140
            t.copy('inventory.new.knit', 'inventory.knit')
 
141
        except errors.NoSuchFile:
 
142
            # empty inventories knit
 
143
            t.delete('inventory.knit')
 
144
        # delete the temp inventory
 
145
        t.delete('inventory.new.kndx')
 
146
        try:
 
147
            t.delete('inventory.new.knit')
 
148
        except errors.NoSuchFile:
 
149
            # empty inventories knit
 
150
            pass
 
151
        # Force index reload (sanity check)
 
152
        self.inventories._index._reset_cache()
 
153
        self.inventories.keys()
 
154
 
 
155
    def _backup_inventory(self):
 
156
        t = self._transport
 
157
        t.copy('inventory.kndx', 'inventory.backup.kndx')
 
158
        t.copy('inventory.knit', 'inventory.backup.knit')
 
159
 
 
160
    def _move_file_id(self, from_id, to_id):
 
161
        t = self._transport.clone('knits')
 
162
        from_rel_url = self.texts._index._mapper.map((from_id, None))
 
163
        to_rel_url = self.texts._index._mapper.map((to_id, None))
 
164
        # We expect both files to always exist in this case.
 
165
        for suffix in ('.knit', '.kndx'):
 
166
            t.rename(from_rel_url + suffix, to_rel_url + suffix)
 
167
 
 
168
    def _remove_file_id(self, file_id):
 
169
        t = self._transport.clone('knits')
 
170
        rel_url = self.texts._index._mapper.map((file_id, None))
 
171
        for suffix in ('.kndx', '.knit'):
 
172
            try:
 
173
                t.delete(rel_url + suffix)
 
174
            except errors.NoSuchFile:
 
175
                pass
 
176
 
 
177
    def _temp_inventories(self):
 
178
        result = self._format._get_inventories(self._transport, self,
 
179
            'inventory.new')
 
180
        # Reconciling when the output has no revisions would result in no
 
181
        # writes - but we want to ensure there is an inventory for
 
182
        # compatibility with older clients that don't lazy-load.
 
183
        result.get_parent_map([('A',)])
 
184
        return result
 
185
 
 
186
    @needs_read_lock
 
187
    def get_revision(self, revision_id):
 
188
        """Return the Revision object for a named revision"""
 
189
        revision_id = osutils.safe_revision_id(revision_id)
 
190
        return self.get_revision_reconcile(revision_id)
 
191
 
 
192
    def _refresh_data(self):
 
193
        if not self.is_locked():
 
194
            return
 
195
        if self.is_in_write_group():
 
196
            raise IsInWriteGroupError(self)
 
197
        # Create a new transaction to force all knits to see the scope change.
 
198
        # This is safe because we're outside a write group.
 
199
        self.control_files._finish_transaction()
 
200
        if self.is_write_locked():
 
201
            self.control_files._set_write_transaction()
 
202
        else:
 
203
            self.control_files._set_read_transaction()
 
204
 
 
205
    @needs_write_lock
 
206
    def reconcile(self, other=None, thorough=False):
 
207
        """Reconcile this repository."""
 
208
        from bzrlib.reconcile import KnitReconciler
 
209
        reconciler = KnitReconciler(self, thorough=thorough)
 
210
        reconciler.reconcile()
 
211
        return reconciler
 
212
 
 
213
    def _make_parents_provider(self):
 
214
        return _KnitsParentsProvider(self.revisions)
 
215
 
 
216
 
 
217
class RepositoryFormatKnit(MetaDirVersionedFileRepositoryFormat):
 
218
    """Bzr repository knit format (generalized).
 
219
 
 
220
    This repository format has:
 
221
     - knits for file texts and inventory
 
222
     - hash subdirectory based stores.
 
223
     - knits for revisions and signatures
 
224
     - TextStores for revisions and signatures.
 
225
     - a format marker of its own
 
226
     - an optional 'shared-storage' flag
 
227
     - an optional 'no-working-trees' flag
 
228
     - a LockDir lock
 
229
    """
 
230
 
 
231
    # Set this attribute in derived classes to control the repository class
 
232
    # created by open and initialize.
 
233
    repository_class = None
 
234
    # Set this attribute in derived classes to control the
 
235
    # _commit_builder_class that the repository objects will have passed to
 
236
    # their constructor.
 
237
    _commit_builder_class = None
 
238
    # Set this attribute in derived clases to control the _serializer that the
 
239
    # repository objects will have passed to their constructor.
 
240
    @property
 
241
    def _serializer(self):
 
242
        return xml5.serializer_v5
 
243
    # Knit based repositories handle ghosts reasonably well.
 
244
    supports_ghosts = True
 
245
    # External lookups are not supported in this format.
 
246
    supports_external_lookups = False
 
247
    # No CHK support.
 
248
    supports_chks = False
 
249
    _fetch_order = 'topological'
 
250
    _fetch_uses_deltas = True
 
251
    fast_deltas = False
 
252
    supports_funky_characters = True
 
253
    # The revision.kndx could potentially claim a revision has a different
 
254
    # parent to the revision text.
 
255
    revision_graph_can_have_wrong_parents = True
 
256
 
 
257
    def _get_inventories(self, repo_transport, repo, name='inventory'):
 
258
        mapper = versionedfile.ConstantMapper(name)
 
259
        index = _mod_knit._KndxIndex(repo_transport, mapper,
 
260
            repo.get_transaction, repo.is_write_locked, repo.is_locked)
 
261
        access = _mod_knit._KnitKeyAccess(repo_transport, mapper)
 
262
        return _mod_knit.KnitVersionedFiles(index, access, annotated=False)
 
263
 
 
264
    def _get_revisions(self, repo_transport, repo):
 
265
        mapper = versionedfile.ConstantMapper('revisions')
 
266
        index = _mod_knit._KndxIndex(repo_transport, mapper,
 
267
            repo.get_transaction, repo.is_write_locked, repo.is_locked)
 
268
        access = _mod_knit._KnitKeyAccess(repo_transport, mapper)
 
269
        return _mod_knit.KnitVersionedFiles(index, access, max_delta_chain=0,
 
270
            annotated=False)
 
271
 
 
272
    def _get_signatures(self, repo_transport, repo):
 
273
        mapper = versionedfile.ConstantMapper('signatures')
 
274
        index = _mod_knit._KndxIndex(repo_transport, mapper,
 
275
            repo.get_transaction, repo.is_write_locked, repo.is_locked)
 
276
        access = _mod_knit._KnitKeyAccess(repo_transport, mapper)
 
277
        return _mod_knit.KnitVersionedFiles(index, access, max_delta_chain=0,
 
278
            annotated=False)
 
279
 
 
280
    def _get_texts(self, repo_transport, repo):
 
281
        mapper = versionedfile.HashEscapedPrefixMapper()
 
282
        base_transport = repo_transport.clone('knits')
 
283
        index = _mod_knit._KndxIndex(base_transport, mapper,
 
284
            repo.get_transaction, repo.is_write_locked, repo.is_locked)
 
285
        access = _mod_knit._KnitKeyAccess(base_transport, mapper)
 
286
        return _mod_knit.KnitVersionedFiles(index, access, max_delta_chain=200,
 
287
            annotated=True)
 
288
 
 
289
    def initialize(self, a_bzrdir, shared=False):
 
290
        """Create a knit format 1 repository.
 
291
 
 
292
        :param a_bzrdir: bzrdir to contain the new repository; must already
 
293
            be initialized.
 
294
        :param shared: If true the repository will be initialized as a shared
 
295
                       repository.
 
296
        """
 
297
        trace.mutter('creating repository in %s.', a_bzrdir.transport.base)
 
298
        dirs = ['knits']
 
299
        files = []
 
300
        utf8_files = [('format', self.get_format_string())]
 
301
 
 
302
        self._upload_blank_content(a_bzrdir, dirs, files, utf8_files, shared)
 
303
        repo_transport = a_bzrdir.get_repository_transport(None)
 
304
        control_files = lockable_files.LockableFiles(repo_transport,
 
305
                                'lock', lockdir.LockDir)
 
306
        transaction = transactions.WriteTransaction()
 
307
        result = self.open(a_bzrdir=a_bzrdir, _found=True)
 
308
        result.lock_write()
 
309
        # the revision id here is irrelevant: it will not be stored, and cannot
 
310
        # already exist, we do this to create files on disk for older clients.
 
311
        result.inventories.get_parent_map([('A',)])
 
312
        result.revisions.get_parent_map([('A',)])
 
313
        result.signatures.get_parent_map([('A',)])
 
314
        result.unlock()
 
315
        self._run_post_repo_init_hooks(result, a_bzrdir, shared)
 
316
        return result
 
317
 
 
318
    def open(self, a_bzrdir, _found=False, _override_transport=None):
 
319
        """See RepositoryFormat.open().
 
320
 
 
321
        :param _override_transport: INTERNAL USE ONLY. Allows opening the
 
322
                                    repository at a slightly different url
 
323
                                    than normal. I.e. during 'upgrade'.
 
324
        """
 
325
        if not _found:
 
326
            format = RepositoryFormatMetaDir.find_format(a_bzrdir)
 
327
        if _override_transport is not None:
 
328
            repo_transport = _override_transport
 
329
        else:
 
330
            repo_transport = a_bzrdir.get_repository_transport(None)
 
331
        control_files = lockable_files.LockableFiles(repo_transport,
 
332
                                'lock', lockdir.LockDir)
 
333
        repo = self.repository_class(_format=self,
 
334
                              a_bzrdir=a_bzrdir,
 
335
                              control_files=control_files,
 
336
                              _commit_builder_class=self._commit_builder_class,
 
337
                              _serializer=self._serializer)
 
338
        repo.revisions = self._get_revisions(repo_transport, repo)
 
339
        repo.signatures = self._get_signatures(repo_transport, repo)
 
340
        repo.inventories = self._get_inventories(repo_transport, repo)
 
341
        repo.texts = self._get_texts(repo_transport, repo)
 
342
        repo.chk_bytes = None
 
343
        repo._transport = repo_transport
 
344
        return repo
 
345
 
 
346
 
 
347
class RepositoryFormatKnit1(RepositoryFormatKnit):
 
348
    """Bzr repository knit format 1.
 
349
 
 
350
    This repository format has:
 
351
     - knits for file texts and inventory
 
352
     - hash subdirectory based stores.
 
353
     - knits for revisions and signatures
 
354
     - TextStores for revisions and signatures.
 
355
     - a format marker of its own
 
356
     - an optional 'shared-storage' flag
 
357
     - an optional 'no-working-trees' flag
 
358
     - a LockDir lock
 
359
 
 
360
    This format was introduced in bzr 0.8.
 
361
    """
 
362
 
 
363
    repository_class = KnitRepository
 
364
    _commit_builder_class = VersionedFileCommitBuilder
 
365
    @property
 
366
    def _serializer(self):
 
367
        return xml5.serializer_v5
 
368
 
 
369
    def __ne__(self, other):
 
370
        return self.__class__ is not other.__class__
 
371
 
 
372
    @classmethod
 
373
    def get_format_string(cls):
 
374
        """See RepositoryFormat.get_format_string()."""
 
375
        return "Bazaar-NG Knit Repository Format 1"
 
376
 
 
377
    def get_format_description(self):
 
378
        """See RepositoryFormat.get_format_description()."""
 
379
        return "Knit repository format 1"
 
380
 
 
381
 
 
382
class RepositoryFormatKnit3(RepositoryFormatKnit):
 
383
    """Bzr repository knit format 3.
 
384
 
 
385
    This repository format has:
 
386
     - knits for file texts and inventory
 
387
     - hash subdirectory based stores.
 
388
     - knits for revisions and signatures
 
389
     - TextStores for revisions and signatures.
 
390
     - a format marker of its own
 
391
     - an optional 'shared-storage' flag
 
392
     - an optional 'no-working-trees' flag
 
393
     - a LockDir lock
 
394
     - support for recording full info about the tree root
 
395
     - support for recording tree-references
 
396
    """
 
397
 
 
398
    repository_class = KnitRepository
 
399
    _commit_builder_class = VersionedFileRootCommitBuilder
 
400
    rich_root_data = True
 
401
    experimental = True
 
402
    supports_tree_reference = True
 
403
    @property
 
404
    def _serializer(self):
 
405
        return xml7.serializer_v7
 
406
 
 
407
    def _get_matching_bzrdir(self):
 
408
        return bzrdir.format_registry.make_bzrdir('dirstate-with-subtree')
 
409
 
 
410
    def _ignore_setting_bzrdir(self, format):
 
411
        pass
 
412
 
 
413
    _matchingbzrdir = property(_get_matching_bzrdir, _ignore_setting_bzrdir)
 
414
 
 
415
    @classmethod
 
416
    def get_format_string(cls):
 
417
        """See RepositoryFormat.get_format_string()."""
 
418
        return "Bazaar Knit Repository Format 3 (bzr 0.15)\n"
 
419
 
 
420
    def get_format_description(self):
 
421
        """See RepositoryFormat.get_format_description()."""
 
422
        return "Knit repository format 3"
 
423
 
 
424
 
 
425
class RepositoryFormatKnit4(RepositoryFormatKnit):
 
426
    """Bzr repository knit format 4.
 
427
 
 
428
    This repository format has everything in format 3, except for
 
429
    tree-references:
 
430
     - knits for file texts and inventory
 
431
     - hash subdirectory based stores.
 
432
     - knits for revisions and signatures
 
433
     - TextStores for revisions and signatures.
 
434
     - a format marker of its own
 
435
     - an optional 'shared-storage' flag
 
436
     - an optional 'no-working-trees' flag
 
437
     - a LockDir lock
 
438
     - support for recording full info about the tree root
 
439
    """
 
440
 
 
441
    repository_class = KnitRepository
 
442
    _commit_builder_class = VersionedFileRootCommitBuilder
 
443
    rich_root_data = True
 
444
    supports_tree_reference = False
 
445
    @property
 
446
    def _serializer(self):
 
447
        return xml6.serializer_v6
 
448
 
 
449
    def _get_matching_bzrdir(self):
 
450
        return bzrdir.format_registry.make_bzrdir('rich-root')
 
451
 
 
452
    def _ignore_setting_bzrdir(self, format):
 
453
        pass
 
454
 
 
455
    _matchingbzrdir = property(_get_matching_bzrdir, _ignore_setting_bzrdir)
 
456
 
 
457
    @classmethod
 
458
    def get_format_string(cls):
 
459
        """See RepositoryFormat.get_format_string()."""
 
460
        return 'Bazaar Knit Repository Format 4 (bzr 1.0)\n'
 
461
 
 
462
    def get_format_description(self):
 
463
        """See RepositoryFormat.get_format_description()."""
 
464
        return "Knit repository format 4"
 
465
 
 
466
 
 
467
class InterKnitRepo(InterSameDataRepository):
 
468
    """Optimised code paths between Knit based repositories."""
 
469
 
 
470
    @classmethod
 
471
    def _get_repo_format_to_test(self):
 
472
        return RepositoryFormatKnit1()
 
473
 
 
474
    @staticmethod
 
475
    def is_compatible(source, target):
 
476
        """Be compatible with known Knit formats.
 
477
 
 
478
        We don't test for the stores being of specific types because that
 
479
        could lead to confusing results, and there is no need to be
 
480
        overly general.
 
481
        """
 
482
        try:
 
483
            are_knits = (isinstance(source._format, RepositoryFormatKnit) and
 
484
                isinstance(target._format, RepositoryFormatKnit))
 
485
        except AttributeError:
 
486
            return False
 
487
        return are_knits and InterRepository._same_model(source, target)
 
488
 
 
489
    @needs_read_lock
 
490
    def search_missing_revision_ids(self,
 
491
            revision_id=symbol_versioning.DEPRECATED_PARAMETER,
 
492
            find_ghosts=True, revision_ids=None, if_present_ids=None,
 
493
            limit=None):
 
494
        """See InterRepository.search_missing_revision_ids()."""
 
495
        if symbol_versioning.deprecated_passed(revision_id):
 
496
            symbol_versioning.warn(
 
497
                'search_missing_revision_ids(revision_id=...) was '
 
498
                'deprecated in 2.4.  Use revision_ids=[...] instead.',
 
499
                DeprecationWarning, stacklevel=2)
 
500
            if revision_ids is not None:
 
501
                raise AssertionError(
 
502
                    'revision_ids is mutually exclusive with revision_id')
 
503
            if revision_id is not None:
 
504
                revision_ids = [revision_id]
 
505
        del revision_id
 
506
        source_ids_set = self._present_source_revisions_for(
 
507
            revision_ids, if_present_ids)
 
508
        # source_ids is the worst possible case we may need to pull.
 
509
        # now we want to filter source_ids against what we actually
 
510
        # have in target, but don't try to check for existence where we know
 
511
        # we do not have a revision as that would be pointless.
 
512
        target_ids = set(self.target.all_revision_ids())
 
513
        possibly_present_revisions = target_ids.intersection(source_ids_set)
 
514
        actually_present_revisions = set(
 
515
            self.target._eliminate_revisions_not_present(possibly_present_revisions))
 
516
        required_revisions = source_ids_set.difference(actually_present_revisions)
 
517
        if revision_ids is not None:
 
518
            # we used get_ancestry to determine source_ids then we are assured all
 
519
            # revisions referenced are present as they are installed in topological order.
 
520
            # and the tip revision was validated by get_ancestry.
 
521
            result_set = required_revisions
 
522
        else:
 
523
            # if we just grabbed the possibly available ids, then
 
524
            # we only have an estimate of whats available and need to validate
 
525
            # that against the revision records.
 
526
            result_set = set(
 
527
                self.source._eliminate_revisions_not_present(required_revisions))
 
528
        if limit is not None:
 
529
            topo_ordered = self.source.get_graph().iter_topo_order(result_set)
 
530
            result_set = set(itertools.islice(topo_ordered, limit))
 
531
        return self.source.revision_ids_to_search_result(result_set)
 
532
 
 
533
 
 
534
InterRepository.register_optimiser(InterKnitRepo)