~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/mutabletree.py

  • Committer: Canonical.com Patch Queue Manager
  • Date: 2008-04-09 23:35:55 UTC
  • mfrom: (3316.2.15 api-cleanup)
  • Revision ID: pqm@pqm.ubuntu.com-20080409233555-n26cmi0y1hb98tf6
(robertc) Many VersionedFile api cleanups and deprecations. Some
        incompatible changes included (see NEWS). (Robert Collins)

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2006-2010 Canonical Ltd
 
1
# Copyright (C) 2006, 2007 Canonical Ltd
2
2
#
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
12
12
#
13
13
# You should have received a copy of the GNU General Public License
14
14
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
16
 
17
17
"""MutableTree object.
18
18
 
23
23
from bzrlib.lazy_import import lazy_import
24
24
lazy_import(globals(), """
25
25
import os
26
 
import re
27
26
 
28
27
from bzrlib import (
29
28
    add,
30
29
    bzrdir,
 
30
    hooks,
 
31
    )
 
32
from bzrlib.osutils import dirname
 
33
from bzrlib.revisiontree import RevisionTree
 
34
from bzrlib.trace import mutter, warning
 
35
""")
 
36
 
 
37
from bzrlib import (
31
38
    errors,
32
 
    hooks,
33
39
    osutils,
34
 
    revisiontree,
35
 
    symbol_versioning,
36
 
    trace,
37
40
    tree,
38
41
    )
39
 
""")
40
 
 
41
42
from bzrlib.decorators import needs_read_lock, needs_write_lock
 
43
from bzrlib.osutils import splitpath
 
44
from bzrlib.symbol_versioning import DEPRECATED_PARAMETER
42
45
 
43
46
 
44
47
def needs_tree_write_lock(unbound):
66
69
    entirely in memory.
67
70
 
68
71
    For now, we are not treating MutableTree as an interface to provide
69
 
    conformance tests for - rather we are testing MemoryTree specifically, and
 
72
    conformance tests for - rather we are testing MemoryTree specifically, and 
70
73
    interface testing implementations of WorkingTree.
71
74
 
72
75
    A mutable tree always has an associated Branch and BzrDir object - the
73
76
    branch and bzrdir attributes.
74
77
    """
75
 
    def __init__(self, *args, **kw):
76
 
        super(MutableTree, self).__init__(*args, **kw)
77
 
        # Is this tree on a case-insensitive or case-preserving file-system?
78
 
        # Sub-classes may initialize to False if they detect they are being
79
 
        # used on media which doesn't differentiate the case of names.
80
 
        self.case_sensitive = True
81
78
 
82
79
    @needs_tree_write_lock
83
80
    def add(self, files, ids=None, kinds=None):
99
96
        TODO: Perhaps callback with the ids and paths as they're added.
100
97
        """
101
98
        if isinstance(files, basestring):
102
 
            # XXX: Passing a single string is inconsistent and should be
103
 
            # deprecated.
104
 
            if not (ids is None or isinstance(ids, basestring)):
105
 
                raise AssertionError()
106
 
            if not (kinds is None or isinstance(kinds, basestring)):
107
 
                raise AssertionError()
 
99
            assert(ids is None or isinstance(ids, basestring))
 
100
            assert(kinds is None or isinstance(kinds, basestring))
108
101
            files = [files]
109
102
            if ids is not None:
110
103
                ids = [ids]
116
109
        if ids is None:
117
110
            ids = [None] * len(files)
118
111
        else:
119
 
            if not (len(ids) == len(files)):
120
 
                raise AssertionError()
 
112
            assert(len(ids) == len(files))
121
113
        if kinds is None:
122
114
            kinds = [None] * len(files)
123
 
        elif not len(kinds) == len(files):
124
 
            raise AssertionError()
 
115
        else:
 
116
            assert(len(kinds) == len(files))
125
117
        for f in files:
126
118
            # generic constraint checks:
127
119
            if self.is_control_filename(f):
128
120
                raise errors.ForbiddenControlFileError(filename=f)
129
 
            fp = osutils.splitpath(f)
130
 
        # fill out file kinds for all files [not needed when we stop
 
121
            fp = splitpath(f)
 
122
        # fill out file kinds for all files [not needed when we stop 
131
123
        # caring about the instantaneous file kind within a uncommmitted tree
132
124
        #
133
125
        self._gather_kinds(files, kinds)
184
176
        from bzrlib import commit
185
177
        if revprops is None:
186
178
            revprops = {}
187
 
        possible_master_transports=[]
188
179
        if not 'branch-nick' in revprops:
189
 
            revprops['branch-nick'] = self.branch._get_nick(
190
 
                kwargs.get('local', False),
191
 
                possible_master_transports)
192
 
        authors = kwargs.pop('authors', None)
 
180
            revprops['branch-nick'] = self.branch.nick
193
181
        author = kwargs.pop('author', None)
194
 
        if authors is not None:
195
 
            if author is not None:
196
 
                raise AssertionError('Specifying both author and authors '
197
 
                        'is not allowed. Specify just authors instead')
198
 
            if 'author' in revprops or 'authors' in revprops:
199
 
                # XXX: maybe we should just accept one of them?
200
 
                raise AssertionError('author property given twice')
201
 
            if authors:
202
 
                for individual in authors:
203
 
                    if '\n' in individual:
204
 
                        raise AssertionError('\\n is not a valid character '
205
 
                                'in an author identity')
206
 
                revprops['authors'] = '\n'.join(authors)
207
182
        if author is not None:
208
 
            symbol_versioning.warn('The parameter author was deprecated'
209
 
                   ' in version 1.13. Use authors instead',
210
 
                   DeprecationWarning)
211
 
            if 'author' in revprops or 'authors' in revprops:
212
 
                # XXX: maybe we should just accept one of them?
213
 
                raise AssertionError('author property given twice')
214
 
            if '\n' in author:
215
 
                raise AssertionError('\\n is not a valid character '
216
 
                        'in an author identity')
217
 
            revprops['authors'] = author
 
183
            assert 'author' not in revprops
 
184
            revprops['author'] = author
218
185
        # args for wt.commit start at message from the Commit.commit method,
219
186
        args = (message, ) + args
220
187
        for hook in MutableTree.hooks['start_commit']:
221
188
            hook(self)
222
189
        committed_id = commit.Commit().commit(working_tree=self,
223
 
            revprops=revprops,
224
 
            possible_master_transports=possible_master_transports,
225
 
            *args, **kwargs)
226
 
        post_hook_params = PostCommitHookParams(self)
227
 
        for hook in MutableTree.hooks['post_commit']:
228
 
            hook(post_hook_params)
 
190
            revprops=revprops, *args, **kwargs)
229
191
        return committed_id
230
192
 
231
193
    def _gather_kinds(self, files, kinds):
233
195
        raise NotImplementedError(self._gather_kinds)
234
196
 
235
197
    @needs_read_lock
236
 
    def has_changes(self, _from_tree=None):
237
 
        """Quickly check that the tree contains at least one commitable change.
238
 
 
239
 
        :param _from_tree: tree to compare against to find changes (default to
240
 
            the basis tree and is intended to be used by tests).
241
 
 
242
 
        :return: True if a change is found. False otherwise
243
 
        """
244
 
        # Check pending merges
245
 
        if len(self.get_parent_ids()) > 1:
246
 
            return True
247
 
        if _from_tree is None:
248
 
            _from_tree = self.basis_tree()
249
 
        changes = self.iter_changes(_from_tree)
250
 
        try:
251
 
            change = changes.next()
252
 
            # Exclude root (talk about black magic... --vila 20090629)
253
 
            if change[4] == (None, None):
254
 
                change = changes.next()
255
 
            return True
256
 
        except StopIteration:
257
 
            # No changes
258
 
            return False
259
 
 
260
 
    @needs_read_lock
261
 
    def check_changed_or_out_of_date(self, strict, opt_name,
262
 
                                     more_error, more_warning):
263
 
        """Check the tree for uncommitted changes and branch synchronization.
264
 
 
265
 
        If strict is None and not set in the config files, a warning is issued.
266
 
        If strict is True, an error is raised.
267
 
        If strict is False, no checks are done and no warning is issued.
268
 
 
269
 
        :param strict: True, False or None, searched in branch config if None.
270
 
 
271
 
        :param opt_name: strict option name to search in config file.
272
 
 
273
 
        :param more_error: Details about how to avoid the check.
274
 
 
275
 
        :param more_warning: Details about what is happening.
276
 
        """
277
 
        if strict is None:
278
 
            strict = self.branch.get_config().get_user_option_as_bool(opt_name)
279
 
        if strict is not False:
280
 
            err_class = None
281
 
            if (self.has_changes()):
282
 
                err_class = errors.UncommittedChanges
283
 
            elif self.last_revision() != self.branch.last_revision():
284
 
                # The tree has lost sync with its branch, there is little
285
 
                # chance that the user is aware of it but he can still force
286
 
                # the action with --no-strict
287
 
                err_class = errors.OutOfDateTree
288
 
            if err_class is not None:
289
 
                if strict is None:
290
 
                    err = err_class(self, more=more_warning)
291
 
                    # We don't want to interrupt the user if he expressed no
292
 
                    # preference about strict.
293
 
                    trace.warning('%s', err._format())
294
 
                else:
295
 
                    err = err_class(self, more=more_error)
296
 
                    raise err
297
 
 
298
 
    @needs_read_lock
299
198
    def last_revision(self):
300
199
        """Return the revision id of the last commit performed in this tree.
301
200
 
302
201
        In early tree formats the result of last_revision is the same as the
303
202
        branch last_revision, but that is no longer the case for modern tree
304
203
        formats.
305
 
 
 
204
        
306
205
        last_revision returns the left most parent id, or None if there are no
307
206
        parents.
308
207
 
325
224
    def lock_write(self):
326
225
        """Lock the tree and its branch. This allows mutating calls to be made.
327
226
 
328
 
        Some mutating methods will take out implicit write locks, but in
 
227
        Some mutating methods will take out implicit write locks, but in 
329
228
        general you should always obtain a write lock before calling mutating
330
229
        methods on a tree.
331
230
        """
341
240
        """
342
241
        raise NotImplementedError(self.mkdir)
343
242
 
344
 
    def _observed_sha1(self, file_id, path, (sha1, stat_value)):
345
 
        """Tell the tree we have observed a paths sha1.
346
 
 
347
 
        The intent of this function is to allow trees that have a hashcache to
348
 
        update the hashcache during commit. If the observed file is too new
349
 
        (based on the stat_value) to be safely hash-cached the tree will ignore
350
 
        it.
351
 
 
352
 
        The default implementation does nothing.
353
 
 
354
 
        :param file_id: The file id
355
 
        :param path: The file path
356
 
        :param sha1: The sha 1 that was observed.
357
 
        :param stat_value: A stat result for the file the sha1 was read from.
358
 
        :return: None
359
 
        """
360
 
 
361
 
    def _fix_case_of_inventory_path(self, path):
362
 
        """If our tree isn't case sensitive, return the canonical path"""
363
 
        if not self.case_sensitive:
364
 
            path = self.get_canonical_inventory_path(path)
365
 
        return path
366
 
 
367
 
    @needs_write_lock
368
 
    def put_file_bytes_non_atomic(self, file_id, bytes):
369
 
        """Update the content of a file in the tree.
370
 
 
371
 
        Note that the file is written in-place rather than being
372
 
        written to a temporary location and renamed. As a consequence,
373
 
        readers can potentially see the file half-written.
374
 
 
375
 
        :param file_id: file-id of the file
376
 
        :param bytes: the new file contents
377
 
        """
378
 
        raise NotImplementedError(self.put_file_bytes_non_atomic)
379
 
 
380
243
    def set_parent_ids(self, revision_ids, allow_leftmost_as_ghost=False):
381
244
        """Set the parents ids of the working tree.
382
245
 
387
250
    def set_parent_trees(self, parents_list, allow_leftmost_as_ghost=False):
388
251
        """Set the parents of the working tree.
389
252
 
390
 
        :param parents_list: A list of (revision_id, tree) tuples.
 
253
        :param parents_list: A list of (revision_id, tree) tuples. 
391
254
            If tree is None, then that element is treated as an unreachable
392
255
            parent tree - i.e. a ghost.
393
256
        """
401
264
        For the specific behaviour see the help for cmd_add().
402
265
 
403
266
        :param action: A reporter to be called with the inventory, parent_ie,
404
 
            path and kind of the path being added. It may return a file_id if
 
267
            path and kind of the path being added. It may return a file_id if 
405
268
            a specific one should be used.
406
269
        :param save: Save the inventory after completing the adds. If False
407
270
            this provides dry-run functionality by doing the add and not saving
413
276
        # not in an inner loop; and we want to remove direct use of this,
414
277
        # so here as a reminder for now. RBC 20070703
415
278
        from bzrlib.inventory import InventoryEntry
 
279
        assert isinstance(recurse, bool)
416
280
        if action is None:
417
281
            action = add.AddAction()
418
 
 
 
282
        
419
283
        if not file_list:
420
284
            # no paths supplied: add the entire tree.
421
 
            # FIXME: this assumes we are running in a working tree subdir :-/
422
 
            # -- vila 20100208
423
285
            file_list = [u'.']
424
286
        # mutter("smart add of %r")
425
287
        inv = self.inventory
427
289
        ignored = {}
428
290
        dirs_to_add = []
429
291
        user_dirs = set()
430
 
        conflicts_related = set()
431
 
        # Not all mutable trees can have conflicts
432
 
        if getattr(self, 'conflicts', None) is not None:
433
 
            # Collect all related files without checking whether they exist or
434
 
            # are versioned. It's cheaper to do that once for all conflicts
435
 
            # than trying to find the relevant conflict for each added file.
436
 
            for c in self.conflicts():
437
 
                conflicts_related.update(c.associated_filenames())
438
292
 
439
 
        # validate user file paths and convert all paths to tree
 
293
        # validate user file paths and convert all paths to tree 
440
294
        # relative : it's cheaper to make a tree relative path an abspath
441
 
        # than to convert an abspath to tree relative, and it's cheaper to
442
 
        # perform the canonicalization in bulk.
443
 
        for filepath in osutils.canonical_relpaths(self.basedir, file_list):
444
 
            rf = _FastPath(filepath)
445
 
            # validate user parameters. Our recursive code avoids adding new
446
 
            # files that need such validation
 
295
        # than to convert an abspath to tree relative.
 
296
        for filepath in file_list:
 
297
            rf = _FastPath(self.relpath(filepath))
 
298
            # validate user parameters. Our recursive code avoids adding new files
 
299
            # that need such validation 
447
300
            if self.is_control_filename(rf.raw_path):
448
301
                raise errors.ForbiddenControlFileError(filename=rf.raw_path)
449
 
 
 
302
            
450
303
            abspath = self.abspath(rf.raw_path)
451
304
            kind = osutils.file_kind(abspath)
452
305
            if kind == 'directory':
455
308
            else:
456
309
                if not InventoryEntry.versionable_kind(kind):
457
310
                    raise errors.BadFileKindError(filename=abspath, kind=kind)
458
 
            # ensure the named path is added, so that ignore rules in the later
459
 
            # directory walk dont skip it.
460
 
            # we dont have a parent ie known yet.: use the relatively slower
461
 
            # inventory probing method
 
311
            # ensure the named path is added, so that ignore rules in the later directory
 
312
            # walk dont skip it.
 
313
            # we dont have a parent ie known yet.: use the relatively slower inventory 
 
314
            # probing method
462
315
            versioned = inv.has_filename(rf.raw_path)
463
316
            if versioned:
464
317
                continue
480
333
                dirs_to_add.append((path, None))
481
334
            prev_dir = path.raw_path
482
335
 
483
 
        illegalpath_re = re.compile(r'[\r\n]')
484
336
        # dirs_to_add is initialised to a list of directories, but as we scan
485
337
        # directories we append files to it.
486
338
        # XXX: We should determine kind of files when we scan them rather than
495
347
            kind = osutils.file_kind(abspath)
496
348
 
497
349
            if not InventoryEntry.versionable_kind(kind):
498
 
                trace.warning("skipping %s (can't add file of kind '%s')",
499
 
                              abspath, kind)
500
 
                continue
501
 
            if illegalpath_re.search(directory.raw_path):
502
 
                trace.warning("skipping %r (contains \\n or \\r)" % abspath)
503
 
                continue
504
 
            if directory.raw_path in conflicts_related:
505
 
                # If the file looks like one generated for a conflict, don't
506
 
                # add it.
507
 
                trace.warning(
508
 
                    'skipping %s (generated to help resolve conflicts)',
509
 
                    abspath)
 
350
                warning("skipping %s (can't add file of kind '%s')", abspath, kind)
510
351
                continue
511
352
 
512
353
            if parent_ie is not None:
513
354
                versioned = directory.base_path in parent_ie.children
514
355
            else:
515
 
                # without the parent ie, use the relatively slower inventory
 
356
                # without the parent ie, use the relatively slower inventory 
516
357
                # probing method
517
 
                versioned = inv.has_filename(
518
 
                        self._fix_case_of_inventory_path(directory.raw_path))
 
358
                versioned = inv.has_filename(directory.raw_path)
519
359
 
520
360
            if kind == 'directory':
521
361
                try:
535
375
                pass
536
376
                # mutter("%r is already versioned", abspath)
537
377
            elif sub_tree:
538
 
                # XXX: This is wrong; people *might* reasonably be trying to
539
 
                # add subtrees as subtrees.  This should probably only be done
540
 
                # in formats which can represent subtrees, and even then
541
 
                # perhaps only when the user asked to add subtrees.  At the
542
 
                # moment you can add them specially through 'join --reference',
543
 
                # which is perhaps reasonable: adding a new reference is a
544
 
                # special operation and can have a special behaviour.  mbp
545
 
                # 20070306
546
 
                trace.mutter("%r is a nested bzr tree", abspath)
 
378
                # XXX: This is wrong; people *might* reasonably be trying to add
 
379
                # subtrees as subtrees.  This should probably only be done in formats 
 
380
                # which can represent subtrees, and even then perhaps only when
 
381
                # the user asked to add subtrees.  At the moment you can add them
 
382
                # specially through 'join --reference', which is perhaps
 
383
                # reasonable: adding a new reference is a special operation and
 
384
                # can have a special behaviour.  mbp 20070306
 
385
                mutter("%r is a nested bzr tree", abspath)
547
386
            else:
548
387
                _add_one(self, inv, parent_ie, directory, kind, action)
549
388
                added.append(directory.raw_path)
553
392
                    # must be present:
554
393
                    this_ie = parent_ie.children[directory.base_path]
555
394
                else:
556
 
                    # without the parent ie, use the relatively slower inventory
 
395
                    # without the parent ie, use the relatively slower inventory 
557
396
                    # probing method
558
 
                    this_id = inv.path2id(
559
 
                        self._fix_case_of_inventory_path(directory.raw_path))
 
397
                    this_id = inv.path2id(directory.raw_path)
560
398
                    if this_id is None:
561
399
                        this_ie = None
562
400
                    else:
563
401
                        this_ie = inv[this_id]
564
402
 
565
403
                for subf in sorted(os.listdir(abspath)):
566
 
                    # here we could use TreeDirectory rather than
 
404
                    # here we could use TreeDirectory rather than 
567
405
                    # string concatenation.
568
406
                    subp = osutils.pathjoin(directory.raw_path, subf)
569
 
                    # TODO: is_control_filename is very slow. Make it faster.
570
 
                    # TreeDirectory.is_control_filename could also make this
571
 
                    # faster - its impossible for a non root dir to have a
 
407
                    # TODO: is_control_filename is very slow. Make it faster. 
 
408
                    # TreeDirectory.is_control_filename could also make this 
 
409
                    # faster - its impossible for a non root dir to have a 
572
410
                    # control file.
573
411
                    if self.is_control_filename(subp):
574
 
                        trace.mutter("skip control directory %r", subp)
 
412
                        mutter("skip control directory %r", subp)
575
413
                    elif subf in this_ie.children:
576
414
                        # recurse into this already versioned subdir.
577
415
                        dirs_to_add.append((_FastPath(subp, subf), this_ie))
609
447
        for commit which is not required to handle situations that do not arise
610
448
        outside of commit.
611
449
 
612
 
        See the inventory developers documentation for the theory behind
613
 
        inventory deltas.
614
 
 
615
450
        :param new_revid: The new revision id for the trees parent.
616
451
        :param delta: An inventory delta (see apply_inventory_delta) describing
617
452
            the changes from the current left most parent revision to new_revid.
627
462
        # WorkingTree classes for optimised versions for specific format trees.
628
463
        basis = self.basis_tree()
629
464
        basis.lock_read()
630
 
        # TODO: Consider re-evaluating the need for this with CHKInventory
631
 
        # we don't strictly need to mutate an inventory for this
632
 
        # it only makes sense when apply_delta is cheaper than get_inventory()
633
 
        inventory = basis.inventory._get_mutable_inventory()
 
465
        inventory = basis.inventory
634
466
        basis.unlock()
635
467
        inventory.apply_delta(delta)
636
 
        rev_tree = revisiontree.RevisionTree(self.branch.repository,
637
 
                                             inventory, new_revid)
 
468
        rev_tree = RevisionTree(self.branch.repository, inventory, new_revid)
638
469
        self.set_parent_trees([(new_revid, rev_tree)])
639
470
 
640
471
 
641
472
class MutableTreeHooks(hooks.Hooks):
642
 
    """A dictionary mapping a hook name to a list of callables for mutabletree
 
473
    """A dictionary mapping a hook name to a list of callables for mutabletree 
643
474
    hooks.
644
475
    """
645
476
 
648
479
 
649
480
        """
650
481
        hooks.Hooks.__init__(self)
651
 
        self.create_hook(hooks.HookPoint('start_commit',
652
 
            "Called before a commit is performed on a tree. The start commit "
653
 
            "hook is able to change the tree before the commit takes place. "
654
 
            "start_commit is called with the bzrlib.mutabletree.MutableTree "
655
 
            "that the commit is being performed on.", (1, 4), None))
656
 
        self.create_hook(hooks.HookPoint('post_commit',
657
 
            "Called after a commit is performed on a tree. The hook is "
658
 
            "called with a bzrlib.mutabletree.PostCommitHookParams object. "
659
 
            "The mutable tree the commit was performed on is available via "
660
 
            "the mutable_tree attribute of that object.", (2, 0), None))
 
482
        # Invoked before a commit is done in a tree. New in 1.4
 
483
        self['start_commit'] = []
661
484
 
662
485
 
663
486
# install the default hooks into the MutableTree class.
664
487
MutableTree.hooks = MutableTreeHooks()
665
488
 
666
489
 
667
 
class PostCommitHookParams(object):
668
 
    """Parameters for the post_commit hook.
669
 
 
670
 
    To access the parameters, use the following attributes:
671
 
 
672
 
    * mutable_tree - the MutableTree object
673
 
    """
674
 
 
675
 
    def __init__(self, mutable_tree):
676
 
        """Create the parameters for the post_commit hook."""
677
 
        self.mutable_tree = mutable_tree
678
 
 
679
 
 
680
490
class _FastPath(object):
681
491
    """A path object with fast accessors for things like basename."""
682
492
 
716
526
        added = []
717
527
    else:
718
528
        # slower but does not need parent_ie
719
 
        if inv.has_filename(tree._fix_case_of_inventory_path(path.raw_path)):
 
529
        if inv.has_filename(path.raw_path):
720
530
            return []
721
531
        # its really not there : add the parent
722
532
        # note that the dirname use leads to some extra str copying etc but as
723
533
        # there are a limited number of dirs we can be nested under, it should
724
534
        # generally find it very fast and not recurse after that.
725
535
        added = _add_one_and_parent(tree, inv, None,
726
 
            _FastPath(osutils.dirname(path.raw_path)), 'directory', action)
727
 
        parent_id = inv.path2id(osutils.dirname(path.raw_path))
 
536
            _FastPath(dirname(path.raw_path)), 'directory', action)
 
537
        parent_id = inv.path2id(dirname(path.raw_path))
728
538
        parent_ie = inv[parent_id]
729
539
    _add_one(tree, inv, parent_ie, path, kind, action)
730
540
    return added + [path.raw_path]