~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/mutabletree.py

  • Committer: John Arbash Meinel
  • Date: 2008-10-04 14:10:13 UTC
  • mto: This revision was merged to the branch mainline in revision 3805.
  • Revision ID: john@arbash-meinel.com-20081004141013-yskxjlwtuy2k18ue
Playing around with expanding requests for btree index nodes into neighboring nodes.

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2006-2011 Canonical Ltd
 
1
# Copyright (C) 2006, 2007 Canonical Ltd
2
2
#
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
12
12
#
13
13
# You should have received a copy of the GNU General Public License
14
14
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
16
 
17
17
"""MutableTree object.
18
18
 
22
22
 
23
23
from bzrlib.lazy_import import lazy_import
24
24
lazy_import(globals(), """
25
 
import operator
26
25
import os
27
 
import re
28
26
 
29
27
from bzrlib import (
30
28
    add,
31
 
    controldir,
 
29
    bzrdir,
 
30
    hooks,
 
31
    )
 
32
from bzrlib.osutils import dirname
 
33
from bzrlib.revisiontree import RevisionTree
 
34
from bzrlib.trace import mutter, warning
 
35
""")
 
36
 
 
37
from bzrlib import (
32
38
    errors,
33
 
    hooks,
34
 
    inventory as _mod_inventory,
35
39
    osutils,
36
 
    revisiontree,
37
 
    trace,
38
 
    transport as _mod_transport,
39
40
    tree,
40
41
    )
41
 
""")
42
 
 
43
42
from bzrlib.decorators import needs_read_lock, needs_write_lock
 
43
from bzrlib.osutils import splitpath
 
44
from bzrlib.symbol_versioning import DEPRECATED_PARAMETER
44
45
 
45
46
 
46
47
def needs_tree_write_lock(unbound):
68
69
    entirely in memory.
69
70
 
70
71
    For now, we are not treating MutableTree as an interface to provide
71
 
    conformance tests for - rather we are testing MemoryTree specifically, and
 
72
    conformance tests for - rather we are testing MemoryTree specifically, and 
72
73
    interface testing implementations of WorkingTree.
73
74
 
74
75
    A mutable tree always has an associated Branch and BzrDir object - the
75
76
    branch and bzrdir attributes.
76
77
    """
77
 
    def __init__(self, *args, **kw):
78
 
        super(MutableTree, self).__init__(*args, **kw)
79
 
        # Is this tree on a case-insensitive or case-preserving file-system?
80
 
        # Sub-classes may initialize to False if they detect they are being
81
 
        # used on media which doesn't differentiate the case of names.
82
 
        self.case_sensitive = True
83
 
 
84
 
    def is_control_filename(self, filename):
85
 
        """True if filename is the name of a control file in this tree.
86
 
 
87
 
        :param filename: A filename within the tree. This is a relative path
88
 
            from the root of this tree.
89
 
 
90
 
        This is true IF and ONLY IF the filename is part of the meta data
91
 
        that bzr controls in this tree. I.E. a random .bzr directory placed
92
 
        on disk will not be a control file for this tree.
93
 
        """
94
 
        raise NotImplementedError(self.is_control_filename)
95
78
 
96
79
    @needs_tree_write_lock
97
80
    def add(self, files, ids=None, kinds=None):
140
123
            # generic constraint checks:
141
124
            if self.is_control_filename(f):
142
125
                raise errors.ForbiddenControlFileError(filename=f)
143
 
            fp = osutils.splitpath(f)
144
 
        # fill out file kinds for all files [not needed when we stop
 
126
            fp = splitpath(f)
 
127
        # fill out file kinds for all files [not needed when we stop 
145
128
        # caring about the instantaneous file kind within a uncommmitted tree
146
129
        #
147
130
        self._gather_kinds(files, kinds)
162
145
        if sub_tree_id == self.get_root_id():
163
146
            raise errors.BadReferenceTarget(self, sub_tree,
164
147
                                     'Trees have the same root id.')
165
 
        if self.has_id(sub_tree_id):
 
148
        if sub_tree_id in self.inventory:
166
149
            raise errors.BadReferenceTarget(self, sub_tree,
167
150
                                            'Root id already present in tree')
168
151
        self._add([sub_tree_path], [sub_tree_id], ['tree-reference'])
177
160
        """
178
161
        raise NotImplementedError(self._add)
179
162
 
 
163
    @needs_tree_write_lock
180
164
    def apply_inventory_delta(self, changes):
181
165
        """Apply changes to the inventory as an atomic operation.
182
166
 
185
169
        :return None:
186
170
        :seealso Inventory.apply_delta: For details on the changes parameter.
187
171
        """
188
 
        raise NotImplementedError(self.apply_inventory_delta)
 
172
        self.flush()
 
173
        inv = self.inventory
 
174
        inv.apply_delta(changes)
 
175
        self._write_inventory(inv)
189
176
 
190
177
    @needs_write_lock
191
178
    def commit(self, message=None, revprops=None, *args,
192
179
               **kwargs):
193
180
        # avoid circular imports
194
181
        from bzrlib import commit
195
 
        possible_master_transports=[]
196
 
        revprops = commit.Commit.update_revprops(
197
 
                revprops,
198
 
                self.branch,
199
 
                kwargs.pop('authors', None),
200
 
                kwargs.pop('author', None),
201
 
                kwargs.get('local', False),
202
 
                possible_master_transports)
 
182
        if revprops is None:
 
183
            revprops = {}
 
184
        if not 'branch-nick' in revprops:
 
185
            revprops['branch-nick'] = self.branch.nick
 
186
        author = kwargs.pop('author', None)
 
187
        if author is not None:
 
188
            if 'author' in revprops:
 
189
                # XXX: maybe we should just accept one of them?
 
190
                raise AssertionError('author property given twice')
 
191
            revprops['author'] = author
203
192
        # args for wt.commit start at message from the Commit.commit method,
204
193
        args = (message, ) + args
205
194
        for hook in MutableTree.hooks['start_commit']:
206
195
            hook(self)
207
196
        committed_id = commit.Commit().commit(working_tree=self,
208
 
            revprops=revprops,
209
 
            possible_master_transports=possible_master_transports,
210
 
            *args, **kwargs)
211
 
        post_hook_params = PostCommitHookParams(self)
212
 
        for hook in MutableTree.hooks['post_commit']:
213
 
            hook(post_hook_params)
 
197
            revprops=revprops, *args, **kwargs)
214
198
        return committed_id
215
199
 
216
200
    def _gather_kinds(self, files, kinds):
217
201
        """Helper function for add - sets the entries of kinds."""
218
202
        raise NotImplementedError(self._gather_kinds)
219
203
 
220
 
    @needs_read_lock
221
 
    def has_changes(self, _from_tree=None):
222
 
        """Quickly check that the tree contains at least one commitable change.
223
 
 
224
 
        :param _from_tree: tree to compare against to find changes (default to
225
 
            the basis tree and is intended to be used by tests).
226
 
 
227
 
        :return: True if a change is found. False otherwise
228
 
        """
229
 
        # Check pending merges
230
 
        if len(self.get_parent_ids()) > 1:
231
 
            return True
232
 
        if _from_tree is None:
233
 
            _from_tree = self.basis_tree()
234
 
        changes = self.iter_changes(_from_tree)
235
 
        try:
236
 
            change = changes.next()
237
 
            # Exclude root (talk about black magic... --vila 20090629)
238
 
            if change[4] == (None, None):
239
 
                change = changes.next()
240
 
            return True
241
 
        except StopIteration:
242
 
            # No changes
243
 
            return False
244
 
 
245
 
    @needs_read_lock
246
 
    def check_changed_or_out_of_date(self, strict, opt_name,
247
 
                                     more_error, more_warning):
248
 
        """Check the tree for uncommitted changes and branch synchronization.
249
 
 
250
 
        If strict is None and not set in the config files, a warning is issued.
251
 
        If strict is True, an error is raised.
252
 
        If strict is False, no checks are done and no warning is issued.
253
 
 
254
 
        :param strict: True, False or None, searched in branch config if None.
255
 
 
256
 
        :param opt_name: strict option name to search in config file.
257
 
 
258
 
        :param more_error: Details about how to avoid the check.
259
 
 
260
 
        :param more_warning: Details about what is happening.
261
 
        """
262
 
        if strict is None:
263
 
            strict = self.branch.get_config().get_user_option_as_bool(opt_name)
264
 
        if strict is not False:
265
 
            err_class = None
266
 
            if (self.has_changes()):
267
 
                err_class = errors.UncommittedChanges
268
 
            elif self.last_revision() != self.branch.last_revision():
269
 
                # The tree has lost sync with its branch, there is little
270
 
                # chance that the user is aware of it but he can still force
271
 
                # the action with --no-strict
272
 
                err_class = errors.OutOfDateTree
273
 
            if err_class is not None:
274
 
                if strict is None:
275
 
                    err = err_class(self, more=more_warning)
276
 
                    # We don't want to interrupt the user if he expressed no
277
 
                    # preference about strict.
278
 
                    trace.warning('%s', err._format())
279
 
                else:
280
 
                    err = err_class(self, more=more_error)
281
 
                    raise err
 
204
    def get_file_with_stat(self, file_id, path=None):
 
205
        """Get a file handle and stat object for file_id.
 
206
 
 
207
        The default implementation returns (self.get_file, None) for backwards
 
208
        compatibility.
 
209
 
 
210
        :param file_id: The file id to read.
 
211
        :param path: The path of the file, if it is known.
 
212
        :return: A tuple (file_handle, stat_value_or_None). If the tree has
 
213
            no stat facility, or need for a stat cache feedback during commit,
 
214
            it may return None for the second element of the tuple.
 
215
        """
 
216
        return (self.get_file(file_id, path), None)
282
217
 
283
218
    @needs_read_lock
284
219
    def last_revision(self):
287
222
        In early tree formats the result of last_revision is the same as the
288
223
        branch last_revision, but that is no longer the case for modern tree
289
224
        formats.
290
 
 
 
225
        
291
226
        last_revision returns the left most parent id, or None if there are no
292
227
        parents.
293
228
 
310
245
    def lock_write(self):
311
246
        """Lock the tree and its branch. This allows mutating calls to be made.
312
247
 
313
 
        Some mutating methods will take out implicit write locks, but in
 
248
        Some mutating methods will take out implicit write locks, but in 
314
249
        general you should always obtain a write lock before calling mutating
315
250
        methods on a tree.
316
251
        """
332
267
        The intent of this function is to allow trees that have a hashcache to
333
268
        update the hashcache during commit. If the observed file is too new
334
269
        (based on the stat_value) to be safely hash-cached the tree will ignore
335
 
        it.
 
270
        it. 
336
271
 
337
272
        The default implementation does nothing.
338
273
 
346
281
    @needs_write_lock
347
282
    def put_file_bytes_non_atomic(self, file_id, bytes):
348
283
        """Update the content of a file in the tree.
349
 
 
 
284
        
350
285
        Note that the file is written in-place rather than being
351
286
        written to a temporary location and renamed. As a consequence,
352
287
        readers can potentially see the file half-written.
366
301
    def set_parent_trees(self, parents_list, allow_leftmost_as_ghost=False):
367
302
        """Set the parents of the working tree.
368
303
 
369
 
        :param parents_list: A list of (revision_id, tree) tuples.
 
304
        :param parents_list: A list of (revision_id, tree) tuples. 
370
305
            If tree is None, then that element is treated as an unreachable
371
306
            parent tree - i.e. a ghost.
372
307
        """
373
308
        raise NotImplementedError(self.set_parent_trees)
374
309
 
 
310
    @needs_tree_write_lock
375
311
    def smart_add(self, file_list, recurse=True, action=None, save=True):
376
312
        """Version file_list, optionally recursing into directories.
377
313
 
378
314
        This is designed more towards DWIM for humans than API clarity.
379
315
        For the specific behaviour see the help for cmd_add().
380
316
 
381
 
        :param file_list: List of zero or more paths.  *NB: these are 
382
 
            interpreted relative to the process cwd, not relative to the 
383
 
            tree.*  (Add and most other tree methods use tree-relative
384
 
            paths.)
385
317
        :param action: A reporter to be called with the inventory, parent_ie,
386
 
            path and kind of the path being added. It may return a file_id if
 
318
            path and kind of the path being added. It may return a file_id if 
387
319
            a specific one should be used.
388
320
        :param save: Save the inventory after completing the adds. If False
389
321
            this provides dry-run functionality by doing the add and not saving
392
324
            of added files, and ignored_files is a dict mapping files that were
393
325
            ignored to the rule that caused them to be ignored.
394
326
        """
395
 
        raise NotImplementedError(self.smart_add)
396
 
 
397
 
 
398
 
class MutableInventoryTree(MutableTree, tree.InventoryTree):
399
 
 
400
 
    @needs_tree_write_lock
401
 
    def apply_inventory_delta(self, changes):
402
 
        """Apply changes to the inventory as an atomic operation.
403
 
 
404
 
        :param changes: An inventory delta to apply to the working tree's
405
 
            inventory.
406
 
        :return None:
407
 
        :seealso Inventory.apply_delta: For details on the changes parameter.
408
 
        """
409
 
        self.flush()
 
327
        # not in an inner loop; and we want to remove direct use of this,
 
328
        # so here as a reminder for now. RBC 20070703
 
329
        from bzrlib.inventory import InventoryEntry
 
330
        if action is None:
 
331
            action = add.AddAction()
 
332
        
 
333
        if not file_list:
 
334
            # no paths supplied: add the entire tree.
 
335
            file_list = [u'.']
 
336
        # mutter("smart add of %r")
410
337
        inv = self.inventory
411
 
        inv.apply_delta(changes)
412
 
        self._write_inventory(inv)
413
 
 
414
 
    def _fix_case_of_inventory_path(self, path):
415
 
        """If our tree isn't case sensitive, return the canonical path"""
416
 
        if not self.case_sensitive:
417
 
            path = self.get_canonical_inventory_path(path)
418
 
        return path
419
 
 
420
 
    @needs_tree_write_lock
421
 
    def smart_add(self, file_list, recurse=True, action=None, save=True):
422
 
        """Version file_list, optionally recursing into directories.
423
 
 
424
 
        This is designed more towards DWIM for humans than API clarity.
425
 
        For the specific behaviour see the help for cmd_add().
426
 
 
427
 
        :param file_list: List of zero or more paths.  *NB: these are 
428
 
            interpreted relative to the process cwd, not relative to the 
429
 
            tree.*  (Add and most other tree methods use tree-relative
430
 
            paths.)
431
 
        :param action: A reporter to be called with the inventory, parent_ie,
432
 
            path and kind of the path being added. It may return a file_id if
433
 
            a specific one should be used.
434
 
        :param save: Save the inventory after completing the adds. If False
435
 
            this provides dry-run functionality by doing the add and not saving
436
 
            the inventory.
437
 
        :return: A tuple - files_added, ignored_files. files_added is the count
438
 
            of added files, and ignored_files is a dict mapping files that were
439
 
            ignored to the rule that caused them to be ignored.
440
 
        """
441
 
        # Not all mutable trees can have conflicts
442
 
        if getattr(self, 'conflicts', None) is not None:
443
 
            # Collect all related files without checking whether they exist or
444
 
            # are versioned. It's cheaper to do that once for all conflicts
445
 
            # than trying to find the relevant conflict for each added file.
446
 
            conflicts_related = set()
447
 
            for c in self.conflicts():
448
 
                conflicts_related.update(c.associated_filenames())
449
 
        else:
450
 
            conflicts_related = None
451
 
        adder = _SmartAddHelper(self, action, conflicts_related)
452
 
        adder.add(file_list, recurse=recurse)
453
 
        if save:
454
 
            invdelta = adder.get_inventory_delta()
455
 
            self.apply_inventory_delta(invdelta)
456
 
        return adder.added, adder.ignored
 
338
        added = []
 
339
        ignored = {}
 
340
        dirs_to_add = []
 
341
        user_dirs = set()
 
342
 
 
343
        # validate user file paths and convert all paths to tree 
 
344
        # relative : it's cheaper to make a tree relative path an abspath
 
345
        # than to convert an abspath to tree relative.
 
346
        for filepath in file_list:
 
347
            rf = _FastPath(self.relpath(filepath))
 
348
            # validate user parameters. Our recursive code avoids adding new files
 
349
            # that need such validation 
 
350
            if self.is_control_filename(rf.raw_path):
 
351
                raise errors.ForbiddenControlFileError(filename=rf.raw_path)
 
352
            
 
353
            abspath = self.abspath(rf.raw_path)
 
354
            kind = osutils.file_kind(abspath)
 
355
            if kind == 'directory':
 
356
                # schedule the dir for scanning
 
357
                user_dirs.add(rf)
 
358
            else:
 
359
                if not InventoryEntry.versionable_kind(kind):
 
360
                    raise errors.BadFileKindError(filename=abspath, kind=kind)
 
361
            # ensure the named path is added, so that ignore rules in the later directory
 
362
            # walk dont skip it.
 
363
            # we dont have a parent ie known yet.: use the relatively slower inventory 
 
364
            # probing method
 
365
            versioned = inv.has_filename(rf.raw_path)
 
366
            if versioned:
 
367
                continue
 
368
            added.extend(_add_one_and_parent(self, inv, None, rf, kind, action))
 
369
 
 
370
        if not recurse:
 
371
            # no need to walk any directories at all.
 
372
            if len(added) > 0 and save:
 
373
                self._write_inventory(inv)
 
374
            return added, ignored
 
375
 
 
376
        # only walk the minimal parents needed: we have user_dirs to override
 
377
        # ignores.
 
378
        prev_dir = None
 
379
 
 
380
        is_inside = osutils.is_inside_or_parent_of_any
 
381
        for path in sorted(user_dirs):
 
382
            if (prev_dir is None or not is_inside([prev_dir], path.raw_path)):
 
383
                dirs_to_add.append((path, None))
 
384
            prev_dir = path.raw_path
 
385
 
 
386
        # dirs_to_add is initialised to a list of directories, but as we scan
 
387
        # directories we append files to it.
 
388
        # XXX: We should determine kind of files when we scan them rather than
 
389
        # adding to this list. RBC 20070703
 
390
        for directory, parent_ie in dirs_to_add:
 
391
            # directory is tree-relative
 
392
            abspath = self.abspath(directory.raw_path)
 
393
 
 
394
            # get the contents of this directory.
 
395
 
 
396
            # find the kind of the path being added.
 
397
            kind = osutils.file_kind(abspath)
 
398
 
 
399
            if not InventoryEntry.versionable_kind(kind):
 
400
                warning("skipping %s (can't add file of kind '%s')", abspath, kind)
 
401
                continue
 
402
 
 
403
            if parent_ie is not None:
 
404
                versioned = directory.base_path in parent_ie.children
 
405
            else:
 
406
                # without the parent ie, use the relatively slower inventory 
 
407
                # probing method
 
408
                versioned = inv.has_filename(directory.raw_path)
 
409
 
 
410
            if kind == 'directory':
 
411
                try:
 
412
                    sub_branch = bzrdir.BzrDir.open(abspath)
 
413
                    sub_tree = True
 
414
                except errors.NotBranchError:
 
415
                    sub_tree = False
 
416
                except errors.UnsupportedFormatError:
 
417
                    sub_tree = True
 
418
            else:
 
419
                sub_tree = False
 
420
 
 
421
            if directory.raw_path == '':
 
422
                # mutter("tree root doesn't need to be added")
 
423
                sub_tree = False
 
424
            elif versioned:
 
425
                pass
 
426
                # mutter("%r is already versioned", abspath)
 
427
            elif sub_tree:
 
428
                # XXX: This is wrong; people *might* reasonably be trying to add
 
429
                # subtrees as subtrees.  This should probably only be done in formats 
 
430
                # which can represent subtrees, and even then perhaps only when
 
431
                # the user asked to add subtrees.  At the moment you can add them
 
432
                # specially through 'join --reference', which is perhaps
 
433
                # reasonable: adding a new reference is a special operation and
 
434
                # can have a special behaviour.  mbp 20070306
 
435
                mutter("%r is a nested bzr tree", abspath)
 
436
            else:
 
437
                _add_one(self, inv, parent_ie, directory, kind, action)
 
438
                added.append(directory.raw_path)
 
439
 
 
440
            if kind == 'directory' and not sub_tree:
 
441
                if parent_ie is not None:
 
442
                    # must be present:
 
443
                    this_ie = parent_ie.children[directory.base_path]
 
444
                else:
 
445
                    # without the parent ie, use the relatively slower inventory 
 
446
                    # probing method
 
447
                    this_id = inv.path2id(directory.raw_path)
 
448
                    if this_id is None:
 
449
                        this_ie = None
 
450
                    else:
 
451
                        this_ie = inv[this_id]
 
452
 
 
453
                for subf in sorted(os.listdir(abspath)):
 
454
                    # here we could use TreeDirectory rather than 
 
455
                    # string concatenation.
 
456
                    subp = osutils.pathjoin(directory.raw_path, subf)
 
457
                    # TODO: is_control_filename is very slow. Make it faster. 
 
458
                    # TreeDirectory.is_control_filename could also make this 
 
459
                    # faster - its impossible for a non root dir to have a 
 
460
                    # control file.
 
461
                    if self.is_control_filename(subp):
 
462
                        mutter("skip control directory %r", subp)
 
463
                    elif subf in this_ie.children:
 
464
                        # recurse into this already versioned subdir.
 
465
                        dirs_to_add.append((_FastPath(subp, subf), this_ie))
 
466
                    else:
 
467
                        # user selection overrides ignoes
 
468
                        # ignore while selecting files - if we globbed in the
 
469
                        # outer loop we would ignore user files.
 
470
                        ignore_glob = self.is_ignored(subp)
 
471
                        if ignore_glob is not None:
 
472
                            # mutter("skip ignored sub-file %r", subp)
 
473
                            ignored.setdefault(ignore_glob, []).append(subp)
 
474
                        else:
 
475
                            #mutter("queue to add sub-file %r", subp)
 
476
                            dirs_to_add.append((_FastPath(subp, subf), this_ie))
 
477
 
 
478
        if len(added) > 0:
 
479
            if save:
 
480
                self._write_inventory(inv)
 
481
            else:
 
482
                self.read_working_inventory()
 
483
        return added, ignored
457
484
 
458
485
    def update_basis_by_delta(self, new_revid, delta):
459
486
        """Update the parents of this tree after a commit.
470
497
        for commit which is not required to handle situations that do not arise
471
498
        outside of commit.
472
499
 
473
 
        See the inventory developers documentation for the theory behind
474
 
        inventory deltas.
475
 
 
476
500
        :param new_revid: The new revision id for the trees parent.
477
501
        :param delta: An inventory delta (see apply_inventory_delta) describing
478
502
            the changes from the current left most parent revision to new_revid.
488
512
        # WorkingTree classes for optimised versions for specific format trees.
489
513
        basis = self.basis_tree()
490
514
        basis.lock_read()
491
 
        # TODO: Consider re-evaluating the need for this with CHKInventory
492
 
        # we don't strictly need to mutate an inventory for this
493
 
        # it only makes sense when apply_delta is cheaper than get_inventory()
494
 
        inventory = _mod_inventory.mutable_inventory_from_tree(basis)
 
515
        inventory = basis.inventory
495
516
        basis.unlock()
496
517
        inventory.apply_delta(delta)
497
 
        rev_tree = revisiontree.InventoryRevisionTree(self.branch.repository,
498
 
                                             inventory, new_revid)
 
518
        rev_tree = RevisionTree(self.branch.repository, inventory, new_revid)
499
519
        self.set_parent_trees([(new_revid, rev_tree)])
500
520
 
501
521
 
502
522
class MutableTreeHooks(hooks.Hooks):
503
 
    """A dictionary mapping a hook name to a list of callables for mutabletree
 
523
    """A dictionary mapping a hook name to a list of callables for mutabletree 
504
524
    hooks.
505
525
    """
506
526
 
508
528
        """Create the default hooks.
509
529
 
510
530
        """
511
 
        hooks.Hooks.__init__(self, "bzrlib.mutabletree", "MutableTree.hooks")
512
 
        self.add_hook('start_commit',
513
 
            "Called before a commit is performed on a tree. The start commit "
514
 
            "hook is able to change the tree before the commit takes place. "
515
 
            "start_commit is called with the bzrlib.mutabletree.MutableTree "
516
 
            "that the commit is being performed on.", (1, 4))
517
 
        self.add_hook('post_commit',
518
 
            "Called after a commit is performed on a tree. The hook is "
519
 
            "called with a bzrlib.mutabletree.PostCommitHookParams object. "
520
 
            "The mutable tree the commit was performed on is available via "
521
 
            "the mutable_tree attribute of that object.", (2, 0))
 
531
        hooks.Hooks.__init__(self)
 
532
        # Invoked before a commit is done in a tree. New in 1.4
 
533
        self['start_commit'] = []
522
534
 
523
535
 
524
536
# install the default hooks into the MutableTree class.
525
537
MutableTree.hooks = MutableTreeHooks()
526
538
 
527
539
 
528
 
class PostCommitHookParams(object):
529
 
    """Parameters for the post_commit hook.
530
 
 
531
 
    To access the parameters, use the following attributes:
532
 
 
533
 
    * mutable_tree - the MutableTree object
534
 
    """
535
 
 
536
 
    def __init__(self, mutable_tree):
537
 
        """Create the parameters for the post_commit hook."""
538
 
        self.mutable_tree = mutable_tree
539
 
 
540
 
 
541
 
class _SmartAddHelper(object):
542
 
    """Helper for MutableTree.smart_add."""
543
 
 
544
 
    def get_inventory_delta(self):
545
 
        return self._invdelta.values()
546
 
 
547
 
    def _get_ie(self, inv_path):
548
 
        """Retrieve the most up to date inventory entry for a path.
549
 
 
550
 
        :param inv_path: Normalized inventory path
551
 
        :return: Inventory entry (with possibly invalid .children for
552
 
            directories)
553
 
        """
554
 
        entry = self._invdelta.get(inv_path)
555
 
        if entry is not None:
556
 
            return entry[3]
557
 
        # Find a 'best fit' match if the filesystem is case-insensitive
558
 
        inv_path = self.tree._fix_case_of_inventory_path(inv_path)
559
 
        file_id = self.tree.path2id(inv_path)
560
 
        if file_id is not None:
561
 
            return self.tree.iter_entries_by_dir([file_id]).next()[1]
562
 
        return None
563
 
 
564
 
    def _convert_to_directory(self, this_ie, inv_path):
565
 
        """Convert an entry to a directory.
566
 
 
567
 
        :param this_ie: Inventory entry
568
 
        :param inv_path: Normalized path for the inventory entry
569
 
        :return: The new inventory entry
570
 
        """
571
 
        # Same as in _add_one below, if the inventory doesn't
572
 
        # think this is a directory, update the inventory
573
 
        this_ie = _mod_inventory.InventoryDirectory(
574
 
            this_ie.file_id, this_ie.name, this_ie.parent_id)
575
 
        self._invdelta[inv_path] = (inv_path, inv_path, this_ie.file_id,
576
 
            this_ie)
577
 
        return this_ie
578
 
 
579
 
    def _add_one_and_parent(self, parent_ie, path, kind, inv_path):
580
 
        """Add a new entry to the inventory and automatically add unversioned parents.
581
 
 
582
 
        :param parent_ie: Parent inventory entry if known, or None.  If
583
 
            None, the parent is looked up by name and used if present, otherwise it
584
 
            is recursively added.
585
 
        :param kind: Kind of new entry (file, directory, etc)
586
 
        :param action: callback(tree, parent_ie, path, kind); can return file_id
587
 
        :return: Inventory entry for path and a list of paths which have been added.
588
 
        """
589
 
        # Nothing to do if path is already versioned.
590
 
        # This is safe from infinite recursion because the tree root is
591
 
        # always versioned.
592
 
        inv_dirname = osutils.dirname(inv_path)
593
 
        dirname, basename = osutils.split(path)
594
 
        if parent_ie is None:
595
 
            # slower but does not need parent_ie
596
 
            this_ie = self._get_ie(inv_path)
597
 
            if this_ie is not None:
598
 
                return this_ie
599
 
            # its really not there : add the parent
600
 
            # note that the dirname use leads to some extra str copying etc but as
601
 
            # there are a limited number of dirs we can be nested under, it should
602
 
            # generally find it very fast and not recurse after that.
603
 
            parent_ie = self._add_one_and_parent(None,
604
 
                dirname, 'directory', 
605
 
                inv_dirname)
606
 
        # if the parent exists, but isn't a directory, we have to do the
607
 
        # kind change now -- really the inventory shouldn't pretend to know
608
 
        # the kind of wt files, but it does.
609
 
        if parent_ie.kind != 'directory':
610
 
            # nb: this relies on someone else checking that the path we're using
611
 
            # doesn't contain symlinks.
612
 
            parent_ie = self._convert_to_directory(parent_ie, inv_dirname)
613
 
        file_id = self.action(self.tree.inventory, parent_ie, path, kind)
614
 
        entry = _mod_inventory.make_entry(kind, basename, parent_ie.file_id,
615
 
            file_id=file_id)
616
 
        self._invdelta[inv_path] = (None, inv_path, entry.file_id, entry)
617
 
        self.added.append(inv_path)
618
 
        return entry
619
 
 
620
 
    def _gather_dirs_to_add(self, user_dirs):
621
 
        # only walk the minimal parents needed: we have user_dirs to override
622
 
        # ignores.
623
 
        prev_dir = None
624
 
 
625
 
        is_inside = osutils.is_inside_or_parent_of_any
626
 
        for path, (inv_path, this_ie) in sorted(
627
 
                user_dirs.iteritems(), key=operator.itemgetter(0)):
628
 
            if (prev_dir is None or not is_inside([prev_dir], path)):
629
 
                yield (path, inv_path, this_ie, None)
630
 
            prev_dir = path
631
 
 
632
 
    def __init__(self, tree, action, conflicts_related=None):
633
 
        self.tree = tree
634
 
        if action is None:
635
 
            self.action = add.AddAction()
636
 
        else:
637
 
            self.action = action
638
 
        self._invdelta = {}
639
 
        self.added = []
640
 
        self.ignored = {}
641
 
        if conflicts_related is None:
642
 
            self.conflicts_related = frozenset()
643
 
        else:
644
 
            self.conflicts_related = conflicts_related
645
 
 
646
 
    def add(self, file_list, recurse=True):
647
 
        from bzrlib.inventory import InventoryEntry
648
 
        if not file_list:
649
 
            # no paths supplied: add the entire tree.
650
 
            # FIXME: this assumes we are running in a working tree subdir :-/
651
 
            # -- vila 20100208
652
 
            file_list = [u'.']
653
 
 
654
 
        # expand any symlinks in the directory part, while leaving the
655
 
        # filename alone
656
 
        # only expanding if symlinks are supported avoids windows path bugs
657
 
        if osutils.has_symlinks():
658
 
            file_list = map(osutils.normalizepath, file_list)
659
 
 
660
 
        user_dirs = {}
661
 
        # validate user file paths and convert all paths to tree
662
 
        # relative : it's cheaper to make a tree relative path an abspath
663
 
        # than to convert an abspath to tree relative, and it's cheaper to
664
 
        # perform the canonicalization in bulk.
665
 
        for filepath in osutils.canonical_relpaths(self.tree.basedir, file_list):
666
 
            # validate user parameters. Our recursive code avoids adding new
667
 
            # files that need such validation
668
 
            if self.tree.is_control_filename(filepath):
669
 
                raise errors.ForbiddenControlFileError(filename=filepath)
670
 
 
671
 
            abspath = self.tree.abspath(filepath)
672
 
            kind = osutils.file_kind(abspath)
673
 
            # ensure the named path is added, so that ignore rules in the later
674
 
            # directory walk dont skip it.
675
 
            # we dont have a parent ie known yet.: use the relatively slower
676
 
            # inventory probing method
677
 
            inv_path, _ = osutils.normalized_filename(filepath)
678
 
            this_ie = self._get_ie(inv_path)
679
 
            if this_ie is None:
680
 
                this_ie = self._add_one_and_parent(None, filepath, kind, inv_path)
681
 
            if kind == 'directory':
682
 
                # schedule the dir for scanning
683
 
                user_dirs[filepath] = (inv_path, this_ie)
684
 
 
685
 
        if not recurse:
686
 
            # no need to walk any directories at all.
687
 
            return
688
 
 
689
 
        things_to_add = list(self._gather_dirs_to_add(user_dirs))
690
 
 
691
 
        illegalpath_re = re.compile(r'[\r\n]')
692
 
        for directory, inv_path, this_ie, parent_ie in things_to_add:
693
 
            # directory is tree-relative
694
 
            abspath = self.tree.abspath(directory)
695
 
 
696
 
            # get the contents of this directory.
697
 
 
698
 
            # find the kind of the path being added.
699
 
            if this_ie is None:
700
 
                kind = osutils.file_kind(abspath)
701
 
            else:
702
 
                kind = this_ie.kind
703
 
 
704
 
            if not InventoryEntry.versionable_kind(kind):
705
 
                trace.warning("skipping %s (can't add file of kind '%s')",
706
 
                              abspath, kind)
707
 
                continue
708
 
            if illegalpath_re.search(directory):
709
 
                trace.warning("skipping %r (contains \\n or \\r)" % abspath)
710
 
                continue
711
 
            if directory in self.conflicts_related:
712
 
                # If the file looks like one generated for a conflict, don't
713
 
                # add it.
714
 
                trace.warning(
715
 
                    'skipping %s (generated to help resolve conflicts)',
716
 
                    abspath)
717
 
                continue
718
 
 
719
 
            if kind == 'directory' and directory != '':
720
 
                try:
721
 
                    transport = _mod_transport.get_transport_from_path(abspath)
722
 
                    controldir.ControlDirFormat.find_format(transport)
723
 
                    sub_tree = True
724
 
                except errors.NotBranchError:
725
 
                    sub_tree = False
726
 
                except errors.UnsupportedFormatError:
727
 
                    sub_tree = True
728
 
            else:
729
 
                sub_tree = False
730
 
 
731
 
            if this_ie is not None:
732
 
                pass
733
 
            elif sub_tree:
734
 
                # XXX: This is wrong; people *might* reasonably be trying to
735
 
                # add subtrees as subtrees.  This should probably only be done
736
 
                # in formats which can represent subtrees, and even then
737
 
                # perhaps only when the user asked to add subtrees.  At the
738
 
                # moment you can add them specially through 'join --reference',
739
 
                # which is perhaps reasonable: adding a new reference is a
740
 
                # special operation and can have a special behaviour.  mbp
741
 
                # 20070306
742
 
                trace.mutter("%r is a nested bzr tree", abspath)
743
 
            else:
744
 
                this_ie = self._add_one_and_parent(parent_ie, directory, kind, inv_path)
745
 
 
746
 
            if kind == 'directory' and not sub_tree:
747
 
                if this_ie.kind != 'directory':
748
 
                    this_ie = self._convert_to_directory(this_ie, inv_path)
749
 
 
750
 
                for subf in sorted(os.listdir(abspath)):
751
 
                    inv_f, _ = osutils.normalized_filename(subf)
752
 
                    # here we could use TreeDirectory rather than
753
 
                    # string concatenation.
754
 
                    subp = osutils.pathjoin(directory, subf)
755
 
                    # TODO: is_control_filename is very slow. Make it faster.
756
 
                    # TreeDirectory.is_control_filename could also make this
757
 
                    # faster - its impossible for a non root dir to have a
758
 
                    # control file.
759
 
                    if self.tree.is_control_filename(subp):
760
 
                        trace.mutter("skip control directory %r", subp)
761
 
                        continue
762
 
                    sub_invp = osutils.pathjoin(inv_path, inv_f)
763
 
                    entry = self._invdelta.get(sub_invp)
764
 
                    if entry is not None:
765
 
                        sub_ie = entry[3]
766
 
                    else:
767
 
                        sub_ie = this_ie.children.get(inv_f)
768
 
                    if sub_ie is not None:
769
 
                        # recurse into this already versioned subdir.
770
 
                        things_to_add.append((subp, sub_invp, sub_ie, this_ie))
771
 
                    else:
772
 
                        # user selection overrides ignoes
773
 
                        # ignore while selecting files - if we globbed in the
774
 
                        # outer loop we would ignore user files.
775
 
                        ignore_glob = self.tree.is_ignored(subp)
776
 
                        if ignore_glob is not None:
777
 
                            self.ignored.setdefault(ignore_glob, []).append(subp)
778
 
                        else:
779
 
                            things_to_add.append((subp, sub_invp, None, this_ie))
 
540
class _FastPath(object):
 
541
    """A path object with fast accessors for things like basename."""
 
542
 
 
543
    __slots__ = ['raw_path', 'base_path']
 
544
 
 
545
    def __init__(self, path, base_path=None):
 
546
        """Construct a FastPath from path."""
 
547
        if base_path is None:
 
548
            self.base_path = osutils.basename(path)
 
549
        else:
 
550
            self.base_path = base_path
 
551
        self.raw_path = path
 
552
 
 
553
    def __cmp__(self, other):
 
554
        return cmp(self.raw_path, other.raw_path)
 
555
 
 
556
    def __hash__(self):
 
557
        return hash(self.raw_path)
 
558
 
 
559
 
 
560
def _add_one_and_parent(tree, inv, parent_ie, path, kind, action):
 
561
    """Add a new entry to the inventory and automatically add unversioned parents.
 
562
 
 
563
    :param inv: Inventory which will receive the new entry.
 
564
    :param parent_ie: Parent inventory entry if known, or None.  If
 
565
        None, the parent is looked up by name and used if present, otherwise it
 
566
        is recursively added.
 
567
    :param kind: Kind of new entry (file, directory, etc)
 
568
    :param action: callback(inv, parent_ie, path, kind); return ignored.
 
569
    :return: A list of paths which have been added.
 
570
    """
 
571
    # Nothing to do if path is already versioned.
 
572
    # This is safe from infinite recursion because the tree root is
 
573
    # always versioned.
 
574
    if parent_ie is not None:
 
575
        # we have a parent ie already
 
576
        added = []
 
577
    else:
 
578
        # slower but does not need parent_ie
 
579
        if inv.has_filename(path.raw_path):
 
580
            return []
 
581
        # its really not there : add the parent
 
582
        # note that the dirname use leads to some extra str copying etc but as
 
583
        # there are a limited number of dirs we can be nested under, it should
 
584
        # generally find it very fast and not recurse after that.
 
585
        added = _add_one_and_parent(tree, inv, None,
 
586
            _FastPath(dirname(path.raw_path)), 'directory', action)
 
587
        parent_id = inv.path2id(dirname(path.raw_path))
 
588
        parent_ie = inv[parent_id]
 
589
    _add_one(tree, inv, parent_ie, path, kind, action)
 
590
    return added + [path.raw_path]
 
591
 
 
592
 
 
593
def _add_one(tree, inv, parent_ie, path, kind, file_id_callback):
 
594
    """Add a new entry to the inventory.
 
595
 
 
596
    :param inv: Inventory which will receive the new entry.
 
597
    :param parent_ie: Parent inventory entry.
 
598
    :param kind: Kind of new entry (file, directory, etc)
 
599
    :param file_id_callback: callback(inv, parent_ie, path, kind); return a
 
600
        file_id or None to generate a new file id
 
601
    :returns: None
 
602
    """
 
603
    file_id = file_id_callback(inv, parent_ie, path, kind)
 
604
    entry = inv.make_entry(kind, path.base_path, parent_ie.file_id,
 
605
        file_id=file_id)
 
606
    inv.add(entry)