~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/mutabletree.py

  • Committer: Ian Clatworthy
  • Date: 2007-08-13 14:33:10 UTC
  • mto: (2733.1.1 ianc-integration)
  • mto: This revision was merged to the branch mainline in revision 2734.
  • Revision ID: ian.clatworthy@internode.on.net-20070813143310-twhj4la0qnupvze8
Added Quick Start Summary

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2006-2011 Canonical Ltd
 
1
# Copyright (C) 2006, 2007 Canonical Ltd
2
2
#
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
12
12
#
13
13
# You should have received a copy of the GNU General Public License
14
14
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
16
 
17
17
"""MutableTree object.
18
18
 
22
22
 
23
23
from bzrlib.lazy_import import lazy_import
24
24
lazy_import(globals(), """
25
 
import operator
26
25
import os
27
 
import re
28
26
 
29
27
from bzrlib import (
30
28
    add,
31
 
    controldir,
 
29
    bzrdir,
 
30
    )
 
31
from bzrlib.osutils import dirname
 
32
from bzrlib.trace import mutter, warning
 
33
""")
 
34
 
 
35
from bzrlib import (
32
36
    errors,
33
 
    hooks,
34
 
    inventory as _mod_inventory,
35
37
    osutils,
36
 
    revisiontree,
37
 
    trace,
38
 
    transport as _mod_transport,
39
38
    tree,
40
39
    )
41
 
""")
42
 
 
43
40
from bzrlib.decorators import needs_read_lock, needs_write_lock
 
41
from bzrlib.osutils import splitpath
 
42
from bzrlib.symbol_versioning import DEPRECATED_PARAMETER
44
43
 
45
44
 
46
45
def needs_tree_write_lock(unbound):
68
67
    entirely in memory.
69
68
 
70
69
    For now, we are not treating MutableTree as an interface to provide
71
 
    conformance tests for - rather we are testing MemoryTree specifically, and
 
70
    conformance tests for - rather we are testing MemoryTree specifically, and 
72
71
    interface testing implementations of WorkingTree.
73
72
 
74
73
    A mutable tree always has an associated Branch and BzrDir object - the
75
74
    branch and bzrdir attributes.
76
75
    """
77
 
    def __init__(self, *args, **kw):
78
 
        super(MutableTree, self).__init__(*args, **kw)
79
 
        # Is this tree on a case-insensitive or case-preserving file-system?
80
 
        # Sub-classes may initialize to False if they detect they are being
81
 
        # used on media which doesn't differentiate the case of names.
82
 
        self.case_sensitive = True
83
 
 
84
 
    def is_control_filename(self, filename):
85
 
        """True if filename is the name of a control file in this tree.
86
 
 
87
 
        :param filename: A filename within the tree. This is a relative path
88
 
            from the root of this tree.
89
 
 
90
 
        This is true IF and ONLY IF the filename is part of the meta data
91
 
        that bzr controls in this tree. I.E. a random .bzr directory placed
92
 
        on disk will not be a control file for this tree.
93
 
        """
94
 
        raise NotImplementedError(self.is_control_filename)
95
76
 
96
77
    @needs_tree_write_lock
97
78
    def add(self, files, ids=None, kinds=None):
113
94
        TODO: Perhaps callback with the ids and paths as they're added.
114
95
        """
115
96
        if isinstance(files, basestring):
116
 
            # XXX: Passing a single string is inconsistent and should be
117
 
            # deprecated.
118
 
            if not (ids is None or isinstance(ids, basestring)):
119
 
                raise AssertionError()
120
 
            if not (kinds is None or isinstance(kinds, basestring)):
121
 
                raise AssertionError()
 
97
            assert(ids is None or isinstance(ids, basestring))
 
98
            assert(kinds is None or isinstance(kinds, basestring))
122
99
            files = [files]
123
100
            if ids is not None:
124
101
                ids = [ids]
130
107
        if ids is None:
131
108
            ids = [None] * len(files)
132
109
        else:
133
 
            if not (len(ids) == len(files)):
134
 
                raise AssertionError()
 
110
            assert(len(ids) == len(files))
 
111
            ids = [osutils.safe_file_id(file_id) for file_id in ids]
 
112
 
135
113
        if kinds is None:
136
114
            kinds = [None] * len(files)
137
 
        elif not len(kinds) == len(files):
138
 
            raise AssertionError()
 
115
        else:
 
116
            assert(len(kinds) == len(files))
139
117
        for f in files:
140
118
            # generic constraint checks:
141
119
            if self.is_control_filename(f):
142
120
                raise errors.ForbiddenControlFileError(filename=f)
143
 
            fp = osutils.splitpath(f)
144
 
        # fill out file kinds for all files [not needed when we stop
 
121
            fp = splitpath(f)
 
122
        # fill out file kinds for all files [not needed when we stop 
145
123
        # caring about the instantaneous file kind within a uncommmitted tree
146
124
        #
147
125
        self._gather_kinds(files, kinds)
162
140
        if sub_tree_id == self.get_root_id():
163
141
            raise errors.BadReferenceTarget(self, sub_tree,
164
142
                                     'Trees have the same root id.')
165
 
        if self.has_id(sub_tree_id):
 
143
        if sub_tree_id in self.inventory:
166
144
            raise errors.BadReferenceTarget(self, sub_tree,
167
145
                                            'Root id already present in tree')
168
146
        self._add([sub_tree_path], [sub_tree_id], ['tree-reference'])
177
155
        """
178
156
        raise NotImplementedError(self._add)
179
157
 
 
158
    @needs_tree_write_lock
180
159
    def apply_inventory_delta(self, changes):
181
160
        """Apply changes to the inventory as an atomic operation.
182
161
 
183
 
        :param changes: An inventory delta to apply to the working tree's
184
 
            inventory.
185
 
        :return None:
186
 
        :seealso Inventory.apply_delta: For details on the changes parameter.
 
162
        The argument is a set of changes to apply.  It must describe a
 
163
        valid result, but the order is not important.  Specifically,
 
164
        intermediate stages *may* be invalid, such as when two files
 
165
        swap names.
 
166
 
 
167
        The changes should be structured as a list of tuples, of the form
 
168
        (old_path, new_path, file_id, new_entry).  For creation, old_path
 
169
        must be None.  For deletion, new_path and new_entry must be None.
 
170
        file_id is always non-None.  For renames and other mutations, all
 
171
        values must be non-None.
 
172
 
 
173
        If the new_entry is a directory, its children should be an empty
 
174
        dict.  Children are handled by apply_inventory_delta itself.
 
175
 
 
176
        :param changes: A list of tuples for the change to apply:
 
177
            [(old_path, new_path, file_id, new_inventory_entry), ...]
187
178
        """
188
 
        raise NotImplementedError(self.apply_inventory_delta)
 
179
        self.flush()
 
180
        inv = self.inventory
 
181
        children = {}
 
182
        for old_path, file_id in sorted(((op, f) for op, np, f, e in changes
 
183
                                        if op is not None), reverse=True):
 
184
            if file_id not in inv:
 
185
                continue
 
186
            children[file_id] = getattr(inv[file_id], 'children', {})
 
187
            inv.remove_recursive_id(file_id)
 
188
        for new_path, new_entry in sorted((np, e) for op, np, f, e in
 
189
                                          changes if np is not None):
 
190
            if getattr(new_entry, 'children', None) is not None:
 
191
                new_entry.children = children.get(new_entry.file_id, {})
 
192
            inv.add(new_entry)
 
193
        self._write_inventory(inv)
189
194
 
190
195
    @needs_write_lock
191
196
    def commit(self, message=None, revprops=None, *args,
192
197
               **kwargs):
193
198
        # avoid circular imports
194
199
        from bzrlib import commit
195
 
        possible_master_transports=[]
196
 
        revprops = commit.Commit.update_revprops(
197
 
                revprops,
198
 
                self.branch,
199
 
                kwargs.pop('authors', None),
200
 
                kwargs.pop('author', None),
201
 
                kwargs.get('local', False),
202
 
                possible_master_transports)
 
200
        if revprops is None:
 
201
            revprops = {}
 
202
        if not 'branch-nick' in revprops:
 
203
            revprops['branch-nick'] = self.branch.nick
203
204
        # args for wt.commit start at message from the Commit.commit method,
204
205
        args = (message, ) + args
205
 
        for hook in MutableTree.hooks['start_commit']:
206
 
            hook(self)
207
206
        committed_id = commit.Commit().commit(working_tree=self,
208
 
            revprops=revprops,
209
 
            possible_master_transports=possible_master_transports,
210
 
            *args, **kwargs)
211
 
        post_hook_params = PostCommitHookParams(self)
212
 
        for hook in MutableTree.hooks['post_commit']:
213
 
            hook(post_hook_params)
 
207
            revprops=revprops, *args, **kwargs)
214
208
        return committed_id
215
209
 
216
210
    def _gather_kinds(self, files, kinds):
218
212
        raise NotImplementedError(self._gather_kinds)
219
213
 
220
214
    @needs_read_lock
221
 
    def has_changes(self, _from_tree=None):
222
 
        """Quickly check that the tree contains at least one commitable change.
223
 
 
224
 
        :param _from_tree: tree to compare against to find changes (default to
225
 
            the basis tree and is intended to be used by tests).
226
 
 
227
 
        :return: True if a change is found. False otherwise
228
 
        """
229
 
        # Check pending merges
230
 
        if len(self.get_parent_ids()) > 1:
231
 
            return True
232
 
        if _from_tree is None:
233
 
            _from_tree = self.basis_tree()
234
 
        changes = self.iter_changes(_from_tree)
235
 
        try:
236
 
            change = changes.next()
237
 
            # Exclude root (talk about black magic... --vila 20090629)
238
 
            if change[4] == (None, None):
239
 
                change = changes.next()
240
 
            return True
241
 
        except StopIteration:
242
 
            # No changes
243
 
            return False
244
 
 
245
 
    @needs_read_lock
246
 
    def check_changed_or_out_of_date(self, strict, opt_name,
247
 
                                     more_error, more_warning):
248
 
        """Check the tree for uncommitted changes and branch synchronization.
249
 
 
250
 
        If strict is None and not set in the config files, a warning is issued.
251
 
        If strict is True, an error is raised.
252
 
        If strict is False, no checks are done and no warning is issued.
253
 
 
254
 
        :param strict: True, False or None, searched in branch config if None.
255
 
 
256
 
        :param opt_name: strict option name to search in config file.
257
 
 
258
 
        :param more_error: Details about how to avoid the check.
259
 
 
260
 
        :param more_warning: Details about what is happening.
261
 
        """
262
 
        if strict is None:
263
 
            strict = self.branch.get_config_stack().get(opt_name)
264
 
        if strict is not False:
265
 
            err_class = None
266
 
            if (self.has_changes()):
267
 
                err_class = errors.UncommittedChanges
268
 
            elif self.last_revision() != self.branch.last_revision():
269
 
                # The tree has lost sync with its branch, there is little
270
 
                # chance that the user is aware of it but he can still force
271
 
                # the action with --no-strict
272
 
                err_class = errors.OutOfDateTree
273
 
            if err_class is not None:
274
 
                if strict is None:
275
 
                    err = err_class(self, more=more_warning)
276
 
                    # We don't want to interrupt the user if he expressed no
277
 
                    # preference about strict.
278
 
                    trace.warning('%s', err._format())
279
 
                else:
280
 
                    err = err_class(self, more=more_error)
281
 
                    raise err
282
 
 
283
 
    @needs_read_lock
284
215
    def last_revision(self):
285
216
        """Return the revision id of the last commit performed in this tree.
286
217
 
287
218
        In early tree formats the result of last_revision is the same as the
288
219
        branch last_revision, but that is no longer the case for modern tree
289
220
        formats.
290
 
 
 
221
        
291
222
        last_revision returns the left most parent id, or None if there are no
292
223
        parents.
293
224
 
310
241
    def lock_write(self):
311
242
        """Lock the tree and its branch. This allows mutating calls to be made.
312
243
 
313
 
        Some mutating methods will take out implicit write locks, but in
 
244
        Some mutating methods will take out implicit write locks, but in 
314
245
        general you should always obtain a write lock before calling mutating
315
246
        methods on a tree.
316
247
        """
326
257
        """
327
258
        raise NotImplementedError(self.mkdir)
328
259
 
329
 
    def _observed_sha1(self, file_id, path, (sha1, stat_value)):
330
 
        """Tell the tree we have observed a paths sha1.
331
 
 
332
 
        The intent of this function is to allow trees that have a hashcache to
333
 
        update the hashcache during commit. If the observed file is too new
334
 
        (based on the stat_value) to be safely hash-cached the tree will ignore
335
 
        it.
336
 
 
337
 
        The default implementation does nothing.
338
 
 
339
 
        :param file_id: The file id
340
 
        :param path: The file path
341
 
        :param sha1: The sha 1 that was observed.
342
 
        :param stat_value: A stat result for the file the sha1 was read from.
343
 
        :return: None
344
 
        """
345
 
 
346
 
    @needs_write_lock
347
 
    def put_file_bytes_non_atomic(self, file_id, bytes):
348
 
        """Update the content of a file in the tree.
349
 
 
350
 
        Note that the file is written in-place rather than being
351
 
        written to a temporary location and renamed. As a consequence,
352
 
        readers can potentially see the file half-written.
353
 
 
354
 
        :param file_id: file-id of the file
355
 
        :param bytes: the new file contents
356
 
        """
357
 
        raise NotImplementedError(self.put_file_bytes_non_atomic)
358
 
 
359
260
    def set_parent_ids(self, revision_ids, allow_leftmost_as_ghost=False):
360
261
        """Set the parents ids of the working tree.
361
262
 
366
267
    def set_parent_trees(self, parents_list, allow_leftmost_as_ghost=False):
367
268
        """Set the parents of the working tree.
368
269
 
369
 
        :param parents_list: A list of (revision_id, tree) tuples.
 
270
        :param parents_list: A list of (revision_id, tree) tuples. 
370
271
            If tree is None, then that element is treated as an unreachable
371
272
            parent tree - i.e. a ghost.
372
273
        """
373
274
        raise NotImplementedError(self.set_parent_trees)
374
275
 
375
 
    def smart_add(self, file_list, recurse=True, action=None, save=True):
376
 
        """Version file_list, optionally recursing into directories.
377
 
 
378
 
        This is designed more towards DWIM for humans than API clarity.
379
 
        For the specific behaviour see the help for cmd_add().
380
 
 
381
 
        :param file_list: List of zero or more paths.  *NB: these are 
382
 
            interpreted relative to the process cwd, not relative to the 
383
 
            tree.*  (Add and most other tree methods use tree-relative
384
 
            paths.)
385
 
        :param action: A reporter to be called with the inventory, parent_ie,
386
 
            path and kind of the path being added. It may return a file_id if
387
 
            a specific one should be used.
388
 
        :param save: Save the inventory after completing the adds. If False
389
 
            this provides dry-run functionality by doing the add and not saving
390
 
            the inventory.
391
 
        :return: A tuple - files_added, ignored_files. files_added is the count
392
 
            of added files, and ignored_files is a dict mapping files that were
393
 
            ignored to the rule that caused them to be ignored.
394
 
        """
395
 
        raise NotImplementedError(self.smart_add)
396
 
 
397
 
 
398
 
class MutableInventoryTree(MutableTree, tree.InventoryTree):
399
 
 
400
 
    @needs_tree_write_lock
401
 
    def apply_inventory_delta(self, changes):
402
 
        """Apply changes to the inventory as an atomic operation.
403
 
 
404
 
        :param changes: An inventory delta to apply to the working tree's
405
 
            inventory.
406
 
        :return None:
407
 
        :seealso Inventory.apply_delta: For details on the changes parameter.
408
 
        """
409
 
        self.flush()
410
 
        inv = self.inventory
411
 
        inv.apply_delta(changes)
412
 
        self._write_inventory(inv)
413
 
 
414
 
    def _fix_case_of_inventory_path(self, path):
415
 
        """If our tree isn't case sensitive, return the canonical path"""
416
 
        if not self.case_sensitive:
417
 
            path = self.get_canonical_inventory_path(path)
418
 
        return path
419
 
 
420
 
    @needs_tree_write_lock
421
 
    def smart_add(self, file_list, recurse=True, action=None, save=True):
422
 
        """Version file_list, optionally recursing into directories.
423
 
 
424
 
        This is designed more towards DWIM for humans than API clarity.
425
 
        For the specific behaviour see the help for cmd_add().
426
 
 
427
 
        :param file_list: List of zero or more paths.  *NB: these are 
428
 
            interpreted relative to the process cwd, not relative to the 
429
 
            tree.*  (Add and most other tree methods use tree-relative
430
 
            paths.)
431
 
        :param action: A reporter to be called with the inventory, parent_ie,
432
 
            path and kind of the path being added. It may return a file_id if
433
 
            a specific one should be used.
434
 
        :param save: Save the inventory after completing the adds. If False
435
 
            this provides dry-run functionality by doing the add and not saving
436
 
            the inventory.
437
 
        :return: A tuple - files_added, ignored_files. files_added is the count
438
 
            of added files, and ignored_files is a dict mapping files that were
439
 
            ignored to the rule that caused them to be ignored.
440
 
        """
441
 
        # Not all mutable trees can have conflicts
442
 
        if getattr(self, 'conflicts', None) is not None:
443
 
            # Collect all related files without checking whether they exist or
444
 
            # are versioned. It's cheaper to do that once for all conflicts
445
 
            # than trying to find the relevant conflict for each added file.
446
 
            conflicts_related = set()
447
 
            for c in self.conflicts():
448
 
                conflicts_related.update(c.associated_filenames())
449
 
        else:
450
 
            conflicts_related = None
451
 
        adder = _SmartAddHelper(self, action, conflicts_related)
452
 
        adder.add(file_list, recurse=recurse)
453
 
        if save:
454
 
            invdelta = adder.get_inventory_delta()
455
 
            self.apply_inventory_delta(invdelta)
456
 
        return adder.added, adder.ignored
457
 
 
458
 
    def update_basis_by_delta(self, new_revid, delta):
459
 
        """Update the parents of this tree after a commit.
460
 
 
461
 
        This gives the tree one parent, with revision id new_revid. The
462
 
        inventory delta is applied to the current basis tree to generate the
463
 
        inventory for the parent new_revid, and all other parent trees are
464
 
        discarded.
465
 
 
466
 
        All the changes in the delta should be changes synchronising the basis
467
 
        tree with some or all of the working tree, with a change to a directory
468
 
        requiring that its contents have been recursively included. That is,
469
 
        this is not a general purpose tree modification routine, but a helper
470
 
        for commit which is not required to handle situations that do not arise
471
 
        outside of commit.
472
 
 
473
 
        See the inventory developers documentation for the theory behind
474
 
        inventory deltas.
475
 
 
476
 
        :param new_revid: The new revision id for the trees parent.
477
 
        :param delta: An inventory delta (see apply_inventory_delta) describing
478
 
            the changes from the current left most parent revision to new_revid.
479
 
        """
480
 
        # if the tree is updated by a pull to the branch, as happens in
481
 
        # WorkingTree2, when there was no separation between branch and tree,
482
 
        # then just clear merges, efficiency is not a concern for now as this
483
 
        # is legacy environments only, and they are slow regardless.
484
 
        if self.last_revision() == new_revid:
485
 
            self.set_parent_ids([new_revid])
486
 
            return
487
 
        # generic implementation based on Inventory manipulation. See
488
 
        # WorkingTree classes for optimised versions for specific format trees.
489
 
        basis = self.basis_tree()
490
 
        basis.lock_read()
491
 
        # TODO: Consider re-evaluating the need for this with CHKInventory
492
 
        # we don't strictly need to mutate an inventory for this
493
 
        # it only makes sense when apply_delta is cheaper than get_inventory()
494
 
        inventory = _mod_inventory.mutable_inventory_from_tree(basis)
495
 
        basis.unlock()
496
 
        inventory.apply_delta(delta)
497
 
        rev_tree = revisiontree.InventoryRevisionTree(self.branch.repository,
498
 
                                             inventory, new_revid)
499
 
        self.set_parent_trees([(new_revid, rev_tree)])
500
 
 
501
 
 
502
 
class MutableTreeHooks(hooks.Hooks):
503
 
    """A dictionary mapping a hook name to a list of callables for mutabletree
504
 
    hooks.
505
 
    """
506
 
 
507
 
    def __init__(self):
508
 
        """Create the default hooks.
509
 
 
510
 
        """
511
 
        hooks.Hooks.__init__(self, "bzrlib.mutabletree", "MutableTree.hooks")
512
 
        self.add_hook('start_commit',
513
 
            "Called before a commit is performed on a tree. The start commit "
514
 
            "hook is able to change the tree before the commit takes place. "
515
 
            "start_commit is called with the bzrlib.mutabletree.MutableTree "
516
 
            "that the commit is being performed on.", (1, 4))
517
 
        self.add_hook('post_commit',
518
 
            "Called after a commit is performed on a tree. The hook is "
519
 
            "called with a bzrlib.mutabletree.PostCommitHookParams object. "
520
 
            "The mutable tree the commit was performed on is available via "
521
 
            "the mutable_tree attribute of that object.", (2, 0))
522
 
 
523
 
 
524
 
# install the default hooks into the MutableTree class.
525
 
MutableTree.hooks = MutableTreeHooks()
526
 
 
527
 
 
528
 
class PostCommitHookParams(object):
529
 
    """Parameters for the post_commit hook.
530
 
 
531
 
    To access the parameters, use the following attributes:
532
 
 
533
 
    * mutable_tree - the MutableTree object
534
 
    """
535
 
 
536
 
    def __init__(self, mutable_tree):
537
 
        """Create the parameters for the post_commit hook."""
538
 
        self.mutable_tree = mutable_tree
539
 
 
540
 
 
541
 
class _SmartAddHelper(object):
542
 
    """Helper for MutableTree.smart_add."""
543
 
 
544
 
    def get_inventory_delta(self):
545
 
        return self._invdelta.values()
546
 
 
547
 
    def _get_ie(self, inv_path):
548
 
        """Retrieve the most up to date inventory entry for a path.
549
 
 
550
 
        :param inv_path: Normalized inventory path
551
 
        :return: Inventory entry (with possibly invalid .children for
552
 
            directories)
553
 
        """
554
 
        entry = self._invdelta.get(inv_path)
555
 
        if entry is not None:
556
 
            return entry[3]
557
 
        # Find a 'best fit' match if the filesystem is case-insensitive
558
 
        inv_path = self.tree._fix_case_of_inventory_path(inv_path)
559
 
        file_id = self.tree.path2id(inv_path)
560
 
        if file_id is not None:
561
 
            return self.tree.iter_entries_by_dir([file_id]).next()[1]
562
 
        return None
563
 
 
564
 
    def _convert_to_directory(self, this_ie, inv_path):
565
 
        """Convert an entry to a directory.
566
 
 
567
 
        :param this_ie: Inventory entry
568
 
        :param inv_path: Normalized path for the inventory entry
569
 
        :return: The new inventory entry
570
 
        """
571
 
        # Same as in _add_one below, if the inventory doesn't
572
 
        # think this is a directory, update the inventory
573
 
        this_ie = _mod_inventory.InventoryDirectory(
574
 
            this_ie.file_id, this_ie.name, this_ie.parent_id)
575
 
        self._invdelta[inv_path] = (inv_path, inv_path, this_ie.file_id,
576
 
            this_ie)
577
 
        return this_ie
578
 
 
579
 
    def _add_one_and_parent(self, parent_ie, path, kind, inv_path):
580
 
        """Add a new entry to the inventory and automatically add unversioned parents.
581
 
 
582
 
        :param parent_ie: Parent inventory entry if known, or None.  If
583
 
            None, the parent is looked up by name and used if present, otherwise it
584
 
            is recursively added.
585
 
        :param path: 
586
 
        :param kind: Kind of new entry (file, directory, etc)
587
 
        :param inv_path:
588
 
        :return: Inventory entry for path and a list of paths which have been added.
589
 
        """
590
 
        # Nothing to do if path is already versioned.
591
 
        # This is safe from infinite recursion because the tree root is
592
 
        # always versioned.
593
 
        inv_dirname = osutils.dirname(inv_path)
594
 
        dirname, basename = osutils.split(path)
595
 
        if parent_ie is None:
596
 
            # slower but does not need parent_ie
597
 
            this_ie = self._get_ie(inv_path)
598
 
            if this_ie is not None:
599
 
                return this_ie
600
 
            # its really not there : add the parent
601
 
            # note that the dirname use leads to some extra str copying etc but as
602
 
            # there are a limited number of dirs we can be nested under, it should
603
 
            # generally find it very fast and not recurse after that.
604
 
            parent_ie = self._add_one_and_parent(None,
605
 
                dirname, 'directory', 
606
 
                inv_dirname)
607
 
        # if the parent exists, but isn't a directory, we have to do the
608
 
        # kind change now -- really the inventory shouldn't pretend to know
609
 
        # the kind of wt files, but it does.
610
 
        if parent_ie.kind != 'directory':
611
 
            # nb: this relies on someone else checking that the path we're using
612
 
            # doesn't contain symlinks.
613
 
            parent_ie = self._convert_to_directory(parent_ie, inv_dirname)
614
 
        file_id = self.action(self.tree.inventory, parent_ie, path, kind)
615
 
        entry = _mod_inventory.make_entry(kind, basename, parent_ie.file_id,
616
 
            file_id=file_id)
617
 
        self._invdelta[inv_path] = (None, inv_path, entry.file_id, entry)
618
 
        self.added.append(inv_path)
619
 
        return entry
620
 
 
621
 
    def _gather_dirs_to_add(self, user_dirs):
622
 
        # only walk the minimal parents needed: we have user_dirs to override
623
 
        # ignores.
624
 
        prev_dir = None
625
 
 
626
 
        is_inside = osutils.is_inside_or_parent_of_any
627
 
        for path, (inv_path, this_ie) in sorted(
628
 
                user_dirs.iteritems(), key=operator.itemgetter(0)):
629
 
            if (prev_dir is None or not is_inside([prev_dir], path)):
630
 
                yield (path, inv_path, this_ie, None)
631
 
            prev_dir = path
632
 
        
633
 
    def __init__(self, tree, action, conflicts_related=None):
634
 
        self.tree = tree
 
276
    @needs_tree_write_lock
 
277
    def smart_add(self, file_list, recurse=True, action=None, save=True):
 
278
        """Version file_list, optionally recursing into directories.
 
279
 
 
280
        This is designed more towards DWIM for humans than API clarity.
 
281
        For the specific behaviour see the help for cmd_add().
 
282
 
 
283
        :param action: A reporter to be called with the inventory, parent_ie,
 
284
            path and kind of the path being added. It may return a file_id if 
 
285
            a specific one should be used.
 
286
        :param save: Save the inventory after completing the adds. If False
 
287
            this provides dry-run functionality by doing the add and not saving
 
288
            the inventory.
 
289
        :return: A tuple - files_added, ignored_files. files_added is the count
 
290
            of added files, and ignored_files is a dict mapping files that were
 
291
            ignored to the rule that caused them to be ignored.
 
292
        """
 
293
        # not in an inner loop; and we want to remove direct use of this,
 
294
        # so here as a reminder for now. RBC 20070703
 
295
        from bzrlib.inventory import InventoryEntry
 
296
        assert isinstance(recurse, bool)
635
297
        if action is None:
636
 
            self.action = add.AddAction()
637
 
        else:
638
 
            self.action = action
639
 
        self._invdelta = {}
640
 
        self.added = []
641
 
        self.ignored = {}
642
 
        if conflicts_related is None:
643
 
            self.conflicts_related = frozenset()
644
 
        else:
645
 
            self.conflicts_related = conflicts_related
646
 
 
647
 
    def add(self, file_list, recurse=True):
648
 
        from bzrlib.inventory import InventoryEntry
 
298
            action = add.AddAction()
 
299
        
649
300
        if not file_list:
650
301
            # no paths supplied: add the entire tree.
651
 
            # FIXME: this assumes we are running in a working tree subdir :-/
652
 
            # -- vila 20100208
653
302
            file_list = [u'.']
654
 
 
655
 
        # expand any symlinks in the directory part, while leaving the
656
 
        # filename alone
657
 
        # only expanding if symlinks are supported avoids windows path bugs
658
 
        if osutils.has_symlinks():
659
 
            file_list = map(osutils.normalizepath, file_list)
660
 
 
661
 
        user_dirs = {}
662
 
        # validate user file paths and convert all paths to tree
 
303
        # mutter("smart add of %r")
 
304
        inv = self.inventory
 
305
        added = []
 
306
        ignored = {}
 
307
        dirs_to_add = []
 
308
        user_dirs = set()
 
309
 
 
310
        # validate user file paths and convert all paths to tree 
663
311
        # relative : it's cheaper to make a tree relative path an abspath
664
 
        # than to convert an abspath to tree relative, and it's cheaper to
665
 
        # perform the canonicalization in bulk.
666
 
        for filepath in osutils.canonical_relpaths(self.tree.basedir, file_list):
667
 
            # validate user parameters. Our recursive code avoids adding new
668
 
            # files that need such validation
669
 
            if self.tree.is_control_filename(filepath):
670
 
                raise errors.ForbiddenControlFileError(filename=filepath)
671
 
 
672
 
            abspath = self.tree.abspath(filepath)
 
312
        # than to convert an abspath to tree relative.
 
313
        for filepath in file_list:
 
314
            rf = _FastPath(self.relpath(filepath))
 
315
            # validate user parameters. Our recursive code avoids adding new files
 
316
            # that need such validation 
 
317
            if self.is_control_filename(rf.raw_path):
 
318
                raise errors.ForbiddenControlFileError(filename=rf.raw_path)
 
319
            
 
320
            abspath = self.abspath(rf.raw_path)
673
321
            kind = osutils.file_kind(abspath)
674
 
            # ensure the named path is added, so that ignore rules in the later
675
 
            # directory walk dont skip it.
676
 
            # we dont have a parent ie known yet.: use the relatively slower
677
 
            # inventory probing method
678
 
            inv_path, _ = osutils.normalized_filename(filepath)
679
 
            this_ie = self._get_ie(inv_path)
680
 
            if this_ie is None:
681
 
                this_ie = self._add_one_and_parent(None, filepath, kind, inv_path)
682
322
            if kind == 'directory':
683
323
                # schedule the dir for scanning
684
 
                user_dirs[filepath] = (inv_path, this_ie)
 
324
                user_dirs.add(rf)
 
325
            else:
 
326
                if not InventoryEntry.versionable_kind(kind):
 
327
                    raise errors.BadFileKindError(filename=abspath, kind=kind)
 
328
            # ensure the named path is added, so that ignore rules in the later directory
 
329
            # walk dont skip it.
 
330
            # we dont have a parent ie known yet.: use the relatively slower inventory 
 
331
            # probing method
 
332
            versioned = inv.has_filename(rf.raw_path)
 
333
            if versioned:
 
334
                continue
 
335
            added.extend(_add_one_and_parent(self, inv, None, rf, kind, action))
685
336
 
686
337
        if not recurse:
687
338
            # no need to walk any directories at all.
688
 
            return
689
 
 
690
 
        things_to_add = list(self._gather_dirs_to_add(user_dirs))
691
 
 
692
 
        illegalpath_re = re.compile(r'[\r\n]')
693
 
        for directory, inv_path, this_ie, parent_ie in things_to_add:
 
339
            if len(added) > 0 and save:
 
340
                self._write_inventory(inv)
 
341
            return added, ignored
 
342
 
 
343
        # only walk the minimal parents needed: we have user_dirs to override
 
344
        # ignores.
 
345
        prev_dir = None
 
346
 
 
347
        is_inside = osutils.is_inside_or_parent_of_any
 
348
        for path in sorted(user_dirs):
 
349
            if (prev_dir is None or not is_inside([prev_dir], path.raw_path)):
 
350
                dirs_to_add.append((path, None))
 
351
            prev_dir = path.raw_path
 
352
 
 
353
        # dirs_to_add is initialised to a list of directories, but as we scan
 
354
        # directories we append files to it.
 
355
        # XXX: We should determine kind of files when we scan them rather than
 
356
        # adding to this list. RBC 20070703
 
357
        for directory, parent_ie in dirs_to_add:
694
358
            # directory is tree-relative
695
 
            abspath = self.tree.abspath(directory)
 
359
            abspath = self.abspath(directory.raw_path)
696
360
 
697
361
            # get the contents of this directory.
698
362
 
699
 
            # find the kind of the path being added, and save stat_value
700
 
            # for reuse
701
 
            stat_value = None
702
 
            if this_ie is None:
703
 
                stat_value = osutils.file_stat(abspath)
704
 
                kind = osutils.file_kind_from_stat_mode(stat_value.st_mode)
705
 
            else:
706
 
                kind = this_ie.kind
707
 
            
708
 
            # allow AddAction to skip this file
709
 
            if self.action.skip_file(self.tree,  abspath,  kind,  stat_value):
710
 
                continue
 
363
            # find the kind of the path being added.
 
364
            kind = osutils.file_kind(abspath)
 
365
 
711
366
            if not InventoryEntry.versionable_kind(kind):
712
 
                trace.warning("skipping %s (can't add file of kind '%s')",
713
 
                              abspath, kind)
714
 
                continue
715
 
            if illegalpath_re.search(directory):
716
 
                trace.warning("skipping %r (contains \\n or \\r)" % abspath)
717
 
                continue
718
 
            if directory in self.conflicts_related:
719
 
                # If the file looks like one generated for a conflict, don't
720
 
                # add it.
721
 
                trace.warning(
722
 
                    'skipping %s (generated to help resolve conflicts)',
723
 
                    abspath)
724
 
                continue
725
 
 
726
 
            if kind == 'directory' and directory != '':
 
367
                warning("skipping %s (can't add file of kind '%s')", abspath, kind)
 
368
                continue
 
369
 
 
370
            if parent_ie is not None:
 
371
                versioned = directory.base_path in parent_ie.children
 
372
            else:
 
373
                # without the parent ie, use the relatively slower inventory 
 
374
                # probing method
 
375
                versioned = inv.has_filename(directory.raw_path)
 
376
 
 
377
            if kind == 'directory':
727
378
                try:
728
 
                    transport = _mod_transport.get_transport_from_path(abspath)
729
 
                    controldir.ControlDirFormat.find_format(transport)
 
379
                    sub_branch = bzrdir.BzrDir.open(abspath)
730
380
                    sub_tree = True
731
381
                except errors.NotBranchError:
732
382
                    sub_tree = False
735
385
            else:
736
386
                sub_tree = False
737
387
 
738
 
            if this_ie is not None:
 
388
            if directory.raw_path == '':
 
389
                # mutter("tree root doesn't need to be added")
 
390
                sub_tree = False
 
391
            elif versioned:
739
392
                pass
 
393
                # mutter("%r is already versioned", abspath)
740
394
            elif sub_tree:
741
 
                # XXX: This is wrong; people *might* reasonably be trying to
742
 
                # add subtrees as subtrees.  This should probably only be done
743
 
                # in formats which can represent subtrees, and even then
744
 
                # perhaps only when the user asked to add subtrees.  At the
745
 
                # moment you can add them specially through 'join --reference',
746
 
                # which is perhaps reasonable: adding a new reference is a
747
 
                # special operation and can have a special behaviour.  mbp
748
 
                # 20070306
749
 
                trace.warning("skipping nested tree %r", abspath)
 
395
                # XXX: This is wrong; people *might* reasonably be trying to add
 
396
                # subtrees as subtrees.  This should probably only be done in formats 
 
397
                # which can represent subtrees, and even then perhaps only when
 
398
                # the user asked to add subtrees.  At the moment you can add them
 
399
                # specially through 'join --reference', which is perhaps
 
400
                # reasonable: adding a new reference is a special operation and
 
401
                # can have a special behaviour.  mbp 20070306
 
402
                mutter("%r is a nested bzr tree", abspath)
750
403
            else:
751
 
                this_ie = self._add_one_and_parent(parent_ie, directory, kind,
752
 
                    inv_path)
 
404
                _add_one(self, inv, parent_ie, directory, kind, action)
 
405
                added.append(directory.raw_path)
753
406
 
754
407
            if kind == 'directory' and not sub_tree:
755
 
                if this_ie.kind != 'directory':
756
 
                    this_ie = self._convert_to_directory(this_ie, inv_path)
 
408
                if parent_ie is not None:
 
409
                    # must be present:
 
410
                    this_ie = parent_ie.children[directory.base_path]
 
411
                else:
 
412
                    # without the parent ie, use the relatively slower inventory 
 
413
                    # probing method
 
414
                    this_id = inv.path2id(directory.raw_path)
 
415
                    if this_id is None:
 
416
                        this_ie = None
 
417
                    else:
 
418
                        this_ie = inv[this_id]
757
419
 
758
420
                for subf in sorted(os.listdir(abspath)):
759
 
                    inv_f, _ = osutils.normalized_filename(subf)
760
 
                    # here we could use TreeDirectory rather than
 
421
                    # here we could use TreeDirectory rather than 
761
422
                    # string concatenation.
762
 
                    subp = osutils.pathjoin(directory, subf)
763
 
                    # TODO: is_control_filename is very slow. Make it faster.
764
 
                    # TreeDirectory.is_control_filename could also make this
765
 
                    # faster - its impossible for a non root dir to have a
 
423
                    subp = osutils.pathjoin(directory.raw_path, subf)
 
424
                    # TODO: is_control_filename is very slow. Make it faster. 
 
425
                    # TreeDirectory.is_control_filename could also make this 
 
426
                    # faster - its impossible for a non root dir to have a 
766
427
                    # control file.
767
 
                    if self.tree.is_control_filename(subp):
768
 
                        trace.mutter("skip control directory %r", subp)
769
 
                        continue
770
 
                    sub_invp = osutils.pathjoin(inv_path, inv_f)
771
 
                    entry = self._invdelta.get(sub_invp)
772
 
                    if entry is not None:
773
 
                        sub_ie = entry[3]
774
 
                    else:
775
 
                        sub_ie = this_ie.children.get(inv_f)
776
 
                    if sub_ie is not None:
 
428
                    if self.is_control_filename(subp):
 
429
                        mutter("skip control directory %r", subp)
 
430
                    elif subf in this_ie.children:
777
431
                        # recurse into this already versioned subdir.
778
 
                        things_to_add.append((subp, sub_invp, sub_ie, this_ie))
 
432
                        dirs_to_add.append((_FastPath(subp, subf), this_ie))
779
433
                    else:
780
 
                        # user selection overrides ignores
 
434
                        # user selection overrides ignoes
781
435
                        # ignore while selecting files - if we globbed in the
782
436
                        # outer loop we would ignore user files.
783
 
                        ignore_glob = self.tree.is_ignored(subp)
 
437
                        ignore_glob = self.is_ignored(subp)
784
438
                        if ignore_glob is not None:
785
 
                            self.ignored.setdefault(ignore_glob, []).append(subp)
 
439
                            # mutter("skip ignored sub-file %r", subp)
 
440
                            ignored.setdefault(ignore_glob, []).append(subp)
786
441
                        else:
787
 
                            things_to_add.append((subp, sub_invp, None, this_ie))
 
442
                            #mutter("queue to add sub-file %r", subp)
 
443
                            dirs_to_add.append((_FastPath(subp, subf), this_ie))
 
444
 
 
445
        if len(added) > 0:
 
446
            if save:
 
447
                self._write_inventory(inv)
 
448
            else:
 
449
                self.read_working_inventory()
 
450
        return added, ignored
 
451
 
 
452
 
 
453
class _FastPath(object):
 
454
    """A path object with fast accessors for things like basename."""
 
455
 
 
456
    __slots__ = ['raw_path', 'base_path']
 
457
 
 
458
    def __init__(self, path, base_path=None):
 
459
        """Construct a FastPath from path."""
 
460
        if base_path is None:
 
461
            self.base_path = osutils.basename(path)
 
462
        else:
 
463
            self.base_path = base_path
 
464
        self.raw_path = path
 
465
 
 
466
    def __cmp__(self, other):
 
467
        return cmp(self.raw_path, other.raw_path)
 
468
 
 
469
    def __hash__(self):
 
470
        return hash(self.raw_path)
 
471
 
 
472
 
 
473
def _add_one_and_parent(tree, inv, parent_ie, path, kind, action):
 
474
    """Add a new entry to the inventory and automatically add unversioned parents.
 
475
 
 
476
    :param inv: Inventory which will receive the new entry.
 
477
    :param parent_ie: Parent inventory entry if known, or None.  If
 
478
        None, the parent is looked up by name and used if present, otherwise it
 
479
        is recursively added.
 
480
    :param kind: Kind of new entry (file, directory, etc)
 
481
    :param action: callback(inv, parent_ie, path, kind); return ignored.
 
482
    :return: A list of paths which have been added.
 
483
    """
 
484
    # Nothing to do if path is already versioned.
 
485
    # This is safe from infinite recursion because the tree root is
 
486
    # always versioned.
 
487
    if parent_ie is not None:
 
488
        # we have a parent ie already
 
489
        added = []
 
490
    else:
 
491
        # slower but does not need parent_ie
 
492
        if inv.has_filename(path.raw_path):
 
493
            return []
 
494
        # its really not there : add the parent
 
495
        # note that the dirname use leads to some extra str copying etc but as
 
496
        # there are a limited number of dirs we can be nested under, it should
 
497
        # generally find it very fast and not recurse after that.
 
498
        added = _add_one_and_parent(tree, inv, None,
 
499
            _FastPath(dirname(path.raw_path)), 'directory', action)
 
500
        parent_id = inv.path2id(dirname(path.raw_path))
 
501
        parent_ie = inv[parent_id]
 
502
    _add_one(tree, inv, parent_ie, path, kind, action)
 
503
    return added + [path.raw_path]
 
504
 
 
505
 
 
506
def _add_one(tree, inv, parent_ie, path, kind, file_id_callback):
 
507
    """Add a new entry to the inventory.
 
508
 
 
509
    :param inv: Inventory which will receive the new entry.
 
510
    :param parent_ie: Parent inventory entry.
 
511
    :param kind: Kind of new entry (file, directory, etc)
 
512
    :param file_id_callback: callback(inv, parent_ie, path, kind); return a
 
513
        file_id or None to generate a new file id
 
514
    :returns: None
 
515
    """
 
516
    file_id = file_id_callback(inv, parent_ie, path, kind)
 
517
    entry = inv.make_entry(kind, path.base_path, parent_ie.file_id,
 
518
        file_id=file_id)
 
519
    inv.add(entry)