~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/workingtree.py

  • Committer: Martin Pool
  • Date: 2005-08-18 05:52:29 UTC
  • Revision ID: mbp@sourcefrog.net-20050818055229-cac46ebce364d04c
- avoid compiling REs at module load time

Show diffs side-by-side

added added

removed removed

Lines of Context:
14
14
# along with this program; if not, write to the Free Software
15
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
16
 
17
 
"""WorkingTree object and friends.
18
 
 
19
 
A WorkingTree represents the editable working copy of a branch.
20
 
Operations which represent the WorkingTree are also done here, 
21
 
such as renaming or adding files.  The WorkingTree has an inventory 
22
 
which is updated by these operations.  A commit produces a 
23
 
new revision based on the workingtree and its inventory.
24
 
 
25
 
At the moment every WorkingTree has its own branch.  Remote
26
 
WorkingTrees aren't supported.
27
 
 
28
 
To get a WorkingTree, call Branch.working_tree():
29
 
"""
30
 
 
31
 
 
32
 
# TODO: Don't allow WorkingTrees to be constructed for remote branches if 
33
 
# they don't work.
 
17
# TODO: Don't allow WorkingTrees to be constructed for remote branches.
34
18
 
35
19
# FIXME: I don't know if writing out the cache from the destructor is really a
36
 
# good idea, because destructors are considered poor taste in Python, and it's
37
 
# not predictable when it will be written out.
38
 
 
39
 
# TODO: Give the workingtree sole responsibility for the working inventory;
40
 
# remove the variable and references to it from the branch.  This may require
41
 
# updating the commit code so as to update the inventory within the working
42
 
# copy, and making sure there's only one WorkingTree for any directory on disk.
43
 
# At the momenthey may alias the inventory and have old copies of it in memory.
 
20
# good idea, because destructors are considered poor taste in Python, and
 
21
# it's not predictable when it will be written out.
44
22
 
45
23
import os
46
 
import stat
47
 
import fnmatch
48
 
 
49
 
from bzrlib.branch import Branch, needs_read_lock, needs_write_lock, quotefn
 
24
    
50
25
import bzrlib.tree
51
 
from bzrlib.osutils import appendpath, file_kind, isdir, splitpath, relpath
52
 
from bzrlib.errors import BzrCheckError, DivergedBranches, NotVersionedError
53
 
from bzrlib.trace import mutter
54
 
import bzrlib.xml5
55
 
 
56
 
 
57
 
class TreeEntry(object):
58
 
    """An entry that implements the minium interface used by commands.
59
 
 
60
 
    This needs further inspection, it may be better to have 
61
 
    InventoryEntries without ids - though that seems wrong. For now,
62
 
    this is a parallel hierarchy to InventoryEntry, and needs to become
63
 
    one of several things: decorates to that hierarchy, children of, or
64
 
    parents of it.
65
 
    Another note is that these objects are currently only used when there is
66
 
    no InventoryEntry available - i.e. for unversioned objects.
67
 
    Perhaps they should be UnversionedEntry et al. ? - RBC 20051003
68
 
    """
69
 
 
70
 
    def __eq__(self, other):
71
 
        # yes, this us ugly, TODO: best practice __eq__ style.
72
 
        return (isinstance(other, TreeEntry)
73
 
                and other.__class__ == self.__class__)
74
 
 
75
 
    def kind_character(self):
76
 
        return "???"
77
 
 
78
 
 
79
 
class TreeDirectory(TreeEntry):
80
 
    """See TreeEntry. This is a directory in a working tree."""
81
 
 
82
 
    def __eq__(self, other):
83
 
        return (isinstance(other, TreeDirectory)
84
 
                and other.__class__ == self.__class__)
85
 
 
86
 
    def kind_character(self):
87
 
        return "/"
88
 
 
89
 
 
90
 
class TreeFile(TreeEntry):
91
 
    """See TreeEntry. This is a regular file in a working tree."""
92
 
 
93
 
    def __eq__(self, other):
94
 
        return (isinstance(other, TreeFile)
95
 
                and other.__class__ == self.__class__)
96
 
 
97
 
    def kind_character(self):
98
 
        return ''
99
 
 
100
 
 
101
 
class TreeLink(TreeEntry):
102
 
    """See TreeEntry. This is a symlink in a working tree."""
103
 
 
104
 
    def __eq__(self, other):
105
 
        return (isinstance(other, TreeLink)
106
 
                and other.__class__ == self.__class__)
107
 
 
108
 
    def kind_character(self):
109
 
        return ''
110
 
 
 
26
from errors import BzrCheckError
 
27
from trace import mutter
111
28
 
112
29
class WorkingTree(bzrlib.tree.Tree):
113
30
    """Working copy tree.
118
35
    It is possible for a `WorkingTree` to have a filename which is
119
36
    not listed in the Inventory and vice versa.
120
37
    """
121
 
 
122
 
    def __init__(self, basedir, branch=None):
123
 
        """Construct a WorkingTree for basedir.
124
 
 
125
 
        If the branch is not supplied, it is opened automatically.
126
 
        If the branch is supplied, it must be the branch for this basedir.
127
 
        (branch.base is not cross checked, because for remote branches that
128
 
        would be meaningless).
129
 
        """
 
38
    def __init__(self, basedir, inv):
130
39
        from bzrlib.hashcache import HashCache
131
40
        from bzrlib.trace import note, mutter
132
 
        assert isinstance(basedir, basestring), \
133
 
            "base directory %r is not a string" % basedir
134
 
        if branch is None:
135
 
            branch = Branch.open(basedir)
136
 
        assert isinstance(branch, Branch), \
137
 
            "branch %r is not a Branch" % branch
138
 
        self.branch = branch
 
41
 
 
42
        self._inventory = inv
139
43
        self.basedir = basedir
140
 
        self._inventory = self.read_working_inventory()
141
 
        self.path2id = self._inventory.path2id
 
44
        self.path2id = inv.path2id
142
45
 
143
46
        # update the whole cache up front and write to disk if anything changed;
144
47
        # in the future we might want to do this more selectively
145
 
        # two possible ways offer themselves : in self._unlock, write the cache
146
 
        # if needed, or, when the cache sees a change, append it to the hash
147
 
        # cache file, and have the parser take the most recent entry for a
148
 
        # given path only.
149
48
        hc = self._hashcache = HashCache(basedir)
150
49
        hc.read()
151
50
        hc.scan()
153
52
        if hc.needs_write:
154
53
            mutter("write hc")
155
54
            hc.write()
 
55
            
 
56
            
 
57
    def __del__(self):
 
58
        if self._hashcache.needs_write:
 
59
            self._hashcache.write()
 
60
 
156
61
 
157
62
    def __iter__(self):
158
63
        """Iterate through file_ids for this tree.
162
67
        """
163
68
        inv = self._inventory
164
69
        for path, ie in inv.iter_entries():
165
 
            if bzrlib.osutils.lexists(self.abspath(path)):
 
70
            if os.path.exists(self.abspath(path)):
166
71
                yield ie.file_id
167
72
 
168
73
 
175
80
    def abspath(self, filename):
176
81
        return os.path.join(self.basedir, filename)
177
82
 
178
 
    def relpath(self, abspath):
179
 
        """Return the local path portion from a given absolute path."""
180
 
        return relpath(self.basedir, abspath)
181
 
 
182
83
    def has_filename(self, filename):
183
 
        return bzrlib.osutils.lexists(self.abspath(filename))
 
84
        return os.path.exists(self.abspath(filename))
184
85
 
185
86
    def get_file(self, file_id):
186
87
        return self.get_file_byname(self.id2path(file_id))
188
89
    def get_file_byname(self, filename):
189
90
        return file(self.abspath(filename), 'rb')
190
91
 
191
 
    def get_root_id(self):
192
 
        """Return the id of this trees root"""
193
 
        inv = self.read_working_inventory()
194
 
        return inv.root.file_id
195
 
        
196
92
    def _get_store_filename(self, file_id):
197
93
        ## XXX: badly named; this isn't in the store at all
198
94
        return self.abspath(self.id2path(file_id))
199
95
 
200
 
 
201
 
    def id2abspath(self, file_id):
202
 
        return self.abspath(self.id2path(file_id))
203
 
 
204
96
                
205
97
    def has_id(self, file_id):
206
98
        # files that have been deleted are excluded
208
100
        if not inv.has_id(file_id):
209
101
            return False
210
102
        path = inv.id2path(file_id)
211
 
        return bzrlib.osutils.lexists(self.abspath(path))
 
103
        return os.path.exists(self.abspath(path))
212
104
 
213
 
    def has_or_had_id(self, file_id):
214
 
        if file_id == self.inventory.root.file_id:
215
 
            return True
216
 
        return self.inventory.has_id(file_id)
217
105
 
218
106
    __contains__ = has_id
219
107
    
220
108
 
221
109
    def get_file_size(self, file_id):
222
 
        return os.path.getsize(self.id2abspath(file_id))
 
110
        # is this still called?
 
111
        raise NotImplementedError()
 
112
 
223
113
 
224
114
    def get_file_sha1(self, file_id):
225
115
        path = self._inventory.id2path(file_id)
226
116
        return self._hashcache.get_sha1(path)
227
117
 
228
118
 
229
 
    def is_executable(self, file_id):
230
 
        if os.name == "nt":
231
 
            return self._inventory[file_id].executable
232
 
        else:
233
 
            path = self._inventory.id2path(file_id)
234
 
            mode = os.lstat(self.abspath(path)).st_mode
235
 
            return bool(stat.S_ISREG(mode) and stat.S_IEXEC&mode)
236
 
 
237
 
    def get_symlink_target(self, file_id):
238
 
        return os.readlink(self.id2abspath(file_id))
239
 
 
240
119
    def file_class(self, filename):
241
120
        if self.path2id(filename):
242
121
            return 'V'
256
135
 
257
136
        Skips the control directory.
258
137
        """
 
138
        from osutils import appendpath, file_kind
 
139
        import os
 
140
 
259
141
        inv = self._inventory
260
142
 
261
143
        def descend(from_dir_relpath, from_dir_id, dp):
290
172
                                            "now of kind %r"
291
173
                                            % (fap, f_ie.kind, f_ie.file_id, fk))
292
174
 
293
 
                # make a last minute entry
294
 
                if f_ie:
295
 
                    entry = f_ie
296
 
                else:
297
 
                    if fk == 'directory':
298
 
                        entry = TreeDirectory()
299
 
                    elif fk == 'file':
300
 
                        entry = TreeFile()
301
 
                    elif fk == 'symlink':
302
 
                        entry = TreeLink()
303
 
                    else:
304
 
                        entry = TreeEntry()
305
 
                
306
 
                yield fp, c, fk, (f_ie and f_ie.file_id), entry
 
175
                yield fp, c, fk, (f_ie and f_ie.file_id)
307
176
 
308
177
                if fk != 'directory':
309
178
                    continue
325
194
            if not self.is_ignored(subp):
326
195
                yield subp
327
196
 
328
 
    def iter_conflicts(self):
329
 
        conflicted = set()
330
 
        for path in (s[0] for s in self.list_files()):
331
 
            stem = get_conflicted_stem(path)
332
 
            if stem is None:
333
 
                continue
334
 
            if stem not in conflicted:
335
 
                conflicted.add(stem)
336
 
                yield stem
337
 
 
338
 
    @needs_write_lock
339
 
    def pull(self, source, overwrite=False):
340
 
        from bzrlib.merge import merge_inner
341
 
        source.lock_read()
342
 
        try:
343
 
            old_revision_history = self.branch.revision_history()
344
 
            self.branch.pull(source, overwrite)
345
 
            new_revision_history = self.branch.revision_history()
346
 
            if new_revision_history != old_revision_history:
347
 
                if len(old_revision_history):
348
 
                    other_revision = old_revision_history[-1]
349
 
                else:
350
 
                    other_revision = None
351
 
                merge_inner(self.branch,
352
 
                            self.branch.basis_tree(), 
353
 
                            self.branch.revision_tree(other_revision))
354
 
        finally:
355
 
            source.unlock()
356
197
 
357
198
    def extras(self):
358
199
        """Yield all unknown files in this WorkingTree.
364
205
        Currently returned depth-first, sorted by name within directories.
365
206
        """
366
207
        ## TODO: Work from given directory downwards
 
208
        from osutils import isdir, appendpath
 
209
        
367
210
        for path, dir_entry in self.inventory.directories():
368
211
            mutter("search for unknowns in %r" % path)
369
212
            dirabs = self.abspath(path)
426
269
        # Eventually it should be replaced with something more
427
270
        # accurate.
428
271
        
 
272
        import fnmatch
 
273
        from osutils import splitpath
 
274
        
429
275
        for pat in self.get_ignore_list():
430
276
            if '/' in pat or '\\' in pat:
431
277
                
444
290
                    return pat
445
291
        else:
446
292
            return None
447
 
 
448
 
    def kind(self, file_id):
449
 
        return file_kind(self.id2abspath(file_id))
450
 
 
451
 
    def lock_read(self):
452
 
        """See Branch.lock_read, and WorkingTree.unlock."""
453
 
        return self.branch.lock_read()
454
 
 
455
 
    def lock_write(self):
456
 
        """See Branch.lock_write, and WorkingTree.unlock."""
457
 
        return self.branch.lock_write()
458
 
 
459
 
    @needs_read_lock
460
 
    def read_working_inventory(self):
461
 
        """Read the working inventory."""
462
 
        # ElementTree does its own conversion from UTF-8, so open in
463
 
        # binary.
464
 
        f = self.branch.controlfile('inventory', 'rb')
465
 
        return bzrlib.xml5.serializer_v5.read_inventory(f)
466
 
 
467
 
    @needs_write_lock
468
 
    def remove(self, files, verbose=False):
469
 
        """Remove nominated files from the working inventory..
470
 
 
471
 
        This does not remove their text.  This does not run on XXX on what? RBC
472
 
 
473
 
        TODO: Refuse to remove modified files unless --force is given?
474
 
 
475
 
        TODO: Do something useful with directories.
476
 
 
477
 
        TODO: Should this remove the text or not?  Tough call; not
478
 
        removing may be useful and the user can just use use rm, and
479
 
        is the opposite of add.  Removing it is consistent with most
480
 
        other tools.  Maybe an option.
481
 
        """
482
 
        ## TODO: Normalize names
483
 
        ## TODO: Remove nested loops; better scalability
484
 
        if isinstance(files, basestring):
485
 
            files = [files]
486
 
 
487
 
        inv = self.inventory
488
 
 
489
 
        # do this before any modifications
490
 
        for f in files:
491
 
            fid = inv.path2id(f)
492
 
            if not fid:
493
 
                # TODO: Perhaps make this just a warning, and continue?
494
 
                # This tends to happen when 
495
 
                raise NotVersionedError(path=f)
496
 
            mutter("remove inventory entry %s {%s}" % (quotefn(f), fid))
497
 
            if verbose:
498
 
                # having remove it, it must be either ignored or unknown
499
 
                if self.is_ignored(f):
500
 
                    new_status = 'I'
501
 
                else:
502
 
                    new_status = '?'
503
 
                show_status(new_status, inv[fid].kind, quotefn(f))
504
 
            del inv[fid]
505
 
 
506
 
        self.branch._write_inventory(inv)
507
 
 
508
 
    @needs_write_lock
509
 
    def set_inventory(self, new_inventory_list):
510
 
        from bzrlib.inventory import (Inventory,
511
 
                                      InventoryDirectory,
512
 
                                      InventoryEntry,
513
 
                                      InventoryFile,
514
 
                                      InventoryLink)
515
 
        inv = Inventory(self.get_root_id())
516
 
        for path, file_id, parent, kind in new_inventory_list:
517
 
            name = os.path.basename(path)
518
 
            if name == "":
519
 
                continue
520
 
            # fixme, there should be a factory function inv,add_?? 
521
 
            if kind == 'directory':
522
 
                inv.add(InventoryDirectory(file_id, name, parent))
523
 
            elif kind == 'file':
524
 
                inv.add(InventoryFile(file_id, name, parent))
525
 
            elif kind == 'symlink':
526
 
                inv.add(InventoryLink(file_id, name, parent))
527
 
            else:
528
 
                raise BzrError("unknown kind %r" % kind)
529
 
        self.branch._write_inventory(inv)
530
 
 
531
 
    def unlock(self):
532
 
        """See Branch.unlock.
533
 
        
534
 
        WorkingTree locking just uses the Branch locking facilities.
535
 
        This is current because all working trees have an embedded branch
536
 
        within them. IF in the future, we were to make branch data shareable
537
 
        between multiple working trees, i.e. via shared storage, then we 
538
 
        would probably want to lock both the local tree, and the branch.
539
 
        """
540
 
        return self.branch.unlock()
541
 
 
542
 
 
543
 
CONFLICT_SUFFIXES = ('.THIS', '.BASE', '.OTHER')
544
 
def get_conflicted_stem(path):
545
 
    for suffix in CONFLICT_SUFFIXES:
546
 
        if path.endswith(suffix):
547
 
            return path[:-len(suffix)]
 
293
        
 
 
b'\\ No newline at end of file'