~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/workingtree.py

  • Committer: Martin Pool
  • Date: 2005-04-29 03:32:40 UTC
  • Revision ID: mbp@sourcefrog.net-20050429033239-43b3a4781828f11d
todo

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2005 Canonical Ltd
2
 
 
3
 
# This program is free software; you can redistribute it and/or modify
4
 
# it under the terms of the GNU General Public License as published by
5
 
# the Free Software Foundation; either version 2 of the License, or
6
 
# (at your option) any later version.
7
 
 
8
 
# This program is distributed in the hope that it will be useful,
9
 
# but WITHOUT ANY WARRANTY; without even the implied warranty of
10
 
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
11
 
# GNU General Public License for more details.
12
 
 
13
 
# You should have received a copy of the GNU General Public License
14
 
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
 
 
17
 
"""WorkingTree object and friends.
18
 
 
19
 
A WorkingTree represents the editable working copy of a branch.
20
 
Operations which represent the WorkingTree are also done here, 
21
 
such as renaming or adding files.  The WorkingTree has an inventory 
22
 
which is updated by these operations.  A commit produces a 
23
 
new revision based on the workingtree and its inventory.
24
 
 
25
 
At the moment every WorkingTree has its own branch.  Remote
26
 
WorkingTrees aren't supported.
27
 
 
28
 
To get a WorkingTree, call Branch.working_tree():
29
 
"""
30
 
 
31
 
 
32
 
# TODO: Don't allow WorkingTrees to be constructed for remote branches if 
33
 
# they don't work.
34
 
 
35
 
# FIXME: I don't know if writing out the cache from the destructor is really a
36
 
# good idea, because destructors are considered poor taste in Python, and it's
37
 
# not predictable when it will be written out.
38
 
 
39
 
# TODO: Give the workingtree sole responsibility for the working inventory;
40
 
# remove the variable and references to it from the branch.  This may require
41
 
# updating the commit code so as to update the inventory within the working
42
 
# copy, and making sure there's only one WorkingTree for any directory on disk.
43
 
# At the momenthey may alias the inventory and have old copies of it in memory.
44
 
 
45
 
import os
46
 
import stat
47
 
import fnmatch
48
 
 
49
 
from bzrlib.branch import Branch, needs_read_lock, needs_write_lock, quotefn
50
 
import bzrlib.tree
51
 
from bzrlib.osutils import appendpath, file_kind, isdir, splitpath, relpath
52
 
from bzrlib.errors import BzrCheckError, NotVersionedError
53
 
from bzrlib.trace import mutter
54
 
 
55
 
class TreeEntry(object):
56
 
    """An entry that implements the minium interface used by commands.
57
 
 
58
 
    This needs further inspection, it may be better to have 
59
 
    InventoryEntries without ids - though that seems wrong. For now,
60
 
    this is a parallel hierarchy to InventoryEntry, and needs to become
61
 
    one of several things: decorates to that hierarchy, children of, or
62
 
    parents of it.
63
 
    Another note is that these objects are currently only used when there is
64
 
    no InventoryEntry available - i.e. for unversioned objects.
65
 
    Perhaps they should be UnversionedEntry et al. ? - RBC 20051003
66
 
    """
67
 
 
68
 
    def __eq__(self, other):
69
 
        # yes, this us ugly, TODO: best practice __eq__ style.
70
 
        return (isinstance(other, TreeEntry)
71
 
                and other.__class__ == self.__class__)
72
 
 
73
 
    def kind_character(self):
74
 
        return "???"
75
 
 
76
 
 
77
 
class TreeDirectory(TreeEntry):
78
 
    """See TreeEntry. This is a directory in a working tree."""
79
 
 
80
 
    def __eq__(self, other):
81
 
        return (isinstance(other, TreeDirectory)
82
 
                and other.__class__ == self.__class__)
83
 
 
84
 
    def kind_character(self):
85
 
        return "/"
86
 
 
87
 
 
88
 
class TreeFile(TreeEntry):
89
 
    """See TreeEntry. This is a regular file in a working tree."""
90
 
 
91
 
    def __eq__(self, other):
92
 
        return (isinstance(other, TreeFile)
93
 
                and other.__class__ == self.__class__)
94
 
 
95
 
    def kind_character(self):
96
 
        return ''
97
 
 
98
 
 
99
 
class TreeLink(TreeEntry):
100
 
    """See TreeEntry. This is a symlink in a working tree."""
101
 
 
102
 
    def __eq__(self, other):
103
 
        return (isinstance(other, TreeLink)
104
 
                and other.__class__ == self.__class__)
105
 
 
106
 
    def kind_character(self):
107
 
        return ''
108
 
 
109
 
 
110
 
class WorkingTree(bzrlib.tree.Tree):
111
 
    """Working copy tree.
112
 
 
113
 
    The inventory is held in the `Branch` working-inventory, and the
114
 
    files are in a directory on disk.
115
 
 
116
 
    It is possible for a `WorkingTree` to have a filename which is
117
 
    not listed in the Inventory and vice versa.
118
 
    """
119
 
 
120
 
    def __init__(self, basedir, branch=None):
121
 
        """Construct a WorkingTree for basedir.
122
 
 
123
 
        If the branch is not supplied, it is opened automatically.
124
 
        If the branch is supplied, it must be the branch for this basedir.
125
 
        (branch.base is not cross checked, because for remote branches that
126
 
        would be meaningless).
127
 
        """
128
 
        from bzrlib.hashcache import HashCache
129
 
        from bzrlib.trace import note, mutter
130
 
        assert isinstance(basedir, basestring), \
131
 
            "base directory %r is not a string" % basedir
132
 
        if branch is None:
133
 
            branch = Branch.open(basedir)
134
 
        assert isinstance(branch, Branch), \
135
 
            "branch %r is not a Branch" % branch
136
 
        self._inventory = branch.inventory
137
 
        self.path2id = self._inventory.path2id
138
 
        self.branch = branch
139
 
        self.basedir = basedir
140
 
 
141
 
        # update the whole cache up front and write to disk if anything changed;
142
 
        # in the future we might want to do this more selectively
143
 
        hc = self._hashcache = HashCache(basedir)
144
 
        hc.read()
145
 
        hc.scan()
146
 
 
147
 
        if hc.needs_write:
148
 
            mutter("write hc")
149
 
            hc.write()
150
 
            
151
 
            
152
 
    def __del__(self):
153
 
        if self._hashcache.needs_write:
154
 
            self._hashcache.write()
155
 
 
156
 
 
157
 
    def __iter__(self):
158
 
        """Iterate through file_ids for this tree.
159
 
 
160
 
        file_ids are in a WorkingTree if they are in the working inventory
161
 
        and the working file exists.
162
 
        """
163
 
        inv = self._inventory
164
 
        for path, ie in inv.iter_entries():
165
 
            if bzrlib.osutils.lexists(self.abspath(path)):
166
 
                yield ie.file_id
167
 
 
168
 
 
169
 
    def __repr__(self):
170
 
        return "<%s of %s>" % (self.__class__.__name__,
171
 
                               getattr(self, 'basedir', None))
172
 
 
173
 
 
174
 
 
175
 
    def abspath(self, filename):
176
 
        return os.path.join(self.basedir, filename)
177
 
 
178
 
    def relpath(self, abspath):
179
 
        """Return the local path portion from a given absolute path."""
180
 
        return relpath(self.basedir, abspath)
181
 
 
182
 
    def has_filename(self, filename):
183
 
        return bzrlib.osutils.lexists(self.abspath(filename))
184
 
 
185
 
    def get_file(self, file_id):
186
 
        return self.get_file_byname(self.id2path(file_id))
187
 
 
188
 
    def get_file_byname(self, filename):
189
 
        return file(self.abspath(filename), 'rb')
190
 
 
191
 
    def _get_store_filename(self, file_id):
192
 
        ## XXX: badly named; this isn't in the store at all
193
 
        return self.abspath(self.id2path(file_id))
194
 
 
195
 
 
196
 
    def id2abspath(self, file_id):
197
 
        return self.abspath(self.id2path(file_id))
198
 
 
199
 
                
200
 
    def has_id(self, file_id):
201
 
        # files that have been deleted are excluded
202
 
        inv = self._inventory
203
 
        if not inv.has_id(file_id):
204
 
            return False
205
 
        path = inv.id2path(file_id)
206
 
        return bzrlib.osutils.lexists(self.abspath(path))
207
 
 
208
 
    def has_or_had_id(self, file_id):
209
 
        if file_id == self.inventory.root.file_id:
210
 
            return True
211
 
        return self.inventory.has_id(file_id)
212
 
 
213
 
    __contains__ = has_id
214
 
    
215
 
 
216
 
    def get_file_size(self, file_id):
217
 
        return os.path.getsize(self.id2abspath(file_id))
218
 
 
219
 
    def get_file_sha1(self, file_id):
220
 
        path = self._inventory.id2path(file_id)
221
 
        return self._hashcache.get_sha1(path)
222
 
 
223
 
 
224
 
    def is_executable(self, file_id):
225
 
        if os.name == "nt":
226
 
            return self._inventory[file_id].executable
227
 
        else:
228
 
            path = self._inventory.id2path(file_id)
229
 
            mode = os.lstat(self.abspath(path)).st_mode
230
 
            return bool(stat.S_ISREG(mode) and stat.S_IEXEC&mode)
231
 
 
232
 
    def get_symlink_target(self, file_id):
233
 
        return os.readlink(self.id2abspath(file_id))
234
 
 
235
 
    def file_class(self, filename):
236
 
        if self.path2id(filename):
237
 
            return 'V'
238
 
        elif self.is_ignored(filename):
239
 
            return 'I'
240
 
        else:
241
 
            return '?'
242
 
 
243
 
 
244
 
    def list_files(self):
245
 
        """Recursively list all files as (path, class, kind, id).
246
 
 
247
 
        Lists, but does not descend into unversioned directories.
248
 
 
249
 
        This does not include files that have been deleted in this
250
 
        tree.
251
 
 
252
 
        Skips the control directory.
253
 
        """
254
 
        inv = self._inventory
255
 
 
256
 
        def descend(from_dir_relpath, from_dir_id, dp):
257
 
            ls = os.listdir(dp)
258
 
            ls.sort()
259
 
            for f in ls:
260
 
                ## TODO: If we find a subdirectory with its own .bzr
261
 
                ## directory, then that is a separate tree and we
262
 
                ## should exclude it.
263
 
                if bzrlib.BZRDIR == f:
264
 
                    continue
265
 
 
266
 
                # path within tree
267
 
                fp = appendpath(from_dir_relpath, f)
268
 
 
269
 
                # absolute path
270
 
                fap = appendpath(dp, f)
271
 
                
272
 
                f_ie = inv.get_child(from_dir_id, f)
273
 
                if f_ie:
274
 
                    c = 'V'
275
 
                elif self.is_ignored(fp):
276
 
                    c = 'I'
277
 
                else:
278
 
                    c = '?'
279
 
 
280
 
                fk = file_kind(fap)
281
 
 
282
 
                if f_ie:
283
 
                    if f_ie.kind != fk:
284
 
                        raise BzrCheckError("file %r entered as kind %r id %r, "
285
 
                                            "now of kind %r"
286
 
                                            % (fap, f_ie.kind, f_ie.file_id, fk))
287
 
 
288
 
                # make a last minute entry
289
 
                if f_ie:
290
 
                    entry = f_ie
291
 
                else:
292
 
                    if fk == 'directory':
293
 
                        entry = TreeDirectory()
294
 
                    elif fk == 'file':
295
 
                        entry = TreeFile()
296
 
                    elif fk == 'symlink':
297
 
                        entry = TreeLink()
298
 
                    else:
299
 
                        entry = TreeEntry()
300
 
                
301
 
                yield fp, c, fk, (f_ie and f_ie.file_id), entry
302
 
 
303
 
                if fk != 'directory':
304
 
                    continue
305
 
 
306
 
                if c != 'V':
307
 
                    # don't descend unversioned directories
308
 
                    continue
309
 
                
310
 
                for ff in descend(fp, f_ie.file_id, fap):
311
 
                    yield ff
312
 
 
313
 
        for f in descend('', inv.root.file_id, self.basedir):
314
 
            yield f
315
 
            
316
 
 
317
 
 
318
 
    def unknowns(self):
319
 
        for subp in self.extras():
320
 
            if not self.is_ignored(subp):
321
 
                yield subp
322
 
 
323
 
    def iter_conflicts(self):
324
 
        conflicted = set()
325
 
        for path in (s[0] for s in self.list_files()):
326
 
            stem = get_conflicted_stem(path)
327
 
            if stem is None:
328
 
                continue
329
 
            if stem not in conflicted:
330
 
                conflicted.add(stem)
331
 
                yield stem
332
 
 
333
 
    def extras(self):
334
 
        """Yield all unknown files in this WorkingTree.
335
 
 
336
 
        If there are any unknown directories then only the directory is
337
 
        returned, not all its children.  But if there are unknown files
338
 
        under a versioned subdirectory, they are returned.
339
 
 
340
 
        Currently returned depth-first, sorted by name within directories.
341
 
        """
342
 
        ## TODO: Work from given directory downwards
343
 
        for path, dir_entry in self.inventory.directories():
344
 
            mutter("search for unknowns in %r" % path)
345
 
            dirabs = self.abspath(path)
346
 
            if not isdir(dirabs):
347
 
                # e.g. directory deleted
348
 
                continue
349
 
 
350
 
            fl = []
351
 
            for subf in os.listdir(dirabs):
352
 
                if (subf != '.bzr'
353
 
                    and (subf not in dir_entry.children)):
354
 
                    fl.append(subf)
355
 
            
356
 
            fl.sort()
357
 
            for subf in fl:
358
 
                subp = appendpath(path, subf)
359
 
                yield subp
360
 
 
361
 
 
362
 
    def ignored_files(self):
363
 
        """Yield list of PATH, IGNORE_PATTERN"""
364
 
        for subp in self.extras():
365
 
            pat = self.is_ignored(subp)
366
 
            if pat != None:
367
 
                yield subp, pat
368
 
 
369
 
 
370
 
    def get_ignore_list(self):
371
 
        """Return list of ignore patterns.
372
 
 
373
 
        Cached in the Tree object after the first call.
374
 
        """
375
 
        if hasattr(self, '_ignorelist'):
376
 
            return self._ignorelist
377
 
 
378
 
        l = bzrlib.DEFAULT_IGNORE[:]
379
 
        if self.has_filename(bzrlib.IGNORE_FILENAME):
380
 
            f = self.get_file_byname(bzrlib.IGNORE_FILENAME)
381
 
            l.extend([line.rstrip("\n\r") for line in f.readlines()])
382
 
        self._ignorelist = l
383
 
        return l
384
 
 
385
 
 
386
 
    def is_ignored(self, filename):
387
 
        r"""Check whether the filename matches an ignore pattern.
388
 
 
389
 
        Patterns containing '/' or '\' need to match the whole path;
390
 
        others match against only the last component.
391
 
 
392
 
        If the file is ignored, returns the pattern which caused it to
393
 
        be ignored, otherwise None.  So this can simply be used as a
394
 
        boolean if desired."""
395
 
 
396
 
        # TODO: Use '**' to match directories, and other extended
397
 
        # globbing stuff from cvs/rsync.
398
 
 
399
 
        # XXX: fnmatch is actually not quite what we want: it's only
400
 
        # approximately the same as real Unix fnmatch, and doesn't
401
 
        # treat dotfiles correctly and allows * to match /.
402
 
        # Eventually it should be replaced with something more
403
 
        # accurate.
404
 
        
405
 
        for pat in self.get_ignore_list():
406
 
            if '/' in pat or '\\' in pat:
407
 
                
408
 
                # as a special case, you can put ./ at the start of a
409
 
                # pattern; this is good to match in the top-level
410
 
                # only;
411
 
                
412
 
                if (pat[:2] == './') or (pat[:2] == '.\\'):
413
 
                    newpat = pat[2:]
414
 
                else:
415
 
                    newpat = pat
416
 
                if fnmatch.fnmatchcase(filename, newpat):
417
 
                    return pat
418
 
            else:
419
 
                if fnmatch.fnmatchcase(splitpath(filename)[-1], pat):
420
 
                    return pat
421
 
        else:
422
 
            return None
423
 
 
424
 
    def kind(self, file_id):
425
 
        return file_kind(self.id2abspath(file_id))
426
 
 
427
 
    def lock_read(self):
428
 
        """See Branch.lock_read, and WorkingTree.unlock."""
429
 
        return self.branch.lock_read()
430
 
 
431
 
    def lock_write(self):
432
 
        """See Branch.lock_write, and WorkingTree.unlock."""
433
 
        return self.branch.lock_write()
434
 
 
435
 
    @needs_write_lock
436
 
    def remove(self, files, verbose=False):
437
 
        """Remove nominated files from the working inventory..
438
 
 
439
 
        This does not remove their text.  This does not run on XXX on what? RBC
440
 
 
441
 
        TODO: Refuse to remove modified files unless --force is given?
442
 
 
443
 
        TODO: Do something useful with directories.
444
 
 
445
 
        TODO: Should this remove the text or not?  Tough call; not
446
 
        removing may be useful and the user can just use use rm, and
447
 
        is the opposite of add.  Removing it is consistent with most
448
 
        other tools.  Maybe an option.
449
 
        """
450
 
        ## TODO: Normalize names
451
 
        ## TODO: Remove nested loops; better scalability
452
 
        if isinstance(files, basestring):
453
 
            files = [files]
454
 
 
455
 
        inv = self.inventory
456
 
 
457
 
        # do this before any modifications
458
 
        for f in files:
459
 
            fid = inv.path2id(f)
460
 
            if not fid:
461
 
                # TODO: Perhaps make this just a warning, and continue?
462
 
                # This tends to happen when 
463
 
                raise NotVersionedError(path=f)
464
 
            mutter("remove inventory entry %s {%s}" % (quotefn(f), fid))
465
 
            if verbose:
466
 
                # having remove it, it must be either ignored or unknown
467
 
                if self.is_ignored(f):
468
 
                    new_status = 'I'
469
 
                else:
470
 
                    new_status = '?'
471
 
                show_status(new_status, inv[fid].kind, quotefn(f))
472
 
            del inv[fid]
473
 
 
474
 
        self.branch._write_inventory(inv)
475
 
 
476
 
    def unlock(self):
477
 
        """See Branch.unlock.
478
 
        
479
 
        WorkingTree locking just uses the Branch locking facilities.
480
 
        This is current because all working trees have an embedded branch
481
 
        within them. IF in the future, we were to make branch data shareable
482
 
        between multiple working trees, i.e. via shared storage, then we 
483
 
        would probably want to lock both the local tree, and the branch.
484
 
        """
485
 
        return self.branch.unlock()
486
 
 
487
 
 
488
 
CONFLICT_SUFFIXES = ('.THIS', '.BASE', '.OTHER')
489
 
def get_conflicted_stem(path):
490
 
    for suffix in CONFLICT_SUFFIXES:
491
 
        if path.endswith(suffix):
492
 
            return path[:-len(suffix)]