~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/branch.py

merge in lsdiff/filterdiff friendliness

Show diffs side-by-side

added added

removed removed

Lines of Context:
15
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
16
 
17
17
 
18
 
from sets import Set
19
 
 
20
 
import sys, os, os.path, random, time, sha, sets, types, re, shutil, tempfile
21
 
import traceback, socket, fnmatch, difflib, time
22
 
from binascii import hexlify
 
18
import sys
 
19
import os
23
20
 
24
21
import bzrlib
25
 
from inventory import Inventory
26
 
from trace import mutter, note
27
 
from tree import Tree, EmptyTree, RevisionTree, WorkingTree
28
 
from inventory import InventoryEntry, Inventory
29
 
from osutils import isdir, quotefn, isfile, uuid, sha_file, username, \
30
 
     format_date, compact_date, pumpfile, user_email, rand_bytes, splitpath, \
31
 
     joinpath, sha_string, file_kind, local_time_offset, appendpath
32
 
from store import ImmutableStore
33
 
from revision import Revision
34
 
from errors import bailout, BzrError
35
 
from textui import show_status
36
 
from diff import diff_trees
 
22
from bzrlib.trace import mutter, note
 
23
from bzrlib.osutils import isdir, quotefn, compact_date, rand_bytes, \
 
24
     splitpath, \
 
25
     sha_file, appendpath, file_kind
 
26
 
 
27
from bzrlib.errors import BzrError, InvalidRevisionNumber, InvalidRevisionId, \
 
28
     DivergedBranches, NotBranchError
 
29
from bzrlib.textui import show_status
 
30
from bzrlib.revision import Revision
 
31
from bzrlib.delta import compare_trees
 
32
from bzrlib.tree import EmptyTree, RevisionTree
 
33
import bzrlib.xml
 
34
import bzrlib.ui
 
35
 
 
36
 
37
37
 
38
38
BZR_BRANCH_FORMAT = "Bazaar-NG branch, format 0.0.4\n"
39
39
## TODO: Maybe include checks for common corruption of newlines, etc?
40
40
 
41
41
 
 
42
# TODO: Some operations like log might retrieve the same revisions
 
43
# repeatedly to calculate deltas.  We could perhaps have a weakref
 
44
# cache in memory to make this faster.
 
45
 
 
46
# TODO: please move the revision-string syntax stuff out of the branch
 
47
# object; it's clutter
 
48
 
 
49
 
 
50
def find_branch(f, **args):
 
51
    if f and (f.startswith('http://') or f.startswith('https://')):
 
52
        from bzrlib.remotebranch import RemoteBranch
 
53
        return RemoteBranch(f, **args)
 
54
    else:
 
55
        return Branch(f, **args)
 
56
 
 
57
 
 
58
def find_cached_branch(f, cache_root, **args):
 
59
    from bzrlib.remotebranch import RemoteBranch
 
60
    br = find_branch(f, **args)
 
61
    def cacheify(br, store_name):
 
62
        from bzrlib.meta_store import CachedStore
 
63
        cache_path = os.path.join(cache_root, store_name)
 
64
        os.mkdir(cache_path)
 
65
        new_store = CachedStore(getattr(br, store_name), cache_path)
 
66
        setattr(br, store_name, new_store)
 
67
 
 
68
    if isinstance(br, RemoteBranch):
 
69
        cacheify(br, 'inventory_store')
 
70
        cacheify(br, 'text_store')
 
71
        cacheify(br, 'revision_store')
 
72
    return br
 
73
 
 
74
 
 
75
def _relpath(base, path):
 
76
    """Return path relative to base, or raise exception.
 
77
 
 
78
    The path may be either an absolute path or a path relative to the
 
79
    current working directory.
 
80
 
 
81
    Lifted out of Branch.relpath for ease of testing.
 
82
 
 
83
    os.path.commonprefix (python2.4) has a bad bug that it works just
 
84
    on string prefixes, assuming that '/u' is a prefix of '/u2'.  This
 
85
    avoids that problem."""
 
86
    rp = os.path.abspath(path)
 
87
 
 
88
    s = []
 
89
    head = rp
 
90
    while len(head) >= len(base):
 
91
        if head == base:
 
92
            break
 
93
        head, tail = os.path.split(head)
 
94
        if tail:
 
95
            s.insert(0, tail)
 
96
    else:
 
97
        raise NotBranchError("path %r is not within branch %r" % (rp, base))
 
98
 
 
99
    return os.sep.join(s)
 
100
        
42
101
 
43
102
def find_branch_root(f=None):
44
103
    """Find the branch root enclosing f, or pwd.
45
104
 
 
105
    f may be a filename or a URL.
 
106
 
46
107
    It is not necessary that f exists.
47
108
 
48
109
    Basically we keep looking up until we find the control directory or
49
 
    run into the root."""
 
110
    run into the root.  If there isn't one, raises NotBranchError.
 
111
    """
50
112
    if f == None:
51
113
        f = os.getcwd()
52
114
    elif hasattr(os.path, 'realpath'):
53
115
        f = os.path.realpath(f)
54
116
    else:
55
117
        f = os.path.abspath(f)
 
118
    if not os.path.exists(f):
 
119
        raise BzrError('%r does not exist' % f)
 
120
        
56
121
 
57
122
    orig_f = f
58
123
 
62
127
        head, tail = os.path.split(f)
63
128
        if head == f:
64
129
            # reached the root, whatever that may be
65
 
            raise BzrError('%r is not in a branch' % orig_f)
 
130
            raise NotBranchError('%s is not in a branch' % orig_f)
66
131
        f = head
67
 
    
 
132
 
 
133
 
68
134
 
69
135
 
70
136
######################################################################
71
137
# branch objects
72
138
 
73
 
class Branch:
 
139
class Branch(object):
74
140
    """Branch holding a history of revisions.
75
141
 
76
142
    base
77
143
        Base directory of the branch.
 
144
 
 
145
    _lock_mode
 
146
        None, or 'r' or 'w'
 
147
 
 
148
    _lock_count
 
149
        If _lock_mode is true, a positive count of the number of times the
 
150
        lock has been taken.
 
151
 
 
152
    _lock
 
153
        Lock object from bzrlib.lock.
78
154
    """
79
 
    _lockmode = None
 
155
    base = None
 
156
    _lock_mode = None
 
157
    _lock_count = None
 
158
    _lock = None
80
159
    
81
 
    def __init__(self, base, init=False, find_root=True, lock_mode='w'):
 
160
    # Map some sort of prefix into a namespace
 
161
    # stuff like "revno:10", "revid:", etc.
 
162
    # This should match a prefix with a function which accepts
 
163
    REVISION_NAMESPACES = {}
 
164
 
 
165
    def __init__(self, base, init=False, find_root=True):
82
166
        """Create new branch object at a particular location.
83
167
 
84
 
        base -- Base directory for the branch.
 
168
        base -- Base directory for the branch. May be a file:// url.
85
169
        
86
170
        init -- If True, create new control files in a previously
87
171
             unversioned directory.  If False, the branch must already
93
177
        In the test suite, creation of new trees is tested using the
94
178
        `ScratchBranch` class.
95
179
        """
 
180
        from bzrlib.store import ImmutableStore
96
181
        if init:
97
182
            self.base = os.path.realpath(base)
98
183
            self._make_control()
99
184
        elif find_root:
100
185
            self.base = find_branch_root(base)
101
186
        else:
 
187
            if base.startswith("file://"):
 
188
                base = base[7:]
102
189
            self.base = os.path.realpath(base)
103
190
            if not isdir(self.controlfilename('.')):
104
 
                bailout("not a bzr branch: %s" % quotefn(base),
105
 
                        ['use "bzr init" to initialize a new working tree',
106
 
                         'current bzr can only operate from top-of-tree'])
 
191
                raise NotBranchError("not a bzr branch: %s" % quotefn(base),
 
192
                                     ['use "bzr init" to initialize a new working tree',
 
193
                                      'current bzr can only operate from top-of-tree'])
107
194
        self._check_format()
108
 
        self.lock(lock_mode)
109
195
 
110
196
        self.text_store = ImmutableStore(self.controlfilename('text-store'))
111
197
        self.revision_store = ImmutableStore(self.controlfilename('revision-store'))
119
205
    __repr__ = __str__
120
206
 
121
207
 
122
 
 
123
 
    def lock(self, mode='w'):
124
 
        """Lock the on-disk branch, excluding other processes."""
125
 
        try:
126
 
            import fcntl, errno
127
 
 
128
 
            if mode == 'w':
129
 
                lm = fcntl.LOCK_EX
130
 
                om = os.O_WRONLY | os.O_CREAT
131
 
            elif mode == 'r':
132
 
                lm = fcntl.LOCK_SH
133
 
                om = os.O_RDONLY
134
 
            else:
135
 
                raise BzrError("invalid locking mode %r" % mode)
136
 
 
137
 
            try:
138
 
                lockfile = os.open(self.controlfilename('branch-lock'), om)
139
 
            except OSError, e:
140
 
                if e.errno == errno.ENOENT:
141
 
                    # might not exist on branches from <0.0.4
142
 
                    self.controlfile('branch-lock', 'w').close()
143
 
                    lockfile = os.open(self.controlfilename('branch-lock'), om)
144
 
                else:
145
 
                    raise e
146
 
            
147
 
            fcntl.lockf(lockfile, lm)
148
 
            def unlock():
149
 
                fcntl.lockf(lockfile, fcntl.LOCK_UN)
150
 
                os.close(lockfile)
151
 
                self._lockmode = None
152
 
            self.unlock = unlock
153
 
            self._lockmode = mode
154
 
        except ImportError:
155
 
            warning("please write a locking method for platform %r" % sys.platform)
156
 
            def unlock():
157
 
                self._lockmode = None
158
 
            self.unlock = unlock
159
 
            self._lockmode = mode
160
 
 
161
 
 
162
 
    def _need_readlock(self):
163
 
        if self._lockmode not in ['r', 'w']:
164
 
            raise BzrError('need read lock on branch, only have %r' % self._lockmode)
165
 
 
166
 
    def _need_writelock(self):
167
 
        if self._lockmode not in ['w']:
168
 
            raise BzrError('need write lock on branch, only have %r' % self._lockmode)
169
 
 
 
208
    def __del__(self):
 
209
        if self._lock_mode or self._lock:
 
210
            from bzrlib.warnings import warn
 
211
            warn("branch %r was not explicitly unlocked" % self)
 
212
            self._lock.unlock()
 
213
 
 
214
    def lock_write(self):
 
215
        if self._lock_mode:
 
216
            if self._lock_mode != 'w':
 
217
                from bzrlib.errors import LockError
 
218
                raise LockError("can't upgrade to a write lock from %r" %
 
219
                                self._lock_mode)
 
220
            self._lock_count += 1
 
221
        else:
 
222
            from bzrlib.lock import WriteLock
 
223
 
 
224
            self._lock = WriteLock(self.controlfilename('branch-lock'))
 
225
            self._lock_mode = 'w'
 
226
            self._lock_count = 1
 
227
 
 
228
 
 
229
    def lock_read(self):
 
230
        if self._lock_mode:
 
231
            assert self._lock_mode in ('r', 'w'), \
 
232
                   "invalid lock mode %r" % self._lock_mode
 
233
            self._lock_count += 1
 
234
        else:
 
235
            from bzrlib.lock import ReadLock
 
236
 
 
237
            self._lock = ReadLock(self.controlfilename('branch-lock'))
 
238
            self._lock_mode = 'r'
 
239
            self._lock_count = 1
 
240
                        
 
241
    def unlock(self):
 
242
        if not self._lock_mode:
 
243
            from bzrlib.errors import LockError
 
244
            raise LockError('branch %r is not locked' % (self))
 
245
 
 
246
        if self._lock_count > 1:
 
247
            self._lock_count -= 1
 
248
        else:
 
249
            self._lock.unlock()
 
250
            self._lock = None
 
251
            self._lock_mode = self._lock_count = None
170
252
 
171
253
    def abspath(self, name):
172
254
        """Return absolute filename for something in the branch"""
173
255
        return os.path.join(self.base, name)
174
256
 
175
 
 
176
257
    def relpath(self, path):
177
258
        """Return path relative to this branch of something inside it.
178
259
 
179
260
        Raises an error if path is not in this branch."""
180
 
        rp = os.path.realpath(path)
181
 
        # FIXME: windows
182
 
        if not rp.startswith(self.base):
183
 
            bailout("path %r is not within branch %r" % (rp, self.base))
184
 
        rp = rp[len(self.base):]
185
 
        rp = rp.lstrip(os.sep)
186
 
        return rp
187
 
 
 
261
        return _relpath(self.base, path)
188
262
 
189
263
    def controlfilename(self, file_or_path):
190
264
        """Return location relative to branch."""
191
 
        if isinstance(file_or_path, types.StringTypes):
 
265
        if isinstance(file_or_path, basestring):
192
266
            file_or_path = [file_or_path]
193
267
        return os.path.join(self.base, bzrlib.BZRDIR, *file_or_path)
194
268
 
200
274
        and binary.  binary files are untranslated byte streams.  Text
201
275
        control files are stored with Unix newlines and in UTF-8, even
202
276
        if the platform or locale defaults are different.
 
277
 
 
278
        Controlfiles should almost never be opened in write mode but
 
279
        rather should be atomically copied and replaced using atomicfile.
203
280
        """
204
281
 
205
282
        fn = self.controlfilename(file_or_path)
215
292
        else:
216
293
            raise BzrError("invalid controlfile mode %r" % mode)
217
294
 
218
 
 
219
 
 
220
295
    def _make_control(self):
 
296
        from bzrlib.inventory import Inventory
 
297
        
221
298
        os.mkdir(self.controlfilename([]))
222
299
        self.controlfile('README', 'w').write(
223
300
            "This is a Bazaar-NG control directory.\n"
224
 
            "Do not change any files in this directory.")
 
301
            "Do not change any files in this directory.\n")
225
302
        self.controlfile('branch-format', 'w').write(BZR_BRANCH_FORMAT)
226
303
        for d in ('text-store', 'inventory-store', 'revision-store'):
227
304
            os.mkdir(self.controlfilename(d))
228
305
        for f in ('revision-history', 'merged-patches',
229
306
                  'pending-merged-patches', 'branch-name',
230
 
                  'branch-lock'):
 
307
                  'branch-lock',
 
308
                  'pending-merges'):
231
309
            self.controlfile(f, 'w').write('')
232
310
        mutter('created control directory in ' + self.base)
233
 
        Inventory().write_xml(self.controlfile('inventory','w'))
 
311
 
 
312
        # if we want per-tree root ids then this is the place to set
 
313
        # them; they're not needed for now and so ommitted for
 
314
        # simplicity.
 
315
        f = self.controlfile('inventory','w')
 
316
        bzrlib.xml.serializer_v4.write_inventory(Inventory(), f)
234
317
 
235
318
 
236
319
    def _check_format(self):
245
328
        # on Windows from Linux and so on.  I think it might be better
246
329
        # to always make all internal files in unix format.
247
330
        fmt = self.controlfile('branch-format', 'r').read()
248
 
        fmt.replace('\r\n', '')
 
331
        fmt = fmt.replace('\r\n', '\n')
249
332
        if fmt != BZR_BRANCH_FORMAT:
250
 
            bailout('sorry, branch format %r not supported' % fmt,
251
 
                    ['use a different bzr version',
252
 
                     'or remove the .bzr directory and "bzr init" again'])
253
 
 
 
333
            raise BzrError('sorry, branch format %r not supported' % fmt,
 
334
                           ['use a different bzr version',
 
335
                            'or remove the .bzr directory and "bzr init" again'])
 
336
 
 
337
    def get_root_id(self):
 
338
        """Return the id of this branches root"""
 
339
        inv = self.read_working_inventory()
 
340
        return inv.root.file_id
 
341
 
 
342
    def set_root_id(self, file_id):
 
343
        inv = self.read_working_inventory()
 
344
        orig_root_id = inv.root.file_id
 
345
        del inv._byid[inv.root.file_id]
 
346
        inv.root.file_id = file_id
 
347
        inv._byid[inv.root.file_id] = inv.root
 
348
        for fid in inv:
 
349
            entry = inv[fid]
 
350
            if entry.parent_id in (None, orig_root_id):
 
351
                entry.parent_id = inv.root.file_id
 
352
        self._write_inventory(inv)
254
353
 
255
354
    def read_working_inventory(self):
256
355
        """Read the working inventory."""
257
 
        self._need_readlock()
258
 
        before = time.time()
259
 
        # ElementTree does its own conversion from UTF-8, so open in
260
 
        # binary.
261
 
        inv = Inventory.read_xml(self.controlfile('inventory', 'rb'))
262
 
        mutter("loaded inventory of %d items in %f"
263
 
               % (len(inv), time.time() - before))
264
 
        return inv
265
 
 
 
356
        from bzrlib.inventory import Inventory
 
357
        self.lock_read()
 
358
        try:
 
359
            # ElementTree does its own conversion from UTF-8, so open in
 
360
            # binary.
 
361
            f = self.controlfile('inventory', 'rb')
 
362
            return bzrlib.xml.serializer_v4.read_inventory(f)
 
363
        finally:
 
364
            self.unlock()
 
365
            
266
366
 
267
367
    def _write_inventory(self, inv):
268
368
        """Update the working inventory.
270
370
        That is to say, the inventory describing changes underway, that
271
371
        will be committed to the next revision.
272
372
        """
273
 
        self._need_writelock()
274
 
        ## TODO: factor out to atomicfile?  is rename safe on windows?
275
 
        ## TODO: Maybe some kind of clean/dirty marker on inventory?
276
 
        tmpfname = self.controlfilename('inventory.tmp')
277
 
        tmpf = file(tmpfname, 'wb')
278
 
        inv.write_xml(tmpf)
279
 
        tmpf.close()
280
 
        inv_fname = self.controlfilename('inventory')
281
 
        if sys.platform == 'win32':
282
 
            os.remove(inv_fname)
283
 
        os.rename(tmpfname, inv_fname)
 
373
        from bzrlib.atomicfile import AtomicFile
 
374
        
 
375
        self.lock_write()
 
376
        try:
 
377
            f = AtomicFile(self.controlfilename('inventory'), 'wb')
 
378
            try:
 
379
                bzrlib.xml.serializer_v4.write_inventory(inv, f)
 
380
                f.commit()
 
381
            finally:
 
382
                f.close()
 
383
        finally:
 
384
            self.unlock()
 
385
        
284
386
        mutter('wrote working inventory')
285
 
 
 
387
            
286
388
 
287
389
    inventory = property(read_working_inventory, _write_inventory, None,
288
390
                         """Inventory for the working copy.""")
289
391
 
290
392
 
291
 
    def add(self, files, verbose=False):
 
393
    def add(self, files, ids=None):
292
394
        """Make files versioned.
293
395
 
294
 
        Note that the command line normally calls smart_add instead.
 
396
        Note that the command line normally calls smart_add instead,
 
397
        which can automatically recurse.
295
398
 
296
399
        This puts the files in the Added state, so that they will be
297
400
        recorded by the next commit.
298
401
 
 
402
        files
 
403
            List of paths to add, relative to the base of the tree.
 
404
 
 
405
        ids
 
406
            If set, use these instead of automatically generated ids.
 
407
            Must be the same length as the list of files, but may
 
408
            contain None for ids that are to be autogenerated.
 
409
 
299
410
        TODO: Perhaps have an option to add the ids even if the files do
300
 
               not (yet) exist.
301
 
 
302
 
        TODO: Perhaps return the ids of the files?  But then again it
303
 
               is easy to retrieve them if they're needed.
304
 
 
305
 
        TODO: Option to specify file id.
306
 
 
307
 
        TODO: Adding a directory should optionally recurse down and
308
 
               add all non-ignored children.  Perhaps do that in a
309
 
               higher-level method.
310
 
 
311
 
        >>> b = ScratchBranch(files=['foo'])
312
 
        >>> 'foo' in b.unknowns()
313
 
        True
314
 
        >>> b.show_status()
315
 
        ?       foo
316
 
        >>> b.add('foo')
317
 
        >>> 'foo' in b.unknowns()
318
 
        False
319
 
        >>> bool(b.inventory.path2id('foo'))
320
 
        True
321
 
        >>> b.show_status()
322
 
        A       foo
323
 
 
324
 
        >>> b.add('foo')
325
 
        Traceback (most recent call last):
326
 
        ...
327
 
        BzrError: ('foo is already versioned', [])
328
 
 
329
 
        >>> b.add(['nothere'])
330
 
        Traceback (most recent call last):
331
 
        BzrError: ('cannot add: not a regular file or directory: nothere', [])
 
411
              not (yet) exist.
 
412
 
 
413
        TODO: Perhaps yield the ids and paths as they're added.
332
414
        """
333
 
        self._need_writelock()
334
 
 
335
415
        # TODO: Re-adding a file that is removed in the working copy
336
416
        # should probably put it back with the previous ID.
337
 
        if isinstance(files, types.StringTypes):
 
417
        if isinstance(files, basestring):
 
418
            assert(ids is None or isinstance(ids, basestring))
338
419
            files = [files]
339
 
        
340
 
        inv = self.read_working_inventory()
341
 
        for f in files:
342
 
            if is_control_file(f):
343
 
                bailout("cannot add control file %s" % quotefn(f))
344
 
 
345
 
            fp = splitpath(f)
346
 
 
347
 
            if len(fp) == 0:
348
 
                bailout("cannot add top-level %r" % f)
349
 
                
350
 
            fullpath = os.path.normpath(self.abspath(f))
351
 
 
352
 
            try:
353
 
                kind = file_kind(fullpath)
354
 
            except OSError:
355
 
                # maybe something better?
356
 
                bailout('cannot add: not a regular file or directory: %s' % quotefn(f))
357
 
            
358
 
            if kind != 'file' and kind != 'directory':
359
 
                bailout('cannot add: not a regular file or directory: %s' % quotefn(f))
360
 
 
361
 
            file_id = gen_file_id(f)
362
 
            inv.add_path(f, kind=kind, file_id=file_id)
363
 
 
364
 
            if verbose:
365
 
                show_status('A', kind, quotefn(f))
366
 
                
367
 
            mutter("add file %s file_id:{%s} kind=%r" % (f, file_id, kind))
368
 
            
369
 
        self._write_inventory(inv)
370
 
 
 
420
            if ids is not None:
 
421
                ids = [ids]
 
422
 
 
423
        if ids is None:
 
424
            ids = [None] * len(files)
 
425
        else:
 
426
            assert(len(ids) == len(files))
 
427
 
 
428
        self.lock_write()
 
429
        try:
 
430
            inv = self.read_working_inventory()
 
431
            for f,file_id in zip(files, ids):
 
432
                if is_control_file(f):
 
433
                    raise BzrError("cannot add control file %s" % quotefn(f))
 
434
 
 
435
                fp = splitpath(f)
 
436
 
 
437
                if len(fp) == 0:
 
438
                    raise BzrError("cannot add top-level %r" % f)
 
439
 
 
440
                fullpath = os.path.normpath(self.abspath(f))
 
441
 
 
442
                try:
 
443
                    kind = file_kind(fullpath)
 
444
                except OSError:
 
445
                    # maybe something better?
 
446
                    raise BzrError('cannot add: not a regular file or directory: %s' % quotefn(f))
 
447
 
 
448
                if kind != 'file' and kind != 'directory':
 
449
                    raise BzrError('cannot add: not a regular file or directory: %s' % quotefn(f))
 
450
 
 
451
                if file_id is None:
 
452
                    file_id = gen_file_id(f)
 
453
                inv.add_path(f, kind=kind, file_id=file_id)
 
454
 
 
455
                mutter("add file %s file_id:{%s} kind=%r" % (f, file_id, kind))
 
456
 
 
457
            self._write_inventory(inv)
 
458
        finally:
 
459
            self.unlock()
 
460
            
371
461
 
372
462
    def print_file(self, file, revno):
373
463
        """Print `file` to stdout."""
374
 
        self._need_readlock()
375
 
        tree = self.revision_tree(self.lookup_revision(revno))
376
 
        # use inventory as it was in that revision
377
 
        file_id = tree.inventory.path2id(file)
378
 
        if not file_id:
379
 
            bailout("%r is not present in revision %d" % (file, revno))
380
 
        tree.print_file(file_id)
381
 
        
 
464
        self.lock_read()
 
465
        try:
 
466
            tree = self.revision_tree(self.lookup_revision(revno))
 
467
            # use inventory as it was in that revision
 
468
            file_id = tree.inventory.path2id(file)
 
469
            if not file_id:
 
470
                raise BzrError("%r is not present in revision %s" % (file, revno))
 
471
            tree.print_file(file_id)
 
472
        finally:
 
473
            self.unlock()
 
474
 
382
475
 
383
476
    def remove(self, files, verbose=False):
384
477
        """Mark nominated files for removal from the inventory.
387
480
 
388
481
        TODO: Refuse to remove modified files unless --force is given?
389
482
 
390
 
        >>> b = ScratchBranch(files=['foo'])
391
 
        >>> b.add('foo')
392
 
        >>> b.inventory.has_filename('foo')
393
 
        True
394
 
        >>> b.remove('foo')
395
 
        >>> b.working_tree().has_filename('foo')
396
 
        True
397
 
        >>> b.inventory.has_filename('foo')
398
 
        False
399
 
        
400
 
        >>> b = ScratchBranch(files=['foo'])
401
 
        >>> b.add('foo')
402
 
        >>> b.commit('one')
403
 
        >>> b.remove('foo')
404
 
        >>> b.commit('two')
405
 
        >>> b.inventory.has_filename('foo') 
406
 
        False
407
 
        >>> b.basis_tree().has_filename('foo') 
408
 
        False
409
 
        >>> b.working_tree().has_filename('foo') 
410
 
        True
411
 
 
412
483
        TODO: Do something useful with directories.
413
484
 
414
485
        TODO: Should this remove the text or not?  Tough call; not
418
489
        """
419
490
        ## TODO: Normalize names
420
491
        ## TODO: Remove nested loops; better scalability
421
 
        self._need_writelock()
422
 
 
423
 
        if isinstance(files, types.StringTypes):
 
492
        if isinstance(files, basestring):
424
493
            files = [files]
425
 
        
426
 
        tree = self.working_tree()
427
 
        inv = tree.inventory
428
 
 
429
 
        # do this before any modifications
430
 
        for f in files:
431
 
            fid = inv.path2id(f)
432
 
            if not fid:
433
 
                bailout("cannot remove unversioned file %s" % quotefn(f))
434
 
            mutter("remove inventory entry %s {%s}" % (quotefn(f), fid))
435
 
            if verbose:
436
 
                # having remove it, it must be either ignored or unknown
437
 
                if tree.is_ignored(f):
438
 
                    new_status = 'I'
439
 
                else:
440
 
                    new_status = '?'
441
 
                show_status(new_status, inv[fid].kind, quotefn(f))
442
 
            del inv[fid]
443
 
 
 
494
 
 
495
        self.lock_write()
 
496
 
 
497
        try:
 
498
            tree = self.working_tree()
 
499
            inv = tree.inventory
 
500
 
 
501
            # do this before any modifications
 
502
            for f in files:
 
503
                fid = inv.path2id(f)
 
504
                if not fid:
 
505
                    raise BzrError("cannot remove unversioned file %s" % quotefn(f))
 
506
                mutter("remove inventory entry %s {%s}" % (quotefn(f), fid))
 
507
                if verbose:
 
508
                    # having remove it, it must be either ignored or unknown
 
509
                    if tree.is_ignored(f):
 
510
                        new_status = 'I'
 
511
                    else:
 
512
                        new_status = '?'
 
513
                    show_status(new_status, inv[fid].kind, quotefn(f))
 
514
                del inv[fid]
 
515
 
 
516
            self._write_inventory(inv)
 
517
        finally:
 
518
            self.unlock()
 
519
 
 
520
 
 
521
    # FIXME: this doesn't need to be a branch method
 
522
    def set_inventory(self, new_inventory_list):
 
523
        from bzrlib.inventory import Inventory, InventoryEntry
 
524
        inv = Inventory(self.get_root_id())
 
525
        for path, file_id, parent, kind in new_inventory_list:
 
526
            name = os.path.basename(path)
 
527
            if name == "":
 
528
                continue
 
529
            inv.add(InventoryEntry(file_id, name, kind, parent))
444
530
        self._write_inventory(inv)
445
531
 
446
532
 
463
549
        return self.working_tree().unknowns()
464
550
 
465
551
 
466
 
    def commit(self, message, timestamp=None, timezone=None,
467
 
               committer=None,
468
 
               verbose=False):
469
 
        """Commit working copy as a new revision.
470
 
        
471
 
        The basic approach is to add all the file texts into the
472
 
        store, then the inventory, then make a new revision pointing
473
 
        to that inventory and store that.
474
 
        
475
 
        This is not quite safe if the working copy changes during the
476
 
        commit; for the moment that is simply not allowed.  A better
477
 
        approach is to make a temporary copy of the files before
478
 
        computing their hashes, and then add those hashes in turn to
479
 
        the inventory.  This should mean at least that there are no
480
 
        broken hash pointers.  There is no way we can get a snapshot
481
 
        of the whole directory at an instant.  This would also have to
482
 
        be robust against files disappearing, moving, etc.  So the
483
 
        whole thing is a bit hard.
484
 
 
485
 
        timestamp -- if not None, seconds-since-epoch for a
486
 
             postdated/predated commit.
487
 
        """
488
 
        self._need_writelock()
489
 
 
490
 
        ## TODO: Show branch names
491
 
 
492
 
        # TODO: Don't commit if there are no changes, unless forced?
493
 
 
494
 
        # First walk over the working inventory; and both update that
495
 
        # and also build a new revision inventory.  The revision
496
 
        # inventory needs to hold the text-id, sha1 and size of the
497
 
        # actual file versions committed in the revision.  (These are
498
 
        # not present in the working inventory.)  We also need to
499
 
        # detect missing/deleted files, and remove them from the
500
 
        # working inventory.
501
 
 
502
 
        work_inv = self.read_working_inventory()
503
 
        inv = Inventory()
504
 
        basis = self.basis_tree()
505
 
        basis_inv = basis.inventory
506
 
        missing_ids = []
507
 
        for path, entry in work_inv.iter_entries():
508
 
            ## TODO: Cope with files that have gone missing.
509
 
 
510
 
            ## TODO: Check that the file kind has not changed from the previous
511
 
            ## revision of this file (if any).
512
 
 
513
 
            entry = entry.copy()
514
 
 
515
 
            p = self.abspath(path)
516
 
            file_id = entry.file_id
517
 
            mutter('commit prep file %s, id %r ' % (p, file_id))
518
 
 
519
 
            if not os.path.exists(p):
520
 
                mutter("    file is missing, removing from inventory")
521
 
                if verbose:
522
 
                    show_status('D', entry.kind, quotefn(path))
523
 
                missing_ids.append(file_id)
524
 
                continue
525
 
 
526
 
            # TODO: Handle files that have been deleted
527
 
 
528
 
            # TODO: Maybe a special case for empty files?  Seems a
529
 
            # waste to store them many times.
530
 
 
531
 
            inv.add(entry)
532
 
 
533
 
            if basis_inv.has_id(file_id):
534
 
                old_kind = basis_inv[file_id].kind
535
 
                if old_kind != entry.kind:
536
 
                    bailout("entry %r changed kind from %r to %r"
537
 
                            % (file_id, old_kind, entry.kind))
538
 
 
539
 
            if entry.kind == 'directory':
540
 
                if not isdir(p):
541
 
                    bailout("%s is entered as directory but not a directory" % quotefn(p))
542
 
            elif entry.kind == 'file':
543
 
                if not isfile(p):
544
 
                    bailout("%s is entered as file but is not a file" % quotefn(p))
545
 
 
546
 
                content = file(p, 'rb').read()
547
 
 
548
 
                entry.text_sha1 = sha_string(content)
549
 
                entry.text_size = len(content)
550
 
 
551
 
                old_ie = basis_inv.has_id(file_id) and basis_inv[file_id]
552
 
                if (old_ie
553
 
                    and (old_ie.text_size == entry.text_size)
554
 
                    and (old_ie.text_sha1 == entry.text_sha1)):
555
 
                    ## assert content == basis.get_file(file_id).read()
556
 
                    entry.text_id = basis_inv[file_id].text_id
557
 
                    mutter('    unchanged from previous text_id {%s}' %
558
 
                           entry.text_id)
559
 
                    
560
 
                else:
561
 
                    entry.text_id = gen_file_id(entry.name)
562
 
                    self.text_store.add(content, entry.text_id)
563
 
                    mutter('    stored with text_id {%s}' % entry.text_id)
564
 
                    if verbose:
565
 
                        if not old_ie:
566
 
                            state = 'A'
567
 
                        elif (old_ie.name == entry.name
568
 
                              and old_ie.parent_id == entry.parent_id):
569
 
                            state = 'M'
570
 
                        else:
571
 
                            state = 'R'
572
 
 
573
 
                        show_status(state, entry.kind, quotefn(path))
574
 
 
575
 
        for file_id in missing_ids:
576
 
            # have to do this later so we don't mess up the iterator.
577
 
            # since parents may be removed before their children we
578
 
            # have to test.
579
 
 
580
 
            # FIXME: There's probably a better way to do this; perhaps
581
 
            # the workingtree should know how to filter itself.
582
 
            if work_inv.has_id(file_id):
583
 
                del work_inv[file_id]
584
 
 
585
 
 
586
 
        inv_id = rev_id = _gen_revision_id(time.time())
587
 
        
588
 
        inv_tmp = tempfile.TemporaryFile()
589
 
        inv.write_xml(inv_tmp)
590
 
        inv_tmp.seek(0)
591
 
        self.inventory_store.add(inv_tmp, inv_id)
592
 
        mutter('new inventory_id is {%s}' % inv_id)
593
 
 
594
 
        self._write_inventory(work_inv)
595
 
 
596
 
        if timestamp == None:
597
 
            timestamp = time.time()
598
 
 
599
 
        if committer == None:
600
 
            committer = username()
601
 
 
602
 
        if timezone == None:
603
 
            timezone = local_time_offset()
604
 
 
605
 
        mutter("building commit log message")
606
 
        rev = Revision(timestamp=timestamp,
607
 
                       timezone=timezone,
608
 
                       committer=committer,
609
 
                       precursor = self.last_patch(),
610
 
                       message = message,
611
 
                       inventory_id=inv_id,
612
 
                       revision_id=rev_id)
613
 
 
614
 
        rev_tmp = tempfile.TemporaryFile()
615
 
        rev.write_xml(rev_tmp)
616
 
        rev_tmp.seek(0)
617
 
        self.revision_store.add(rev_tmp, rev_id)
618
 
        mutter("new revision_id is {%s}" % rev_id)
619
 
        
620
 
        ## XXX: Everything up to here can simply be orphaned if we abort
621
 
        ## the commit; it will leave junk files behind but that doesn't
622
 
        ## matter.
623
 
 
624
 
        ## TODO: Read back the just-generated changeset, and make sure it
625
 
        ## applies and recreates the right state.
626
 
 
627
 
        ## TODO: Also calculate and store the inventory SHA1
628
 
        mutter("committing patch r%d" % (self.revno() + 1))
629
 
 
630
 
 
631
 
        self.append_revision(rev_id)
632
 
        
633
 
        if verbose:
634
 
            note("commited r%d" % self.revno())
635
 
 
636
 
 
637
 
    def append_revision(self, revision_id):
638
 
        mutter("add {%s} to revision-history" % revision_id)
 
552
    def append_revision(self, *revision_ids):
 
553
        from bzrlib.atomicfile import AtomicFile
 
554
 
 
555
        for revision_id in revision_ids:
 
556
            mutter("add {%s} to revision-history" % revision_id)
 
557
 
639
558
        rev_history = self.revision_history()
640
 
 
641
 
        tmprhname = self.controlfilename('revision-history.tmp')
642
 
        rhname = self.controlfilename('revision-history')
643
 
        
644
 
        f = file(tmprhname, 'wt')
645
 
        rev_history.append(revision_id)
646
 
        f.write('\n'.join(rev_history))
647
 
        f.write('\n')
648
 
        f.close()
649
 
 
650
 
        if sys.platform == 'win32':
651
 
            os.remove(rhname)
652
 
        os.rename(tmprhname, rhname)
653
 
        
 
559
        rev_history.extend(revision_ids)
 
560
 
 
561
        f = AtomicFile(self.controlfilename('revision-history'))
 
562
        try:
 
563
            for rev_id in rev_history:
 
564
                print >>f, rev_id
 
565
            f.commit()
 
566
        finally:
 
567
            f.close()
 
568
 
 
569
 
 
570
    def get_revision_xml_file(self, revision_id):
 
571
        """Return XML file object for revision object."""
 
572
        if not revision_id or not isinstance(revision_id, basestring):
 
573
            raise InvalidRevisionId(revision_id)
 
574
 
 
575
        self.lock_read()
 
576
        try:
 
577
            try:
 
578
                return self.revision_store[revision_id]
 
579
            except IndexError:
 
580
                raise bzrlib.errors.NoSuchRevision(self, revision_id)
 
581
        finally:
 
582
            self.unlock()
 
583
 
 
584
 
 
585
    #deprecated
 
586
    get_revision_xml = get_revision_xml_file
654
587
 
655
588
 
656
589
    def get_revision(self, revision_id):
657
590
        """Return the Revision object for a named revision"""
658
 
        self._need_readlock()
659
 
        r = Revision.read_xml(self.revision_store[revision_id])
 
591
        xml_file = self.get_revision_xml_file(revision_id)
 
592
 
 
593
        try:
 
594
            r = bzrlib.xml.serializer_v4.read_revision(xml_file)
 
595
        except SyntaxError, e:
 
596
            raise bzrlib.errors.BzrError('failed to unpack revision_xml',
 
597
                                         [revision_id,
 
598
                                          str(e)])
 
599
            
660
600
        assert r.revision_id == revision_id
661
601
        return r
662
602
 
663
603
 
 
604
    def get_revision_delta(self, revno):
 
605
        """Return the delta for one revision.
 
606
 
 
607
        The delta is relative to its mainline predecessor, or the
 
608
        empty tree for revision 1.
 
609
        """
 
610
        assert isinstance(revno, int)
 
611
        rh = self.revision_history()
 
612
        if not (1 <= revno <= len(rh)):
 
613
            raise InvalidRevisionNumber(revno)
 
614
 
 
615
        # revno is 1-based; list is 0-based
 
616
 
 
617
        new_tree = self.revision_tree(rh[revno-1])
 
618
        if revno == 1:
 
619
            old_tree = EmptyTree()
 
620
        else:
 
621
            old_tree = self.revision_tree(rh[revno-2])
 
622
 
 
623
        return compare_trees(old_tree, new_tree)
 
624
 
 
625
        
 
626
 
 
627
    def get_revision_sha1(self, revision_id):
 
628
        """Hash the stored value of a revision, and return it."""
 
629
        # In the future, revision entries will be signed. At that
 
630
        # point, it is probably best *not* to include the signature
 
631
        # in the revision hash. Because that lets you re-sign
 
632
        # the revision, (add signatures/remove signatures) and still
 
633
        # have all hash pointers stay consistent.
 
634
        # But for now, just hash the contents.
 
635
        return bzrlib.osutils.sha_file(self.get_revision_xml(revision_id))
 
636
 
 
637
 
664
638
    def get_inventory(self, inventory_id):
665
639
        """Get Inventory object by hash.
666
640
 
667
641
        TODO: Perhaps for this and similar methods, take a revision
668
642
               parameter which can be either an integer revno or a
669
643
               string hash."""
670
 
        self._need_readlock()
671
 
        i = Inventory.read_xml(self.inventory_store[inventory_id])
672
 
        return i
 
644
        from bzrlib.inventory import Inventory
 
645
 
 
646
        f = self.get_inventory_xml_file(inventory_id)
 
647
        return bzrlib.xml.serializer_v4.read_inventory(f)
 
648
 
 
649
 
 
650
    def get_inventory_xml(self, inventory_id):
 
651
        """Get inventory XML as a file object."""
 
652
        return self.inventory_store[inventory_id]
 
653
 
 
654
    get_inventory_xml_file = get_inventory_xml
 
655
            
 
656
 
 
657
    def get_inventory_sha1(self, inventory_id):
 
658
        """Return the sha1 hash of the inventory entry
 
659
        """
 
660
        return sha_file(self.get_inventory_xml(inventory_id))
673
661
 
674
662
 
675
663
    def get_revision_inventory(self, revision_id):
676
664
        """Return inventory of a past revision."""
677
 
        self._need_readlock()
 
665
        # bzr 0.0.6 imposes the constraint that the inventory_id
 
666
        # must be the same as its revision, so this is trivial.
678
667
        if revision_id == None:
679
 
            return Inventory()
 
668
            from bzrlib.inventory import Inventory
 
669
            return Inventory(self.get_root_id())
680
670
        else:
681
 
            return self.get_inventory(self.get_revision(revision_id).inventory_id)
 
671
            return self.get_inventory(revision_id)
682
672
 
683
673
 
684
674
    def revision_history(self):
687
677
        >>> ScratchBranch().revision_history()
688
678
        []
689
679
        """
690
 
        self._need_readlock()
691
 
        return [l.rstrip('\r\n') for l in self.controlfile('revision-history', 'r').readlines()]
692
 
 
693
 
 
694
 
    def enum_history(self, direction):
695
 
        """Return (revno, revision_id) for history of branch.
696
 
 
697
 
        direction
698
 
            'forward' is from earliest to latest
699
 
            'reverse' is from latest to earliest
700
 
        """
701
 
        rh = self.revision_history()
702
 
        if direction == 'forward':
703
 
            i = 1
704
 
            for rid in rh:
705
 
                yield i, rid
706
 
                i += 1
707
 
        elif direction == 'reverse':
708
 
            i = len(rh)
709
 
            while i > 0:
710
 
                yield i, rh[i-1]
711
 
                i -= 1
712
 
        else:
713
 
            raise BzrError('invalid history direction %r' % direction)
 
680
        self.lock_read()
 
681
        try:
 
682
            return [l.rstrip('\r\n') for l in
 
683
                    self.controlfile('revision-history', 'r').readlines()]
 
684
        finally:
 
685
            self.unlock()
 
686
 
 
687
 
 
688
    def common_ancestor(self, other, self_revno=None, other_revno=None):
 
689
        """
 
690
        >>> from bzrlib.commit import commit
 
691
        >>> sb = ScratchBranch(files=['foo', 'foo~'])
 
692
        >>> sb.common_ancestor(sb) == (None, None)
 
693
        True
 
694
        >>> commit(sb, "Committing first revision", verbose=False)
 
695
        >>> sb.common_ancestor(sb)[0]
 
696
        1
 
697
        >>> clone = sb.clone()
 
698
        >>> commit(sb, "Committing second revision", verbose=False)
 
699
        >>> sb.common_ancestor(sb)[0]
 
700
        2
 
701
        >>> sb.common_ancestor(clone)[0]
 
702
        1
 
703
        >>> commit(clone, "Committing divergent second revision", 
 
704
        ...               verbose=False)
 
705
        >>> sb.common_ancestor(clone)[0]
 
706
        1
 
707
        >>> sb.common_ancestor(clone) == clone.common_ancestor(sb)
 
708
        True
 
709
        >>> sb.common_ancestor(sb) != clone.common_ancestor(clone)
 
710
        True
 
711
        >>> clone2 = sb.clone()
 
712
        >>> sb.common_ancestor(clone2)[0]
 
713
        2
 
714
        >>> sb.common_ancestor(clone2, self_revno=1)[0]
 
715
        1
 
716
        >>> sb.common_ancestor(clone2, other_revno=1)[0]
 
717
        1
 
718
        """
 
719
        my_history = self.revision_history()
 
720
        other_history = other.revision_history()
 
721
        if self_revno is None:
 
722
            self_revno = len(my_history)
 
723
        if other_revno is None:
 
724
            other_revno = len(other_history)
 
725
        indices = range(min((self_revno, other_revno)))
 
726
        indices.reverse()
 
727
        for r in indices:
 
728
            if my_history[r] == other_history[r]:
 
729
                return r+1, my_history[r]
 
730
        return None, None
714
731
 
715
732
 
716
733
    def revno(self):
718
735
 
719
736
        That is equivalent to the number of revisions committed to
720
737
        this branch.
721
 
 
722
 
        >>> b = ScratchBranch()
723
 
        >>> b.revno()
724
 
        0
725
 
        >>> b.commit('no foo')
726
 
        >>> b.revno()
727
 
        1
728
738
        """
729
739
        return len(self.revision_history())
730
740
 
731
741
 
732
742
    def last_patch(self):
733
743
        """Return last patch hash, or None if no history.
734
 
 
735
 
        >>> ScratchBranch().last_patch() == None
736
 
        True
737
744
        """
738
745
        ph = self.revision_history()
739
746
        if ph:
740
747
            return ph[-1]
741
748
        else:
742
749
            return None
743
 
        
744
 
 
745
 
    def lookup_revision(self, revno):
746
 
        """Return revision hash for revision number."""
 
750
 
 
751
 
 
752
    def missing_revisions(self, other, stop_revision=None, diverged_ok=False):
 
753
        """
 
754
        If self and other have not diverged, return a list of the revisions
 
755
        present in other, but missing from self.
 
756
 
 
757
        >>> from bzrlib.commit import commit
 
758
        >>> bzrlib.trace.silent = True
 
759
        >>> br1 = ScratchBranch()
 
760
        >>> br2 = ScratchBranch()
 
761
        >>> br1.missing_revisions(br2)
 
762
        []
 
763
        >>> commit(br2, "lala!", rev_id="REVISION-ID-1")
 
764
        >>> br1.missing_revisions(br2)
 
765
        [u'REVISION-ID-1']
 
766
        >>> br2.missing_revisions(br1)
 
767
        []
 
768
        >>> commit(br1, "lala!", rev_id="REVISION-ID-1")
 
769
        >>> br1.missing_revisions(br2)
 
770
        []
 
771
        >>> commit(br2, "lala!", rev_id="REVISION-ID-2A")
 
772
        >>> br1.missing_revisions(br2)
 
773
        [u'REVISION-ID-2A']
 
774
        >>> commit(br1, "lala!", rev_id="REVISION-ID-2B")
 
775
        >>> br1.missing_revisions(br2)
 
776
        Traceback (most recent call last):
 
777
        DivergedBranches: These branches have diverged.
 
778
        """
 
779
        self_history = self.revision_history()
 
780
        self_len = len(self_history)
 
781
        other_history = other.revision_history()
 
782
        other_len = len(other_history)
 
783
        common_index = min(self_len, other_len) -1
 
784
        if common_index >= 0 and \
 
785
            self_history[common_index] != other_history[common_index]:
 
786
            raise DivergedBranches(self, other)
 
787
 
 
788
        if stop_revision is None:
 
789
            stop_revision = other_len
 
790
        elif stop_revision > other_len:
 
791
            raise bzrlib.errors.NoSuchRevision(self, stop_revision)
 
792
        
 
793
        return other_history[self_len:stop_revision]
 
794
 
 
795
 
 
796
    def update_revisions(self, other, stop_revision=None):
 
797
        """Pull in all new revisions from other branch.
 
798
        """
 
799
        from bzrlib.fetch import greedy_fetch
 
800
        from bzrlib.revision import get_intervening_revisions
 
801
 
 
802
        pb = bzrlib.ui.ui_factory.progress_bar()
 
803
        pb.update('comparing histories')
 
804
 
 
805
        try:
 
806
            revision_ids = self.missing_revisions(other, stop_revision)
 
807
        except DivergedBranches, e:
 
808
            try:
 
809
                if stop_revision is None:
 
810
                    end_revision = other.last_patch()
 
811
                revision_ids = get_intervening_revisions(self.last_patch(), 
 
812
                                                         end_revision, other)
 
813
                assert self.last_patch() not in revision_ids
 
814
            except bzrlib.errors.NotAncestor:
 
815
                raise e
 
816
 
 
817
        if len(revision_ids) > 0:
 
818
            count = greedy_fetch(self, other, revision_ids[-1], pb)[0]
 
819
        else:
 
820
            count = 0
 
821
        self.append_revision(*revision_ids)
 
822
        ## note("Added %d revisions." % count)
 
823
        pb.clear()
 
824
 
 
825
    def install_revisions(self, other, revision_ids, pb):
 
826
        if hasattr(other.revision_store, "prefetch"):
 
827
            other.revision_store.prefetch(revision_ids)
 
828
        if hasattr(other.inventory_store, "prefetch"):
 
829
            inventory_ids = [other.get_revision(r).inventory_id
 
830
                             for r in revision_ids]
 
831
            other.inventory_store.prefetch(inventory_ids)
 
832
 
 
833
        if pb is None:
 
834
            pb = bzrlib.ui.ui_factory.progress_bar()
 
835
                
 
836
        revisions = []
 
837
        needed_texts = set()
 
838
        i = 0
 
839
 
 
840
        failures = set()
 
841
        for i, rev_id in enumerate(revision_ids):
 
842
            pb.update('fetching revision', i+1, len(revision_ids))
 
843
            try:
 
844
                rev = other.get_revision(rev_id)
 
845
            except bzrlib.errors.NoSuchRevision:
 
846
                failures.add(rev_id)
 
847
                continue
 
848
 
 
849
            revisions.append(rev)
 
850
            inv = other.get_inventory(str(rev.inventory_id))
 
851
            for key, entry in inv.iter_entries():
 
852
                if entry.text_id is None:
 
853
                    continue
 
854
                if entry.text_id not in self.text_store:
 
855
                    needed_texts.add(entry.text_id)
 
856
 
 
857
        pb.clear()
 
858
                    
 
859
        count, cp_fail = self.text_store.copy_multi(other.text_store, 
 
860
                                                    needed_texts)
 
861
        #print "Added %d texts." % count 
 
862
        inventory_ids = [ f.inventory_id for f in revisions ]
 
863
        count, cp_fail = self.inventory_store.copy_multi(other.inventory_store, 
 
864
                                                         inventory_ids)
 
865
        #print "Added %d inventories." % count 
 
866
        revision_ids = [ f.revision_id for f in revisions]
 
867
 
 
868
        count, cp_fail = self.revision_store.copy_multi(other.revision_store, 
 
869
                                                          revision_ids,
 
870
                                                          permit_failure=True)
 
871
        assert len(cp_fail) == 0 
 
872
        return count, failures
 
873
       
 
874
 
 
875
    def commit(self, *args, **kw):
 
876
        from bzrlib.commit import commit
 
877
        commit(self, *args, **kw)
 
878
        
 
879
 
 
880
    def lookup_revision(self, revision):
 
881
        """Return the revision identifier for a given revision information."""
 
882
        revno, info = self._get_revision_info(revision)
 
883
        return info
 
884
 
 
885
 
 
886
    def revision_id_to_revno(self, revision_id):
 
887
        """Given a revision id, return its revno"""
 
888
        history = self.revision_history()
 
889
        try:
 
890
            return history.index(revision_id) + 1
 
891
        except ValueError:
 
892
            raise bzrlib.errors.NoSuchRevision(self, revision_id)
 
893
 
 
894
 
 
895
    def get_revision_info(self, revision):
 
896
        """Return (revno, revision id) for revision identifier.
 
897
 
 
898
        revision can be an integer, in which case it is assumed to be revno (though
 
899
            this will translate negative values into positive ones)
 
900
        revision can also be a string, in which case it is parsed for something like
 
901
            'date:' or 'revid:' etc.
 
902
        """
 
903
        revno, rev_id = self._get_revision_info(revision)
 
904
        if revno is None:
 
905
            raise bzrlib.errors.NoSuchRevision(self, revision)
 
906
        return revno, rev_id
 
907
 
 
908
    def get_rev_id(self, revno, history=None):
 
909
        """Find the revision id of the specified revno."""
747
910
        if revno == 0:
748
911
            return None
749
 
 
750
 
        try:
751
 
            # list is 0-based; revisions are 1-based
752
 
            return self.revision_history()[revno-1]
753
 
        except IndexError:
754
 
            raise BzrError("no such revision %s" % revno)
755
 
 
 
912
        if history is None:
 
913
            history = self.revision_history()
 
914
        elif revno <= 0 or revno > len(history):
 
915
            raise bzrlib.errors.NoSuchRevision(self, revno)
 
916
        return history[revno - 1]
 
917
 
 
918
    def _get_revision_info(self, revision):
 
919
        """Return (revno, revision id) for revision specifier.
 
920
 
 
921
        revision can be an integer, in which case it is assumed to be revno
 
922
        (though this will translate negative values into positive ones)
 
923
        revision can also be a string, in which case it is parsed for something
 
924
        like 'date:' or 'revid:' etc.
 
925
 
 
926
        A revid is always returned.  If it is None, the specifier referred to
 
927
        the null revision.  If the revid does not occur in the revision
 
928
        history, revno will be None.
 
929
        """
 
930
        
 
931
        if revision is None:
 
932
            return 0, None
 
933
        revno = None
 
934
        try:# Convert to int if possible
 
935
            revision = int(revision)
 
936
        except ValueError:
 
937
            pass
 
938
        revs = self.revision_history()
 
939
        if isinstance(revision, int):
 
940
            if revision < 0:
 
941
                revno = len(revs) + revision + 1
 
942
            else:
 
943
                revno = revision
 
944
            rev_id = self.get_rev_id(revno, revs)
 
945
        elif isinstance(revision, basestring):
 
946
            for prefix, func in Branch.REVISION_NAMESPACES.iteritems():
 
947
                if revision.startswith(prefix):
 
948
                    result = func(self, revs, revision)
 
949
                    if len(result) > 1:
 
950
                        revno, rev_id = result
 
951
                    else:
 
952
                        revno = result[0]
 
953
                        rev_id = self.get_rev_id(revno, revs)
 
954
                    break
 
955
            else:
 
956
                raise BzrError('No namespace registered for string: %r' %
 
957
                               revision)
 
958
        else:
 
959
            raise TypeError('Unhandled revision type %s' % revision)
 
960
 
 
961
        if revno is None:
 
962
            if rev_id is None:
 
963
                raise bzrlib.errors.NoSuchRevision(self, revision)
 
964
        return revno, rev_id
 
965
 
 
966
    def _namespace_revno(self, revs, revision):
 
967
        """Lookup a revision by revision number"""
 
968
        assert revision.startswith('revno:')
 
969
        try:
 
970
            return (int(revision[6:]),)
 
971
        except ValueError:
 
972
            return None
 
973
    REVISION_NAMESPACES['revno:'] = _namespace_revno
 
974
 
 
975
    def _namespace_revid(self, revs, revision):
 
976
        assert revision.startswith('revid:')
 
977
        rev_id = revision[len('revid:'):]
 
978
        try:
 
979
            return revs.index(rev_id) + 1, rev_id
 
980
        except ValueError:
 
981
            return None, rev_id
 
982
    REVISION_NAMESPACES['revid:'] = _namespace_revid
 
983
 
 
984
    def _namespace_last(self, revs, revision):
 
985
        assert revision.startswith('last:')
 
986
        try:
 
987
            offset = int(revision[5:])
 
988
        except ValueError:
 
989
            return (None,)
 
990
        else:
 
991
            if offset <= 0:
 
992
                raise BzrError('You must supply a positive value for --revision last:XXX')
 
993
            return (len(revs) - offset + 1,)
 
994
    REVISION_NAMESPACES['last:'] = _namespace_last
 
995
 
 
996
    def _namespace_tag(self, revs, revision):
 
997
        assert revision.startswith('tag:')
 
998
        raise BzrError('tag: namespace registered, but not implemented.')
 
999
    REVISION_NAMESPACES['tag:'] = _namespace_tag
 
1000
 
 
1001
    def _namespace_date(self, revs, revision):
 
1002
        assert revision.startswith('date:')
 
1003
        import datetime
 
1004
        # Spec for date revisions:
 
1005
        #   date:value
 
1006
        #   value can be 'yesterday', 'today', 'tomorrow' or a YYYY-MM-DD string.
 
1007
        #   it can also start with a '+/-/='. '+' says match the first
 
1008
        #   entry after the given date. '-' is match the first entry before the date
 
1009
        #   '=' is match the first entry after, but still on the given date.
 
1010
        #
 
1011
        #   +2005-05-12 says find the first matching entry after May 12th, 2005 at 0:00
 
1012
        #   -2005-05-12 says find the first matching entry before May 12th, 2005 at 0:00
 
1013
        #   =2005-05-12 says find the first match after May 12th, 2005 at 0:00 but before
 
1014
        #       May 13th, 2005 at 0:00
 
1015
        #
 
1016
        #   So the proper way of saying 'give me all entries for today' is:
 
1017
        #       -r {date:+today}:{date:-tomorrow}
 
1018
        #   The default is '=' when not supplied
 
1019
        val = revision[5:]
 
1020
        match_style = '='
 
1021
        if val[:1] in ('+', '-', '='):
 
1022
            match_style = val[:1]
 
1023
            val = val[1:]
 
1024
 
 
1025
        today = datetime.datetime.today().replace(hour=0,minute=0,second=0,microsecond=0)
 
1026
        if val.lower() == 'yesterday':
 
1027
            dt = today - datetime.timedelta(days=1)
 
1028
        elif val.lower() == 'today':
 
1029
            dt = today
 
1030
        elif val.lower() == 'tomorrow':
 
1031
            dt = today + datetime.timedelta(days=1)
 
1032
        else:
 
1033
            import re
 
1034
            # This should be done outside the function to avoid recompiling it.
 
1035
            _date_re = re.compile(
 
1036
                    r'(?P<date>(?P<year>\d\d\d\d)-(?P<month>\d\d)-(?P<day>\d\d))?'
 
1037
                    r'(,|T)?\s*'
 
1038
                    r'(?P<time>(?P<hour>\d\d):(?P<minute>\d\d)(:(?P<second>\d\d))?)?'
 
1039
                )
 
1040
            m = _date_re.match(val)
 
1041
            if not m or (not m.group('date') and not m.group('time')):
 
1042
                raise BzrError('Invalid revision date %r' % revision)
 
1043
 
 
1044
            if m.group('date'):
 
1045
                year, month, day = int(m.group('year')), int(m.group('month')), int(m.group('day'))
 
1046
            else:
 
1047
                year, month, day = today.year, today.month, today.day
 
1048
            if m.group('time'):
 
1049
                hour = int(m.group('hour'))
 
1050
                minute = int(m.group('minute'))
 
1051
                if m.group('second'):
 
1052
                    second = int(m.group('second'))
 
1053
                else:
 
1054
                    second = 0
 
1055
            else:
 
1056
                hour, minute, second = 0,0,0
 
1057
 
 
1058
            dt = datetime.datetime(year=year, month=month, day=day,
 
1059
                    hour=hour, minute=minute, second=second)
 
1060
        first = dt
 
1061
        last = None
 
1062
        reversed = False
 
1063
        if match_style == '-':
 
1064
            reversed = True
 
1065
        elif match_style == '=':
 
1066
            last = dt + datetime.timedelta(days=1)
 
1067
 
 
1068
        if reversed:
 
1069
            for i in range(len(revs)-1, -1, -1):
 
1070
                r = self.get_revision(revs[i])
 
1071
                # TODO: Handle timezone.
 
1072
                dt = datetime.datetime.fromtimestamp(r.timestamp)
 
1073
                if first >= dt and (last is None or dt >= last):
 
1074
                    return (i+1,)
 
1075
        else:
 
1076
            for i in range(len(revs)):
 
1077
                r = self.get_revision(revs[i])
 
1078
                # TODO: Handle timezone.
 
1079
                dt = datetime.datetime.fromtimestamp(r.timestamp)
 
1080
                if first <= dt and (last is None or dt <= last):
 
1081
                    return (i+1,)
 
1082
    REVISION_NAMESPACES['date:'] = _namespace_date
756
1083
 
757
1084
    def revision_tree(self, revision_id):
758
1085
        """Return Tree for a revision on this branch.
759
1086
 
760
1087
        `revision_id` may be None for the null revision, in which case
761
1088
        an `EmptyTree` is returned."""
762
 
        self._need_readlock()
 
1089
        # TODO: refactor this to use an existing revision object
 
1090
        # so we don't need to read it in twice.
763
1091
        if revision_id == None:
764
1092
            return EmptyTree()
765
1093
        else:
769
1097
 
770
1098
    def working_tree(self):
771
1099
        """Return a `Tree` for the working copy."""
 
1100
        from bzrlib.workingtree import WorkingTree
772
1101
        return WorkingTree(self.base, self.read_working_inventory())
773
1102
 
774
1103
 
776
1105
        """Return `Tree` object for last revision.
777
1106
 
778
1107
        If there are no revisions yet, return an `EmptyTree`.
779
 
 
780
 
        >>> b = ScratchBranch(files=['foo'])
781
 
        >>> b.basis_tree().has_filename('foo')
782
 
        False
783
 
        >>> b.working_tree().has_filename('foo')
784
 
        True
785
 
        >>> b.add('foo')
786
 
        >>> b.commit('add foo')
787
 
        >>> b.basis_tree().has_filename('foo')
788
 
        True
789
1108
        """
790
1109
        r = self.last_patch()
791
1110
        if r == None:
800
1119
 
801
1120
        This can change the directory or the filename or both.
802
1121
        """
803
 
        self._need_writelock()
804
 
        tree = self.working_tree()
805
 
        inv = tree.inventory
806
 
        if not tree.has_filename(from_rel):
807
 
            bailout("can't rename: old working file %r does not exist" % from_rel)
808
 
        if tree.has_filename(to_rel):
809
 
            bailout("can't rename: new working file %r already exists" % to_rel)
810
 
            
811
 
        file_id = inv.path2id(from_rel)
812
 
        if file_id == None:
813
 
            bailout("can't rename: old name %r is not versioned" % from_rel)
814
 
 
815
 
        if inv.path2id(to_rel):
816
 
            bailout("can't rename: new name %r is already versioned" % to_rel)
817
 
 
818
 
        to_dir, to_tail = os.path.split(to_rel)
819
 
        to_dir_id = inv.path2id(to_dir)
820
 
        if to_dir_id == None and to_dir != '':
821
 
            bailout("can't determine destination directory id for %r" % to_dir)
822
 
 
823
 
        mutter("rename_one:")
824
 
        mutter("  file_id    {%s}" % file_id)
825
 
        mutter("  from_rel   %r" % from_rel)
826
 
        mutter("  to_rel     %r" % to_rel)
827
 
        mutter("  to_dir     %r" % to_dir)
828
 
        mutter("  to_dir_id  {%s}" % to_dir_id)
829
 
            
830
 
        inv.rename(file_id, to_dir_id, to_tail)
831
 
 
832
 
        print "%s => %s" % (from_rel, to_rel)
833
 
        
834
 
        from_abs = self.abspath(from_rel)
835
 
        to_abs = self.abspath(to_rel)
 
1122
        self.lock_write()
836
1123
        try:
837
 
            os.rename(from_abs, to_abs)
838
 
        except OSError, e:
839
 
            bailout("failed to rename %r to %r: %s"
840
 
                    % (from_abs, to_abs, e[1]),
841
 
                    ["rename rolled back"])
842
 
 
843
 
        self._write_inventory(inv)
844
 
            
 
1124
            tree = self.working_tree()
 
1125
            inv = tree.inventory
 
1126
            if not tree.has_filename(from_rel):
 
1127
                raise BzrError("can't rename: old working file %r does not exist" % from_rel)
 
1128
            if tree.has_filename(to_rel):
 
1129
                raise BzrError("can't rename: new working file %r already exists" % to_rel)
 
1130
 
 
1131
            file_id = inv.path2id(from_rel)
 
1132
            if file_id == None:
 
1133
                raise BzrError("can't rename: old name %r is not versioned" % from_rel)
 
1134
 
 
1135
            if inv.path2id(to_rel):
 
1136
                raise BzrError("can't rename: new name %r is already versioned" % to_rel)
 
1137
 
 
1138
            to_dir, to_tail = os.path.split(to_rel)
 
1139
            to_dir_id = inv.path2id(to_dir)
 
1140
            if to_dir_id == None and to_dir != '':
 
1141
                raise BzrError("can't determine destination directory id for %r" % to_dir)
 
1142
 
 
1143
            mutter("rename_one:")
 
1144
            mutter("  file_id    {%s}" % file_id)
 
1145
            mutter("  from_rel   %r" % from_rel)
 
1146
            mutter("  to_rel     %r" % to_rel)
 
1147
            mutter("  to_dir     %r" % to_dir)
 
1148
            mutter("  to_dir_id  {%s}" % to_dir_id)
 
1149
 
 
1150
            inv.rename(file_id, to_dir_id, to_tail)
 
1151
 
 
1152
            from_abs = self.abspath(from_rel)
 
1153
            to_abs = self.abspath(to_rel)
 
1154
            try:
 
1155
                os.rename(from_abs, to_abs)
 
1156
            except OSError, e:
 
1157
                raise BzrError("failed to rename %r to %r: %s"
 
1158
                        % (from_abs, to_abs, e[1]),
 
1159
                        ["rename rolled back"])
 
1160
 
 
1161
            self._write_inventory(inv)
 
1162
        finally:
 
1163
            self.unlock()
845
1164
 
846
1165
 
847
1166
    def move(self, from_paths, to_name):
854
1173
 
855
1174
        Note that to_name is only the last component of the new name;
856
1175
        this doesn't change the directory.
857
 
        """
858
 
        self._need_writelock()
859
 
        ## TODO: Option to move IDs only
860
 
        assert not isinstance(from_paths, basestring)
861
 
        tree = self.working_tree()
862
 
        inv = tree.inventory
863
 
        to_abs = self.abspath(to_name)
864
 
        if not isdir(to_abs):
865
 
            bailout("destination %r is not a directory" % to_abs)
866
 
        if not tree.has_filename(to_name):
867
 
            bailout("destination %r not in working directory" % to_abs)
868
 
        to_dir_id = inv.path2id(to_name)
869
 
        if to_dir_id == None and to_name != '':
870
 
            bailout("destination %r is not a versioned directory" % to_name)
871
 
        to_dir_ie = inv[to_dir_id]
872
 
        if to_dir_ie.kind not in ('directory', 'root_directory'):
873
 
            bailout("destination %r is not a directory" % to_abs)
874
 
 
875
 
        to_idpath = Set(inv.get_idpath(to_dir_id))
876
 
 
877
 
        for f in from_paths:
878
 
            if not tree.has_filename(f):
879
 
                bailout("%r does not exist in working tree" % f)
880
 
            f_id = inv.path2id(f)
881
 
            if f_id == None:
882
 
                bailout("%r is not versioned" % f)
883
 
            name_tail = splitpath(f)[-1]
884
 
            dest_path = appendpath(to_name, name_tail)
885
 
            if tree.has_filename(dest_path):
886
 
                bailout("destination %r already exists" % dest_path)
887
 
            if f_id in to_idpath:
888
 
                bailout("can't move %r to a subdirectory of itself" % f)
889
 
 
890
 
        # OK, so there's a race here, it's possible that someone will
891
 
        # create a file in this interval and then the rename might be
892
 
        # left half-done.  But we should have caught most problems.
893
 
 
894
 
        for f in from_paths:
895
 
            name_tail = splitpath(f)[-1]
896
 
            dest_path = appendpath(to_name, name_tail)
897
 
            print "%s => %s" % (f, dest_path)
898
 
            inv.rename(inv.path2id(f), to_dir_id, name_tail)
899
 
            try:
900
 
                os.rename(self.abspath(f), self.abspath(dest_path))
901
 
            except OSError, e:
902
 
                bailout("failed to rename %r to %r: %s" % (f, dest_path, e[1]),
903
 
                        ["rename rolled back"])
904
 
 
905
 
        self._write_inventory(inv)
906
 
 
907
 
 
908
 
 
909
 
    def show_status(self, show_all=False):
910
 
        """Display single-line status for non-ignored working files.
911
 
 
912
 
        The list is show sorted in order by file name.
913
 
 
914
 
        >>> b = ScratchBranch(files=['foo', 'foo~'])
915
 
        >>> b.show_status()
916
 
        ?       foo
917
 
        >>> b.add('foo')
918
 
        >>> b.show_status()
919
 
        A       foo
920
 
        >>> b.commit("add foo")
921
 
        >>> b.show_status()
922
 
        >>> os.unlink(b.abspath('foo'))
923
 
        >>> b.show_status()
924
 
        D       foo
925
 
        
926
 
        TODO: Get state for single files.
927
 
        """
928
 
        self._need_readlock()
929
 
 
930
 
        # We have to build everything into a list first so that it can
931
 
        # sorted by name, incorporating all the different sources.
932
 
 
933
 
        # FIXME: Rather than getting things in random order and then sorting,
934
 
        # just step through in order.
935
 
 
936
 
        # Interesting case: the old ID for a file has been removed,
937
 
        # but a new file has been created under that name.
938
 
 
939
 
        old = self.basis_tree()
940
 
        new = self.working_tree()
941
 
 
942
 
        for fs, fid, oldname, newname, kind in diff_trees(old, new):
943
 
            if fs == 'R':
944
 
                show_status(fs, kind,
945
 
                            oldname + ' => ' + newname)
946
 
            elif fs == 'A' or fs == 'M':
947
 
                show_status(fs, kind, newname)
948
 
            elif fs == 'D':
949
 
                show_status(fs, kind, oldname)
950
 
            elif fs == '.':
951
 
                if show_all:
952
 
                    show_status(fs, kind, newname)
953
 
            elif fs == 'I':
954
 
                if show_all:
955
 
                    show_status(fs, kind, newname)
956
 
            elif fs == '?':
957
 
                show_status(fs, kind, newname)
958
 
            else:
959
 
                bailout("weird file state %r" % ((fs, fid),))
960
 
                
 
1176
 
 
1177
        This returns a list of (from_path, to_path) pairs for each
 
1178
        entry that is moved.
 
1179
        """
 
1180
        result = []
 
1181
        self.lock_write()
 
1182
        try:
 
1183
            ## TODO: Option to move IDs only
 
1184
            assert not isinstance(from_paths, basestring)
 
1185
            tree = self.working_tree()
 
1186
            inv = tree.inventory
 
1187
            to_abs = self.abspath(to_name)
 
1188
            if not isdir(to_abs):
 
1189
                raise BzrError("destination %r is not a directory" % to_abs)
 
1190
            if not tree.has_filename(to_name):
 
1191
                raise BzrError("destination %r not in working directory" % to_abs)
 
1192
            to_dir_id = inv.path2id(to_name)
 
1193
            if to_dir_id == None and to_name != '':
 
1194
                raise BzrError("destination %r is not a versioned directory" % to_name)
 
1195
            to_dir_ie = inv[to_dir_id]
 
1196
            if to_dir_ie.kind not in ('directory', 'root_directory'):
 
1197
                raise BzrError("destination %r is not a directory" % to_abs)
 
1198
 
 
1199
            to_idpath = inv.get_idpath(to_dir_id)
 
1200
 
 
1201
            for f in from_paths:
 
1202
                if not tree.has_filename(f):
 
1203
                    raise BzrError("%r does not exist in working tree" % f)
 
1204
                f_id = inv.path2id(f)
 
1205
                if f_id == None:
 
1206
                    raise BzrError("%r is not versioned" % f)
 
1207
                name_tail = splitpath(f)[-1]
 
1208
                dest_path = appendpath(to_name, name_tail)
 
1209
                if tree.has_filename(dest_path):
 
1210
                    raise BzrError("destination %r already exists" % dest_path)
 
1211
                if f_id in to_idpath:
 
1212
                    raise BzrError("can't move %r to a subdirectory of itself" % f)
 
1213
 
 
1214
            # OK, so there's a race here, it's possible that someone will
 
1215
            # create a file in this interval and then the rename might be
 
1216
            # left half-done.  But we should have caught most problems.
 
1217
 
 
1218
            for f in from_paths:
 
1219
                name_tail = splitpath(f)[-1]
 
1220
                dest_path = appendpath(to_name, name_tail)
 
1221
                result.append((f, dest_path))
 
1222
                inv.rename(inv.path2id(f), to_dir_id, name_tail)
 
1223
                try:
 
1224
                    os.rename(self.abspath(f), self.abspath(dest_path))
 
1225
                except OSError, e:
 
1226
                    raise BzrError("failed to rename %r to %r: %s" % (f, dest_path, e[1]),
 
1227
                            ["rename rolled back"])
 
1228
 
 
1229
            self._write_inventory(inv)
 
1230
        finally:
 
1231
            self.unlock()
 
1232
 
 
1233
        return result
 
1234
 
 
1235
 
 
1236
    def revert(self, filenames, old_tree=None, backups=True):
 
1237
        """Restore selected files to the versions from a previous tree.
 
1238
 
 
1239
        backups
 
1240
            If true (default) backups are made of files before
 
1241
            they're renamed.
 
1242
        """
 
1243
        from bzrlib.errors import NotVersionedError, BzrError
 
1244
        from bzrlib.atomicfile import AtomicFile
 
1245
        from bzrlib.osutils import backup_file
 
1246
        
 
1247
        inv = self.read_working_inventory()
 
1248
        if old_tree is None:
 
1249
            old_tree = self.basis_tree()
 
1250
        old_inv = old_tree.inventory
 
1251
 
 
1252
        nids = []
 
1253
        for fn in filenames:
 
1254
            file_id = inv.path2id(fn)
 
1255
            if not file_id:
 
1256
                raise NotVersionedError("not a versioned file", fn)
 
1257
            if not old_inv.has_id(file_id):
 
1258
                raise BzrError("file not present in old tree", fn, file_id)
 
1259
            nids.append((fn, file_id))
 
1260
            
 
1261
        # TODO: Rename back if it was previously at a different location
 
1262
 
 
1263
        # TODO: If given a directory, restore the entire contents from
 
1264
        # the previous version.
 
1265
 
 
1266
        # TODO: Make a backup to a temporary file.
 
1267
 
 
1268
        # TODO: If the file previously didn't exist, delete it?
 
1269
        for fn, file_id in nids:
 
1270
            backup_file(fn)
 
1271
            
 
1272
            f = AtomicFile(fn, 'wb')
 
1273
            try:
 
1274
                f.write(old_tree.get_file(file_id).read())
 
1275
                f.commit()
 
1276
            finally:
 
1277
                f.close()
 
1278
 
 
1279
 
 
1280
    def pending_merges(self):
 
1281
        """Return a list of pending merges.
 
1282
 
 
1283
        These are revisions that have been merged into the working
 
1284
        directory but not yet committed.
 
1285
        """
 
1286
        cfn = self.controlfilename('pending-merges')
 
1287
        if not os.path.exists(cfn):
 
1288
            return []
 
1289
        p = []
 
1290
        for l in self.controlfile('pending-merges', 'r').readlines():
 
1291
            p.append(l.rstrip('\n'))
 
1292
        return p
 
1293
 
 
1294
 
 
1295
    def add_pending_merge(self, revision_id):
 
1296
        from bzrlib.revision import validate_revision_id
 
1297
 
 
1298
        validate_revision_id(revision_id)
 
1299
 
 
1300
        p = self.pending_merges()
 
1301
        if revision_id in p:
 
1302
            return
 
1303
        p.append(revision_id)
 
1304
        self.set_pending_merges(p)
 
1305
 
 
1306
 
 
1307
    def set_pending_merges(self, rev_list):
 
1308
        from bzrlib.atomicfile import AtomicFile
 
1309
        self.lock_write()
 
1310
        try:
 
1311
            f = AtomicFile(self.controlfilename('pending-merges'))
 
1312
            try:
 
1313
                for l in rev_list:
 
1314
                    print >>f, l
 
1315
                f.commit()
 
1316
            finally:
 
1317
                f.close()
 
1318
        finally:
 
1319
            self.unlock()
 
1320
 
 
1321
 
 
1322
    def get_parent(self):
 
1323
        """Return the parent location of the branch.
 
1324
 
 
1325
        This is the default location for push/pull/missing.  The usual
 
1326
        pattern is that the user can override it by specifying a
 
1327
        location.
 
1328
        """
 
1329
        import errno
 
1330
        _locs = ['parent', 'pull', 'x-pull']
 
1331
        for l in _locs:
 
1332
            try:
 
1333
                return self.controlfile(l, 'r').read().strip('\n')
 
1334
            except IOError, e:
 
1335
                if e.errno != errno.ENOENT:
 
1336
                    raise
 
1337
        return None
 
1338
 
 
1339
 
 
1340
    def set_parent(self, url):
 
1341
        # TODO: Maybe delete old location files?
 
1342
        from bzrlib.atomicfile import AtomicFile
 
1343
        self.lock_write()
 
1344
        try:
 
1345
            f = AtomicFile(self.controlfilename('parent'))
 
1346
            try:
 
1347
                f.write(url + '\n')
 
1348
                f.commit()
 
1349
            finally:
 
1350
                f.close()
 
1351
        finally:
 
1352
            self.unlock()
 
1353
 
 
1354
    def check_revno(self, revno):
 
1355
        """\
 
1356
        Check whether a revno corresponds to any revision.
 
1357
        Zero (the NULL revision) is considered valid.
 
1358
        """
 
1359
        if revno != 0:
 
1360
            self.check_real_revno(revno)
 
1361
            
 
1362
    def check_real_revno(self, revno):
 
1363
        """\
 
1364
        Check whether a revno corresponds to a real revision.
 
1365
        Zero (the NULL revision) is considered invalid
 
1366
        """
 
1367
        if revno < 1 or revno > self.revno():
 
1368
            raise InvalidRevisionNumber(revno)
 
1369
        
 
1370
        
961
1371
 
962
1372
 
963
1373
class ScratchBranch(Branch):
971
1381
    >>> isdir(bd)
972
1382
    False
973
1383
    """
974
 
    def __init__(self, files=[], dirs=[]):
 
1384
    def __init__(self, files=[], dirs=[], base=None):
975
1385
        """Make a test branch.
976
1386
 
977
1387
        This creates a temporary directory and runs init-tree in it.
978
1388
 
979
1389
        If any files are listed, they are created in the working copy.
980
1390
        """
981
 
        Branch.__init__(self, tempfile.mkdtemp(), init=True)
 
1391
        from tempfile import mkdtemp
 
1392
        init = False
 
1393
        if base is None:
 
1394
            base = mkdtemp()
 
1395
            init = True
 
1396
        Branch.__init__(self, base, init=init)
982
1397
        for d in dirs:
983
1398
            os.mkdir(self.abspath(d))
984
1399
            
986
1401
            file(os.path.join(self.base, f), 'w').write('content of %s' % f)
987
1402
 
988
1403
 
 
1404
    def clone(self):
 
1405
        """
 
1406
        >>> orig = ScratchBranch(files=["file1", "file2"])
 
1407
        >>> clone = orig.clone()
 
1408
        >>> os.path.samefile(orig.base, clone.base)
 
1409
        False
 
1410
        >>> os.path.isfile(os.path.join(clone.base, "file1"))
 
1411
        True
 
1412
        """
 
1413
        from shutil import copytree
 
1414
        from tempfile import mkdtemp
 
1415
        base = mkdtemp()
 
1416
        os.rmdir(base)
 
1417
        copytree(self.base, base, symlinks=True)
 
1418
        return ScratchBranch(base=base)
 
1419
 
 
1420
 
 
1421
        
989
1422
    def __del__(self):
990
1423
        self.destroy()
991
1424
 
992
1425
    def destroy(self):
993
1426
        """Destroy the test branch, removing the scratch directory."""
 
1427
        from shutil import rmtree
994
1428
        try:
995
 
            mutter("delete ScratchBranch %s" % self.base)
996
 
            shutil.rmtree(self.base)
 
1429
            if self.base:
 
1430
                mutter("delete ScratchBranch %s" % self.base)
 
1431
                rmtree(self.base)
997
1432
        except OSError, e:
998
1433
            # Work around for shutil.rmtree failing on Windows when
999
1434
            # readonly files are encountered
1001
1436
            for root, dirs, files in os.walk(self.base, topdown=False):
1002
1437
                for name in files:
1003
1438
                    os.chmod(os.path.join(root, name), 0700)
1004
 
            shutil.rmtree(self.base)
 
1439
            rmtree(self.base)
1005
1440
        self.base = None
1006
1441
 
1007
1442
    
1025
1460
 
1026
1461
 
1027
1462
 
1028
 
def _gen_revision_id(when):
1029
 
    """Return new revision-id."""
1030
 
    s = '%s-%s-' % (user_email(), compact_date(when))
1031
 
    s += hexlify(rand_bytes(8))
1032
 
    return s
1033
 
 
1034
 
 
1035
1463
def gen_file_id(name):
1036
1464
    """Return new file id.
1037
1465
 
1038
1466
    This should probably generate proper UUIDs, but for the moment we
1039
1467
    cope with just randomness because running uuidgen every time is
1040
1468
    slow."""
 
1469
    import re
 
1470
    from binascii import hexlify
 
1471
    from time import time
 
1472
 
 
1473
    # get last component
1041
1474
    idx = name.rfind('/')
1042
1475
    if idx != -1:
1043
1476
        name = name[idx+1 : ]
1045
1478
    if idx != -1:
1046
1479
        name = name[idx+1 : ]
1047
1480
 
 
1481
    # make it not a hidden file
1048
1482
    name = name.lstrip('.')
1049
1483
 
 
1484
    # remove any wierd characters; we don't escape them but rather
 
1485
    # just pull them out
 
1486
    name = re.sub(r'[^\w.]', '', name)
 
1487
 
1050
1488
    s = hexlify(rand_bytes(8))
1051
 
    return '-'.join((name, compact_date(time.time()), s))
 
1489
    return '-'.join((name, compact_date(time()), s))
 
1490
 
 
1491
 
 
1492
def gen_root_id():
 
1493
    """Return a new tree-root file id."""
 
1494
    return gen_file_id('TREE_ROOT')
 
1495
 
 
1496
 
 
1497
def copy_branch(branch_from, to_location, revision=None):
 
1498
    """Copy branch_from into the existing directory to_location.
 
1499
 
 
1500
    revision
 
1501
        If not None, only revisions up to this point will be copied.
 
1502
        The head of the new branch will be that revision.
 
1503
 
 
1504
    to_location
 
1505
        The name of a local directory that exists but is empty.
 
1506
    """
 
1507
    from bzrlib.merge import merge
 
1508
 
 
1509
    assert isinstance(branch_from, Branch)
 
1510
    assert isinstance(to_location, basestring)
 
1511
    
 
1512
    br_to = Branch(to_location, init=True)
 
1513
    br_to.set_root_id(branch_from.get_root_id())
 
1514
    if revision is None:
 
1515
        revno = branch_from.revno()
 
1516
    else:
 
1517
        revno, rev_id = branch_from.get_revision_info(revision)
 
1518
    br_to.update_revisions(branch_from, stop_revision=revno)
 
1519
    merge((to_location, -1), (to_location, 0), this_dir=to_location,
 
1520
          check_clean=False, ignore_zero=True)
 
1521
    
 
1522
    br_to.set_parent(branch_from.base)