~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/branch.py

  • Committer: mbp at sourcefrog
  • Date: 2005-03-09 06:49:00 UTC
  • Revision ID: mbp@sourcefrog.net-20050309064900-74935ffb7350b24b
import more files from baz

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2005 Canonical Ltd
 
1
#! /usr/bin/env python
 
2
# -*- coding: UTF-8 -*-
2
3
 
3
4
# This program is free software; you can redistribute it and/or modify
4
5
# it under the terms of the GNU General Public License as published by
15
16
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
17
 
17
18
 
18
 
import sys
19
 
import os
20
 
import errno
21
 
from warnings import warn
22
 
from cStringIO import StringIO
 
19
from sets import Set
23
20
 
 
21
import sys, os, os.path, random, time, sha, sets, types, re, shutil, tempfile
 
22
import traceback, socket, fnmatch, difflib, time
 
23
from binascii import hexlify
24
24
 
25
25
import bzrlib
26
 
from bzrlib.inventory import InventoryEntry
27
 
import bzrlib.inventory as inventory
28
 
from bzrlib.trace import mutter, note
29
 
from bzrlib.osutils import (isdir, quotefn, compact_date, rand_bytes, 
30
 
                            rename, splitpath, sha_file, appendpath, 
31
 
                            file_kind)
32
 
from bzrlib.errors import (BzrError, InvalidRevisionNumber, InvalidRevisionId,
33
 
                           NoSuchRevision, HistoryMissing, NotBranchError,
34
 
                           DivergedBranches, LockError, UnlistableStore,
35
 
                           UnlistableBranch, NoSuchFile)
36
 
from bzrlib.textui import show_status
37
 
from bzrlib.revision import Revision
38
 
from bzrlib.delta import compare_trees
39
 
from bzrlib.tree import EmptyTree, RevisionTree
40
 
from bzrlib.inventory import Inventory
41
 
from bzrlib.store import copy_all
42
 
from bzrlib.store.compressed_text import CompressedTextStore
43
 
from bzrlib.store.text import TextStore
44
 
from bzrlib.store.weave import WeaveStore
45
 
from bzrlib.transport import Transport, get_transport
46
 
import bzrlib.xml5
47
 
import bzrlib.ui
48
 
 
49
 
 
50
 
BZR_BRANCH_FORMAT_4 = "Bazaar-NG branch, format 0.0.4\n"
51
 
BZR_BRANCH_FORMAT_5 = "Bazaar-NG branch, format 5\n"
 
26
from inventory import Inventory
 
27
from trace import mutter, note
 
28
from tree import Tree, EmptyTree, RevisionTree, WorkingTree
 
29
from inventory import InventoryEntry, Inventory
 
30
from osutils import isdir, quotefn, isfile, uuid, sha_file, username, chomp, \
 
31
     format_date, compact_date, pumpfile, user_email, rand_bytes, splitpath, \
 
32
     joinpath, sha_string, file_kind, local_time_offset
 
33
from store import ImmutableStore
 
34
from revision import Revision
 
35
from errors import bailout
 
36
from textui import show_status
 
37
from diff import diff_trees
 
38
 
 
39
BZR_BRANCH_FORMAT = "Bazaar-NG branch, format 0.0.4\n"
52
40
## TODO: Maybe include checks for common corruption of newlines, etc?
53
41
 
54
42
 
55
 
# TODO: Some operations like log might retrieve the same revisions
56
 
# repeatedly to calculate deltas.  We could perhaps have a weakref
57
 
# cache in memory to make this faster.  In general anything can be
58
 
# cached in memory between lock and unlock operations.
59
 
 
60
 
def find_branch(*ignored, **ignored_too):
61
 
    # XXX: leave this here for about one release, then remove it
62
 
    raise NotImplementedError('find_branch() is not supported anymore, '
63
 
                              'please use one of the new branch constructors')
64
 
def _relpath(base, path):
65
 
    """Return path relative to base, or raise exception.
66
 
 
67
 
    The path may be either an absolute path or a path relative to the
68
 
    current working directory.
69
 
 
70
 
    Lifted out of Branch.relpath for ease of testing.
71
 
 
72
 
    os.path.commonprefix (python2.4) has a bad bug that it works just
73
 
    on string prefixes, assuming that '/u' is a prefix of '/u2'.  This
74
 
    avoids that problem."""
75
 
    rp = os.path.abspath(path)
76
 
 
77
 
    s = []
78
 
    head = rp
79
 
    while len(head) >= len(base):
80
 
        if head == base:
81
 
            break
82
 
        head, tail = os.path.split(head)
83
 
        if tail:
84
 
            s.insert(0, tail)
85
 
    else:
86
 
        raise NotBranchError("path %r is not within branch %r" % (rp, base))
87
 
 
88
 
    return os.sep.join(s)
89
 
        
90
 
 
91
 
def find_branch_root(t):
92
 
    """Find the branch root enclosing the transport's base.
93
 
 
94
 
    t is a Transport object.
95
 
 
96
 
    It is not necessary that the base of t exists.
97
 
 
98
 
    Basically we keep looking up until we find the control directory or
99
 
    run into the root.  If there isn't one, raises NotBranchError.
100
 
    """
101
 
    orig_base = t.base
102
 
    while True:
103
 
        if t.has(bzrlib.BZRDIR):
104
 
            return t
105
 
        new_t = t.clone('..')
106
 
        if new_t.base == t.base:
107
 
            # reached the root, whatever that may be
108
 
            raise NotBranchError('%s is not in a branch' % orig_base)
109
 
        t = new_t
 
43
 
110
44
 
111
45
 
112
46
######################################################################
113
47
# branch objects
114
48
 
115
 
class Branch(object):
 
49
class Branch:
116
50
    """Branch holding a history of revisions.
117
51
 
118
 
    base
119
 
        Base directory/url of the branch.
120
 
    """
121
 
    base = None
122
 
 
123
 
    def __init__(self, *ignored, **ignored_too):
124
 
        raise NotImplementedError('The Branch class is abstract')
125
 
 
126
 
    @staticmethod
127
 
    def open_downlevel(base):
128
 
        """Open a branch which may be of an old format.
129
 
        
130
 
        Only local branches are supported."""
131
 
        return _Branch(get_transport(base), relax_version_check=True)
132
 
        
133
 
    @staticmethod
134
 
    def open(base):
135
 
        """Open an existing branch, rooted at 'base' (url)"""
136
 
        t = get_transport(base)
137
 
        mutter("trying to open %r with transport %r", base, t)
138
 
        return _Branch(t)
139
 
 
140
 
    @staticmethod
141
 
    def open_containing(url):
142
 
        """Open an existing branch which contains url.
143
 
        
144
 
        This probes for a branch at url, and searches upwards from there.
145
 
        """
146
 
        t = get_transport(url)
147
 
        t = find_branch_root(t)
148
 
        return _Branch(t)
149
 
 
150
 
    @staticmethod
151
 
    def initialize(base):
152
 
        """Create a new branch, rooted at 'base' (url)"""
153
 
        t = get_transport(base)
154
 
        return _Branch(t, init=True)
155
 
 
156
 
    def setup_caching(self, cache_root):
157
 
        """Subclasses that care about caching should override this, and set
158
 
        up cached stores located under cache_root.
159
 
        """
160
 
        self.cache_root = cache_root
161
 
 
162
 
 
163
 
class _Branch(Branch):
164
 
    """A branch stored in the actual filesystem.
165
 
 
166
 
    Note that it's "local" in the context of the filesystem; it doesn't
167
 
    really matter if it's on an nfs/smb/afs/coda/... share, as long as
168
 
    it's writable, and can be accessed via the normal filesystem API.
169
 
 
170
 
    _lock_mode
171
 
        None, or 'r' or 'w'
172
 
 
173
 
    _lock_count
174
 
        If _lock_mode is true, a positive count of the number of times the
175
 
        lock has been taken.
176
 
 
177
 
    _lock
178
 
        Lock object from bzrlib.lock.
179
 
    """
180
 
    # We actually expect this class to be somewhat short-lived; part of its
181
 
    # purpose is to try to isolate what bits of the branch logic are tied to
182
 
    # filesystem access, so that in a later step, we can extricate them to
183
 
    # a separarte ("storage") class.
184
 
    _lock_mode = None
185
 
    _lock_count = None
186
 
    _lock = None
187
 
    _inventory_weave = None
188
 
    
189
 
    # Map some sort of prefix into a namespace
190
 
    # stuff like "revno:10", "revid:", etc.
191
 
    # This should match a prefix with a function which accepts
192
 
    REVISION_NAMESPACES = {}
193
 
 
194
 
    def push_stores(self, branch_to):
195
 
        """Copy the content of this branches store to branch_to."""
196
 
        if (self._branch_format != branch_to._branch_format
197
 
            or self._branch_format != 4):
198
 
            from bzrlib.fetch import greedy_fetch
199
 
            mutter("falling back to fetch logic to push between %s(%s) and %s(%s)",
200
 
                   self, self._branch_format, branch_to, branch_to._branch_format)
201
 
            greedy_fetch(to_branch=branch_to, from_branch=self,
202
 
                         revision=self.last_revision())
203
 
            return
204
 
 
205
 
        store_pairs = ((self.text_store,      branch_to.text_store),
206
 
                       (self.inventory_store, branch_to.inventory_store),
207
 
                       (self.revision_store,  branch_to.revision_store))
208
 
        try:
209
 
            for from_store, to_store in store_pairs: 
210
 
                copy_all(from_store, to_store)
211
 
        except UnlistableStore:
212
 
            raise UnlistableBranch(from_store)
213
 
 
214
 
    def __init__(self, transport, init=False,
215
 
                 relax_version_check=False):
 
52
    :todo: Perhaps use different stores for different classes of object,
 
53
           so that we can keep track of how much space each one uses,
 
54
           or garbage-collect them.
 
55
 
 
56
    :todo: Add a RemoteBranch subclass.  For the basic case of read-only
 
57
           HTTP access this should be very easy by, 
 
58
           just redirecting controlfile access into HTTP requests.
 
59
           We would need a RemoteStore working similarly.
 
60
 
 
61
    :todo: Keep the on-disk branch locked while the object exists.
 
62
 
 
63
    :todo: mkdir() method.
 
64
    """
 
65
    def __init__(self, base, init=False):
216
66
        """Create new branch object at a particular location.
217
67
 
218
 
        transport -- A Transport object, defining how to access files.
219
 
                (If a string, transport.transport() will be used to
220
 
                create a Transport object)
221
 
        
222
 
        init -- If True, create new control files in a previously
 
68
        :param base: Base directory for the branch.
 
69
 
 
70
        :param init: If True, create new control files in a previously
223
71
             unversioned directory.  If False, the branch must already
224
72
             be versioned.
225
73
 
226
 
        relax_version_check -- If true, the usual check for the branch
227
 
            version is not applied.  This is intended only for
228
 
            upgrade/recovery type use; it's not guaranteed that
229
 
            all operations will work on old format branches.
230
 
 
231
74
        In the test suite, creation of new trees is tested using the
232
75
        `ScratchBranch` class.
233
76
        """
234
 
        assert isinstance(transport, Transport), \
235
 
            "%r is not a Transport" % transport
236
 
        self._transport = transport
 
77
        self.base = os.path.realpath(base)
237
78
        if init:
238
79
            self._make_control()
239
 
        self._check_format(relax_version_check)
240
 
 
241
 
        def get_store(name, compressed=True):
242
 
            # FIXME: This approach of assuming stores are all entirely compressed
243
 
            # or entirely uncompressed is tidy, but breaks upgrade from 
244
 
            # some existing branches where there's a mixture; we probably 
245
 
            # still want the option to look for both.
246
 
            relpath = self._rel_controlfilename(name)
247
 
            if compressed:
248
 
                store = CompressedTextStore(self._transport.clone(relpath))
249
 
            else:
250
 
                store = TextStore(self._transport.clone(relpath))
251
 
            #if self._transport.should_cache():
252
 
            #    cache_path = os.path.join(self.cache_root, name)
253
 
            #    os.mkdir(cache_path)
254
 
            #    store = bzrlib.store.CachedStore(store, cache_path)
255
 
            return store
256
 
        def get_weave(name):
257
 
            relpath = self._rel_controlfilename(name)
258
 
            ws = WeaveStore(self._transport.clone(relpath))
259
 
            if self._transport.should_cache():
260
 
                ws.enable_cache = True
261
 
            return ws
262
 
 
263
 
        if self._branch_format == 4:
264
 
            self.inventory_store = get_store('inventory-store')
265
 
            self.text_store = get_store('text-store')
266
 
            self.revision_store = get_store('revision-store')
267
 
        elif self._branch_format == 5:
268
 
            self.control_weaves = get_weave([])
269
 
            self.weave_store = get_weave('weaves')
270
 
            self.revision_store = get_store('revision-store', compressed=False)
 
80
        else:
 
81
            if not isdir(self.controlfilename('.')):
 
82
                bailout("not a bzr branch: %s" % quotefn(base),
 
83
                        ['use "bzr init" to initialize a new working tree',
 
84
                         'current bzr can only operate from top-of-tree'])
 
85
            self._check_format()
 
86
 
 
87
        self.text_store = ImmutableStore(self.controlfilename('text-store'))
 
88
        self.revision_store = ImmutableStore(self.controlfilename('revision-store'))
 
89
        self.inventory_store = ImmutableStore(self.controlfilename('inventory-store'))
 
90
 
271
91
 
272
92
    def __str__(self):
273
 
        return '%s(%r)' % (self.__class__.__name__, self._transport.base)
 
93
        return '%s(%r)' % (self.__class__.__name__, self.base)
274
94
 
275
95
 
276
96
    __repr__ = __str__
277
97
 
278
98
 
279
 
    def __del__(self):
280
 
        if self._lock_mode or self._lock:
281
 
            # XXX: This should show something every time, and be suitable for
282
 
            # headless operation and embedding
283
 
            warn("branch %r was not explicitly unlocked" % self)
284
 
            self._lock.unlock()
285
 
 
286
 
        # TODO: It might be best to do this somewhere else,
287
 
        # but it is nice for a Branch object to automatically
288
 
        # cache it's information.
289
 
        # Alternatively, we could have the Transport objects cache requests
290
 
        # See the earlier discussion about how major objects (like Branch)
291
 
        # should never expect their __del__ function to run.
292
 
        if hasattr(self, 'cache_root') and self.cache_root is not None:
293
 
            try:
294
 
                import shutil
295
 
                shutil.rmtree(self.cache_root)
296
 
            except:
297
 
                pass
298
 
            self.cache_root = None
299
 
 
300
 
    def _get_base(self):
301
 
        if self._transport:
302
 
            return self._transport.base
303
 
        return None
304
 
 
305
 
    base = property(_get_base)
306
 
 
307
 
 
308
 
    def lock_write(self):
309
 
        # TODO: Upgrade locking to support using a Transport,
310
 
        # and potentially a remote locking protocol
311
 
        if self._lock_mode:
312
 
            if self._lock_mode != 'w':
313
 
                raise LockError("can't upgrade to a write lock from %r" %
314
 
                                self._lock_mode)
315
 
            self._lock_count += 1
316
 
        else:
317
 
            self._lock = self._transport.lock_write(
318
 
                    self._rel_controlfilename('branch-lock'))
319
 
            self._lock_mode = 'w'
320
 
            self._lock_count = 1
321
 
 
322
 
 
323
 
    def lock_read(self):
324
 
        if self._lock_mode:
325
 
            assert self._lock_mode in ('r', 'w'), \
326
 
                   "invalid lock mode %r" % self._lock_mode
327
 
            self._lock_count += 1
328
 
        else:
329
 
            self._lock = self._transport.lock_read(
330
 
                    self._rel_controlfilename('branch-lock'))
331
 
            self._lock_mode = 'r'
332
 
            self._lock_count = 1
333
 
                        
334
 
    def unlock(self):
335
 
        if not self._lock_mode:
336
 
            raise LockError('branch %r is not locked' % (self))
337
 
 
338
 
        if self._lock_count > 1:
339
 
            self._lock_count -= 1
340
 
        else:
341
 
            self._lock.unlock()
342
 
            self._lock = None
343
 
            self._lock_mode = self._lock_count = None
344
 
 
345
 
    def abspath(self, name):
346
 
        """Return absolute filename for something in the branch"""
347
 
        return self._transport.abspath(name)
348
 
 
349
 
    def relpath(self, path):
350
 
        """Return path relative to this branch of something inside it.
351
 
 
352
 
        Raises an error if path is not in this branch."""
353
 
        return self._transport.relpath(path)
354
 
 
355
 
 
356
 
    def _rel_controlfilename(self, file_or_path):
357
 
        if isinstance(file_or_path, basestring):
358
 
            file_or_path = [file_or_path]
359
 
        return [bzrlib.BZRDIR] + file_or_path
 
99
    def _rel(self, name):
 
100
        """Return filename relative to branch top"""
 
101
        return os.path.join(self.base, name)
 
102
        
360
103
 
361
104
    def controlfilename(self, file_or_path):
362
105
        """Return location relative to branch."""
363
 
        return self._transport.abspath(self._rel_controlfilename(file_or_path))
 
106
        if isinstance(file_or_path, types.StringTypes):
 
107
            file_or_path = [file_or_path]
 
108
        return os.path.join(self.base, bzrlib.BZRDIR, *file_or_path)
364
109
 
365
110
 
366
111
    def controlfile(self, file_or_path, mode='r'):
367
 
        """Open a control file for this branch.
368
 
 
369
 
        There are two classes of file in the control directory: text
370
 
        and binary.  binary files are untranslated byte streams.  Text
371
 
        control files are stored with Unix newlines and in UTF-8, even
372
 
        if the platform or locale defaults are different.
373
 
 
374
 
        Controlfiles should almost never be opened in write mode but
375
 
        rather should be atomically copied and replaced using atomicfile.
376
 
        """
377
 
        import codecs
378
 
 
379
 
        relpath = self._rel_controlfilename(file_or_path)
380
 
        #TODO: codecs.open() buffers linewise, so it was overloaded with
381
 
        # a much larger buffer, do we need to do the same for getreader/getwriter?
382
 
        if mode == 'rb': 
383
 
            return self._transport.get(relpath)
384
 
        elif mode == 'wb':
385
 
            raise BzrError("Branch.controlfile(mode='wb') is not supported, use put_controlfiles")
386
 
        elif mode == 'r':
387
 
            return codecs.getreader('utf-8')(self._transport.get(relpath), errors='replace')
388
 
        elif mode == 'w':
389
 
            raise BzrError("Branch.controlfile(mode='w') is not supported, use put_controlfiles")
390
 
        else:
391
 
            raise BzrError("invalid controlfile mode %r" % mode)
392
 
 
393
 
    def put_controlfile(self, path, f, encode=True):
394
 
        """Write an entry as a controlfile.
395
 
 
396
 
        :param path: The path to put the file, relative to the .bzr control
397
 
                     directory
398
 
        :param f: A file-like or string object whose contents should be copied.
399
 
        :param encode:  If true, encode the contents as utf-8
400
 
        """
401
 
        self.put_controlfiles([(path, f)], encode=encode)
402
 
 
403
 
    def put_controlfiles(self, files, encode=True):
404
 
        """Write several entries as controlfiles.
405
 
 
406
 
        :param files: A list of [(path, file)] pairs, where the path is the directory
407
 
                      underneath the bzr control directory
408
 
        :param encode:  If true, encode the contents as utf-8
409
 
        """
410
 
        import codecs
411
 
        ctrl_files = []
412
 
        for path, f in files:
413
 
            if encode:
414
 
                if isinstance(f, basestring):
415
 
                    f = f.encode('utf-8', 'replace')
416
 
                else:
417
 
                    f = codecs.getwriter('utf-8')(f, errors='replace')
418
 
            path = self._rel_controlfilename(path)
419
 
            ctrl_files.append((path, f))
420
 
        self._transport.put_multi(ctrl_files)
 
112
        """Open a control file for this branch"""
 
113
        return file(self.controlfilename(file_or_path), mode)
 
114
 
421
115
 
422
116
    def _make_control(self):
423
 
        from bzrlib.inventory import Inventory
424
 
        from bzrlib.weavefile import write_weave_v5
425
 
        from bzrlib.weave import Weave
426
 
        
427
 
        # Create an empty inventory
428
 
        sio = StringIO()
429
 
        # if we want per-tree root ids then this is the place to set
430
 
        # them; they're not needed for now and so ommitted for
431
 
        # simplicity.
432
 
        bzrlib.xml5.serializer_v5.write_inventory(Inventory(), sio)
433
 
        empty_inv = sio.getvalue()
434
 
        sio = StringIO()
435
 
        bzrlib.weavefile.write_weave_v5(Weave(), sio)
436
 
        empty_weave = sio.getvalue()
437
 
 
438
 
        dirs = [[], 'revision-store', 'weaves']
439
 
        files = [('README', 
 
117
        os.mkdir(self.controlfilename([]))
 
118
        self.controlfile('README', 'w').write(
440
119
            "This is a Bazaar-NG control directory.\n"
441
 
            "Do not change any files in this directory.\n"),
442
 
            ('branch-format', BZR_BRANCH_FORMAT_5),
443
 
            ('revision-history', ''),
444
 
            ('branch-name', ''),
445
 
            ('branch-lock', ''),
446
 
            ('pending-merges', ''),
447
 
            ('inventory', empty_inv),
448
 
            ('inventory.weave', empty_weave),
449
 
            ('ancestry.weave', empty_weave)
450
 
        ]
451
 
        cfn = self._rel_controlfilename
452
 
        self._transport.mkdir_multi([cfn(d) for d in dirs])
453
 
        self.put_controlfiles(files)
454
 
        mutter('created control directory in ' + self._transport.base)
455
 
 
456
 
    def _check_format(self, relax_version_check):
 
120
            "Do not change any files in this directory.")
 
121
        self.controlfile('branch-format', 'w').write(BZR_BRANCH_FORMAT)
 
122
        for d in ('text-store', 'inventory-store', 'revision-store'):
 
123
            os.mkdir(self.controlfilename(d))
 
124
        for f in ('revision-history', 'merged-patches',
 
125
                  'pending-merged-patches', 'branch-name'):
 
126
            self.controlfile(f, 'w').write('')
 
127
        mutter('created control directory in ' + self.base)
 
128
        Inventory().write_xml(self.controlfile('inventory','w'))
 
129
 
 
130
 
 
131
    def _check_format(self):
457
132
        """Check this branch format is supported.
458
133
 
459
 
        The format level is stored, as an integer, in
460
 
        self._branch_format for code that needs to check it later.
 
134
        The current tool only supports the current unstable format.
461
135
 
462
136
        In the future, we might need different in-memory Branch
463
137
        classes to support downlevel branches.  But not yet.
464
 
        """
465
 
        try:
466
 
            fmt = self.controlfile('branch-format', 'r').read()
467
 
        except NoSuchFile:
468
 
            raise NotBranchError(self.base)
469
 
        mutter("got branch format %r", fmt)
470
 
        if fmt == BZR_BRANCH_FORMAT_5:
471
 
            self._branch_format = 5
472
 
        elif fmt == BZR_BRANCH_FORMAT_4:
473
 
            self._branch_format = 4
474
 
 
475
 
        if (not relax_version_check
476
 
            and self._branch_format != 5):
477
 
            raise BzrError('sorry, branch format %r not supported' % fmt,
478
 
                           ['use a different bzr version',
479
 
                            'or remove the .bzr directory'
480
 
                            ' and "bzr init" again'])
481
 
 
482
 
    def get_root_id(self):
483
 
        """Return the id of this branches root"""
484
 
        inv = self.read_working_inventory()
485
 
        return inv.root.file_id
486
 
 
487
 
    def set_root_id(self, file_id):
488
 
        inv = self.read_working_inventory()
489
 
        orig_root_id = inv.root.file_id
490
 
        del inv._byid[inv.root.file_id]
491
 
        inv.root.file_id = file_id
492
 
        inv._byid[inv.root.file_id] = inv.root
493
 
        for fid in inv:
494
 
            entry = inv[fid]
495
 
            if entry.parent_id in (None, orig_root_id):
496
 
                entry.parent_id = inv.root.file_id
497
 
        self._write_inventory(inv)
 
138
        """        
 
139
        # read in binary mode to detect newline wierdness.
 
140
        fmt = self.controlfile('branch-format', 'rb').read()
 
141
        if fmt != BZR_BRANCH_FORMAT:
 
142
            bailout('sorry, branch format %r not supported' % fmt,
 
143
                    ['use a different bzr version',
 
144
                     'or remove the .bzr directory and "bzr init" again'])
 
145
 
498
146
 
499
147
    def read_working_inventory(self):
500
148
        """Read the working inventory."""
501
 
        self.lock_read()
502
 
        try:
503
 
            # ElementTree does its own conversion from UTF-8, so open in
504
 
            # binary.
505
 
            f = self.controlfile('inventory', 'rb')
506
 
            return bzrlib.xml5.serializer_v5.read_inventory(f)
507
 
        finally:
508
 
            self.unlock()
509
 
            
 
149
        before = time.time()
 
150
        inv = Inventory.read_xml(self.controlfile('inventory', 'r'))
 
151
        mutter("loaded inventory of %d items in %f"
 
152
               % (len(inv), time.time() - before))
 
153
        return inv
 
154
 
510
155
 
511
156
    def _write_inventory(self, inv):
512
157
        """Update the working inventory.
514
159
        That is to say, the inventory describing changes underway, that
515
160
        will be committed to the next revision.
516
161
        """
517
 
        from cStringIO import StringIO
518
 
        self.lock_write()
519
 
        try:
520
 
            sio = StringIO()
521
 
            bzrlib.xml5.serializer_v5.write_inventory(inv, sio)
522
 
            sio.seek(0)
523
 
            # Transport handles atomicity
524
 
            self.put_controlfile('inventory', sio)
525
 
        finally:
526
 
            self.unlock()
527
 
        
528
 
        mutter('wrote working inventory')
529
 
            
 
162
        inv.write_xml(self.controlfile('inventory', 'w'))
 
163
        mutter('wrote inventory to %s' % quotefn(self.controlfilename('inventory')))
 
164
 
 
165
 
530
166
    inventory = property(read_working_inventory, _write_inventory, None,
531
167
                         """Inventory for the working copy.""")
532
168
 
533
 
    def add(self, files, ids=None):
 
169
 
 
170
    def add(self, files, verbose=False):
534
171
        """Make files versioned.
535
172
 
536
 
        Note that the command line normally calls smart_add instead,
537
 
        which can automatically recurse.
538
 
 
539
173
        This puts the files in the Added state, so that they will be
540
174
        recorded by the next commit.
541
175
 
542
 
        files
543
 
            List of paths to add, relative to the base of the tree.
544
 
 
545
 
        ids
546
 
            If set, use these instead of automatically generated ids.
547
 
            Must be the same length as the list of files, but may
548
 
            contain None for ids that are to be autogenerated.
549
 
 
550
 
        TODO: Perhaps have an option to add the ids even if the files do
551
 
              not (yet) exist.
552
 
 
553
 
        TODO: Perhaps yield the ids and paths as they're added.
 
176
        :todo: Perhaps have an option to add the ids even if the files do
 
177
               not (yet) exist.
 
178
 
 
179
        :todo: Perhaps return the ids of the files?  But then again it
 
180
               is easy to retrieve them if they're needed.
 
181
 
 
182
        :todo: Option to specify file id.
 
183
 
 
184
        :todo: Adding a directory should optionally recurse down and
 
185
               add all non-ignored children.  Perhaps do that in a
 
186
               higher-level method.
 
187
 
 
188
        >>> b = ScratchBranch(files=['foo'])
 
189
        >>> 'foo' in b.unknowns()
 
190
        True
 
191
        >>> b.show_status()
 
192
        ?       foo
 
193
        >>> b.add('foo')
 
194
        >>> 'foo' in b.unknowns()
 
195
        False
 
196
        >>> bool(b.inventory.path2id('foo'))
 
197
        True
 
198
        >>> b.show_status()
 
199
        A       foo
 
200
 
 
201
        >>> b.add('foo')
 
202
        Traceback (most recent call last):
 
203
        ...
 
204
        BzrError: ('foo is already versioned', [])
 
205
 
 
206
        >>> b.add(['nothere'])
 
207
        Traceback (most recent call last):
 
208
        BzrError: ('cannot add: not a regular file or directory: nothere', [])
554
209
        """
 
210
 
555
211
        # TODO: Re-adding a file that is removed in the working copy
556
212
        # should probably put it back with the previous ID.
557
 
        if isinstance(files, basestring):
558
 
            assert(ids is None or isinstance(ids, basestring))
 
213
        if isinstance(files, types.StringTypes):
559
214
            files = [files]
560
 
            if ids is not None:
561
 
                ids = [ids]
562
 
 
563
 
        if ids is None:
564
 
            ids = [None] * len(files)
565
 
        else:
566
 
            assert(len(ids) == len(files))
567
 
 
568
 
        self.lock_write()
569
 
        try:
570
 
            inv = self.read_working_inventory()
571
 
            for f,file_id in zip(files, ids):
572
 
                if is_control_file(f):
573
 
                    raise BzrError("cannot add control file %s" % quotefn(f))
574
 
 
575
 
                fp = splitpath(f)
576
 
 
577
 
                if len(fp) == 0:
578
 
                    raise BzrError("cannot add top-level %r" % f)
579
 
 
580
 
                fullpath = os.path.normpath(self.abspath(f))
581
 
 
582
 
                try:
583
 
                    kind = file_kind(fullpath)
584
 
                except OSError:
585
 
                    # maybe something better?
586
 
                    raise BzrError('cannot add: not a regular file, symlink or directory: %s' % quotefn(f))
587
 
 
588
 
                if not InventoryEntry.versionable_kind(kind):
589
 
                    raise BzrError('cannot add: not a versionable file ('
590
 
                                   'i.e. regular file, symlink or directory): %s' % quotefn(f))
591
 
 
592
 
                if file_id is None:
593
 
                    file_id = gen_file_id(f)
594
 
                inv.add_path(f, kind=kind, file_id=file_id)
595
 
 
596
 
                mutter("add file %s file_id:{%s} kind=%r" % (f, file_id, kind))
597
 
 
598
 
            self._write_inventory(inv)
599
 
        finally:
600
 
            self.unlock()
601
 
            
602
 
 
603
 
    def print_file(self, file, revno):
604
 
        """Print `file` to stdout."""
605
 
        self.lock_read()
606
 
        try:
607
 
            tree = self.revision_tree(self.get_rev_id(revno))
608
 
            # use inventory as it was in that revision
609
 
            file_id = tree.inventory.path2id(file)
610
 
            if not file_id:
611
 
                raise BzrError("%r is not present in revision %s" % (file, revno))
612
 
            tree.print_file(file_id)
613
 
        finally:
614
 
            self.unlock()
 
215
        
 
216
        inv = self.read_working_inventory()
 
217
        for f in files:
 
218
            if is_control_file(f):
 
219
                bailout("cannot add control file %s" % quotefn(f))
 
220
 
 
221
            fp = splitpath(f)
 
222
 
 
223
            if len(fp) == 0:
 
224
                bailout("cannot add top-level %r" % f)
 
225
                
 
226
            fullpath = os.path.normpath(self._rel(f))
 
227
 
 
228
            if isfile(fullpath):
 
229
                kind = 'file'
 
230
            elif isdir(fullpath):
 
231
                kind = 'directory'
 
232
            else:
 
233
                bailout('cannot add: not a regular file or directory: %s' % quotefn(f))
 
234
 
 
235
            if len(fp) > 1:
 
236
                parent_name = joinpath(fp[:-1])
 
237
                mutter("lookup parent %r" % parent_name)
 
238
                parent_id = inv.path2id(parent_name)
 
239
                if parent_id == None:
 
240
                    bailout("cannot add: parent %r is not versioned"
 
241
                            % joinpath(fp[:-1]))
 
242
            else:
 
243
                parent_id = None
 
244
 
 
245
            file_id = _gen_file_id(fp[-1])
 
246
            inv.add(InventoryEntry(file_id, fp[-1], kind=kind, parent_id=parent_id))
 
247
            if verbose:
 
248
                show_status('A', kind, quotefn(f))
 
249
                
 
250
            mutter("add file %s file_id:{%s} kind=%r parent_id={%s}"
 
251
                   % (f, file_id, kind, parent_id))
 
252
        self._write_inventory(inv)
 
253
 
615
254
 
616
255
 
617
256
    def remove(self, files, verbose=False):
619
258
 
620
259
        This does not remove their text.  This does not run on 
621
260
 
622
 
        TODO: Refuse to remove modified files unless --force is given?
623
 
 
624
 
        TODO: Do something useful with directories.
625
 
 
626
 
        TODO: Should this remove the text or not?  Tough call; not
 
261
        :todo: Refuse to remove modified files unless --force is given?
 
262
 
 
263
        >>> b = ScratchBranch(files=['foo'])
 
264
        >>> b.add('foo')
 
265
        >>> b.inventory.has_filename('foo')
 
266
        True
 
267
        >>> b.remove('foo')
 
268
        >>> b.working_tree().has_filename('foo')
 
269
        True
 
270
        >>> b.inventory.has_filename('foo')
 
271
        False
 
272
        
 
273
        >>> b = ScratchBranch(files=['foo'])
 
274
        >>> b.add('foo')
 
275
        >>> b.commit('one')
 
276
        >>> b.remove('foo')
 
277
        >>> b.commit('two')
 
278
        >>> b.inventory.has_filename('foo') 
 
279
        False
 
280
        >>> b.basis_tree().has_filename('foo') 
 
281
        False
 
282
        >>> b.working_tree().has_filename('foo') 
 
283
        True
 
284
 
 
285
        :todo: Do something useful with directories.
 
286
 
 
287
        :todo: Should this remove the text or not?  Tough call; not
627
288
        removing may be useful and the user can just use use rm, and
628
289
        is the opposite of add.  Removing it is consistent with most
629
290
        other tools.  Maybe an option.
630
291
        """
631
292
        ## TODO: Normalize names
632
293
        ## TODO: Remove nested loops; better scalability
633
 
        if isinstance(files, basestring):
 
294
 
 
295
        if isinstance(files, types.StringTypes):
634
296
            files = [files]
635
 
 
636
 
        self.lock_write()
637
 
 
638
 
        try:
639
 
            tree = self.working_tree()
640
 
            inv = tree.inventory
641
 
 
642
 
            # do this before any modifications
643
 
            for f in files:
644
 
                fid = inv.path2id(f)
645
 
                if not fid:
646
 
                    raise BzrError("cannot remove unversioned file %s" % quotefn(f))
647
 
                mutter("remove inventory entry %s {%s}" % (quotefn(f), fid))
648
 
                if verbose:
649
 
                    # having remove it, it must be either ignored or unknown
650
 
                    if tree.is_ignored(f):
651
 
                        new_status = 'I'
652
 
                    else:
653
 
                        new_status = '?'
654
 
                    show_status(new_status, inv[fid].kind, quotefn(f))
655
 
                del inv[fid]
656
 
 
657
 
            self._write_inventory(inv)
658
 
        finally:
659
 
            self.unlock()
660
 
 
661
 
    # FIXME: this doesn't need to be a branch method
662
 
    def set_inventory(self, new_inventory_list):
663
 
        from bzrlib.inventory import Inventory, InventoryEntry
664
 
        inv = Inventory(self.get_root_id())
665
 
        for path, file_id, parent, kind in new_inventory_list:
666
 
            name = os.path.basename(path)
667
 
            if name == "":
668
 
                continue
669
 
            # fixme, there should be a factory function inv,add_?? 
670
 
            if kind == 'directory':
671
 
                inv.add(inventory.InventoryDirectory(file_id, name, parent))
672
 
            elif kind == 'file':
673
 
                inv.add(inventory.InventoryFile(file_id, name, parent))
674
 
            elif kind == 'symlink':
675
 
                inv.add(inventory.InventoryLink(file_id, name, parent))
676
 
            else:
677
 
                raise BzrError("unknown kind %r" % kind)
 
297
        
 
298
        inv = self.read_working_inventory()
 
299
 
 
300
        # do this before any modifications
 
301
        for f in files:
 
302
            fid = inv.path2id(f)
 
303
            if not fid:
 
304
                bailout("cannot remove unversioned file %s" % quotefn(f))
 
305
            mutter("remove inventory entry %s {%s}" % (quotefn(f), fid))
 
306
            if verbose:
 
307
                show_status('D', inv[fid].kind, quotefn(f))
 
308
            del inv[fid]
 
309
 
678
310
        self._write_inventory(inv)
679
311
 
 
312
 
680
313
    def unknowns(self):
681
314
        """Return all unknown files.
682
315
 
696
329
        return self.working_tree().unknowns()
697
330
 
698
331
 
699
 
    def append_revision(self, *revision_ids):
700
 
        for revision_id in revision_ids:
701
 
            mutter("add {%s} to revision-history" % revision_id)
702
 
        self.lock_write()
703
 
        try:
704
 
            rev_history = self.revision_history()
705
 
            rev_history.extend(revision_ids)
706
 
            self.put_controlfile('revision-history', '\n'.join(rev_history))
707
 
        finally:
708
 
            self.unlock()
709
 
 
710
 
    def has_revision(self, revision_id):
711
 
        """True if this branch has a copy of the revision.
712
 
 
713
 
        This does not necessarily imply the revision is merge
714
 
        or on the mainline."""
715
 
        return (revision_id is None
716
 
                or revision_id in self.revision_store)
717
 
 
718
 
    def get_revision_xml_file(self, revision_id):
719
 
        """Return XML file object for revision object."""
720
 
        if not revision_id or not isinstance(revision_id, basestring):
721
 
            raise InvalidRevisionId(revision_id)
722
 
 
723
 
        self.lock_read()
724
 
        try:
725
 
            try:
726
 
                return self.revision_store[revision_id]
727
 
            except (IndexError, KeyError):
728
 
                raise bzrlib.errors.NoSuchRevision(self, revision_id)
729
 
        finally:
730
 
            self.unlock()
731
 
 
732
 
    #deprecated
733
 
    get_revision_xml = get_revision_xml_file
734
 
 
735
 
    def get_revision_xml(self, revision_id):
736
 
        return self.get_revision_xml_file(revision_id).read()
 
332
    def commit(self, message, timestamp=None, timezone=None,
 
333
               committer=None,
 
334
               verbose=False):
 
335
        """Commit working copy as a new revision.
 
336
        
 
337
        The basic approach is to add all the file texts into the
 
338
        store, then the inventory, then make a new revision pointing
 
339
        to that inventory and store that.
 
340
        
 
341
        This is not quite safe if the working copy changes during the
 
342
        commit; for the moment that is simply not allowed.  A better
 
343
        approach is to make a temporary copy of the files before
 
344
        computing their hashes, and then add those hashes in turn to
 
345
        the inventory.  This should mean at least that there are no
 
346
        broken hash pointers.  There is no way we can get a snapshot
 
347
        of the whole directory at an instant.  This would also have to
 
348
        be robust against files disappearing, moving, etc.  So the
 
349
        whole thing is a bit hard.
 
350
 
 
351
        :param timestamp: if not None, seconds-since-epoch for a
 
352
             postdated/predated commit.
 
353
        """
 
354
 
 
355
        ## TODO: Show branch names
 
356
 
 
357
        # TODO: Don't commit if there are no changes, unless forced?
 
358
 
 
359
        # First walk over the working inventory; and both update that
 
360
        # and also build a new revision inventory.  The revision
 
361
        # inventory needs to hold the text-id, sha1 and size of the
 
362
        # actual file versions committed in the revision.  (These are
 
363
        # not present in the working inventory.)  We also need to
 
364
        # detect missing/deleted files, and remove them from the
 
365
        # working inventory.
 
366
 
 
367
        work_inv = self.read_working_inventory()
 
368
        inv = Inventory()
 
369
        basis = self.basis_tree()
 
370
        basis_inv = basis.inventory
 
371
        missing_ids = []
 
372
        for path, entry in work_inv.iter_entries():
 
373
            ## TODO: Cope with files that have gone missing.
 
374
 
 
375
            ## TODO: Check that the file kind has not changed from the previous
 
376
            ## revision of this file (if any).
 
377
 
 
378
            entry = entry.copy()
 
379
 
 
380
            p = self._rel(path)
 
381
            file_id = entry.file_id
 
382
            mutter('commit prep file %s, id %r ' % (p, file_id))
 
383
 
 
384
            if not os.path.exists(p):
 
385
                mutter("    file is missing, removing from inventory")
 
386
                if verbose:
 
387
                    show_status('D', entry.kind, quotefn(path))
 
388
                missing_ids.append(file_id)
 
389
                continue
 
390
 
 
391
            # TODO: Handle files that have been deleted
 
392
 
 
393
            # TODO: Maybe a special case for empty files?  Seems a
 
394
            # waste to store them many times.
 
395
 
 
396
            inv.add(entry)
 
397
 
 
398
            if basis_inv.has_id(file_id):
 
399
                old_kind = basis_inv[file_id].kind
 
400
                if old_kind != entry.kind:
 
401
                    bailout("entry %r changed kind from %r to %r"
 
402
                            % (file_id, old_kind, entry.kind))
 
403
 
 
404
            if entry.kind == 'directory':
 
405
                if not isdir(p):
 
406
                    bailout("%s is entered as directory but not a directory" % quotefn(p))
 
407
            elif entry.kind == 'file':
 
408
                if not isfile(p):
 
409
                    bailout("%s is entered as file but is not a file" % quotefn(p))
 
410
 
 
411
                content = file(p, 'rb').read()
 
412
 
 
413
                entry.text_sha1 = sha_string(content)
 
414
                entry.text_size = len(content)
 
415
 
 
416
                old_ie = basis_inv.has_id(file_id) and basis_inv[file_id]
 
417
                if (old_ie
 
418
                    and (old_ie.text_size == entry.text_size)
 
419
                    and (old_ie.text_sha1 == entry.text_sha1)):
 
420
                    ## assert content == basis.get_file(file_id).read()
 
421
                    entry.text_id = basis_inv[file_id].text_id
 
422
                    mutter('    unchanged from previous text_id {%s}' %
 
423
                           entry.text_id)
 
424
                    
 
425
                else:
 
426
                    entry.text_id = _gen_file_id(entry.name)
 
427
                    self.text_store.add(content, entry.text_id)
 
428
                    mutter('    stored with text_id {%s}' % entry.text_id)
 
429
                    if verbose:
 
430
                        if not old_ie:
 
431
                            state = 'A'
 
432
                        elif (old_ie.name == entry.name
 
433
                              and old_ie.parent_id == entry.parent_id):
 
434
                            state = 'R'
 
435
                        else:
 
436
                            state = 'M'
 
437
 
 
438
                        show_status(state, entry.kind, quotefn(path))
 
439
 
 
440
        for file_id in missing_ids:
 
441
            # have to do this later so we don't mess up the iterator.
 
442
            # since parents may be removed before their children we
 
443
            # have to test.
 
444
 
 
445
            # FIXME: There's probably a better way to do this; perhaps
 
446
            # the workingtree should know how to filter itself.
 
447
            if work_inv.has_id(file_id):
 
448
                del work_inv[file_id]
 
449
 
 
450
 
 
451
        inv_id = rev_id = _gen_revision_id(time.time())
 
452
        
 
453
        inv_tmp = tempfile.TemporaryFile()
 
454
        inv.write_xml(inv_tmp)
 
455
        inv_tmp.seek(0)
 
456
        self.inventory_store.add(inv_tmp, inv_id)
 
457
        mutter('new inventory_id is {%s}' % inv_id)
 
458
 
 
459
        self._write_inventory(work_inv)
 
460
 
 
461
        if timestamp == None:
 
462
            timestamp = time.time()
 
463
 
 
464
        if committer == None:
 
465
            committer = username()
 
466
 
 
467
        if timezone == None:
 
468
            timezone = local_time_offset()
 
469
 
 
470
        mutter("building commit log message")
 
471
        rev = Revision(timestamp=timestamp,
 
472
                       timezone=timezone,
 
473
                       committer=committer,
 
474
                       precursor = self.last_patch(),
 
475
                       message = message,
 
476
                       inventory_id=inv_id,
 
477
                       revision_id=rev_id)
 
478
 
 
479
        rev_tmp = tempfile.TemporaryFile()
 
480
        rev.write_xml(rev_tmp)
 
481
        rev_tmp.seek(0)
 
482
        self.revision_store.add(rev_tmp, rev_id)
 
483
        mutter("new revision_id is {%s}" % rev_id)
 
484
        
 
485
        ## XXX: Everything up to here can simply be orphaned if we abort
 
486
        ## the commit; it will leave junk files behind but that doesn't
 
487
        ## matter.
 
488
 
 
489
        ## TODO: Read back the just-generated changeset, and make sure it
 
490
        ## applies and recreates the right state.
 
491
 
 
492
        ## TODO: Also calculate and store the inventory SHA1
 
493
        mutter("committing patch r%d" % (self.revno() + 1))
 
494
 
 
495
        mutter("append to revision-history")
 
496
        self.controlfile('revision-history', 'at').write(rev_id + '\n')
 
497
 
 
498
        mutter("done!")
737
499
 
738
500
 
739
501
    def get_revision(self, revision_id):
740
502
        """Return the Revision object for a named revision"""
741
 
        xml_file = self.get_revision_xml_file(revision_id)
742
 
 
743
 
        try:
744
 
            r = bzrlib.xml5.serializer_v5.read_revision(xml_file)
745
 
        except SyntaxError, e:
746
 
            raise bzrlib.errors.BzrError('failed to unpack revision_xml',
747
 
                                         [revision_id,
748
 
                                          str(e)])
749
 
            
 
503
        r = Revision.read_xml(self.revision_store[revision_id])
750
504
        assert r.revision_id == revision_id
751
505
        return r
752
506
 
753
 
    def get_revision_delta(self, revno):
754
 
        """Return the delta for one revision.
755
 
 
756
 
        The delta is relative to its mainline predecessor, or the
757
 
        empty tree for revision 1.
758
 
        """
759
 
        assert isinstance(revno, int)
760
 
        rh = self.revision_history()
761
 
        if not (1 <= revno <= len(rh)):
762
 
            raise InvalidRevisionNumber(revno)
763
 
 
764
 
        # revno is 1-based; list is 0-based
765
 
 
766
 
        new_tree = self.revision_tree(rh[revno-1])
767
 
        if revno == 1:
768
 
            old_tree = EmptyTree()
769
 
        else:
770
 
            old_tree = self.revision_tree(rh[revno-2])
771
 
 
772
 
        return compare_trees(old_tree, new_tree)
773
 
 
774
 
    def get_revision_sha1(self, revision_id):
775
 
        """Hash the stored value of a revision, and return it."""
776
 
        # In the future, revision entries will be signed. At that
777
 
        # point, it is probably best *not* to include the signature
778
 
        # in the revision hash. Because that lets you re-sign
779
 
        # the revision, (add signatures/remove signatures) and still
780
 
        # have all hash pointers stay consistent.
781
 
        # But for now, just hash the contents.
782
 
        return bzrlib.osutils.sha_file(self.get_revision_xml_file(revision_id))
783
 
 
784
 
    def get_ancestry(self, revision_id):
785
 
        """Return a list of revision-ids integrated by a revision.
786
 
        
787
 
        This currently returns a list, but the ordering is not guaranteed:
788
 
        treat it as a set.
789
 
        """
790
 
        if revision_id is None:
791
 
            return [None]
792
 
        w = self.control_weaves.get_weave('inventory')
793
 
        return [None] + map(w.idx_to_name,
794
 
                            w.inclusions([w.lookup(revision_id)]))
795
 
 
796
 
    def get_inventory_weave(self):
797
 
        return self.control_weaves.get_weave('inventory')
798
 
 
799
 
    def get_inventory(self, revision_id):
800
 
        """Get Inventory object by hash."""
801
 
        xml = self.get_inventory_xml(revision_id)
802
 
        return bzrlib.xml5.serializer_v5.read_inventory_from_string(xml)
803
 
 
804
 
    def get_inventory_xml(self, revision_id):
805
 
        """Get inventory XML as a file object."""
806
 
        try:
807
 
            assert isinstance(revision_id, basestring), type(revision_id)
808
 
            iw = self.get_inventory_weave()
809
 
            return iw.get_text(iw.lookup(revision_id))
810
 
        except IndexError:
811
 
            raise bzrlib.errors.HistoryMissing(self, 'inventory', revision_id)
812
 
 
813
 
    def get_inventory_sha1(self, revision_id):
814
 
        """Return the sha1 hash of the inventory entry
815
 
        """
816
 
        return self.get_revision(revision_id).inventory_sha1
 
507
 
 
508
    def get_inventory(self, inventory_id):
 
509
        """Get Inventory object by hash.
 
510
 
 
511
        :todo: Perhaps for this and similar methods, take a revision
 
512
               parameter which can be either an integer revno or a
 
513
               string hash."""
 
514
        i = Inventory.read_xml(self.inventory_store[inventory_id])
 
515
        return i
 
516
 
817
517
 
818
518
    def get_revision_inventory(self, revision_id):
819
519
        """Return inventory of a past revision."""
820
 
        # TODO: Unify this with get_inventory()
821
 
        # bzr 0.0.6 and later imposes the constraint that the inventory_id
822
 
        # must be the same as its revision, so this is trivial.
823
520
        if revision_id == None:
824
 
            return Inventory(self.get_root_id())
 
521
            return Inventory()
825
522
        else:
826
 
            return self.get_inventory(revision_id)
 
523
            return self.get_inventory(self.get_revision(revision_id).inventory_id)
 
524
 
827
525
 
828
526
    def revision_history(self):
829
 
        """Return sequence of revision hashes on to this branch."""
830
 
        self.lock_read()
831
 
        try:
832
 
            return [l.rstrip('\r\n') for l in
833
 
                    self.controlfile('revision-history', 'r').readlines()]
834
 
        finally:
835
 
            self.unlock()
 
527
        """Return sequence of revision hashes on to this branch.
836
528
 
837
 
    def common_ancestor(self, other, self_revno=None, other_revno=None):
838
 
        """
839
 
        >>> from bzrlib.commit import commit
840
 
        >>> sb = ScratchBranch(files=['foo', 'foo~'])
841
 
        >>> sb.common_ancestor(sb) == (None, None)
842
 
        True
843
 
        >>> commit(sb, "Committing first revision", verbose=False)
844
 
        >>> sb.common_ancestor(sb)[0]
845
 
        1
846
 
        >>> clone = sb.clone()
847
 
        >>> commit(sb, "Committing second revision", verbose=False)
848
 
        >>> sb.common_ancestor(sb)[0]
849
 
        2
850
 
        >>> sb.common_ancestor(clone)[0]
851
 
        1
852
 
        >>> commit(clone, "Committing divergent second revision", 
853
 
        ...               verbose=False)
854
 
        >>> sb.common_ancestor(clone)[0]
855
 
        1
856
 
        >>> sb.common_ancestor(clone) == clone.common_ancestor(sb)
857
 
        True
858
 
        >>> sb.common_ancestor(sb) != clone.common_ancestor(clone)
859
 
        True
860
 
        >>> clone2 = sb.clone()
861
 
        >>> sb.common_ancestor(clone2)[0]
862
 
        2
863
 
        >>> sb.common_ancestor(clone2, self_revno=1)[0]
864
 
        1
865
 
        >>> sb.common_ancestor(clone2, other_revno=1)[0]
866
 
        1
867
 
        """
868
 
        my_history = self.revision_history()
869
 
        other_history = other.revision_history()
870
 
        if self_revno is None:
871
 
            self_revno = len(my_history)
872
 
        if other_revno is None:
873
 
            other_revno = len(other_history)
874
 
        indices = range(min((self_revno, other_revno)))
875
 
        indices.reverse()
876
 
        for r in indices:
877
 
            if my_history[r] == other_history[r]:
878
 
                return r+1, my_history[r]
879
 
        return None, None
 
529
        >>> ScratchBranch().revision_history()
 
530
        []
 
531
        """
 
532
        return [chomp(l) for l in self.controlfile('revision-history').readlines()]
880
533
 
881
534
 
882
535
    def revno(self):
884
537
 
885
538
        That is equivalent to the number of revisions committed to
886
539
        this branch.
 
540
 
 
541
        >>> b = ScratchBranch()
 
542
        >>> b.revno()
 
543
        0
 
544
        >>> b.commit('no foo')
 
545
        >>> b.revno()
 
546
        1
887
547
        """
888
548
        return len(self.revision_history())
889
549
 
890
550
 
891
 
    def last_revision(self):
 
551
    def last_patch(self):
892
552
        """Return last patch hash, or None if no history.
 
553
 
 
554
        >>> ScratchBranch().last_patch() == None
 
555
        True
893
556
        """
894
557
        ph = self.revision_history()
895
558
        if ph:
896
559
            return ph[-1]
897
 
        else:
898
 
            return None
899
 
 
900
 
 
901
 
    def missing_revisions(self, other, stop_revision=None, diverged_ok=False):
902
 
        """Return a list of new revisions that would perfectly fit.
903
 
        
904
 
        If self and other have not diverged, return a list of the revisions
905
 
        present in other, but missing from self.
906
 
 
907
 
        >>> from bzrlib.commit import commit
908
 
        >>> bzrlib.trace.silent = True
909
 
        >>> br1 = ScratchBranch()
910
 
        >>> br2 = ScratchBranch()
911
 
        >>> br1.missing_revisions(br2)
912
 
        []
913
 
        >>> commit(br2, "lala!", rev_id="REVISION-ID-1")
914
 
        >>> br1.missing_revisions(br2)
915
 
        [u'REVISION-ID-1']
916
 
        >>> br2.missing_revisions(br1)
917
 
        []
918
 
        >>> commit(br1, "lala!", rev_id="REVISION-ID-1")
919
 
        >>> br1.missing_revisions(br2)
920
 
        []
921
 
        >>> commit(br2, "lala!", rev_id="REVISION-ID-2A")
922
 
        >>> br1.missing_revisions(br2)
923
 
        [u'REVISION-ID-2A']
924
 
        >>> commit(br1, "lala!", rev_id="REVISION-ID-2B")
925
 
        >>> br1.missing_revisions(br2)
926
 
        Traceback (most recent call last):
927
 
        DivergedBranches: These branches have diverged.
928
 
        """
929
 
        # FIXME: If the branches have diverged, but the latest
930
 
        # revision in this branch is completely merged into the other,
931
 
        # then we should still be able to pull.
932
 
        self_history = self.revision_history()
933
 
        self_len = len(self_history)
934
 
        other_history = other.revision_history()
935
 
        other_len = len(other_history)
936
 
        common_index = min(self_len, other_len) -1
937
 
        if common_index >= 0 and \
938
 
            self_history[common_index] != other_history[common_index]:
939
 
            raise DivergedBranches(self, other)
940
 
 
941
 
        if stop_revision is None:
942
 
            stop_revision = other_len
943
 
        else:
944
 
            assert isinstance(stop_revision, int)
945
 
            if stop_revision > other_len:
946
 
                raise bzrlib.errors.NoSuchRevision(self, stop_revision)
947
 
        return other_history[self_len:stop_revision]
948
 
 
949
 
    def update_revisions(self, other, stop_revision=None):
950
 
        """Pull in new perfect-fit revisions."""
951
 
        from bzrlib.fetch import greedy_fetch
952
 
        from bzrlib.revision import get_intervening_revisions
953
 
        if stop_revision is None:
954
 
            stop_revision = other.last_revision()
955
 
        greedy_fetch(to_branch=self, from_branch=other,
956
 
                     revision=stop_revision)
957
 
        pullable_revs = self.missing_revisions(
958
 
            other, other.revision_id_to_revno(stop_revision))
959
 
        if pullable_revs:
960
 
            greedy_fetch(to_branch=self,
961
 
                         from_branch=other,
962
 
                         revision=pullable_revs[-1])
963
 
            self.append_revision(*pullable_revs)
964
 
    
965
 
 
966
 
    def commit(self, *args, **kw):
967
 
        from bzrlib.commit import Commit
968
 
        Commit().commit(self, *args, **kw)
969
 
    
970
 
    def revision_id_to_revno(self, revision_id):
971
 
        """Given a revision id, return its revno"""
972
 
        if revision_id is None:
973
 
            return 0
974
 
        history = self.revision_history()
975
 
        try:
976
 
            return history.index(revision_id) + 1
977
 
        except ValueError:
978
 
            raise bzrlib.errors.NoSuchRevision(self, revision_id)
979
 
 
980
 
    def get_rev_id(self, revno, history=None):
981
 
        """Find the revision id of the specified revno."""
 
560
 
 
561
 
 
562
    def lookup_revision(self, revno):
 
563
        """Return revision hash for revision number."""
982
564
        if revno == 0:
983
565
            return None
984
 
        if history is None:
985
 
            history = self.revision_history()
986
 
        elif revno <= 0 or revno > len(history):
987
 
            raise bzrlib.errors.NoSuchRevision(self, revno)
988
 
        return history[revno - 1]
 
566
 
 
567
        try:
 
568
            # list is 0-based; revisions are 1-based
 
569
            return self.revision_history()[revno-1]
 
570
        except IndexError:
 
571
            bailout("no such revision %s" % revno)
 
572
 
989
573
 
990
574
    def revision_tree(self, revision_id):
991
575
        """Return Tree for a revision on this branch.
992
576
 
993
577
        `revision_id` may be None for the null revision, in which case
994
578
        an `EmptyTree` is returned."""
995
 
        # TODO: refactor this to use an existing revision object
996
 
        # so we don't need to read it in twice.
 
579
 
997
580
        if revision_id == None:
998
581
            return EmptyTree()
999
582
        else:
1000
583
            inv = self.get_revision_inventory(revision_id)
1001
 
            return RevisionTree(self.weave_store, inv, revision_id)
 
584
            return RevisionTree(self.text_store, inv)
1002
585
 
1003
586
 
1004
587
    def working_tree(self):
1005
588
        """Return a `Tree` for the working copy."""
1006
 
        from bzrlib.workingtree import WorkingTree
1007
 
        # TODO: In the future, WorkingTree should utilize Transport
1008
 
        # RobertCollins 20051003 - I don't think it should - working trees are
1009
 
        # much more complex to keep consistent than our careful .bzr subset.
1010
 
        # instead, we should say that working trees are local only, and optimise
1011
 
        # for that.
1012
 
        return WorkingTree(self._transport.base, self.read_working_inventory())
 
589
        return WorkingTree(self.base, self.read_working_inventory())
1013
590
 
1014
591
 
1015
592
    def basis_tree(self):
1016
593
        """Return `Tree` object for last revision.
1017
594
 
1018
595
        If there are no revisions yet, return an `EmptyTree`.
1019
 
        """
1020
 
        return self.revision_tree(self.last_revision())
1021
 
 
1022
 
 
1023
 
    def rename_one(self, from_rel, to_rel):
1024
 
        """Rename one file.
1025
 
 
1026
 
        This can change the directory or the filename or both.
1027
 
        """
1028
 
        self.lock_write()
1029
 
        try:
1030
 
            tree = self.working_tree()
1031
 
            inv = tree.inventory
1032
 
            if not tree.has_filename(from_rel):
1033
 
                raise BzrError("can't rename: old working file %r does not exist" % from_rel)
1034
 
            if tree.has_filename(to_rel):
1035
 
                raise BzrError("can't rename: new working file %r already exists" % to_rel)
1036
 
 
1037
 
            file_id = inv.path2id(from_rel)
1038
 
            if file_id == None:
1039
 
                raise BzrError("can't rename: old name %r is not versioned" % from_rel)
1040
 
 
1041
 
            if inv.path2id(to_rel):
1042
 
                raise BzrError("can't rename: new name %r is already versioned" % to_rel)
1043
 
 
1044
 
            to_dir, to_tail = os.path.split(to_rel)
1045
 
            to_dir_id = inv.path2id(to_dir)
1046
 
            if to_dir_id == None and to_dir != '':
1047
 
                raise BzrError("can't determine destination directory id for %r" % to_dir)
1048
 
 
1049
 
            mutter("rename_one:")
1050
 
            mutter("  file_id    {%s}" % file_id)
1051
 
            mutter("  from_rel   %r" % from_rel)
1052
 
            mutter("  to_rel     %r" % to_rel)
1053
 
            mutter("  to_dir     %r" % to_dir)
1054
 
            mutter("  to_dir_id  {%s}" % to_dir_id)
1055
 
 
1056
 
            inv.rename(file_id, to_dir_id, to_tail)
1057
 
 
1058
 
            from_abs = self.abspath(from_rel)
1059
 
            to_abs = self.abspath(to_rel)
1060
 
            try:
1061
 
                rename(from_abs, to_abs)
1062
 
            except OSError, e:
1063
 
                raise BzrError("failed to rename %r to %r: %s"
1064
 
                        % (from_abs, to_abs, e[1]),
1065
 
                        ["rename rolled back"])
1066
 
 
1067
 
            self._write_inventory(inv)
1068
 
        finally:
1069
 
            self.unlock()
1070
 
 
1071
 
 
1072
 
    def move(self, from_paths, to_name):
1073
 
        """Rename files.
1074
 
 
1075
 
        to_name must exist as a versioned directory.
1076
 
 
1077
 
        If to_name exists and is a directory, the files are moved into
1078
 
        it, keeping their old names.  If it is a directory, 
1079
 
 
1080
 
        Note that to_name is only the last component of the new name;
1081
 
        this doesn't change the directory.
1082
 
 
1083
 
        This returns a list of (from_path, to_path) pairs for each
1084
 
        entry that is moved.
1085
 
        """
1086
 
        result = []
1087
 
        self.lock_write()
1088
 
        try:
1089
 
            ## TODO: Option to move IDs only
1090
 
            assert not isinstance(from_paths, basestring)
1091
 
            tree = self.working_tree()
1092
 
            inv = tree.inventory
1093
 
            to_abs = self.abspath(to_name)
1094
 
            if not isdir(to_abs):
1095
 
                raise BzrError("destination %r is not a directory" % to_abs)
1096
 
            if not tree.has_filename(to_name):
1097
 
                raise BzrError("destination %r not in working directory" % to_abs)
1098
 
            to_dir_id = inv.path2id(to_name)
1099
 
            if to_dir_id == None and to_name != '':
1100
 
                raise BzrError("destination %r is not a versioned directory" % to_name)
1101
 
            to_dir_ie = inv[to_dir_id]
1102
 
            if to_dir_ie.kind not in ('directory', 'root_directory'):
1103
 
                raise BzrError("destination %r is not a directory" % to_abs)
1104
 
 
1105
 
            to_idpath = inv.get_idpath(to_dir_id)
1106
 
 
1107
 
            for f in from_paths:
1108
 
                if not tree.has_filename(f):
1109
 
                    raise BzrError("%r does not exist in working tree" % f)
1110
 
                f_id = inv.path2id(f)
1111
 
                if f_id == None:
1112
 
                    raise BzrError("%r is not versioned" % f)
1113
 
                name_tail = splitpath(f)[-1]
1114
 
                dest_path = appendpath(to_name, name_tail)
1115
 
                if tree.has_filename(dest_path):
1116
 
                    raise BzrError("destination %r already exists" % dest_path)
1117
 
                if f_id in to_idpath:
1118
 
                    raise BzrError("can't move %r to a subdirectory of itself" % f)
1119
 
 
1120
 
            # OK, so there's a race here, it's possible that someone will
1121
 
            # create a file in this interval and then the rename might be
1122
 
            # left half-done.  But we should have caught most problems.
1123
 
 
1124
 
            for f in from_paths:
1125
 
                name_tail = splitpath(f)[-1]
1126
 
                dest_path = appendpath(to_name, name_tail)
1127
 
                result.append((f, dest_path))
1128
 
                inv.rename(inv.path2id(f), to_dir_id, name_tail)
1129
 
                try:
1130
 
                    rename(self.abspath(f), self.abspath(dest_path))
1131
 
                except OSError, e:
1132
 
                    raise BzrError("failed to rename %r to %r: %s" % (f, dest_path, e[1]),
1133
 
                            ["rename rolled back"])
1134
 
 
1135
 
            self._write_inventory(inv)
1136
 
        finally:
1137
 
            self.unlock()
1138
 
 
1139
 
        return result
1140
 
 
1141
 
 
1142
 
    def revert(self, filenames, old_tree=None, backups=True):
1143
 
        """Restore selected files to the versions from a previous tree.
1144
 
 
1145
 
        backups
1146
 
            If true (default) backups are made of files before
1147
 
            they're renamed.
1148
 
        """
1149
 
        from bzrlib.errors import NotVersionedError, BzrError
1150
 
        from bzrlib.atomicfile import AtomicFile
1151
 
        from bzrlib.osutils import backup_file
1152
 
        
1153
 
        inv = self.read_working_inventory()
1154
 
        if old_tree is None:
1155
 
            old_tree = self.basis_tree()
1156
 
        old_inv = old_tree.inventory
1157
 
 
1158
 
        nids = []
1159
 
        for fn in filenames:
1160
 
            file_id = inv.path2id(fn)
1161
 
            if not file_id:
1162
 
                raise NotVersionedError("not a versioned file", fn)
1163
 
            if not old_inv.has_id(file_id):
1164
 
                raise BzrError("file not present in old tree", fn, file_id)
1165
 
            nids.append((fn, file_id))
1166
 
            
1167
 
        # TODO: Rename back if it was previously at a different location
1168
 
 
1169
 
        # TODO: If given a directory, restore the entire contents from
1170
 
        # the previous version.
1171
 
 
1172
 
        # TODO: Make a backup to a temporary file.
1173
 
 
1174
 
        # TODO: If the file previously didn't exist, delete it?
1175
 
        for fn, file_id in nids:
1176
 
            backup_file(fn)
1177
 
            
1178
 
            f = AtomicFile(fn, 'wb')
1179
 
            try:
1180
 
                f.write(old_tree.get_file(file_id).read())
1181
 
                f.commit()
1182
 
            finally:
1183
 
                f.close()
1184
 
 
1185
 
 
1186
 
    def pending_merges(self):
1187
 
        """Return a list of pending merges.
1188
 
 
1189
 
        These are revisions that have been merged into the working
1190
 
        directory but not yet committed.
1191
 
        """
1192
 
        cfn = self._rel_controlfilename('pending-merges')
1193
 
        if not self._transport.has(cfn):
1194
 
            return []
1195
 
        p = []
1196
 
        for l in self.controlfile('pending-merges', 'r').readlines():
1197
 
            p.append(l.rstrip('\n'))
1198
 
        return p
1199
 
 
1200
 
 
1201
 
    def add_pending_merge(self, *revision_ids):
1202
 
        # TODO: Perhaps should check at this point that the
1203
 
        # history of the revision is actually present?
1204
 
        p = self.pending_merges()
1205
 
        updated = False
1206
 
        for rev_id in revision_ids:
1207
 
            if rev_id in p:
1208
 
                continue
1209
 
            p.append(rev_id)
1210
 
            updated = True
1211
 
        if updated:
1212
 
            self.set_pending_merges(p)
1213
 
 
1214
 
    def set_pending_merges(self, rev_list):
1215
 
        self.lock_write()
1216
 
        try:
1217
 
            self.put_controlfile('pending-merges', '\n'.join(rev_list))
1218
 
        finally:
1219
 
            self.unlock()
1220
 
 
1221
 
 
1222
 
    def get_parent(self):
1223
 
        """Return the parent location of the branch.
1224
 
 
1225
 
        This is the default location for push/pull/missing.  The usual
1226
 
        pattern is that the user can override it by specifying a
1227
 
        location.
1228
 
        """
1229
 
        import errno
1230
 
        _locs = ['parent', 'pull', 'x-pull']
1231
 
        for l in _locs:
1232
 
            try:
1233
 
                return self.controlfile(l, 'r').read().strip('\n')
1234
 
            except IOError, e:
1235
 
                if e.errno != errno.ENOENT:
1236
 
                    raise
1237
 
        return None
1238
 
 
1239
 
 
1240
 
    def set_parent(self, url):
1241
 
        # TODO: Maybe delete old location files?
1242
 
        from bzrlib.atomicfile import AtomicFile
1243
 
        self.lock_write()
1244
 
        try:
1245
 
            f = AtomicFile(self.controlfilename('parent'))
1246
 
            try:
1247
 
                f.write(url + '\n')
1248
 
                f.commit()
1249
 
            finally:
1250
 
                f.close()
1251
 
        finally:
1252
 
            self.unlock()
1253
 
 
1254
 
    def check_revno(self, revno):
1255
 
        """\
1256
 
        Check whether a revno corresponds to any revision.
1257
 
        Zero (the NULL revision) is considered valid.
1258
 
        """
1259
 
        if revno != 0:
1260
 
            self.check_real_revno(revno)
1261
 
            
1262
 
    def check_real_revno(self, revno):
1263
 
        """\
1264
 
        Check whether a revno corresponds to a real revision.
1265
 
        Zero (the NULL revision) is considered invalid
1266
 
        """
1267
 
        if revno < 1 or revno > self.revno():
1268
 
            raise InvalidRevisionNumber(revno)
1269
 
        
1270
 
        
1271
 
        
1272
 
 
1273
 
 
1274
 
class ScratchBranch(_Branch):
 
596
 
 
597
        >>> b = ScratchBranch(files=['foo'])
 
598
        >>> b.basis_tree().has_filename('foo')
 
599
        False
 
600
        >>> b.working_tree().has_filename('foo')
 
601
        True
 
602
        >>> b.add('foo')
 
603
        >>> b.commit('add foo')
 
604
        >>> b.basis_tree().has_filename('foo')
 
605
        True
 
606
        """
 
607
        r = self.last_patch()
 
608
        if r == None:
 
609
            return EmptyTree()
 
610
        else:
 
611
            return RevisionTree(self.text_store, self.get_revision_inventory(r))
 
612
 
 
613
 
 
614
 
 
615
    def write_log(self, utc=False):
 
616
        """Write out human-readable log of commits to this branch
 
617
 
 
618
        :param utc: If true, show dates in universal time, not local time."""
 
619
        ## TODO: Option to choose either original, utc or local timezone
 
620
        revno = 1
 
621
        precursor = None
 
622
        for p in self.revision_history():
 
623
            print '-' * 40
 
624
            print 'revno:', revno
 
625
            ## TODO: Show hash if --id is given.
 
626
            ##print 'revision-hash:', p
 
627
            rev = self.get_revision(p)
 
628
            print 'committer:', rev.committer
 
629
            print 'timestamp: %s' % (format_date(rev.timestamp, rev.timezone or 0))
 
630
 
 
631
            ## opportunistic consistency check, same as check_patch_chaining
 
632
            if rev.precursor != precursor:
 
633
                bailout("mismatched precursor!")
 
634
 
 
635
            print 'message:'
 
636
            if not rev.message:
 
637
                print '  (no message)'
 
638
            else:
 
639
                for l in rev.message.split('\n'):
 
640
                    print '  ' + l
 
641
 
 
642
            revno += 1
 
643
            precursor = p
 
644
 
 
645
 
 
646
 
 
647
    def show_status(branch, show_all=False):
 
648
        """Display single-line status for non-ignored working files.
 
649
 
 
650
        The list is show sorted in order by file name.
 
651
 
 
652
        >>> b = ScratchBranch(files=['foo', 'foo~'])
 
653
        >>> b.show_status()
 
654
        ?       foo
 
655
        >>> b.add('foo')
 
656
        >>> b.show_status()
 
657
        A       foo
 
658
        >>> b.commit("add foo")
 
659
        >>> b.show_status()
 
660
 
 
661
        :todo: Get state for single files.
 
662
 
 
663
        :todo: Perhaps show a slash at the end of directory names.        
 
664
 
 
665
        """
 
666
 
 
667
        # We have to build everything into a list first so that it can
 
668
        # sorted by name, incorporating all the different sources.
 
669
 
 
670
        # FIXME: Rather than getting things in random order and then sorting,
 
671
        # just step through in order.
 
672
 
 
673
        # Interesting case: the old ID for a file has been removed,
 
674
        # but a new file has been created under that name.
 
675
 
 
676
        old = branch.basis_tree()
 
677
        old_inv = old.inventory
 
678
        new = branch.working_tree()
 
679
        new_inv = new.inventory
 
680
 
 
681
        for fs, fid, oldname, newname, kind in diff_trees(old, new):
 
682
            if fs == 'R':
 
683
                show_status(fs, kind,
 
684
                            oldname + ' => ' + newname)
 
685
            elif fs == 'A' or fs == 'M':
 
686
                show_status(fs, kind, newname)
 
687
            elif fs == 'D':
 
688
                show_status(fs, kind, oldname)
 
689
            elif fs == '.':
 
690
                if show_all:
 
691
                    show_status(fs, kind, newname)
 
692
            elif fs == 'I':
 
693
                if show_all:
 
694
                    show_status(fs, kind, newname)
 
695
            elif fs == '?':
 
696
                show_status(fs, kind, newname)
 
697
            else:
 
698
                bailout("wierd file state %r" % ((fs, fid),))
 
699
                
 
700
 
 
701
 
 
702
class ScratchBranch(Branch):
1275
703
    """Special test class: a branch that cleans up after itself.
1276
704
 
1277
705
    >>> b = ScratchBranch()
1278
706
    >>> isdir(b.base)
1279
707
    True
1280
708
    >>> bd = b.base
1281
 
    >>> b.destroy()
 
709
    >>> del b
1282
710
    >>> isdir(bd)
1283
711
    False
1284
712
    """
1285
 
    def __init__(self, files=[], dirs=[], base=None):
 
713
    def __init__(self, files = []):
1286
714
        """Make a test branch.
1287
715
 
1288
716
        This creates a temporary directory and runs init-tree in it.
1289
717
 
1290
718
        If any files are listed, they are created in the working copy.
1291
719
        """
1292
 
        from tempfile import mkdtemp
1293
 
        init = False
1294
 
        if base is None:
1295
 
            base = mkdtemp()
1296
 
            init = True
1297
 
        if isinstance(base, basestring):
1298
 
            base = get_transport(base)
1299
 
        _Branch.__init__(self, base, init=init)
1300
 
        for d in dirs:
1301
 
            self._transport.mkdir(d)
1302
 
            
 
720
        Branch.__init__(self, tempfile.mkdtemp(), init=True)
1303
721
        for f in files:
1304
 
            self._transport.put(f, 'content of %s' % f)
1305
 
 
1306
 
 
1307
 
    def clone(self):
1308
 
        """
1309
 
        >>> orig = ScratchBranch(files=["file1", "file2"])
1310
 
        >>> clone = orig.clone()
1311
 
        >>> if os.name != 'nt':
1312
 
        ...   os.path.samefile(orig.base, clone.base)
1313
 
        ... else:
1314
 
        ...   orig.base == clone.base
1315
 
        ...
1316
 
        False
1317
 
        >>> os.path.isfile(os.path.join(clone.base, "file1"))
1318
 
        True
1319
 
        """
1320
 
        from shutil import copytree
1321
 
        from tempfile import mkdtemp
1322
 
        base = mkdtemp()
1323
 
        os.rmdir(base)
1324
 
        copytree(self.base, base, symlinks=True)
1325
 
        return ScratchBranch(base=base)
 
722
            file(os.path.join(self.base, f), 'w').write('content of %s' % f)
 
723
 
1326
724
 
1327
725
    def __del__(self):
1328
 
        self.destroy()
1329
 
 
1330
 
    def destroy(self):
1331
726
        """Destroy the test branch, removing the scratch directory."""
1332
 
        from shutil import rmtree
1333
 
        try:
1334
 
            if self.base:
1335
 
                mutter("delete ScratchBranch %s" % self.base)
1336
 
                rmtree(self.base)
1337
 
        except OSError, e:
1338
 
            # Work around for shutil.rmtree failing on Windows when
1339
 
            # readonly files are encountered
1340
 
            mutter("hit exception in destroying ScratchBranch: %s" % e)
1341
 
            for root, dirs, files in os.walk(self.base, topdown=False):
1342
 
                for name in files:
1343
 
                    os.chmod(os.path.join(root, name), 0700)
1344
 
            rmtree(self.base)
1345
 
        self._transport = None
 
727
        shutil.rmtree(self.base)
1346
728
 
1347
729
    
1348
730
 
1358
740
        ## mutter('check %r for control file' % ((head, tail), ))
1359
741
        if tail == bzrlib.BZRDIR:
1360
742
            return True
1361
 
        if filename == head:
1362
 
            break
1363
743
        filename = head
1364
744
    return False
1365
745
 
1366
746
 
1367
747
 
1368
 
def gen_file_id(name):
 
748
def _gen_revision_id(when):
 
749
    """Return new revision-id."""
 
750
    s = '%s-%s-' % (user_email(), compact_date(when))
 
751
    s += hexlify(rand_bytes(8))
 
752
    return s
 
753
 
 
754
 
 
755
def _gen_file_id(name):
1369
756
    """Return new file id.
1370
757
 
1371
758
    This should probably generate proper UUIDs, but for the moment we
1372
759
    cope with just randomness because running uuidgen every time is
1373
760
    slow."""
1374
 
    import re
1375
 
    from binascii import hexlify
1376
 
    from time import time
1377
 
 
1378
 
    # get last component
1379
 
    idx = name.rfind('/')
1380
 
    if idx != -1:
1381
 
        name = name[idx+1 : ]
1382
 
    idx = name.rfind('\\')
1383
 
    if idx != -1:
1384
 
        name = name[idx+1 : ]
1385
 
 
1386
 
    # make it not a hidden file
1387
 
    name = name.lstrip('.')
1388
 
 
1389
 
    # remove any wierd characters; we don't escape them but rather
1390
 
    # just pull them out
1391
 
    name = re.sub(r'[^\w.]', '', name)
1392
 
 
 
761
    assert '/' not in name
 
762
    while name[0] == '.':
 
763
        name = name[1:]
1393
764
    s = hexlify(rand_bytes(8))
1394
 
    return '-'.join((name, compact_date(time()), s))
1395
 
 
1396
 
 
1397
 
def gen_root_id():
1398
 
    """Return a new tree-root file id."""
1399
 
    return gen_file_id('TREE_ROOT')
 
765
    return '-'.join((name, compact_date(time.time()), s))
1400
766
 
1401
767