~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/revision.py

  • Committer: Matthew Revell
  • Date: 2008-03-05 14:11:35 UTC
  • mto: This revision was merged to the branch mainline in revision 3263.
  • Revision ID: matthew.revell@canonical.com-20080305141135-96jf8j24b9crru6v
Added an admin-guide directory to doc/en and outlined headings for the admin guide in index.txt

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# (C) 2005 Canonical
2
 
 
 
1
# Copyright (C) 2005, 2006 Canonical Ltd
 
2
#
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
5
5
# the Free Software Foundation; either version 2 of the License, or
6
6
# (at your option) any later version.
7
 
 
 
7
#
8
8
# This program is distributed in the hope that it will be useful,
9
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
10
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
11
11
# GNU General Public License for more details.
12
 
 
 
12
#
13
13
# You should have received a copy of the GNU General Public License
14
14
# along with this program; if not, write to the Free Software
15
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
16
 
17
 
 
18
 
import bzrlib.errors
19
 
 
20
 
 
21
 
class RevisionReference(object):
22
 
    """
23
 
    Reference to a stored revision.
24
 
 
25
 
    Includes the revision_id and revision_sha1.
26
 
    """
27
 
    revision_id = None
28
 
    revision_sha1 = None
29
 
    def __init__(self, revision_id, revision_sha1=None):
30
 
        if revision_id == None \
31
 
           or isinstance(revision_id, basestring):
32
 
            self.revision_id = revision_id
33
 
        else:
34
 
            raise ValueError('bad revision_id %r' % revision_id)
35
 
 
36
 
        if revision_sha1 != None:
37
 
            if isinstance(revision_sha1, basestring) \
38
 
               and len(revision_sha1) == 40:
39
 
                self.revision_sha1 = revision_sha1
40
 
            else:
41
 
                raise ValueError('bad revision_sha1 %r' % revision_sha1)
42
 
                
 
17
# TODO: Some kind of command-line display of revision properties: 
 
18
# perhaps show them in log -v and allow them as options to the commit command.
 
19
 
 
20
 
 
21
from bzrlib import (
 
22
    errors,
 
23
    symbol_versioning
 
24
    )
 
25
from bzrlib.deprecated_graph import (
 
26
    all_descendants,
 
27
    Graph,
 
28
    node_distances,
 
29
    select_farthest,
 
30
    )
 
31
from bzrlib.osutils import contains_whitespace
 
32
from bzrlib.progress import DummyProgress
 
33
from bzrlib.symbol_versioning import (deprecated_function,
 
34
        )
 
35
 
 
36
NULL_REVISION="null:"
 
37
CURRENT_REVISION="current:"
43
38
 
44
39
 
45
40
class Revision(object):
51
46
 
52
47
    After bzr 0.0.5 revisions are allowed to have multiple parents.
53
48
 
54
 
    parents
55
 
        List of parent revisions, each is a RevisionReference.
 
49
    parent_ids
 
50
        List of parent revision_ids
 
51
 
 
52
    properties
 
53
        Dictionary of revision properties.  These are attached to the
 
54
        revision as extra metadata.  The name must be a single 
 
55
        word; the value can be an arbitrary string.
56
56
    """
57
 
    inventory_id = None
58
 
    inventory_sha1 = None
59
 
    revision_id = None
60
 
    timestamp = None
61
 
    message = None
62
 
    timezone = None
63
 
    committer = None
64
57
    
65
 
    def __init__(self, **args):
 
58
    def __init__(self, revision_id, properties=None, **args):
 
59
        self.revision_id = revision_id
 
60
        self.properties = properties or {}
 
61
        self._check_properties()
 
62
        self.parent_ids = []
 
63
        self.parent_sha1s = []
 
64
        """Not used anymore - legacy from for 4."""
66
65
        self.__dict__.update(args)
67
 
        self.parents = []
68
 
 
69
66
 
70
67
    def __repr__(self):
71
68
        return "<Revision id %s>" % self.revision_id
72
69
 
73
 
        
74
 
    def to_element(self):
75
 
        from bzrlib.xml import Element, SubElement
76
 
        
77
 
        root = Element('revision',
78
 
                       committer = self.committer,
79
 
                       timestamp = '%.9f' % self.timestamp,
80
 
                       revision_id = self.revision_id,
81
 
                       inventory_id = self.inventory_id,
82
 
                       inventory_sha1 = self.inventory_sha1,
83
 
                       )
84
 
        if self.timezone:
85
 
            root.set('timezone', str(self.timezone))
86
 
        root.text = '\n'
87
 
        
88
 
        msg = SubElement(root, 'message')
89
 
        msg.text = self.message
90
 
        msg.tail = '\n'
91
 
 
92
 
        if self.parents:
93
 
            pelts = SubElement(root, 'parents')
94
 
            pelts.tail = pelts.text = '\n'
95
 
            for rr in self.parents:
96
 
                assert isinstance(rr, RevisionReference)
97
 
                p = SubElement(pelts, 'revision_ref')
98
 
                p.tail = '\n'
99
 
                assert rr.revision_id
100
 
                p.set('revision_id', rr.revision_id)
101
 
                if rr.revision_sha1:
102
 
                    p.set('revision_sha1', rr.revision_sha1)
103
 
 
104
 
        return root
105
 
 
106
 
 
107
 
    def from_element(cls, elt):
108
 
        return unpack_revision(elt)
109
 
 
110
 
    from_element = classmethod(from_element)
111
 
 
112
 
 
113
 
 
114
 
def unpack_revision(elt):
115
 
    """Convert XML element into Revision object."""
116
 
    # <changeset> is deprecated...
117
 
    if elt.tag not in ('revision', 'changeset'):
118
 
        raise bzrlib.errors.BzrError("unexpected tag in revision file: %r" % elt)
119
 
 
120
 
    rev = Revision(committer = elt.get('committer'),
121
 
                   timestamp = float(elt.get('timestamp')),
122
 
                   revision_id = elt.get('revision_id'),
123
 
                   inventory_id = elt.get('inventory_id'),
124
 
                   inventory_sha1 = elt.get('inventory_sha1')
125
 
                   )
126
 
 
127
 
    precursor = elt.get('precursor')
128
 
    precursor_sha1 = elt.get('precursor_sha1')
129
 
 
130
 
    pelts = elt.find('parents')
131
 
 
132
 
    if pelts:
133
 
        for p in pelts:
134
 
            assert p.tag == 'revision_ref', \
135
 
                   "bad parent node tag %r" % p.tag
136
 
            rev_ref = RevisionReference(p.get('revision_id'),
137
 
                                        p.get('revision_sha1'))
138
 
            rev.parents.append(rev_ref)
139
 
 
140
 
        if precursor:
141
 
            # must be consistent
142
 
            prec_parent = rev.parents[0].revision_id
143
 
            assert prec_parent == precursor
144
 
    elif precursor:
145
 
        # revisions written prior to 0.0.5 have a single precursor
146
 
        # give as an attribute
147
 
        rev_ref = RevisionReference(precursor, precursor_sha1)
148
 
        rev.parents.append(rev_ref)
149
 
 
150
 
    v = elt.get('timezone')
151
 
    rev.timezone = v and int(v)
152
 
 
153
 
    rev.message = elt.findtext('message') # text of <message>
154
 
    return rev
155
 
 
156
 
 
157
 
 
158
 
REVISION_ID_RE = None
159
 
 
160
 
def validate_revision_id(rid):
161
 
    """Check rid is syntactically valid for a revision id."""
162
 
    global REVISION_ID_RE
163
 
    if not REVISION_ID_RE:
164
 
        import re
165
 
        REVISION_ID_RE = re.compile('[\w.-]+@[\w.-]+--?\d+--?[0-9a-f]+\Z')
166
 
 
167
 
    if not REVISION_ID_RE.match(rid):
168
 
        raise ValueError("malformed revision-id %r" % rid)
169
 
 
170
 
def is_ancestor(revision_id, candidate_id, revision_source):
 
70
    def __eq__(self, other):
 
71
        if not isinstance(other, Revision):
 
72
            return False
 
73
        # FIXME: rbc 20050930 parent_ids are not being compared
 
74
        return (
 
75
                self.inventory_sha1 == other.inventory_sha1
 
76
                and self.revision_id == other.revision_id
 
77
                and self.timestamp == other.timestamp
 
78
                and self.message == other.message
 
79
                and self.timezone == other.timezone
 
80
                and self.committer == other.committer
 
81
                and self.properties == other.properties)
 
82
 
 
83
    def __ne__(self, other):
 
84
        return not self.__eq__(other)
 
85
 
 
86
    def _check_properties(self):
 
87
        """Verify that all revision properties are OK."""
 
88
        for name, value in self.properties.iteritems():
 
89
            if not isinstance(name, basestring) or contains_whitespace(name):
 
90
                raise ValueError("invalid property name %r" % name)
 
91
            if not isinstance(value, basestring):
 
92
                raise ValueError("invalid property value %r for %r" % 
 
93
                                 (name, value))
 
94
 
 
95
    def get_history(self, repository):
 
96
        """Return the canonical line-of-history for this revision.
 
97
 
 
98
        If ghosts are present this may differ in result from a ghost-free
 
99
        repository.
 
100
        """
 
101
        current_revision = self
 
102
        reversed_result = []
 
103
        while current_revision is not None:
 
104
            reversed_result.append(current_revision.revision_id)
 
105
            if not len (current_revision.parent_ids):
 
106
                reversed_result.append(None)
 
107
                current_revision = None
 
108
            else:
 
109
                next_revision_id = current_revision.parent_ids[0]
 
110
                current_revision = repository.get_revision(next_revision_id)
 
111
        reversed_result.reverse()
 
112
        return reversed_result
 
113
 
 
114
    def get_summary(self):
 
115
        """Get the first line of the log message for this revision.
 
116
        """
 
117
        return self.message.lstrip().split('\n', 1)[0]
 
118
 
 
119
    def get_apparent_author(self):
 
120
        """Return the apparent author of this revision.
 
121
 
 
122
        If the revision properties contain the author name,
 
123
        return it. Otherwise return the committer name.
 
124
        """
 
125
        return self.properties.get('author', self.committer)
 
126
 
 
127
 
 
128
@deprecated_function(symbol_versioning.one_zero)
 
129
def is_ancestor(revision_id, candidate_id, branch):
171
130
    """Return true if candidate_id is an ancestor of revision_id.
 
131
 
172
132
    A false negative will be returned if any intermediate descendent of
173
133
    candidate_id is not present in any of the revision_sources.
174
134
    
175
135
    revisions_source is an object supporting a get_revision operation that
176
136
    behaves like Branch's.
 
137
 
 
138
    This function is deprecated, it is better for callers to directly use
 
139
    Graph.is_ancestor() (just watch out that the parameter order is switched)
177
140
    """
178
 
 
 
141
    return branch.repository.get_graph().is_ancestor(candidate_id, revision_id)
 
142
 
 
143
 
 
144
def iter_ancestors(revision_id, revision_source, only_present=False):
179
145
    ancestors = (revision_id,)
 
146
    distance = 0
180
147
    while len(ancestors) > 0:
181
148
        new_ancestors = []
182
149
        for ancestor in ancestors:
183
 
            if ancestor == candidate_id:
184
 
                return True
 
150
            if not only_present:
 
151
                yield ancestor, distance
185
152
            try:
186
153
                revision = revision_source.get_revision(ancestor)
187
 
            except bzrlib.errors.NoSuchRevision, e:
 
154
            except errors.NoSuchRevision, e:
188
155
                if e.revision == revision_id:
189
156
                    raise 
190
157
                else:
191
158
                    continue
192
 
            new_ancestors.extend([p.revision_id for p in revision.parents])
 
159
            if only_present:
 
160
                yield ancestor, distance
 
161
            new_ancestors.extend(revision.parent_ids)
193
162
        ancestors = new_ancestors
 
163
        distance += 1
 
164
 
 
165
 
 
166
def find_present_ancestors(revision_id, revision_source):
 
167
    """Return the ancestors of a revision present in a branch.
 
168
 
 
169
    It's possible that a branch won't have the complete ancestry of
 
170
    one of its revisions.  
 
171
 
 
172
    """
 
173
    found_ancestors = {}
 
174
    anc_iter = enumerate(iter_ancestors(revision_id, revision_source,
 
175
                         only_present=True))
 
176
    for anc_order, (anc_id, anc_distance) in anc_iter:
 
177
        if anc_id not in found_ancestors:
 
178
            found_ancestors[anc_id] = (anc_order, anc_distance)
 
179
    return found_ancestors
 
180
    
 
181
 
 
182
def __get_closest(intersection):
 
183
    intersection.sort()
 
184
    matches = [] 
 
185
    for entry in intersection:
 
186
        if entry[0] == intersection[0][0]:
 
187
            matches.append(entry[2])
 
188
    return matches
 
189
 
 
190
 
 
191
def revision_graph(revision, revision_source):
 
192
    """Produce a graph of the ancestry of the specified revision.
 
193
    
 
194
    :return: root, ancestors map, descendants map
 
195
    """
 
196
    revision_source.lock_read()
 
197
    try:
 
198
        return _revision_graph(revision, revision_source)
 
199
    finally:
 
200
        revision_source.unlock()
 
201
 
 
202
 
 
203
def _revision_graph(revision, revision_source):
 
204
    """See revision_graph."""
 
205
    from bzrlib.tsort import topo_sort
 
206
    graph = revision_source.get_revision_graph(revision)
 
207
    # mark all no-parent revisions as being NULL_REVISION parentage.
 
208
    for node, parents in graph.items():
 
209
        if len(parents) == 0:
 
210
            graph[node] = [NULL_REVISION]
 
211
    # add NULL_REVISION to the graph
 
212
    graph[NULL_REVISION] = []
 
213
 
 
214
    # pick a root. If there are multiple roots
 
215
    # this could pick a random one.
 
216
    topo_order = topo_sort(graph.items())
 
217
    root = topo_order[0]
 
218
 
 
219
    ancestors = {}
 
220
    descendants = {}
 
221
 
 
222
    # map the descendants of the graph.
 
223
    # and setup our set based return graph.
 
224
    for node in graph.keys():
 
225
        descendants[node] = {}
 
226
    for node, parents in graph.items():
 
227
        for parent in parents:
 
228
            descendants[parent][node] = 1
 
229
        ancestors[node] = set(parents)
 
230
 
 
231
    assert root not in descendants[root]
 
232
    assert root not in ancestors[root]
 
233
    return root, ancestors, descendants
 
234
 
 
235
 
 
236
def combined_graph(revision_a, revision_b, revision_source):
 
237
    """Produce a combined ancestry graph.
 
238
    Return graph root, ancestors map, descendants map, set of common nodes"""
 
239
    root, ancestors, descendants = revision_graph(
 
240
        revision_a, revision_source)
 
241
    root_b, ancestors_b, descendants_b = revision_graph(
 
242
        revision_b, revision_source)
 
243
    if root != root_b:
 
244
        raise errors.NoCommonRoot(revision_a, revision_b)
 
245
    common = set()
 
246
    for node, node_anc in ancestors_b.iteritems():
 
247
        if node in ancestors:
 
248
            common.add(node)
 
249
        else:
 
250
            ancestors[node] = set()
 
251
        ancestors[node].update(node_anc)
 
252
    for node, node_dec in descendants_b.iteritems():
 
253
        if node not in descendants:
 
254
            descendants[node] = {}
 
255
        descendants[node].update(node_dec)
 
256
    return root, ancestors, descendants, common
 
257
 
 
258
 
 
259
def common_ancestor(revision_a, revision_b, revision_source, 
 
260
                    pb=DummyProgress()):
 
261
    if None in (revision_a, revision_b):
 
262
        return None
 
263
    if NULL_REVISION in (revision_a, revision_b):
 
264
        return NULL_REVISION
 
265
    # trivial optimisation
 
266
    if revision_a == revision_b:
 
267
        return revision_a
 
268
    try:
 
269
        try:
 
270
            pb.update('Picking ancestor', 1, 3)
 
271
            graph = revision_source.get_revision_graph_with_ghosts(
 
272
                [revision_a, revision_b])
 
273
            # Shortcut the case where one of the tips is already included in
 
274
            # the other graphs ancestry.
 
275
            ancestry_a = graph.get_ancestry(revision_a, topo_sorted=False)
 
276
            if revision_b in ancestry_a:
 
277
                return revision_b
 
278
            ancestry_b = graph.get_ancestry(revision_b, topo_sorted=False)
 
279
            if revision_a in ancestry_b:
 
280
                return revision_a
 
281
            # convert to a NULL_REVISION based graph.
 
282
            ancestors = graph.get_ancestors()
 
283
            descendants = graph.get_descendants()
 
284
            common = set(ancestry_a)
 
285
            common.intersection_update(ancestry_b)
 
286
            descendants[NULL_REVISION] = {}
 
287
            ancestors[NULL_REVISION] = []
 
288
            for root in graph.roots:
 
289
                descendants[NULL_REVISION][root] = 1
 
290
                ancestors[root].append(NULL_REVISION)
 
291
            for ghost in graph.ghosts:
 
292
                # ghosts act as roots for the purpose of finding 
 
293
                # the longest paths from the root: any ghost *might*
 
294
                # be directly attached to the root, so we treat them
 
295
                # as being such.
 
296
                # ghost now descends from NULL
 
297
                descendants[NULL_REVISION][ghost] = 1
 
298
                # that is it has an ancestor of NULL
 
299
                ancestors[ghost] = [NULL_REVISION]
 
300
                # ghost is common if any of ghosts descendants are common:
 
301
                for ghost_descendant in descendants[ghost]:
 
302
                    if ghost_descendant in common:
 
303
                        common.add(ghost)
 
304
                
 
305
            root = NULL_REVISION
 
306
            common.add(NULL_REVISION)
 
307
        except errors.NoCommonRoot:
 
308
            raise errors.NoCommonAncestor(revision_a, revision_b)
 
309
            
 
310
        pb.update('Picking ancestor', 2, 3)
 
311
        distances = node_distances (descendants, ancestors, root)
 
312
        pb.update('Picking ancestor', 3, 2)
 
313
        farthest = select_farthest(distances, common)
 
314
        if farthest is None or farthest == NULL_REVISION:
 
315
            raise errors.NoCommonAncestor(revision_a, revision_b)
 
316
    finally:
 
317
        pb.clear()
 
318
    return farthest
194
319
 
195
320
 
196
321
class MultipleRevisionSources(object):
 
322
    """Proxy that looks in multiple branches for revisions."""
197
323
    def __init__(self, *args):
198
324
        object.__init__(self)
199
325
        assert len(args) != 0
200
326
        self._revision_sources = args
201
327
 
 
328
    def revision_parents(self, revision_id):
 
329
        for source in self._revision_sources:
 
330
            try:
 
331
                return source.revision_parents(revision_id)
 
332
            except (errors.WeaveRevisionNotPresent, errors.NoSuchRevision), e:
 
333
                pass
 
334
        raise e
 
335
 
202
336
    def get_revision(self, revision_id):
203
337
        for source in self._revision_sources:
204
338
            try:
205
339
                return source.get_revision(revision_id)
206
 
            except bzrlib.errors.NoSuchRevision, e:
 
340
            except errors.NoSuchRevision, e:
207
341
                pass
208
342
        raise e
 
343
 
 
344
    def get_revision_graph(self, revision_id):
 
345
        # we could probe incrementally until the pending
 
346
        # ghosts list stop growing, but its cheaper for now
 
347
        # to just ask for the complete graph for each repository.
 
348
        graphs = []
 
349
        for source in self._revision_sources:
 
350
            ghost_graph = source.get_revision_graph_with_ghosts()
 
351
            graphs.append(ghost_graph)
 
352
        absent = 0
 
353
        for graph in graphs:
 
354
            if not revision_id in graph.get_ancestors():
 
355
                absent += 1
 
356
        if absent == len(graphs):
 
357
            raise errors.NoSuchRevision(self._revision_sources[0], revision_id)
 
358
 
 
359
        # combine the graphs
 
360
        result = {}
 
361
        pending = set([revision_id])
 
362
        def find_parents(node_id):
 
363
            """find the parents for node_id."""
 
364
            for graph in graphs:
 
365
                ancestors = graph.get_ancestors()
 
366
                try:
 
367
                    return ancestors[node_id]
 
368
                except KeyError:
 
369
                    pass
 
370
            raise errors.NoSuchRevision(self._revision_sources[0], node_id)
 
371
        while len(pending):
 
372
            # all the graphs should have identical parent lists
 
373
            node_id = pending.pop()
 
374
            try:
 
375
                result[node_id] = find_parents(node_id)
 
376
                for parent_node in result[node_id]:
 
377
                    if not parent_node in result:
 
378
                        pending.add(parent_node)
 
379
            except errors.NoSuchRevision:
 
380
                # ghost, ignore it.
 
381
                pass
 
382
        return result
 
383
 
 
384
    def get_revision_graph_with_ghosts(self, revision_ids):
 
385
        # query all the sources for their entire graphs 
 
386
        # and then build a combined graph for just
 
387
        # revision_ids.
 
388
        graphs = []
 
389
        for source in self._revision_sources:
 
390
            ghost_graph = source.get_revision_graph_with_ghosts()
 
391
            graphs.append(ghost_graph.get_ancestors())
 
392
        for revision_id in revision_ids:
 
393
            absent = 0
 
394
            for graph in graphs:
 
395
                    if not revision_id in graph:
 
396
                        absent += 1
 
397
            if absent == len(graphs):
 
398
                raise errors.NoSuchRevision(self._revision_sources[0],
 
399
                                            revision_id)
 
400
 
 
401
        # combine the graphs
 
402
        result = Graph()
 
403
        pending = set(revision_ids)
 
404
        done = set()
 
405
        def find_parents(node_id):
 
406
            """find the parents for node_id."""
 
407
            for graph in graphs:
 
408
                try:
 
409
                    return graph[node_id]
 
410
                except KeyError:
 
411
                    pass
 
412
            raise errors.NoSuchRevision(self._revision_sources[0], node_id)
 
413
        while len(pending):
 
414
            # all the graphs should have identical parent lists
 
415
            node_id = pending.pop()
 
416
            try:
 
417
                parents = find_parents(node_id)
 
418
                for parent_node in parents:
 
419
                    # queued or done? 
 
420
                    if (parent_node not in pending and
 
421
                        parent_node not in done):
 
422
                        # no, queue
 
423
                        pending.add(parent_node)
 
424
                result.add_node(node_id, parents)
 
425
                done.add(node_id)
 
426
            except errors.NoSuchRevision:
 
427
                # ghost
 
428
                result.add_ghost(node_id)
 
429
                continue
 
430
        return result
 
431
 
 
432
    def lock_read(self):
 
433
        for source in self._revision_sources:
 
434
            source.lock_read()
 
435
 
 
436
    def unlock(self):
 
437
        for source in self._revision_sources:
 
438
            source.unlock()
 
439
 
 
440
 
 
441
def is_reserved_id(revision_id):
 
442
    """Determine whether a revision id is reserved
 
443
 
 
444
    :return: True if the revision is is reserved, False otherwise
 
445
    """
 
446
    return isinstance(revision_id, basestring) and revision_id.endswith(':')
 
447
 
 
448
 
 
449
def check_not_reserved_id(revision_id):
 
450
    """Raise ReservedId if the supplied revision_id is reserved"""
 
451
    if is_reserved_id(revision_id):
 
452
        raise errors.ReservedId(revision_id)
 
453
 
 
454
 
 
455
def ensure_null(revision_id):
 
456
    """Ensure only NULL_REVISION is used to represent the null revision"""
 
457
    if revision_id is None:
 
458
        symbol_versioning.warn('NULL_REVISION should be used for the null'
 
459
            ' revision instead of None, as of bzr 0.91.',
 
460
            DeprecationWarning, stacklevel=2)
 
461
        return NULL_REVISION
 
462
    else:
 
463
        return revision_id
 
464
 
 
465
 
 
466
def is_null(revision_id):
 
467
    if revision_id is None:
 
468
        symbol_versioning.warn('NULL_REVISION should be used for the null'
 
469
            ' revision instead of None, as of bzr 0.90.',
 
470
            DeprecationWarning, stacklevel=2)
 
471
    return revision_id in (None, NULL_REVISION)