~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/revision.py

  • Committer: Martin Pool
  • Date: 2005-05-03 08:00:27 UTC
  • Revision ID: mbp@sourcefrog.net-20050503080027-908edb5b39982198
doc

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2005, 2006 Canonical Ltd
2
 
#
 
1
# (C) 2005 Canonical
 
2
 
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
5
5
# the Free Software Foundation; either version 2 of the License, or
6
6
# (at your option) any later version.
7
 
#
 
7
 
8
8
# This program is distributed in the hope that it will be useful,
9
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
10
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
11
11
# GNU General Public License for more details.
12
 
#
 
12
 
13
13
# You should have received a copy of the GNU General Public License
14
14
# along with this program; if not, write to the Free Software
15
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
16
 
17
 
# TODO: Some kind of command-line display of revision properties: 
18
 
# perhaps show them in log -v and allow them as options to the commit command.
19
 
 
20
 
 
21
 
from bzrlib import (
22
 
    errors,
23
 
    symbol_versioning
24
 
    )
25
 
from bzrlib.deprecated_graph import (
26
 
    all_descendants,
27
 
    Graph,
28
 
    node_distances,
29
 
    select_farthest,
30
 
    )
31
 
from bzrlib.osutils import contains_whitespace
32
 
from bzrlib.progress import DummyProgress
33
 
from bzrlib.symbol_versioning import (deprecated_function,
34
 
        )
35
 
 
36
 
NULL_REVISION="null:"
37
 
CURRENT_REVISION="current:"
38
 
 
39
 
 
40
 
class Revision(object):
 
17
 
 
18
 
 
19
 
 
20
from xml import XMLMixin
 
21
 
 
22
try:
 
23
    from cElementTree import Element, ElementTree, SubElement
 
24
except ImportError:
 
25
    from elementtree.ElementTree import Element, ElementTree, SubElement
 
26
 
 
27
from errors import BzrError
 
28
 
 
29
 
 
30
class Revision(XMLMixin):
41
31
    """Single revision on a branch.
42
32
 
43
33
    Revisions may know their revision_hash, but only once they've been
44
34
    written out.  This is not stored because you cannot write the hash
45
35
    into the file it describes.
46
36
 
47
 
    After bzr 0.0.5 revisions are allowed to have multiple parents.
48
 
 
49
 
    parent_ids
50
 
        List of parent revision_ids
51
 
 
52
 
    properties
53
 
        Dictionary of revision properties.  These are attached to the
54
 
        revision as extra metadata.  The name must be a single 
55
 
        word; the value can be an arbitrary string.
 
37
    TODO: Perhaps make predecessor be a child element, not an attribute?
56
38
    """
57
 
    
58
 
    def __init__(self, revision_id, properties=None, **args):
59
 
        self.revision_id = revision_id
60
 
        self.properties = properties or {}
61
 
        self._check_properties()
62
 
        self.parent_ids = []
63
 
        self.parent_sha1s = []
64
 
        """Not used anymore - legacy from for 4."""
 
39
    def __init__(self, **args):
 
40
        self.inventory_id = None
 
41
        self.revision_id = None
 
42
        self.timestamp = None
 
43
        self.message = None
 
44
        self.timezone = None
 
45
        self.committer = None
 
46
        self.precursor = None
65
47
        self.__dict__.update(args)
66
48
 
 
49
 
67
50
    def __repr__(self):
68
51
        return "<Revision id %s>" % self.revision_id
69
52
 
70
 
    def __eq__(self, other):
71
 
        if not isinstance(other, Revision):
72
 
            return False
73
 
        # FIXME: rbc 20050930 parent_ids are not being compared
74
 
        return (
75
 
                self.inventory_sha1 == other.inventory_sha1
76
 
                and self.revision_id == other.revision_id
77
 
                and self.timestamp == other.timestamp
78
 
                and self.message == other.message
79
 
                and self.timezone == other.timezone
80
 
                and self.committer == other.committer
81
 
                and self.properties == other.properties)
82
 
 
83
 
    def __ne__(self, other):
84
 
        return not self.__eq__(other)
85
 
 
86
 
    def _check_properties(self):
87
 
        """Verify that all revision properties are OK."""
88
 
        for name, value in self.properties.iteritems():
89
 
            if not isinstance(name, basestring) or contains_whitespace(name):
90
 
                raise ValueError("invalid property name %r" % name)
91
 
            if not isinstance(value, basestring):
92
 
                raise ValueError("invalid property value %r for %r" % 
93
 
                                 (name, value))
94
 
 
95
 
    def get_history(self, repository):
96
 
        """Return the canonical line-of-history for this revision.
97
 
 
98
 
        If ghosts are present this may differ in result from a ghost-free
99
 
        repository.
100
 
        """
101
 
        current_revision = self
102
 
        reversed_result = []
103
 
        while current_revision is not None:
104
 
            reversed_result.append(current_revision.revision_id)
105
 
            if not len (current_revision.parent_ids):
106
 
                reversed_result.append(None)
107
 
                current_revision = None
108
 
            else:
109
 
                next_revision_id = current_revision.parent_ids[0]
110
 
                current_revision = repository.get_revision(next_revision_id)
111
 
        reversed_result.reverse()
112
 
        return reversed_result
113
 
 
114
 
    def get_summary(self):
115
 
        """Get the first line of the log message for this revision.
116
 
        """
117
 
        return self.message.lstrip().split('\n', 1)[0]
118
 
 
119
 
    def get_apparent_author(self):
120
 
        """Return the apparent author of this revision.
121
 
 
122
 
        If the revision properties contain the author name,
123
 
        return it. Otherwise return the committer name.
124
 
        """
125
 
        return self.properties.get('author', self.committer)
126
 
 
127
 
 
128
 
def is_ancestor(revision_id, candidate_id, branch):
129
 
    """Return true if candidate_id is an ancestor of revision_id.
130
 
 
131
 
    A false negative will be returned if any intermediate descendent of
132
 
    candidate_id is not present in any of the revision_sources.
133
 
    
134
 
    revisions_source is an object supporting a get_revision operation that
135
 
    behaves like Branch's.
136
 
    """
137
 
    if is_null(candidate_id):
138
 
        return True
139
 
    return (candidate_id in branch.repository.get_ancestry(revision_id,
140
 
            topo_sorted=False))
141
 
 
142
 
 
143
 
def iter_ancestors(revision_id, revision_source, only_present=False):
144
 
    ancestors = (revision_id,)
145
 
    distance = 0
146
 
    while len(ancestors) > 0:
147
 
        new_ancestors = []
148
 
        for ancestor in ancestors:
149
 
            if not only_present:
150
 
                yield ancestor, distance
151
 
            try:
152
 
                revision = revision_source.get_revision(ancestor)
153
 
            except errors.NoSuchRevision, e:
154
 
                if e.revision == revision_id:
155
 
                    raise 
156
 
                else:
157
 
                    continue
158
 
            if only_present:
159
 
                yield ancestor, distance
160
 
            new_ancestors.extend(revision.parent_ids)
161
 
        ancestors = new_ancestors
162
 
        distance += 1
163
 
 
164
 
 
165
 
def find_present_ancestors(revision_id, revision_source):
166
 
    """Return the ancestors of a revision present in a branch.
167
 
 
168
 
    It's possible that a branch won't have the complete ancestry of
169
 
    one of its revisions.  
170
 
 
171
 
    """
172
 
    found_ancestors = {}
173
 
    anc_iter = enumerate(iter_ancestors(revision_id, revision_source,
174
 
                         only_present=True))
175
 
    for anc_order, (anc_id, anc_distance) in anc_iter:
176
 
        if anc_id not in found_ancestors:
177
 
            found_ancestors[anc_id] = (anc_order, anc_distance)
178
 
    return found_ancestors
179
 
    
180
 
 
181
 
def __get_closest(intersection):
182
 
    intersection.sort()
183
 
    matches = [] 
184
 
    for entry in intersection:
185
 
        if entry[0] == intersection[0][0]:
186
 
            matches.append(entry[2])
187
 
    return matches
188
 
 
189
 
 
190
 
def revision_graph(revision, revision_source):
191
 
    """Produce a graph of the ancestry of the specified revision.
192
 
    
193
 
    :return: root, ancestors map, descendants map
194
 
    """
195
 
    revision_source.lock_read()
196
 
    try:
197
 
        return _revision_graph(revision, revision_source)
198
 
    finally:
199
 
        revision_source.unlock()
200
 
 
201
 
 
202
 
def _revision_graph(revision, revision_source):
203
 
    """See revision_graph."""
204
 
    from bzrlib.tsort import topo_sort
205
 
    graph = revision_source.get_revision_graph(revision)
206
 
    # mark all no-parent revisions as being NULL_REVISION parentage.
207
 
    for node, parents in graph.items():
208
 
        if len(parents) == 0:
209
 
            graph[node] = [NULL_REVISION]
210
 
    # add NULL_REVISION to the graph
211
 
    graph[NULL_REVISION] = []
212
 
 
213
 
    # pick a root. If there are multiple roots
214
 
    # this could pick a random one.
215
 
    topo_order = topo_sort(graph.items())
216
 
    root = topo_order[0]
217
 
 
218
 
    ancestors = {}
219
 
    descendants = {}
220
 
 
221
 
    # map the descendants of the graph.
222
 
    # and setup our set based return graph.
223
 
    for node in graph.keys():
224
 
        descendants[node] = {}
225
 
    for node, parents in graph.items():
226
 
        for parent in parents:
227
 
            descendants[parent][node] = 1
228
 
        ancestors[node] = set(parents)
229
 
 
230
 
    assert root not in descendants[root]
231
 
    assert root not in ancestors[root]
232
 
    return root, ancestors, descendants
233
 
 
234
 
 
235
 
def combined_graph(revision_a, revision_b, revision_source):
236
 
    """Produce a combined ancestry graph.
237
 
    Return graph root, ancestors map, descendants map, set of common nodes"""
238
 
    root, ancestors, descendants = revision_graph(
239
 
        revision_a, revision_source)
240
 
    root_b, ancestors_b, descendants_b = revision_graph(
241
 
        revision_b, revision_source)
242
 
    if root != root_b:
243
 
        raise errors.NoCommonRoot(revision_a, revision_b)
244
 
    common = set()
245
 
    for node, node_anc in ancestors_b.iteritems():
246
 
        if node in ancestors:
247
 
            common.add(node)
248
 
        else:
249
 
            ancestors[node] = set()
250
 
        ancestors[node].update(node_anc)
251
 
    for node, node_dec in descendants_b.iteritems():
252
 
        if node not in descendants:
253
 
            descendants[node] = {}
254
 
        descendants[node].update(node_dec)
255
 
    return root, ancestors, descendants, common
256
 
 
257
 
 
258
 
def common_ancestor(revision_a, revision_b, revision_source, 
259
 
                    pb=DummyProgress()):
260
 
    if None in (revision_a, revision_b):
261
 
        return None
262
 
    if NULL_REVISION in (revision_a, revision_b):
263
 
        return NULL_REVISION
264
 
    # trivial optimisation
265
 
    if revision_a == revision_b:
266
 
        return revision_a
267
 
    try:
268
 
        try:
269
 
            pb.update('Picking ancestor', 1, 3)
270
 
            graph = revision_source.get_revision_graph_with_ghosts(
271
 
                [revision_a, revision_b])
272
 
            # Shortcut the case where one of the tips is already included in
273
 
            # the other graphs ancestry.
274
 
            ancestry_a = graph.get_ancestry(revision_a, topo_sorted=False)
275
 
            if revision_b in ancestry_a:
276
 
                return revision_b
277
 
            ancestry_b = graph.get_ancestry(revision_b, topo_sorted=False)
278
 
            if revision_a in ancestry_b:
279
 
                return revision_a
280
 
            # convert to a NULL_REVISION based graph.
281
 
            ancestors = graph.get_ancestors()
282
 
            descendants = graph.get_descendants()
283
 
            common = set(ancestry_a)
284
 
            common.intersection_update(ancestry_b)
285
 
            descendants[NULL_REVISION] = {}
286
 
            ancestors[NULL_REVISION] = []
287
 
            for root in graph.roots:
288
 
                descendants[NULL_REVISION][root] = 1
289
 
                ancestors[root].append(NULL_REVISION)
290
 
            for ghost in graph.ghosts:
291
 
                # ghosts act as roots for the purpose of finding 
292
 
                # the longest paths from the root: any ghost *might*
293
 
                # be directly attached to the root, so we treat them
294
 
                # as being such.
295
 
                # ghost now descends from NULL
296
 
                descendants[NULL_REVISION][ghost] = 1
297
 
                # that is it has an ancestor of NULL
298
 
                ancestors[ghost] = [NULL_REVISION]
299
 
                # ghost is common if any of ghosts descendants are common:
300
 
                for ghost_descendant in descendants[ghost]:
301
 
                    if ghost_descendant in common:
302
 
                        common.add(ghost)
303
 
                
304
 
            root = NULL_REVISION
305
 
            common.add(NULL_REVISION)
306
 
        except errors.NoCommonRoot:
307
 
            raise errors.NoCommonAncestor(revision_a, revision_b)
308
 
            
309
 
        pb.update('Picking ancestor', 2, 3)
310
 
        distances = node_distances (descendants, ancestors, root)
311
 
        pb.update('Picking ancestor', 3, 2)
312
 
        farthest = select_farthest(distances, common)
313
 
        if farthest is None or farthest == NULL_REVISION:
314
 
            raise errors.NoCommonAncestor(revision_a, revision_b)
315
 
    finally:
316
 
        pb.clear()
317
 
    return farthest
318
 
 
319
 
 
320
 
class MultipleRevisionSources(object):
321
 
    """Proxy that looks in multiple branches for revisions."""
322
 
    def __init__(self, *args):
323
 
        object.__init__(self)
324
 
        assert len(args) != 0
325
 
        self._revision_sources = args
326
 
 
327
 
    def revision_parents(self, revision_id):
328
 
        for source in self._revision_sources:
329
 
            try:
330
 
                return source.revision_parents(revision_id)
331
 
            except (errors.WeaveRevisionNotPresent, errors.NoSuchRevision), e:
332
 
                pass
333
 
        raise e
334
 
 
335
 
    def get_revision(self, revision_id):
336
 
        for source in self._revision_sources:
337
 
            try:
338
 
                return source.get_revision(revision_id)
339
 
            except errors.NoSuchRevision, e:
340
 
                pass
341
 
        raise e
342
 
 
343
 
    def get_revision_graph(self, revision_id):
344
 
        # we could probe incrementally until the pending
345
 
        # ghosts list stop growing, but its cheaper for now
346
 
        # to just ask for the complete graph for each repository.
347
 
        graphs = []
348
 
        for source in self._revision_sources:
349
 
            ghost_graph = source.get_revision_graph_with_ghosts()
350
 
            graphs.append(ghost_graph)
351
 
        absent = 0
352
 
        for graph in graphs:
353
 
            if not revision_id in graph.get_ancestors():
354
 
                absent += 1
355
 
        if absent == len(graphs):
356
 
            raise errors.NoSuchRevision(self._revision_sources[0], revision_id)
357
 
 
358
 
        # combine the graphs
359
 
        result = {}
360
 
        pending = set([revision_id])
361
 
        def find_parents(node_id):
362
 
            """find the parents for node_id."""
363
 
            for graph in graphs:
364
 
                ancestors = graph.get_ancestors()
365
 
                try:
366
 
                    return ancestors[node_id]
367
 
                except KeyError:
368
 
                    pass
369
 
            raise errors.NoSuchRevision(self._revision_sources[0], node_id)
370
 
        while len(pending):
371
 
            # all the graphs should have identical parent lists
372
 
            node_id = pending.pop()
373
 
            try:
374
 
                result[node_id] = find_parents(node_id)
375
 
                for parent_node in result[node_id]:
376
 
                    if not parent_node in result:
377
 
                        pending.add(parent_node)
378
 
            except errors.NoSuchRevision:
379
 
                # ghost, ignore it.
380
 
                pass
381
 
        return result
382
 
 
383
 
    def get_revision_graph_with_ghosts(self, revision_ids):
384
 
        # query all the sources for their entire graphs 
385
 
        # and then build a combined graph for just
386
 
        # revision_ids.
387
 
        graphs = []
388
 
        for source in self._revision_sources:
389
 
            ghost_graph = source.get_revision_graph_with_ghosts()
390
 
            graphs.append(ghost_graph.get_ancestors())
391
 
        for revision_id in revision_ids:
392
 
            absent = 0
393
 
            for graph in graphs:
394
 
                    if not revision_id in graph:
395
 
                        absent += 1
396
 
            if absent == len(graphs):
397
 
                raise errors.NoSuchRevision(self._revision_sources[0],
398
 
                                            revision_id)
399
 
 
400
 
        # combine the graphs
401
 
        result = Graph()
402
 
        pending = set(revision_ids)
403
 
        done = set()
404
 
        def find_parents(node_id):
405
 
            """find the parents for node_id."""
406
 
            for graph in graphs:
407
 
                try:
408
 
                    return graph[node_id]
409
 
                except KeyError:
410
 
                    pass
411
 
            raise errors.NoSuchRevision(self._revision_sources[0], node_id)
412
 
        while len(pending):
413
 
            # all the graphs should have identical parent lists
414
 
            node_id = pending.pop()
415
 
            try:
416
 
                parents = find_parents(node_id)
417
 
                for parent_node in parents:
418
 
                    # queued or done? 
419
 
                    if (parent_node not in pending and
420
 
                        parent_node not in done):
421
 
                        # no, queue
422
 
                        pending.add(parent_node)
423
 
                result.add_node(node_id, parents)
424
 
                done.add(node_id)
425
 
            except errors.NoSuchRevision:
426
 
                # ghost
427
 
                result.add_ghost(node_id)
428
 
                continue
429
 
        return result
430
 
 
431
 
    def lock_read(self):
432
 
        for source in self._revision_sources:
433
 
            source.lock_read()
434
 
 
435
 
    def unlock(self):
436
 
        for source in self._revision_sources:
437
 
            source.unlock()
438
 
 
439
 
 
440
 
def is_reserved_id(revision_id):
441
 
    """Determine whether a revision id is reserved
442
 
 
443
 
    :return: True if the revision is is reserved, False otherwise
444
 
    """
445
 
    return isinstance(revision_id, basestring) and revision_id.endswith(':')
446
 
 
447
 
 
448
 
def check_not_reserved_id(revision_id):
449
 
    """Raise ReservedId if the supplied revision_id is reserved"""
450
 
    if is_reserved_id(revision_id):
451
 
        raise errors.ReservedId(revision_id)
452
 
 
453
 
 
454
 
def ensure_null(revision_id):
455
 
    """Ensure only NULL_REVISION is used to represent the null revisionn"""
456
 
    if revision_id is None:
457
 
        symbol_versioning.warn('NULL_REVISION should be used for the null'
458
 
            ' revision instead of None, as of bzr 0.91.',
459
 
            DeprecationWarning, stacklevel=2)
460
 
        return NULL_REVISION
461
 
    else:
462
 
        return revision_id
463
 
 
464
 
 
465
 
def is_null(revision_id):
466
 
    if revision_id is None:
467
 
        symbol_versioning.warn('NULL_REVISION should be used for the null'
468
 
            ' revision instead of None, as of bzr 0.90.',
469
 
            DeprecationWarning, stacklevel=2)
470
 
    return revision_id in (None, NULL_REVISION)
 
53
        
 
54
    def to_element(self):
 
55
        root = Element('revision',
 
56
                       committer = self.committer,
 
57
                       timestamp = '%.9f' % self.timestamp,
 
58
                       revision_id = self.revision_id,
 
59
                       inventory_id = self.inventory_id,
 
60
                       timezone = str(self.timezone))
 
61
        if self.precursor:
 
62
            root.set('precursor', self.precursor)
 
63
        root.text = '\n'
 
64
        
 
65
        msg = SubElement(root, 'message')
 
66
        msg.text = self.message
 
67
        msg.tail = '\n'
 
68
 
 
69
        return root
 
70
 
 
71
 
 
72
    def from_element(cls, elt):
 
73
        # <changeset> is deprecated...
 
74
        if elt.tag not in ('revision', 'changeset'):
 
75
            raise BzrError("unexpected tag in revision file: %r" % elt)
 
76
 
 
77
        cs = cls(committer = elt.get('committer'),
 
78
                 timestamp = float(elt.get('timestamp')),
 
79
                 precursor = elt.get('precursor'),
 
80
                 revision_id = elt.get('revision_id'),
 
81
                 inventory_id = elt.get('inventory_id'))
 
82
 
 
83
        v = elt.get('timezone')
 
84
        cs.timezone = v and int(v)
 
85
 
 
86
        cs.message = elt.findtext('message') # text of <message>
 
87
        return cs
 
88
 
 
89
    from_element = classmethod(from_element)
 
90