~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/revision.py

  • Committer: John Arbash Meinel
  • Date: 2007-03-15 22:35:35 UTC
  • mto: This revision was merged to the branch mainline in revision 2363.
  • Revision ID: john@arbash-meinel.com-20070315223535-d3d4964oe1hc8zhg
Add an overzealous test, for Unicode support of _iter_changes.
For both knowns and unknowns.
And include a basic, if suboptimal, fix.
I would rather defer the decoding until we've determined that we are going to return the tuple.
There is still something broken with added files, but I'll get to that.

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# (C) 2005 Canonical
2
 
 
 
1
# Copyright (C) 2005, 2006 Canonical Ltd
 
2
#
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
5
5
# the Free Software Foundation; either version 2 of the License, or
6
6
# (at your option) any later version.
7
 
 
 
7
#
8
8
# This program is distributed in the hope that it will be useful,
9
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
10
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
11
11
# GNU General Public License for more details.
12
 
 
 
12
#
13
13
# You should have received a copy of the GNU General Public License
14
14
# along with this program; if not, write to the Free Software
15
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
16
 
17
 
 
18
 
 
19
 
 
20
 
from xml import XMLMixin
21
 
 
22
 
try:
23
 
    from cElementTree import Element, ElementTree, SubElement
24
 
except ImportError:
25
 
    from elementtree.ElementTree import Element, ElementTree, SubElement
26
 
 
27
 
from errors import BzrError
28
 
 
29
 
 
30
 
class Revision(XMLMixin):
 
17
# TODO: Some kind of command-line display of revision properties: 
 
18
# perhaps show them in log -v and allow them as options to the commit command.
 
19
 
 
20
 
 
21
import bzrlib.errors as errors
 
22
from bzrlib.graph import node_distances, select_farthest, all_descendants, Graph
 
23
from bzrlib.osutils import contains_whitespace
 
24
from bzrlib.progress import DummyProgress
 
25
from bzrlib.symbol_versioning import (deprecated_function,
 
26
        zero_eight,
 
27
        )
 
28
 
 
29
NULL_REVISION="null:"
 
30
CURRENT_REVISION="current:"
 
31
 
 
32
 
 
33
class Revision(object):
31
34
    """Single revision on a branch.
32
35
 
33
36
    Revisions may know their revision_hash, but only once they've been
34
37
    written out.  This is not stored because you cannot write the hash
35
38
    into the file it describes.
36
39
 
37
 
    TODO: Perhaps make predecessor be a child element, not an attribute?
 
40
    After bzr 0.0.5 revisions are allowed to have multiple parents.
 
41
 
 
42
    parent_ids
 
43
        List of parent revision_ids
 
44
 
 
45
    properties
 
46
        Dictionary of revision properties.  These are attached to the
 
47
        revision as extra metadata.  The name must be a single 
 
48
        word; the value can be an arbitrary string.
38
49
    """
39
 
    def __init__(self, **args):
40
 
        self.inventory_id = None
41
 
        self.revision_id = None
42
 
        self.timestamp = None
43
 
        self.message = None
44
 
        self.timezone = None
45
 
        self.committer = None
46
 
        self.precursor = None
 
50
    
 
51
    def __init__(self, revision_id, properties=None, **args):
 
52
        self.revision_id = revision_id
 
53
        self.properties = properties or {}
 
54
        self._check_properties()
 
55
        self.parent_ids = []
 
56
        self.parent_sha1s = []
 
57
        """Not used anymore - legacy from for 4."""
47
58
        self.__dict__.update(args)
48
59
 
49
 
 
50
60
    def __repr__(self):
51
61
        return "<Revision id %s>" % self.revision_id
52
62
 
53
 
        
54
 
    def to_element(self):
55
 
        root = Element('revision',
56
 
                       committer = self.committer,
57
 
                       timestamp = '%.9f' % self.timestamp,
58
 
                       revision_id = self.revision_id,
59
 
                       inventory_id = self.inventory_id,
60
 
                       timezone = str(self.timezone))
61
 
        if self.precursor:
62
 
            root.set('precursor', self.precursor)
63
 
        root.text = '\n'
64
 
        
65
 
        msg = SubElement(root, 'message')
66
 
        msg.text = self.message
67
 
        msg.tail = '\n'
68
 
 
69
 
        return root
70
 
 
71
 
 
72
 
    def from_element(cls, elt):
73
 
        # <changeset> is deprecated...
74
 
        if elt.tag not in ('revision', 'changeset'):
75
 
            raise BzrError("unexpected tag in revision file: %r" % elt)
76
 
 
77
 
        cs = cls(committer = elt.get('committer'),
78
 
                 timestamp = float(elt.get('timestamp')),
79
 
                 precursor = elt.get('precursor'),
80
 
                 revision_id = elt.get('revision_id'),
81
 
                 inventory_id = elt.get('inventory_id'))
82
 
 
83
 
        v = elt.get('timezone')
84
 
        cs.timezone = v and int(v)
85
 
 
86
 
        cs.message = elt.findtext('message') # text of <message>
87
 
        return cs
88
 
 
89
 
    from_element = classmethod(from_element)
90
 
 
 
63
    def __eq__(self, other):
 
64
        if not isinstance(other, Revision):
 
65
            return False
 
66
        # FIXME: rbc 20050930 parent_ids are not being compared
 
67
        return (
 
68
                self.inventory_sha1 == other.inventory_sha1
 
69
                and self.revision_id == other.revision_id
 
70
                and self.timestamp == other.timestamp
 
71
                and self.message == other.message
 
72
                and self.timezone == other.timezone
 
73
                and self.committer == other.committer
 
74
                and self.properties == other.properties)
 
75
 
 
76
    def __ne__(self, other):
 
77
        return not self.__eq__(other)
 
78
 
 
79
    def _check_properties(self):
 
80
        """Verify that all revision properties are OK."""
 
81
        for name, value in self.properties.iteritems():
 
82
            if not isinstance(name, basestring) or contains_whitespace(name):
 
83
                raise ValueError("invalid property name %r" % name)
 
84
            if not isinstance(value, basestring):
 
85
                raise ValueError("invalid property value %r for %r" % 
 
86
                                 (name, value))
 
87
 
 
88
    def get_history(self, repository):
 
89
        """Return the canonical line-of-history for this revision.
 
90
 
 
91
        If ghosts are present this may differ in result from a ghost-free
 
92
        repository.
 
93
        """
 
94
        current_revision = self
 
95
        reversed_result = []
 
96
        while current_revision is not None:
 
97
            reversed_result.append(current_revision.revision_id)
 
98
            if not len (current_revision.parent_ids):
 
99
                reversed_result.append(None)
 
100
                current_revision = None
 
101
            else:
 
102
                next_revision_id = current_revision.parent_ids[0]
 
103
                current_revision = repository.get_revision(next_revision_id)
 
104
        reversed_result.reverse()
 
105
        return reversed_result
 
106
 
 
107
    def get_summary(self):
 
108
        """Get the first line of the log message for this revision.
 
109
        """
 
110
        return self.message.split('\n', 1)[0]
 
111
 
 
112
 
 
113
def is_ancestor(revision_id, candidate_id, branch):
 
114
    """Return true if candidate_id is an ancestor of revision_id.
 
115
 
 
116
    A false negative will be returned if any intermediate descendent of
 
117
    candidate_id is not present in any of the revision_sources.
 
118
    
 
119
    revisions_source is an object supporting a get_revision operation that
 
120
    behaves like Branch's.
 
121
    """
 
122
    return (candidate_id in branch.repository.get_ancestry(revision_id))
 
123
 
 
124
 
 
125
def iter_ancestors(revision_id, revision_source, only_present=False):
 
126
    ancestors = (revision_id,)
 
127
    distance = 0
 
128
    while len(ancestors) > 0:
 
129
        new_ancestors = []
 
130
        for ancestor in ancestors:
 
131
            if not only_present:
 
132
                yield ancestor, distance
 
133
            try:
 
134
                revision = revision_source.get_revision(ancestor)
 
135
            except errors.NoSuchRevision, e:
 
136
                if e.revision == revision_id:
 
137
                    raise 
 
138
                else:
 
139
                    continue
 
140
            if only_present:
 
141
                yield ancestor, distance
 
142
            new_ancestors.extend(revision.parent_ids)
 
143
        ancestors = new_ancestors
 
144
        distance += 1
 
145
 
 
146
 
 
147
def find_present_ancestors(revision_id, revision_source):
 
148
    """Return the ancestors of a revision present in a branch.
 
149
 
 
150
    It's possible that a branch won't have the complete ancestry of
 
151
    one of its revisions.  
 
152
 
 
153
    """
 
154
    found_ancestors = {}
 
155
    anc_iter = enumerate(iter_ancestors(revision_id, revision_source,
 
156
                         only_present=True))
 
157
    for anc_order, (anc_id, anc_distance) in anc_iter:
 
158
        if anc_id not in found_ancestors:
 
159
            found_ancestors[anc_id] = (anc_order, anc_distance)
 
160
    return found_ancestors
 
161
    
 
162
 
 
163
def __get_closest(intersection):
 
164
    intersection.sort()
 
165
    matches = [] 
 
166
    for entry in intersection:
 
167
        if entry[0] == intersection[0][0]:
 
168
            matches.append(entry[2])
 
169
    return matches
 
170
 
 
171
 
 
172
def revision_graph(revision, revision_source):
 
173
    """Produce a graph of the ancestry of the specified revision.
 
174
    
 
175
    :return: root, ancestors map, descendants map
 
176
    """
 
177
    revision_source.lock_read()
 
178
    try:
 
179
        return _revision_graph(revision, revision_source)
 
180
    finally:
 
181
        revision_source.unlock()
 
182
 
 
183
 
 
184
def _revision_graph(revision, revision_source):
 
185
    """See revision_graph."""
 
186
    from bzrlib.tsort import topo_sort
 
187
    graph = revision_source.get_revision_graph(revision)
 
188
    # mark all no-parent revisions as being NULL_REVISION parentage.
 
189
    for node, parents in graph.items():
 
190
        if len(parents) == 0:
 
191
            graph[node] = [NULL_REVISION]
 
192
    # add NULL_REVISION to the graph
 
193
    graph[NULL_REVISION] = []
 
194
 
 
195
    # pick a root. If there are multiple roots
 
196
    # this could pick a random one.
 
197
    topo_order = topo_sort(graph.items())
 
198
    root = topo_order[0]
 
199
 
 
200
    ancestors = {}
 
201
    descendants = {}
 
202
 
 
203
    # map the descendants of the graph.
 
204
    # and setup our set based return graph.
 
205
    for node in graph.keys():
 
206
        descendants[node] = {}
 
207
    for node, parents in graph.items():
 
208
        for parent in parents:
 
209
            descendants[parent][node] = 1
 
210
        ancestors[node] = set(parents)
 
211
 
 
212
    assert root not in descendants[root]
 
213
    assert root not in ancestors[root]
 
214
    return root, ancestors, descendants
 
215
 
 
216
 
 
217
def combined_graph(revision_a, revision_b, revision_source):
 
218
    """Produce a combined ancestry graph.
 
219
    Return graph root, ancestors map, descendants map, set of common nodes"""
 
220
    root, ancestors, descendants = revision_graph(
 
221
        revision_a, revision_source)
 
222
    root_b, ancestors_b, descendants_b = revision_graph(
 
223
        revision_b, revision_source)
 
224
    if root != root_b:
 
225
        raise errors.NoCommonRoot(revision_a, revision_b)
 
226
    common = set()
 
227
    for node, node_anc in ancestors_b.iteritems():
 
228
        if node in ancestors:
 
229
            common.add(node)
 
230
        else:
 
231
            ancestors[node] = set()
 
232
        ancestors[node].update(node_anc)
 
233
    for node, node_dec in descendants_b.iteritems():
 
234
        if node not in descendants:
 
235
            descendants[node] = {}
 
236
        descendants[node].update(node_dec)
 
237
    return root, ancestors, descendants, common
 
238
 
 
239
 
 
240
def common_ancestor(revision_a, revision_b, revision_source, 
 
241
                    pb=DummyProgress()):
 
242
    if None in (revision_a, revision_b):
 
243
        return None
 
244
    if NULL_REVISION in (revision_a, revision_b):
 
245
        return NULL_REVISION
 
246
    # trivial optimisation
 
247
    if revision_a == revision_b:
 
248
        return revision_a
 
249
    try:
 
250
        try:
 
251
            pb.update('Picking ancestor', 1, 3)
 
252
            graph = revision_source.get_revision_graph_with_ghosts(
 
253
                [revision_a, revision_b])
 
254
            # convert to a NULL_REVISION based graph.
 
255
            ancestors = graph.get_ancestors()
 
256
            descendants = graph.get_descendants()
 
257
            common = set(graph.get_ancestry(revision_a)).intersection(
 
258
                     set(graph.get_ancestry(revision_b)))
 
259
            descendants[NULL_REVISION] = {}
 
260
            ancestors[NULL_REVISION] = []
 
261
            for root in graph.roots:
 
262
                descendants[NULL_REVISION][root] = 1
 
263
                ancestors[root].append(NULL_REVISION)
 
264
            for ghost in graph.ghosts:
 
265
                # ghosts act as roots for the purpose of finding 
 
266
                # the longest paths from the root: any ghost *might*
 
267
                # be directly attached to the root, so we treat them
 
268
                # as being such.
 
269
                # ghost now descends from NULL
 
270
                descendants[NULL_REVISION][ghost] = 1
 
271
                # that is it has an ancestor of NULL
 
272
                ancestors[ghost] = [NULL_REVISION]
 
273
                # ghost is common if any of ghosts descendants are common:
 
274
                for ghost_descendant in descendants[ghost]:
 
275
                    if ghost_descendant in common:
 
276
                        common.add(ghost)
 
277
                
 
278
            root = NULL_REVISION
 
279
            common.add(NULL_REVISION)
 
280
        except errors.NoCommonRoot:
 
281
            raise errors.NoCommonAncestor(revision_a, revision_b)
 
282
            
 
283
        pb.update('Picking ancestor', 2, 3)
 
284
        distances = node_distances (descendants, ancestors, root)
 
285
        pb.update('Picking ancestor', 3, 2)
 
286
        farthest = select_farthest(distances, common)
 
287
        if farthest is None or farthest == NULL_REVISION:
 
288
            raise errors.NoCommonAncestor(revision_a, revision_b)
 
289
    finally:
 
290
        pb.clear()
 
291
    return farthest
 
292
 
 
293
 
 
294
class MultipleRevisionSources(object):
 
295
    """Proxy that looks in multiple branches for revisions."""
 
296
    def __init__(self, *args):
 
297
        object.__init__(self)
 
298
        assert len(args) != 0
 
299
        self._revision_sources = args
 
300
 
 
301
    def revision_parents(self, revision_id):
 
302
        for source in self._revision_sources:
 
303
            try:
 
304
                return source.revision_parents(revision_id)
 
305
            except (errors.WeaveRevisionNotPresent, errors.NoSuchRevision), e:
 
306
                pass
 
307
        raise e
 
308
 
 
309
    def get_revision(self, revision_id):
 
310
        for source in self._revision_sources:
 
311
            try:
 
312
                return source.get_revision(revision_id)
 
313
            except errors.NoSuchRevision, e:
 
314
                pass
 
315
        raise e
 
316
 
 
317
    def get_revision_graph(self, revision_id):
 
318
        # we could probe incrementally until the pending
 
319
        # ghosts list stop growing, but its cheaper for now
 
320
        # to just ask for the complete graph for each repository.
 
321
        graphs = []
 
322
        for source in self._revision_sources:
 
323
            ghost_graph = source.get_revision_graph_with_ghosts()
 
324
            graphs.append(ghost_graph)
 
325
        absent = 0
 
326
        for graph in graphs:
 
327
            if not revision_id in graph.get_ancestors():
 
328
                absent += 1
 
329
        if absent == len(graphs):
 
330
            raise errors.NoSuchRevision(self._revision_sources[0], revision_id)
 
331
 
 
332
        # combine the graphs
 
333
        result = {}
 
334
        pending = set([revision_id])
 
335
        def find_parents(node_id):
 
336
            """find the parents for node_id."""
 
337
            for graph in graphs:
 
338
                ancestors = graph.get_ancestors()
 
339
                try:
 
340
                    return ancestors[node_id]
 
341
                except KeyError:
 
342
                    pass
 
343
            raise errors.NoSuchRevision(self._revision_sources[0], node_id)
 
344
        while len(pending):
 
345
            # all the graphs should have identical parent lists
 
346
            node_id = pending.pop()
 
347
            try:
 
348
                result[node_id] = find_parents(node_id)
 
349
                for parent_node in result[node_id]:
 
350
                    if not parent_node in result:
 
351
                        pending.add(parent_node)
 
352
            except errors.NoSuchRevision:
 
353
                # ghost, ignore it.
 
354
                pass
 
355
        return result
 
356
 
 
357
    def get_revision_graph_with_ghosts(self, revision_ids):
 
358
        # query all the sources for their entire graphs 
 
359
        # and then build a combined graph for just
 
360
        # revision_ids.
 
361
        graphs = []
 
362
        for source in self._revision_sources:
 
363
            ghost_graph = source.get_revision_graph_with_ghosts()
 
364
            graphs.append(ghost_graph.get_ancestors())
 
365
        for revision_id in revision_ids:
 
366
            absent = 0
 
367
            for graph in graphs:
 
368
                    if not revision_id in graph:
 
369
                        absent += 1
 
370
            if absent == len(graphs):
 
371
                raise errors.NoSuchRevision(self._revision_sources[0],
 
372
                                            revision_id)
 
373
 
 
374
        # combine the graphs
 
375
        result = Graph()
 
376
        pending = set(revision_ids)
 
377
        done = set()
 
378
        def find_parents(node_id):
 
379
            """find the parents for node_id."""
 
380
            for graph in graphs:
 
381
                try:
 
382
                    return graph[node_id]
 
383
                except KeyError:
 
384
                    pass
 
385
            raise errors.NoSuchRevision(self._revision_sources[0], node_id)
 
386
        while len(pending):
 
387
            # all the graphs should have identical parent lists
 
388
            node_id = pending.pop()
 
389
            try:
 
390
                parents = find_parents(node_id)
 
391
                for parent_node in parents:
 
392
                    # queued or done? 
 
393
                    if (parent_node not in pending and
 
394
                        parent_node not in done):
 
395
                        # no, queue
 
396
                        pending.add(parent_node)
 
397
                result.add_node(node_id, parents)
 
398
                done.add(node_id)
 
399
            except errors.NoSuchRevision:
 
400
                # ghost
 
401
                result.add_ghost(node_id)
 
402
                continue
 
403
        return result
 
404
 
 
405
    def lock_read(self):
 
406
        for source in self._revision_sources:
 
407
            source.lock_read()
 
408
 
 
409
    def unlock(self):
 
410
        for source in self._revision_sources:
 
411
            source.unlock()
 
412
 
 
413
 
 
414
@deprecated_function(zero_eight)
 
415
def get_intervening_revisions(ancestor_id, rev_id, rev_source,
 
416
                              revision_history=None):
 
417
    """Find the longest line of descent from maybe_ancestor to revision.
 
418
    Revision history is followed where possible.
 
419
 
 
420
    If ancestor_id == rev_id, list will be empty.
 
421
    Otherwise, rev_id will be the last entry.  ancestor_id will never appear.
 
422
    If ancestor_id is not an ancestor, NotAncestor will be thrown
 
423
    """
 
424
    root, ancestors, descendants = revision_graph(rev_id, rev_source)
 
425
    if len(descendants) == 0:
 
426
        raise errors.NoSuchRevision(rev_source, rev_id)
 
427
    if ancestor_id not in descendants:
 
428
        rev_source.get_revision(ancestor_id)
 
429
        raise errors.NotAncestor(rev_id, ancestor_id)
 
430
    root_descendants = all_descendants(descendants, ancestor_id)
 
431
    root_descendants.add(ancestor_id)
 
432
    if rev_id not in root_descendants:
 
433
        raise errors.NotAncestor(rev_id, ancestor_id)
 
434
    distances = node_distances(descendants, ancestors, ancestor_id,
 
435
                               root_descendants=root_descendants)
 
436
 
 
437
    def best_ancestor(rev_id):
 
438
        best = None
 
439
        for anc_id in ancestors[rev_id]:
 
440
            try:
 
441
                distance = distances[anc_id]
 
442
            except KeyError:
 
443
                continue
 
444
            if revision_history is not None and anc_id in revision_history:
 
445
                return anc_id
 
446
            elif best is None or distance > best[1]:
 
447
                best = (anc_id, distance)
 
448
        return best[0]
 
449
 
 
450
    next = rev_id
 
451
    path = []
 
452
    while next != ancestor_id:
 
453
        path.append(next)
 
454
        next = best_ancestor(next)
 
455
    path.reverse()
 
456
    return path
 
457
 
 
458
 
 
459
def is_reserved_id(revision_id):
 
460
    """Determine whether a revision id is reserved
 
461
 
 
462
    :return: True if the revision is is reserved, False otherwise
 
463
    """
 
464
    return isinstance(revision_id, basestring) and revision_id.endswith(':')
 
465
 
 
466
 
 
467
def check_not_reserved_id(revision_id):
 
468
    """Raise ReservedId if the supplied revision_id is reserved"""
 
469
    if is_reserved_id(revision_id):
 
470
        raise errors.ReservedId(revision_id)