~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/weave.py

  • Committer: John Arbash Meinel
  • Date: 2005-11-23 15:44:24 UTC
  • mto: (1185.50.19 bzr-jam-integration)
  • mto: This revision was merged to the branch mainline in revision 1512.
  • Revision ID: john@arbash-meinel.com-20051123154424-a02f8bf990a1fed5
Renamed all of the tests from selftest/foo.py to tests/test_foo.py

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
1
#! /usr/bin/python
2
2
 
3
3
# Copyright (C) 2005 Canonical Ltd
4
 
#
 
4
 
5
5
# This program is free software; you can redistribute it and/or modify
6
6
# it under the terms of the GNU General Public License as published by
7
7
# the Free Software Foundation; either version 2 of the License, or
8
8
# (at your option) any later version.
9
 
#
 
9
 
10
10
# This program is distributed in the hope that it will be useful,
11
11
# but WITHOUT ANY WARRANTY; without even the implied warranty of
12
12
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13
13
# GNU General Public License for more details.
14
 
#
 
14
 
15
15
# You should have received a copy of the GNU General Public License
16
16
# along with this program; if not, write to the Free Software
17
 
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
 
17
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
18
18
 
19
19
# Author: Martin Pool <mbp@canonical.com>
20
20
 
27
27
# property.
28
28
 
29
29
# TODO: Nothing here so far assumes the lines are really \n newlines,
30
 
# rather than being split up in some other way.  We could accommodate
 
30
# rather than being split up in some other way.  We could accomodate
31
31
# binaries, perhaps by naively splitting on \n or perhaps using
32
32
# something like a rolling checksum.
33
33
 
61
61
# where the basis and destination are unchanged.
62
62
 
63
63
# FIXME: Sometimes we will be given a parents list for a revision
64
 
# that includes some redundant parents (i.e. already a parent of
65
 
# something in the list.)  We should eliminate them.  This can
 
64
# that includes some redundant parents (i.e. already a parent of 
 
65
# something in the list.)  We should eliminate them.  This can 
66
66
# be done fairly efficiently because the sequence numbers constrain
67
67
# the possible relationships.
68
68
 
69
 
# FIXME: the conflict markers should be *7* characters
70
 
 
71
 
from copy import copy
72
 
from cStringIO import StringIO
73
 
import os
74
 
import time
75
 
import warnings
76
 
 
77
 
from bzrlib.lazy_import import lazy_import
78
 
lazy_import(globals(), """
79
 
from bzrlib import tsort
80
 
""")
81
 
from bzrlib import (
82
 
    errors,
83
 
    osutils,
84
 
    progress,
85
 
    )
86
 
from bzrlib.errors import (WeaveError, WeaveFormatError, WeaveParentMismatch,
87
 
        RevisionAlreadyPresent,
88
 
        RevisionNotPresent,
89
 
        UnavailableRepresentation,
90
 
        WeaveRevisionAlreadyPresent,
91
 
        WeaveRevisionNotPresent,
92
 
        )
93
 
from bzrlib.osutils import dirname, sha, sha_strings, split_lines
94
 
import bzrlib.patiencediff
95
 
from bzrlib.revision import NULL_REVISION
96
 
from bzrlib.symbol_versioning import *
 
69
 
 
70
import sha
 
71
from difflib import SequenceMatcher
 
72
 
97
73
from bzrlib.trace import mutter
98
 
from bzrlib.versionedfile import (
99
 
    AbsentContentFactory,
100
 
    adapter_registry,
101
 
    ContentFactory,
102
 
    sort_groupcompress,
103
 
    VersionedFile,
104
 
    )
105
 
from bzrlib.weavefile import _read_weave_v5, write_weave_v5
106
 
 
107
 
 
108
 
class WeaveContentFactory(ContentFactory):
109
 
    """Content factory for streaming from weaves.
110
 
 
111
 
    :seealso ContentFactory:
112
 
    """
113
 
 
114
 
    def __init__(self, version, weave):
115
 
        """Create a WeaveContentFactory for version from weave."""
116
 
        ContentFactory.__init__(self)
117
 
        self.sha1 = weave.get_sha1s([version])[version]
118
 
        self.key = (version,)
119
 
        parents = weave.get_parent_map([version])[version]
120
 
        self.parents = tuple((parent,) for parent in parents)
121
 
        self.storage_kind = 'fulltext'
122
 
        self._weave = weave
123
 
 
124
 
    def get_bytes_as(self, storage_kind):
125
 
        if storage_kind == 'fulltext':
126
 
            return self._weave.get_text(self.key[-1])
127
 
        elif storage_kind == 'chunked':
128
 
            return self._weave.get_lines(self.key[-1])
129
 
        else:
130
 
            raise UnavailableRepresentation(self.key, storage_kind, 'fulltext')
131
 
 
132
 
 
133
 
class Weave(VersionedFile):
 
74
from bzrlib.errors import WeaveError, WeaveFormatError, WeaveParentMismatch, \
 
75
        WeaveRevisionNotPresent, WeaveRevisionAlreadyPresent
 
76
from bzrlib.tsort import topo_sort
 
77
 
 
78
 
 
79
class Weave(object):
134
80
    """weave - versioned text file storage.
135
 
 
 
81
    
136
82
    A Weave manages versions of line-based text files, keeping track
137
83
    of the originating version for each line.
138
84
 
184
130
 
185
131
    * It doesn't seem very useful to have an active insertion
186
132
      inside an inactive insertion, but it might happen.
187
 
 
 
133
      
188
134
    * Therefore, all instructions are always"considered"; that
189
135
      is passed onto and off the stack.  An outer inactive block
190
136
      doesn't disable an inner block.
220
166
    """
221
167
 
222
168
    __slots__ = ['_weave', '_parents', '_sha1s', '_names', '_name_map',
223
 
                 '_weave_name', '_matcher', '_allow_reserved']
224
 
 
225
 
    def __init__(self, weave_name=None, access_mode='w', matcher=None,
226
 
                 get_scope=None, allow_reserved=False):
227
 
        """Create a weave.
228
 
 
229
 
        :param get_scope: A callable that returns an opaque object to be used
230
 
            for detecting when this weave goes out of scope (should stop
231
 
            answering requests or allowing mutation).
232
 
        """
233
 
        super(Weave, self).__init__()
 
169
                 '_weave_name']
 
170
    
 
171
    def __init__(self, weave_name=None):
234
172
        self._weave = []
235
173
        self._parents = []
236
174
        self._sha1s = []
237
175
        self._names = []
238
176
        self._name_map = {}
239
177
        self._weave_name = weave_name
240
 
        if matcher is None:
241
 
            self._matcher = bzrlib.patiencediff.PatienceSequenceMatcher
242
 
        else:
243
 
            self._matcher = matcher
244
 
        if get_scope is None:
245
 
            get_scope = lambda:None
246
 
        self._get_scope = get_scope
247
 
        self._scope = get_scope()
248
 
        self._access_mode = access_mode
249
 
        self._allow_reserved = allow_reserved
250
178
 
251
179
    def __repr__(self):
252
180
        return "Weave(%r)" % self._weave_name
253
181
 
254
 
    def _check_write_ok(self):
255
 
        """Is the versioned file marked as 'finished' ? Raise if it is."""
256
 
        if self._get_scope() != self._scope:
257
 
            raise errors.OutSideTransaction()
258
 
        if self._access_mode != 'w':
259
 
            raise errors.ReadOnlyObjectDirtiedError(self)
260
182
 
261
183
    def copy(self):
262
184
        """Return a deep copy of self.
263
 
 
 
185
        
264
186
        The copy can be modified without affecting the original weave."""
265
187
        other = Weave()
266
188
        other._weave = self._weave[:]
276
198
            return False
277
199
        return self._parents == other._parents \
278
200
               and self._weave == other._weave \
279
 
               and self._sha1s == other._sha1s
 
201
               and self._sha1s == other._sha1s 
280
202
 
 
203
    
281
204
    def __ne__(self, other):
282
205
        return not self.__eq__(other)
283
206
 
284
 
    def _idx_to_name(self, version):
285
 
        return self._names[version]
286
 
 
287
 
    def _lookup(self, name):
 
207
    def __contains__(self, name):
 
208
        return self._name_map.has_key(name)
 
209
 
 
210
    def maybe_lookup(self, name_or_index):
 
211
        """Convert possible symbolic name to index, or pass through indexes."""
 
212
        if isinstance(name_or_index, (int, long)):
 
213
            return name_or_index
 
214
        else:
 
215
            return self.lookup(name_or_index)
 
216
 
 
217
        
 
218
    def lookup(self, name):
288
219
        """Convert symbolic version name to index."""
289
 
        if not self._allow_reserved:
290
 
            self.check_not_reserved_id(name)
291
220
        try:
292
221
            return self._name_map[name]
293
222
        except KeyError:
294
 
            raise RevisionNotPresent(name, self._weave_name)
 
223
            raise WeaveRevisionNotPresent(name, self)
295
224
 
296
 
    def versions(self):
297
 
        """See VersionedFile.versions."""
 
225
    def names(self):
298
226
        return self._names[:]
299
227
 
300
 
    def has_version(self, version_id):
301
 
        """See VersionedFile.has_version."""
302
 
        return (version_id in self._name_map)
303
 
 
304
 
    __contains__ = has_version
305
 
 
306
 
    def get_record_stream(self, versions, ordering, include_delta_closure):
307
 
        """Get a stream of records for versions.
308
 
 
309
 
        :param versions: The versions to include. Each version is a tuple
310
 
            (version,).
311
 
        :param ordering: Either 'unordered' or 'topological'. A topologically
312
 
            sorted stream has compression parents strictly before their
313
 
            children.
314
 
        :param include_delta_closure: If True then the closure across any
315
 
            compression parents will be included (in the opaque data).
316
 
        :return: An iterator of ContentFactory objects, each of which is only
317
 
            valid until the iterator is advanced.
318
 
        """
319
 
        versions = [version[-1] for version in versions]
320
 
        if ordering == 'topological':
321
 
            parents = self.get_parent_map(versions)
322
 
            new_versions = tsort.topo_sort(parents)
323
 
            new_versions.extend(set(versions).difference(set(parents)))
324
 
            versions = new_versions
325
 
        elif ordering == 'groupcompress':
326
 
            parents = self.get_parent_map(versions)
327
 
            new_versions = sort_groupcompress(parents)
328
 
            new_versions.extend(set(versions).difference(set(parents)))
329
 
            versions = new_versions
330
 
        for version in versions:
331
 
            if version in self:
332
 
                yield WeaveContentFactory(version, self)
333
 
            else:
334
 
                yield AbsentContentFactory((version,))
335
 
 
336
 
    def get_parent_map(self, version_ids):
337
 
        """See VersionedFile.get_parent_map."""
338
 
        result = {}
339
 
        for version_id in version_ids:
340
 
            if version_id == NULL_REVISION:
341
 
                parents = ()
342
 
            else:
343
 
                try:
344
 
                    parents = tuple(
345
 
                        map(self._idx_to_name,
346
 
                            self._parents[self._lookup(version_id)]))
347
 
                except RevisionNotPresent:
348
 
                    continue
349
 
            result[version_id] = parents
350
 
        return result
351
 
 
352
 
    def get_parents_with_ghosts(self, version_id):
353
 
        raise NotImplementedError(self.get_parents_with_ghosts)
354
 
 
355
 
    def insert_record_stream(self, stream):
356
 
        """Insert a record stream into this versioned file.
357
 
 
358
 
        :param stream: A stream of records to insert.
359
 
        :return: None
360
 
        :seealso VersionedFile.get_record_stream:
361
 
        """
362
 
        adapters = {}
363
 
        for record in stream:
364
 
            # Raise an error when a record is missing.
365
 
            if record.storage_kind == 'absent':
366
 
                raise RevisionNotPresent([record.key[0]], self)
367
 
            # adapt to non-tuple interface
368
 
            parents = [parent[0] for parent in record.parents]
369
 
            if (record.storage_kind == 'fulltext'
370
 
                or record.storage_kind == 'chunked'):
371
 
                self.add_lines(record.key[0], parents,
372
 
                    osutils.chunks_to_lines(record.get_bytes_as('chunked')))
373
 
            else:
374
 
                adapter_key = record.storage_kind, 'fulltext'
375
 
                try:
376
 
                    adapter = adapters[adapter_key]
377
 
                except KeyError:
378
 
                    adapter_factory = adapter_registry.get(adapter_key)
379
 
                    adapter = adapter_factory(self)
380
 
                    adapters[adapter_key] = adapter
381
 
                lines = split_lines(adapter.get_bytes(record))
382
 
                try:
383
 
                    self.add_lines(record.key[0], parents, lines)
384
 
                except RevisionAlreadyPresent:
385
 
                    pass
 
228
    def iter_names(self):
 
229
        """Yield a list of all names in this weave."""
 
230
        return iter(self._names)
 
231
 
 
232
    def idx_to_name(self, version):
 
233
        return self._names[version]
386
234
 
387
235
    def _check_repeated_add(self, name, parents, text, sha1):
388
236
        """Check that a duplicated add is OK.
389
237
 
390
238
        If it is, return the (old) index; otherwise raise an exception.
391
239
        """
392
 
        idx = self._lookup(name)
 
240
        idx = self.lookup(name)
393
241
        if sorted(self._parents[idx]) != sorted(parents) \
394
242
            or sha1 != self._sha1s[idx]:
395
 
            raise RevisionAlreadyPresent(name, self._weave_name)
 
243
            raise WeaveRevisionAlreadyPresent(name, self)
396
244
        return idx
397
 
 
398
 
    def _add_lines(self, version_id, parents, lines, parent_texts,
399
 
       left_matching_blocks, nostore_sha, random_id, check_content):
400
 
        """See VersionedFile.add_lines."""
401
 
        idx = self._add(version_id, lines, map(self._lookup, parents),
402
 
            nostore_sha=nostore_sha)
403
 
        return sha_strings(lines), sum(map(len, lines)), idx
404
 
 
405
 
    def _add(self, version_id, lines, parents, sha1=None, nostore_sha=None):
 
245
        
 
246
    def add(self, name, parents, text, sha1=None):
406
247
        """Add a single text on top of the weave.
407
 
 
 
248
  
408
249
        Returns the index number of the newly added version.
409
250
 
410
 
        version_id
 
251
        name
411
252
            Symbolic name for this version.
412
253
            (Typically the revision-id of the revision that added it.)
413
 
            If None, a name will be allocated based on the hash. (sha1:SHAHASH)
414
254
 
415
255
        parents
416
256
            List or set of direct parent version numbers.
417
 
 
418
 
        lines
 
257
            
 
258
        text
419
259
            Sequence of lines to be added in the new version.
420
260
 
421
 
        :param nostore_sha: See VersionedFile.add_lines.
 
261
        sha -- SHA-1 of the file, if known.  This is trusted to be
 
262
            correct if supplied.
422
263
        """
423
 
        self._check_lines_not_unicode(lines)
424
 
        self._check_lines_are_lines(lines)
425
 
        if not sha1:
426
 
            sha1 = sha_strings(lines)
427
 
        if sha1 == nostore_sha:
428
 
            raise errors.ExistingContent
429
 
        if version_id is None:
430
 
            version_id = "sha1:" + sha1
431
 
        if version_id in self._name_map:
432
 
            return self._check_repeated_add(version_id, parents, lines, sha1)
433
 
 
 
264
        from bzrlib.osutils import sha_strings
 
265
 
 
266
        assert isinstance(name, basestring)
 
267
        if sha1 is None:
 
268
            sha1 = sha_strings(text)
 
269
        if name in self._name_map:
 
270
            return self._check_repeated_add(name, parents, text, sha1)
 
271
 
 
272
        parents = map(self.maybe_lookup, parents)
434
273
        self._check_versions(parents)
435
 
        ## self._check_lines(lines)
 
274
        ## self._check_lines(text)
436
275
        new_version = len(self._parents)
437
276
 
 
277
 
438
278
        # if we abort after here the (in-memory) weave will be corrupt because only
439
279
        # some fields are updated
440
 
        # XXX: FIXME implement a succeed-or-fail of the rest of this routine.
441
 
        #      - Robert Collins 20060226
442
280
        self._parents.append(parents[:])
443
281
        self._sha1s.append(sha1)
444
 
        self._names.append(version_id)
445
 
        self._name_map[version_id] = new_version
446
 
 
447
 
 
 
282
        self._names.append(name)
 
283
        self._name_map[name] = new_version
 
284
 
 
285
            
448
286
        if not parents:
449
287
            # special case; adding with no parents revision; can do
450
288
            # this more quickly by just appending unconditionally.
451
289
            # even more specially, if we're adding an empty text we
452
290
            # need do nothing at all.
453
 
            if lines:
 
291
            if text:
454
292
                self._weave.append(('{', new_version))
455
 
                self._weave.extend(lines)
 
293
                self._weave.extend(text)
456
294
                self._weave.append(('}', None))
 
295
        
457
296
            return new_version
458
297
 
459
298
        if len(parents) == 1:
461
300
            if sha1 == self._sha1s[pv]:
462
301
                # special case: same as the single parent
463
302
                return new_version
464
 
 
465
 
 
466
 
        ancestors = self._inclusions(parents)
 
303
            
 
304
 
 
305
        ancestors = self.inclusions(parents)
467
306
 
468
307
        l = self._weave
469
308
 
476
315
 
477
316
        # another small special case: a merge, producing the same text
478
317
        # as auto-merge
479
 
        if lines == basis_lines:
480
 
            return new_version
 
318
        if text == basis_lines:
 
319
            return new_version            
481
320
 
482
 
        # add a sentinel, because we can also match against the final line
 
321
        # add a sentinal, because we can also match against the final line
483
322
        basis_lineno.append(len(self._weave))
484
323
 
485
324
        # XXX: which line of the weave should we really consider
489
328
        #print 'basis_lines:', basis_lines
490
329
        #print 'new_lines:  ', lines
491
330
 
492
 
        s = self._matcher(None, basis_lines, lines)
 
331
        s = SequenceMatcher(None, basis_lines, text)
493
332
 
494
333
        # offset gives the number of lines that have been inserted
495
334
        # into the weave up to the current point; if the original edit instruction
502
341
            #print 'raw match', tag, i1, i2, j1, j2
503
342
            if tag == 'equal':
504
343
                continue
 
344
 
505
345
            i1 = basis_lineno[i1]
506
346
            i2 = basis_lineno[i2]
 
347
 
 
348
            assert 0 <= j1 <= j2 <= len(text)
 
349
 
 
350
            #print tag, i1, i2, j1, j2
 
351
 
507
352
            # the deletion and insertion are handled separately.
508
353
            # first delete the region.
509
354
            if i1 != i2:
516
361
                # i2; we want to insert after this region to make sure
517
362
                # we don't destroy ourselves
518
363
                i = i2 + offset
519
 
                self._weave[i:i] = ([('{', new_version)]
520
 
                                    + lines[j1:j2]
 
364
                self._weave[i:i] = ([('{', new_version)] 
 
365
                                    + text[j1:j2] 
521
366
                                    + [('}', None)])
522
367
                offset += 2 + (j2 - j1)
 
368
 
523
369
        return new_version
524
370
 
525
 
    def _inclusions(self, versions):
 
371
    def add_identical(self, old_rev_id, new_rev_id, parents):
 
372
        """Add an identical text to old_rev_id as new_rev_id."""
 
373
        old_lines = self.get(self.lookup(old_rev_id))
 
374
        self.add(new_rev_id, parents, old_lines)
 
375
 
 
376
    def inclusions(self, versions):
526
377
        """Return set of all ancestors of given version(s)."""
527
 
        if not len(versions):
528
 
            return []
529
378
        i = set(versions)
530
379
        for v in xrange(max(versions), 0, -1):
531
380
            if v in i:
535
384
        ## except IndexError:
536
385
        ##     raise ValueError("version %d not present in weave" % v)
537
386
 
538
 
    def get_ancestry(self, version_ids, topo_sorted=True):
539
 
        """See VersionedFile.get_ancestry."""
540
 
        if isinstance(version_ids, basestring):
541
 
            version_ids = [version_ids]
542
 
        i = self._inclusions([self._lookup(v) for v in version_ids])
543
 
        return [self._idx_to_name(v) for v in i]
 
387
 
 
388
    def parents(self, version):
 
389
        return self._parents[version]
 
390
 
 
391
 
 
392
    def parent_names(self, version):
 
393
        """Return version names for parents of a version."""
 
394
        return map(self.idx_to_name, self._parents[self.lookup(version)])
 
395
 
 
396
 
 
397
    def minimal_parents(self, version):
 
398
        """Find the minimal set of parents for the version."""
 
399
        included = self._parents[version]
 
400
        if not included:
 
401
            return []
 
402
        
 
403
        li = list(included)
 
404
        li.sort(reverse=True)
 
405
 
 
406
        mininc = []
 
407
        gotit = set()
 
408
 
 
409
        for pv in li:
 
410
            if pv not in gotit:
 
411
                mininc.append(pv)
 
412
                gotit.update(self.inclusions(pv))
 
413
 
 
414
        assert mininc[0] >= 0
 
415
        assert mininc[-1] < version
 
416
        return mininc
 
417
 
 
418
 
544
419
 
545
420
    def _check_lines(self, text):
546
421
        if not isinstance(text, list):
550
425
            if not isinstance(l, basestring):
551
426
                raise ValueError("text line should be a string or unicode, not %s"
552
427
                                 % type(l))
553
 
 
 
428
        
554
429
 
555
430
 
556
431
    def _check_versions(self, indexes):
561
436
            except IndexError:
562
437
                raise IndexError("invalid version number %r" % i)
563
438
 
564
 
    def _compatible_parents(self, my_parents, other_parents):
565
 
        """During join check that other_parents are joinable with my_parents.
566
 
 
567
 
        Joinable is defined as 'is a subset of' - supersets may require
568
 
        regeneration of diffs, but subsets do not.
569
 
        """
570
 
        return len(other_parents.difference(my_parents)) == 0
571
 
 
572
 
    def annotate(self, version_id):
573
 
        """Return a list of (version-id, line) tuples for version_id.
 
439
    
 
440
    def annotate(self, name_or_index):
 
441
        return list(self.annotate_iter(name_or_index))
 
442
 
 
443
 
 
444
    def annotate_iter(self, name_or_index):
 
445
        """Yield list of (index-id, line) pairs for the specified version.
574
446
 
575
447
        The index indicates when the line originated in the weave."""
576
 
        incls = [self._lookup(version_id)]
577
 
        return [(self._idx_to_name(origin), text) for origin, lineno, text in
578
 
            self._extract(incls)]
579
 
 
580
 
    def iter_lines_added_or_present_in_versions(self, version_ids=None,
581
 
                                                pb=None):
582
 
        """See VersionedFile.iter_lines_added_or_present_in_versions()."""
583
 
        if version_ids is None:
584
 
            version_ids = self.versions()
585
 
        version_ids = set(version_ids)
586
 
        for lineno, inserted, deletes, line in self._walk_internal(version_ids):
587
 
            if inserted not in version_ids: continue
588
 
            if line[-1] != '\n':
589
 
                yield line + '\n', inserted
590
 
            else:
591
 
                yield line, inserted
592
 
 
593
 
    def _walk_internal(self, version_ids=None):
594
 
        """Helper method for weave actions."""
595
 
 
 
448
        incls = [self.maybe_lookup(name_or_index)]
 
449
        for origin, lineno, text in self._extract(incls):
 
450
            yield origin, text
 
451
 
 
452
    def _walk(self):
 
453
        """Walk the weave.
 
454
 
 
455
        Yields sequence of
 
456
        (lineno, insert, deletes, text)
 
457
        for each literal line.
 
458
        """
 
459
        
596
460
        istack = []
597
461
        dset = set()
598
462
 
599
463
        lineno = 0         # line of weave, 0-based
600
464
 
601
465
        for l in self._weave:
602
 
            if l.__class__ == tuple:
 
466
            if isinstance(l, tuple):
603
467
                c, v = l
604
468
                isactive = None
605
469
                if c == '{':
606
 
                    istack.append(self._names[v])
 
470
                    istack.append(v)
607
471
                elif c == '}':
608
472
                    istack.pop()
609
473
                elif c == '[':
610
 
                    dset.add(self._names[v])
 
474
                    assert v not in dset
 
475
                    dset.add(v)
611
476
                elif c == ']':
612
 
                    dset.remove(self._names[v])
 
477
                    dset.remove(v)
613
478
                else:
614
479
                    raise WeaveFormatError('unexpected instruction %r' % v)
615
480
            else:
616
 
                yield lineno, istack[-1], frozenset(dset), l
617
 
            lineno += 1
618
 
 
 
481
                assert isinstance(l, basestring)
 
482
                assert istack
 
483
                yield lineno, istack[-1], dset, l
 
484
            lineno += 1
 
485
 
 
486
 
 
487
 
 
488
    def _extract(self, versions):
 
489
        """Yield annotation of lines in included set.
 
490
 
 
491
        Yields a sequence of tuples (origin, lineno, text), where
 
492
        origin is the origin version, lineno the index in the weave,
 
493
        and text the text of the line.
 
494
 
 
495
        The set typically but not necessarily corresponds to a version.
 
496
        """
 
497
        for i in versions:
 
498
            if not isinstance(i, int):
 
499
                raise ValueError(i)
 
500
            
 
501
        included = self.inclusions(versions)
 
502
 
 
503
        istack = []
 
504
        dset = set()
 
505
 
 
506
        lineno = 0         # line of weave, 0-based
 
507
 
 
508
        isactive = None
 
509
 
 
510
        result = []
 
511
 
 
512
        WFE = WeaveFormatError
 
513
 
 
514
        for l in self._weave:
 
515
            if isinstance(l, tuple):
 
516
                c, v = l
 
517
                isactive = None
 
518
                if c == '{':
 
519
                    assert v not in istack
 
520
                    istack.append(v)
 
521
                elif c == '}':
 
522
                    istack.pop()
 
523
                elif c == '[':
 
524
                    if v in included:
 
525
                        assert v not in dset
 
526
                        dset.add(v)
 
527
                else:
 
528
                    assert c == ']'
 
529
                    if v in included:
 
530
                        assert v in dset
 
531
                        dset.remove(v)
 
532
            else:
 
533
                assert isinstance(l, basestring)
 
534
                if isactive is None:
 
535
                    isactive = (not dset) and istack and (istack[-1] in included)
 
536
                if isactive:
 
537
                    result.append((istack[-1], lineno, l))
 
538
            lineno += 1
619
539
        if istack:
620
540
            raise WeaveFormatError("unclosed insertion blocks "
621
541
                    "at end of weave: %s" % istack)
622
542
        if dset:
623
543
            raise WeaveFormatError("unclosed deletion blocks at end of weave: %s"
624
544
                                   % dset)
625
 
 
 
545
        return result
 
546
 
 
547
 
 
548
    def get_iter(self, name_or_index):
 
549
        """Yield lines for the specified version."""
 
550
        incls = [self.maybe_lookup(name_or_index)]
 
551
        for origin, lineno, line in self._extract(incls):
 
552
            yield line
 
553
 
 
554
 
 
555
    def get_text(self, name_or_index):
 
556
        return ''.join(self.get_iter(name_or_index))
 
557
        assert isinstance(version, int)
 
558
 
 
559
 
 
560
    def get_lines(self, name_or_index):
 
561
        return list(self.get_iter(name_or_index))
 
562
 
 
563
 
 
564
    get = get_lines
 
565
 
 
566
 
 
567
    def mash_iter(self, included):
 
568
        """Return composed version of multiple included versions."""
 
569
        included = map(self.maybe_lookup, included)
 
570
        for origin, lineno, text in self._extract(included):
 
571
            yield text
 
572
 
 
573
 
 
574
    def dump(self, to_file):
 
575
        from pprint import pprint
 
576
        print >>to_file, "Weave._weave = ",
 
577
        pprint(self._weave, to_file)
 
578
        print >>to_file, "Weave._parents = ",
 
579
        pprint(self._parents, to_file)
 
580
 
 
581
 
 
582
 
 
583
    def numversions(self):
 
584
        l = len(self._parents)
 
585
        assert l == len(self._sha1s)
 
586
        return l
 
587
 
 
588
 
 
589
    def __len__(self):
 
590
        return self.numversions()
 
591
 
 
592
 
 
593
    def check(self, progress_bar=None):
 
594
        # check no circular inclusions
 
595
        for version in range(self.numversions()):
 
596
            inclusions = list(self._parents[version])
 
597
            if inclusions:
 
598
                inclusions.sort()
 
599
                if inclusions[-1] >= version:
 
600
                    raise WeaveFormatError("invalid included version %d for index %d"
 
601
                                           % (inclusions[-1], version))
 
602
 
 
603
        # try extracting all versions; this is a bit slow and parallel
 
604
        # extraction could be used
 
605
        nv = self.numversions()
 
606
        for version in range(nv):
 
607
            if progress_bar:
 
608
                progress_bar.update('checking text', version, nv)
 
609
            s = sha.new()
 
610
            for l in self.get_iter(version):
 
611
                s.update(l)
 
612
            hd = s.hexdigest()
 
613
            expected = self._sha1s[version]
 
614
            if hd != expected:
 
615
                raise WeaveError("mismatched sha1 for version %d; "
 
616
                                 "got %s, expected %s"
 
617
                                 % (version, hd, expected))
 
618
 
 
619
        # TODO: check insertions are properly nested, that there are
 
620
        # no lines outside of insertion blocks, that deletions are
 
621
        # properly paired, etc.
 
622
 
 
623
 
 
624
 
 
625
    def merge(self, merge_versions):
 
626
        """Automerge and mark conflicts between versions.
 
627
 
 
628
        This returns a sequence, each entry describing alternatives
 
629
        for a chunk of the file.  Each of the alternatives is given as
 
630
        a list of lines.
 
631
 
 
632
        If there is a chunk of the file where there's no diagreement,
 
633
        only one alternative is given.
 
634
        """
 
635
        # approach: find the included versions common to all the
 
636
        # merged versions
 
637
        raise NotImplementedError()
 
638
 
 
639
 
 
640
 
 
641
    def _delta(self, included, lines):
 
642
        """Return changes from basis to new revision.
 
643
 
 
644
        The old text for comparison is the union of included revisions.
 
645
 
 
646
        This is used in inserting a new text.
 
647
 
 
648
        Delta is returned as a sequence of
 
649
        (weave1, weave2, newlines).
 
650
 
 
651
        This indicates that weave1:weave2 of the old weave should be
 
652
        replaced by the sequence of lines in newlines.  Note that
 
653
        these line numbers are positions in the total weave and don't
 
654
        correspond to the lines in any extracted version, or even the
 
655
        extracted union of included versions.
 
656
 
 
657
        If line1=line2, this is a pure insert; if newlines=[] this is a
 
658
        pure delete.  (Similar to difflib.)
 
659
        """
 
660
        raise NotImplementedError()
 
661
 
 
662
            
626
663
    def plan_merge(self, ver_a, ver_b):
627
664
        """Return pseudo-annotation indicating how the two versions merge.
628
665
 
631
668
 
632
669
        Weave lines present in none of them are skipped entirely.
633
670
        """
634
 
        inc_a = set(self.get_ancestry([ver_a]))
635
 
        inc_b = set(self.get_ancestry([ver_b]))
 
671
        inc_a = self.inclusions([ver_a])
 
672
        inc_b = self.inclusions([ver_b])
636
673
        inc_c = inc_a & inc_b
637
674
 
638
 
        for lineno, insert, deleteset, line in self._walk_internal([ver_a, ver_b]):
 
675
        for lineno, insert, deleteset, line in self._walk():
639
676
            if deleteset & inc_c:
640
677
                # killed in parent; can't be in either a or b
641
678
                # not relevant to our work
667
704
                # not in either revision
668
705
                yield 'irrelevant', line
669
706
 
670
 
    def _extract(self, versions):
671
 
        """Yield annotation of lines in included set.
672
 
 
673
 
        Yields a sequence of tuples (origin, lineno, text), where
674
 
        origin is the origin version, lineno the index in the weave,
675
 
        and text the text of the line.
676
 
 
677
 
        The set typically but not necessarily corresponds to a version.
678
 
        """
679
 
        for i in versions:
680
 
            if not isinstance(i, int):
681
 
                raise ValueError(i)
682
 
 
683
 
        included = self._inclusions(versions)
684
 
 
685
 
        istack = []
686
 
        iset = set()
687
 
        dset = set()
688
 
 
689
 
        lineno = 0         # line of weave, 0-based
690
 
 
691
 
        isactive = None
692
 
 
693
 
        result = []
694
 
 
695
 
        WFE = WeaveFormatError
696
 
 
697
 
        # wow.
698
 
        #  449       0   4474.6820   2356.5590   bzrlib.weave:556(_extract)
699
 
        #  +285282   0   1676.8040   1676.8040   +<isinstance>
700
 
        # 1.6 seconds in 'isinstance'.
701
 
        # changing the first isinstance:
702
 
        #  449       0   2814.2660   1577.1760   bzrlib.weave:556(_extract)
703
 
        #  +140414   0    762.8050    762.8050   +<isinstance>
704
 
        # note that the inline time actually dropped (less function calls)
705
 
        # and total processing time was halved.
706
 
        # we're still spending ~1/4 of the method in isinstance though.
707
 
        # so lets hard code the acceptable string classes we expect:
708
 
        #  449       0   1202.9420    786.2930   bzrlib.weave:556(_extract)
709
 
        # +71352     0    377.5560    377.5560   +<method 'append' of 'list'
710
 
        #                                          objects>
711
 
        # yay, down to ~1/4 the initial extract time, and our inline time
712
 
        # has shrunk again, with isinstance no longer dominating.
713
 
        # tweaking the stack inclusion test to use a set gives:
714
 
        #  449       0   1122.8030    713.0080   bzrlib.weave:556(_extract)
715
 
        # +71352     0    354.9980    354.9980   +<method 'append' of 'list'
716
 
        #                                          objects>
717
 
        # - a 5% win, or possibly just noise. However with large istacks that
718
 
        # 'in' test could dominate, so I'm leaving this change in place -
719
 
        # when its fast enough to consider profiling big datasets we can review.
720
 
 
721
 
 
722
 
 
723
 
 
724
 
        for l in self._weave:
725
 
            if l.__class__ == tuple:
726
 
                c, v = l
727
 
                isactive = None
728
 
                if c == '{':
729
 
                    istack.append(v)
730
 
                    iset.add(v)
731
 
                elif c == '}':
732
 
                    iset.remove(istack.pop())
733
 
                elif c == '[':
734
 
                    if v in included:
735
 
                        dset.add(v)
736
 
                elif c == ']':
737
 
                    if v in included:
738
 
                        dset.remove(v)
 
707
        yield 'unchanged', ''           # terminator
 
708
 
 
709
 
 
710
 
 
711
    def weave_merge(self, plan):
 
712
        lines_a = []
 
713
        lines_b = []
 
714
        ch_a = ch_b = False
 
715
 
 
716
        for state, line in plan:
 
717
            if state == 'unchanged' or state == 'killed-both':
 
718
                # resync and flush queued conflicts changes if any
 
719
                if not lines_a and not lines_b:
 
720
                    pass
 
721
                elif ch_a and not ch_b:
 
722
                    # one-sided change:                    
 
723
                    for l in lines_a: yield l
 
724
                elif ch_b and not ch_a:
 
725
                    for l in lines_b: yield l
 
726
                elif lines_a == lines_b:
 
727
                    for l in lines_a: yield l
739
728
                else:
740
 
                    raise AssertionError()
 
729
                    yield '<<<<<<<\n'
 
730
                    for l in lines_a: yield l
 
731
                    yield '=======\n'
 
732
                    for l in lines_b: yield l
 
733
                    yield '>>>>>>>\n'
 
734
 
 
735
                del lines_a[:]
 
736
                del lines_b[:]
 
737
                ch_a = ch_b = False
 
738
                
 
739
            if state == 'unchanged':
 
740
                if line:
 
741
                    yield line
 
742
            elif state == 'killed-a':
 
743
                ch_a = True
 
744
                lines_b.append(line)
 
745
            elif state == 'killed-b':
 
746
                ch_b = True
 
747
                lines_a.append(line)
 
748
            elif state == 'new-a':
 
749
                ch_a = True
 
750
                lines_a.append(line)
 
751
            elif state == 'new-b':
 
752
                ch_b = True
 
753
                lines_b.append(line)
741
754
            else:
742
 
                if isactive is None:
743
 
                    isactive = (not dset) and istack and (istack[-1] in included)
744
 
                if isactive:
745
 
                    result.append((istack[-1], lineno, l))
746
 
            lineno += 1
747
 
        if istack:
748
 
            raise WeaveFormatError("unclosed insertion blocks "
749
 
                    "at end of weave: %s" % istack)
750
 
        if dset:
751
 
            raise WeaveFormatError("unclosed deletion blocks at end of weave: %s"
752
 
                                   % dset)
753
 
        return result
754
 
 
755
 
    def _maybe_lookup(self, name_or_index):
756
 
        """Convert possible symbolic name to index, or pass through indexes.
757
 
 
758
 
        NOT FOR PUBLIC USE.
 
755
                assert state in ('irrelevant', 'ghost-a', 'ghost-b', 'killed-base',
 
756
                                 'killed-both'), \
 
757
                       state
 
758
 
 
759
                
 
760
    def join(self, other):
 
761
        """Integrate versions from other into this weave.
 
762
 
 
763
        The resulting weave contains all the history of both weaves; 
 
764
        any version you could retrieve from either self or other can be 
 
765
        retrieved from self after this call.
 
766
 
 
767
        It is illegal for the two weaves to contain different values 
 
768
        or different parents for any version.  See also reweave().
759
769
        """
760
 
        if isinstance(name_or_index, (int, long)):
761
 
            return name_or_index
762
 
        else:
763
 
            return self._lookup(name_or_index)
764
 
 
765
 
    def get_lines(self, version_id):
766
 
        """See VersionedFile.get_lines()."""
767
 
        int_index = self._maybe_lookup(version_id)
768
 
        result = [line for (origin, lineno, line) in self._extract([int_index])]
769
 
        expected_sha1 = self._sha1s[int_index]
770
 
        measured_sha1 = sha_strings(result)
771
 
        if measured_sha1 != expected_sha1:
772
 
            raise errors.WeaveInvalidChecksum(
773
 
                    'file %s, revision %s, expected: %s, measured %s'
774
 
                    % (self._weave_name, version_id,
775
 
                       expected_sha1, measured_sha1))
776
 
        return result
777
 
 
778
 
    def get_sha1s(self, version_ids):
779
 
        """See VersionedFile.get_sha1s()."""
780
 
        result = {}
781
 
        for v in version_ids:
782
 
            result[v] = self._sha1s[self._lookup(v)]
783
 
        return result
784
 
 
785
 
    def num_versions(self):
786
 
        """How many versions are in this weave?"""
787
 
        l = len(self._parents)
788
 
        return l
789
 
 
790
 
    __len__ = num_versions
791
 
 
792
 
    def check(self, progress_bar=None):
793
 
        # TODO evaluate performance hit of using string sets in this routine.
794
 
        # TODO: check no circular inclusions
795
 
        # TODO: create a nested progress bar
796
 
        for version in range(self.num_versions()):
797
 
            inclusions = list(self._parents[version])
798
 
            if inclusions:
799
 
                inclusions.sort()
800
 
                if inclusions[-1] >= version:
801
 
                    raise WeaveFormatError("invalid included version %d for index %d"
802
 
                                           % (inclusions[-1], version))
803
 
 
804
 
        # try extracting all versions; parallel extraction is used
805
 
        nv = self.num_versions()
806
 
        sha1s = {}
807
 
        texts = {}
808
 
        inclusions = {}
809
 
        for i in range(nv):
810
 
            # For creating the ancestry, IntSet is much faster (3.7s vs 0.17s)
811
 
            # The problem is that set membership is much more expensive
812
 
            name = self._idx_to_name(i)
813
 
            sha1s[name] = sha()
814
 
            texts[name] = []
815
 
            new_inc = set([name])
816
 
            for p in self._parents[i]:
817
 
                new_inc.update(inclusions[self._idx_to_name(p)])
818
 
 
819
 
            if set(new_inc) != set(self.get_ancestry(name)):
820
 
                raise AssertionError(
821
 
                    'failed %s != %s'
822
 
                    % (set(new_inc), set(self.get_ancestry(name))))
823
 
            inclusions[name] = new_inc
824
 
 
825
 
        nlines = len(self._weave)
826
 
 
827
 
        update_text = 'checking weave'
828
 
        if self._weave_name:
829
 
            short_name = os.path.basename(self._weave_name)
830
 
            update_text = 'checking %s' % (short_name,)
831
 
            update_text = update_text[:25]
832
 
 
833
 
        for lineno, insert, deleteset, line in self._walk_internal():
834
 
            if progress_bar:
835
 
                progress_bar.update(update_text, lineno, nlines)
836
 
 
837
 
            for name, name_inclusions in inclusions.items():
838
 
                # The active inclusion must be an ancestor,
839
 
                # and no ancestors must have deleted this line,
840
 
                # because we don't support resurrection.
841
 
                if (insert in name_inclusions) and not (deleteset & name_inclusions):
842
 
                    sha1s[name].update(line)
843
 
 
844
 
        for i in range(nv):
845
 
            version = self._idx_to_name(i)
846
 
            hd = sha1s[version].hexdigest()
847
 
            expected = self._sha1s[i]
848
 
            if hd != expected:
849
 
                raise errors.WeaveInvalidChecksum(
850
 
                        "mismatched sha1 for version %s: "
851
 
                        "got %s, expected %s"
852
 
                        % (version, hd, expected))
853
 
 
854
 
        # TODO: check insertions are properly nested, that there are
855
 
        # no lines outside of insertion blocks, that deletions are
856
 
        # properly paired, etc.
 
770
        if other.numversions() == 0:
 
771
            return          # nothing to update, easy
 
772
        # two loops so that we do not change ourselves before verifying it
 
773
        # will be ok
 
774
        # work through in index order to make sure we get all dependencies
 
775
        for other_idx, name in enumerate(other._names):
 
776
            if self._check_version_consistent(other, other_idx, name):
 
777
                continue
 
778
        for other_idx, name in enumerate(other._names):
 
779
            # TODO: If all the parents of the other version are already 
 
780
            # present then we can avoid some work by just taking the delta
 
781
            # and adjusting the offsets.
 
782
            new_parents = self._imported_parents(other, other_idx)
 
783
            lines = other.get_lines(other_idx)
 
784
            sha1 = other._sha1s[other_idx]
 
785
            self.add(name, new_parents, lines, sha1)
 
786
 
857
787
 
858
788
    def _imported_parents(self, other, other_idx):
859
789
        """Return list of parents in self corresponding to indexes in other."""
860
790
        new_parents = []
861
791
        for parent_idx in other._parents[other_idx]:
862
792
            parent_name = other._names[parent_idx]
863
 
            if parent_name not in self._name_map:
 
793
            if parent_name not in self._names:
864
794
                # should not be possible
865
 
                raise WeaveError("missing parent {%s} of {%s} in %r"
 
795
                raise WeaveError("missing parent {%s} of {%s} in %r" 
866
796
                                 % (parent_name, other._name_map[other_idx], self))
867
797
            new_parents.append(self._name_map[parent_name])
868
798
        return new_parents
875
805
         * the same text
876
806
         * the same direct parents (by name, not index, and disregarding
877
807
           order)
878
 
 
 
808
        
879
809
        If present & correct return True;
880
 
        if not present in self return False;
 
810
        if not present in self return False; 
881
811
        if inconsistent raise error."""
882
812
        this_idx = self._name_map.get(name, -1)
883
813
        if this_idx != -1:
884
814
            if self._sha1s[this_idx] != other._sha1s[other_idx]:
885
 
                raise errors.WeaveTextDiffers(name, self, other)
 
815
                raise WeaveError("inconsistent texts for version {%s} "
 
816
                                 "when joining weaves"
 
817
                                 % (name))
886
818
            self_parents = self._parents[this_idx]
887
819
            other_parents = other._parents[other_idx]
888
 
            n1 = set([self._names[i] for i in self_parents])
889
 
            n2 = set([other._names[i] for i in other_parents])
890
 
            if not self._compatible_parents(n1, n2):
 
820
            n1 = [self._names[i] for i in self_parents]
 
821
            n2 = [other._names[i] for i in other_parents]
 
822
            n1.sort()
 
823
            n2.sort()
 
824
            if n1 != n2:
891
825
                raise WeaveParentMismatch("inconsistent parents "
892
826
                    "for version {%s}: %s vs %s" % (name, n1, n2))
893
827
            else:
895
829
        else:
896
830
            return False
897
831
 
898
 
    def _reweave(self, other, pb, msg):
899
 
        """Reweave self with other - internal helper for join().
900
 
 
901
 
        :param other: The other weave to merge
902
 
        :param pb: An optional progress bar, indicating how far done we are
903
 
        :param msg: An optional message for the progress
904
 
        """
905
 
        new_weave = _reweave(self, other, pb=pb, msg=msg)
906
 
        self._copy_weave_content(new_weave)
907
 
 
908
 
    def _copy_weave_content(self, otherweave):
909
 
        """adsorb the content from otherweave."""
 
832
    def reweave(self, other):
 
833
        """Reweave self with other."""
 
834
        new_weave = reweave(self, other)
910
835
        for attr in self.__slots__:
911
 
            if attr != '_weave_name':
912
 
                setattr(self, attr, copy(getattr(otherweave, attr)))
913
 
 
914
 
 
915
 
class WeaveFile(Weave):
916
 
    """A WeaveFile represents a Weave on disk and writes on change."""
917
 
 
918
 
    WEAVE_SUFFIX = '.weave'
919
 
 
920
 
    def __init__(self, name, transport, filemode=None, create=False, access_mode='w', get_scope=None):
921
 
        """Create a WeaveFile.
922
 
 
923
 
        :param create: If not True, only open an existing knit.
924
 
        """
925
 
        super(WeaveFile, self).__init__(name, access_mode, get_scope=get_scope,
926
 
            allow_reserved=False)
927
 
        self._transport = transport
928
 
        self._filemode = filemode
929
 
        try:
930
 
            _read_weave_v5(self._transport.get(name + WeaveFile.WEAVE_SUFFIX), self)
931
 
        except errors.NoSuchFile:
932
 
            if not create:
933
 
                raise
934
 
            # new file, save it
935
 
            self._save()
936
 
 
937
 
    def _add_lines(self, version_id, parents, lines, parent_texts,
938
 
        left_matching_blocks, nostore_sha, random_id, check_content):
939
 
        """Add a version and save the weave."""
940
 
        self.check_not_reserved_id(version_id)
941
 
        result = super(WeaveFile, self)._add_lines(version_id, parents, lines,
942
 
            parent_texts, left_matching_blocks, nostore_sha, random_id,
943
 
            check_content)
944
 
        self._save()
945
 
        return result
946
 
 
947
 
    def copy_to(self, name, transport):
948
 
        """See VersionedFile.copy_to()."""
949
 
        # as we are all in memory always, just serialise to the new place.
950
 
        sio = StringIO()
951
 
        write_weave_v5(self, sio)
952
 
        sio.seek(0)
953
 
        transport.put_file(name + WeaveFile.WEAVE_SUFFIX, sio, self._filemode)
954
 
 
955
 
    def _save(self):
956
 
        """Save the weave."""
957
 
        self._check_write_ok()
958
 
        sio = StringIO()
959
 
        write_weave_v5(self, sio)
960
 
        sio.seek(0)
961
 
        bytes = sio.getvalue()
962
 
        path = self._weave_name + WeaveFile.WEAVE_SUFFIX
963
 
        try:
964
 
            self._transport.put_bytes(path, bytes, self._filemode)
965
 
        except errors.NoSuchFile:
966
 
            self._transport.mkdir(dirname(path))
967
 
            self._transport.put_bytes(path, bytes, self._filemode)
968
 
 
969
 
    @staticmethod
970
 
    def get_suffixes():
971
 
        """See VersionedFile.get_suffixes()."""
972
 
        return [WeaveFile.WEAVE_SUFFIX]
973
 
 
974
 
    def insert_record_stream(self, stream):
975
 
        super(WeaveFile, self).insert_record_stream(stream)
976
 
        self._save()
977
 
 
978
 
 
979
 
def _reweave(wa, wb, pb=None, msg=None):
 
836
            setattr(self, attr, getattr(new_weave, attr))
 
837
 
 
838
 
 
839
def reweave(wa, wb):
980
840
    """Combine two weaves and return the result.
981
841
 
982
 
    This works even if a revision R has different parents in
 
842
    This works even if a revision R has different parents in 
983
843
    wa and wb.  In the resulting weave all the parents are given.
984
844
 
985
 
    This is done by just building up a new weave, maintaining ordering
 
845
    This is done by just building up a new weave, maintaining ordering 
986
846
    of the versions in the two inputs.  More efficient approaches
987
 
    might be possible but it should only be necessary to do
988
 
    this operation rarely, when a new previously ghost version is
 
847
    might be possible but it should only be necessary to do 
 
848
    this operation rarely, when a new previously ghost version is 
989
849
    inserted.
990
 
 
991
 
    :param pb: An optional progress bar, indicating how far done we are
992
 
    :param msg: An optional message for the progress
993
850
    """
994
851
    wr = Weave()
995
852
    ia = ib = 0
996
 
    queue_a = range(wa.num_versions())
997
 
    queue_b = range(wb.num_versions())
 
853
    queue_a = range(wa.numversions())
 
854
    queue_b = range(wb.numversions())
998
855
    # first determine combined parents of all versions
999
856
    # map from version name -> all parent names
1000
857
    combined_parents = _reweave_parent_graphs(wa, wb)
1001
858
    mutter("combined parents: %r", combined_parents)
1002
 
    order = tsort.topo_sort(combined_parents.iteritems())
 
859
    order = topo_sort(combined_parents.iteritems())
1003
860
    mutter("order to reweave: %r", order)
1004
 
 
1005
 
    if pb and not msg:
1006
 
        msg = 'reweave'
1007
 
 
1008
 
    for idx, name in enumerate(order):
1009
 
        if pb:
1010
 
            pb.update(msg, idx, len(order))
 
861
    for name in order:
1011
862
        if name in wa._name_map:
1012
863
            lines = wa.get_lines(name)
1013
864
            if name in wb._name_map:
1014
 
                lines_b = wb.get_lines(name)
1015
 
                if lines != lines_b:
1016
 
                    mutter('Weaves differ on content. rev_id {%s}', name)
1017
 
                    mutter('weaves: %s, %s', wa._weave_name, wb._weave_name)
1018
 
                    import difflib
1019
 
                    lines = list(difflib.unified_diff(lines, lines_b,
1020
 
                            wa._weave_name, wb._weave_name))
1021
 
                    mutter('lines:\n%s', ''.join(lines))
1022
 
                    raise errors.WeaveTextDiffers(name, wa, wb)
 
865
                assert lines == wb.get_lines(name)
1023
866
        else:
1024
867
            lines = wb.get_lines(name)
1025
 
        wr._add(name, lines, [wr._lookup(i) for i in combined_parents[name]])
 
868
        wr.add(name, combined_parents[name], lines)
1026
869
    return wr
1027
870
 
 
871
 
1028
872
def _reweave_parent_graphs(wa, wb):
1029
873
    """Return combined parent ancestry for two weaves.
1030
 
 
 
874
    
1031
875
    Returned as a list of (version_name, set(parent_names))"""
1032
876
    combined = {}
1033
877
    for weave in [wa, wb]:
1034
878
        for idx, name in enumerate(weave._names):
1035
879
            p = combined.setdefault(name, set())
1036
 
            p.update(map(weave._idx_to_name, weave._parents[idx]))
 
880
            p.update(map(weave.idx_to_name, weave._parents[idx]))
1037
881
    return combined
1038
882
 
1039
883
 
1043
887
    for i in (6, 50, 10, 10):
1044
888
        print '-' * i,
1045
889
    print
1046
 
    for i in range(w.num_versions()):
 
890
    for i in range(w.numversions()):
1047
891
        sha1 = w._sha1s[i]
1048
892
        name = w._names[i]
1049
893
        parent_str = ' '.join(map(str, w._parents[i]))
1096
940
        Add NEWTEXT, with specified parent versions.
1097
941
    weave annotate WEAVEFILE VERSION
1098
942
        Display origin of each line.
 
943
    weave mash WEAVEFILE VERSION...
 
944
        Display composite of all selected versions.
1099
945
    weave merge WEAVEFILE VERSION1 VERSION2 > OUT
1100
946
        Auto-merge two versions and display conflicts.
1101
 
    weave diff WEAVEFILE VERSION1 VERSION2
 
947
    weave diff WEAVEFILE VERSION1 VERSION2 
1102
948
        Show differences between two versions.
1103
949
 
1104
950
example:
1121
967
 
1122
968
    % weave merge foo.weave 1 2 > foo.txt   (merge them)
1123
969
    % vi foo.txt                            (resolve conflicts)
1124
 
    % weave add foo.weave merged 1 2 < foo.txt     (commit merged version)
1125
 
 
 
970
    % weave add foo.weave merged 1 2 < foo.txt     (commit merged version)     
 
971
    
1126
972
"""
1127
 
 
 
973
    
1128
974
 
1129
975
 
1130
976
def main(argv):
1153
999
 
1154
1000
    def readit():
1155
1001
        return read_weave(file(argv[2], 'rb'))
1156
 
 
 
1002
    
1157
1003
    if cmd == 'help':
1158
1004
        usage()
1159
1005
    elif cmd == 'add':
1174
1020
    elif cmd == 'get': # get one version
1175
1021
        w = readit()
1176
1022
        sys.stdout.writelines(w.get_iter(int(argv[3])))
 
1023
        
 
1024
    elif cmd == 'mash': # get composite
 
1025
        w = readit()
 
1026
        sys.stdout.writelines(w.mash_iter(map(int, argv[3:])))
1177
1027
 
1178
1028
    elif cmd == 'diff':
 
1029
        from difflib import unified_diff
1179
1030
        w = readit()
1180
1031
        fn = argv[2]
1181
1032
        v1, v2 = map(int, argv[3:5])
1182
1033
        lines1 = w.get(v1)
1183
1034
        lines2 = w.get(v2)
1184
 
        diff_gen = bzrlib.patiencediff.unified_diff(lines1, lines2,
 
1035
        diff_gen = unified_diff(lines1, lines2,
1185
1036
                                '%s version %d' % (fn, v1),
1186
1037
                                '%s version %d' % (fn, v2))
1187
1038
        sys.stdout.writelines(diff_gen)
1188
 
 
 
1039
            
1189
1040
    elif cmd == 'annotate':
1190
1041
        w = readit()
1191
1042
        # newline is added to all lines regardless; too hard to get
1198
1049
            else:
1199
1050
                print '%5d | %s' % (origin, text)
1200
1051
                lasto = origin
1201
 
 
 
1052
                
1202
1053
    elif cmd == 'toc':
1203
1054
        weave_toc(readit())
1204
1055
 
1205
1056
    elif cmd == 'stats':
1206
1057
        weave_stats(argv[2], ProgressBar())
1207
 
 
 
1058
        
1208
1059
    elif cmd == 'check':
1209
1060
        w = readit()
1210
1061
        pb = ProgressBar()
1211
1062
        w.check(pb)
1212
1063
        pb.clear()
1213
 
        print '%d versions ok' % w.num_versions()
 
1064
        print '%d versions ok' % w.numversions()
1214
1065
 
1215
1066
    elif cmd == 'inclusions':
1216
1067
        w = readit()
1221
1072
        print ' '.join(map(str, w._parents[int(argv[3])]))
1222
1073
 
1223
1074
    elif cmd == 'plan-merge':
1224
 
        # replaced by 'bzr weave-plan-merge'
1225
1075
        w = readit()
1226
1076
        for state, line in w.plan_merge(int(argv[3]), int(argv[4])):
1227
1077
            if line:
1228
1078
                print '%14s | %s' % (state, line),
 
1079
 
1229
1080
    elif cmd == 'merge':
1230
 
        # replaced by 'bzr weave-merge-text'
1231
1081
        w = readit()
1232
1082
        p = w.plan_merge(int(argv[3]), int(argv[4]))
1233
1083
        sys.stdout.writelines(w.weave_merge(p))
 
1084
            
 
1085
    elif cmd == 'mash-merge':
 
1086
        if len(argv) != 5:
 
1087
            usage()
 
1088
            return 1
 
1089
 
 
1090
        w = readit()
 
1091
        v1, v2 = map(int, argv[3:5])
 
1092
 
 
1093
        basis = w.inclusions([v1]).intersection(w.inclusions([v2]))
 
1094
 
 
1095
        base_lines = list(w.mash_iter(basis))
 
1096
        a_lines = list(w.get(v1))
 
1097
        b_lines = list(w.get(v2))
 
1098
 
 
1099
        from bzrlib.merge3 import Merge3
 
1100
        m3 = Merge3(base_lines, a_lines, b_lines)
 
1101
 
 
1102
        name_a = 'version %d' % v1
 
1103
        name_b = 'version %d' % v2
 
1104
        sys.stdout.writelines(m3.merge_lines(name_a=name_a, name_b=name_b))
1234
1105
    else:
1235
1106
        raise ValueError('unknown command %r' % cmd)
 
1107
    
 
1108
 
 
1109
 
 
1110
def profile_main(argv): 
 
1111
    import tempfile, hotshot, hotshot.stats
 
1112
 
 
1113
    prof_f = tempfile.NamedTemporaryFile()
 
1114
 
 
1115
    prof = hotshot.Profile(prof_f.name)
 
1116
 
 
1117
    ret = prof.runcall(main, argv)
 
1118
    prof.close()
 
1119
 
 
1120
    stats = hotshot.stats.load(prof_f.name)
 
1121
    #stats.strip_dirs()
 
1122
    stats.sort_stats('cumulative')
 
1123
    ## XXX: Might like to write to stderr or the trace file instead but
 
1124
    ## print_stats seems hardcoded to stdout
 
1125
    stats.print_stats(20)
 
1126
            
 
1127
    return ret
1236
1128
 
1237
1129
 
1238
1130
if __name__ == '__main__':
1239
1131
    import sys
1240
 
    sys.exit(main(sys.argv))
 
1132
    if '--profile' in sys.argv:
 
1133
        args = sys.argv[:]
 
1134
        args.remove('--profile')
 
1135
        sys.exit(profile_main(args))
 
1136
    else:
 
1137
        sys.exit(main(sys.argv))
 
1138