~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/weave.py

  • Committer: John Arbash Meinel
  • Date: 2009-02-25 21:13:22 UTC
  • mto: This revision was merged to the branch mainline in revision 4051.
  • Revision ID: john@arbash-meinel.com-20090225211322-qc94czk3s1g7nliq
Some direct tests for _group_keys_for_io

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2005, 2009 Canonical Ltd
 
1
#! /usr/bin/python
 
2
 
 
3
# Copyright (C) 2005 Canonical Ltd
2
4
#
3
5
# This program is free software; you can redistribute it and/or modify
4
6
# it under the terms of the GNU General Public License as published by
12
14
#
13
15
# You should have received a copy of the GNU General Public License
14
16
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
 
17
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
18
 
17
19
# Author: Martin Pool <mbp@canonical.com>
18
20
 
97
99
    AbsentContentFactory,
98
100
    adapter_registry,
99
101
    ContentFactory,
100
 
    sort_groupcompress,
101
102
    VersionedFile,
102
103
    )
103
104
from bzrlib.weavefile import _read_weave_v5, write_weave_v5
320
321
            new_versions = tsort.topo_sort(parents)
321
322
            new_versions.extend(set(versions).difference(set(parents)))
322
323
            versions = new_versions
323
 
        elif ordering == 'groupcompress':
324
 
            parents = self.get_parent_map(versions)
325
 
            new_versions = sort_groupcompress(parents)
326
 
            new_versions.extend(set(versions).difference(set(parents)))
327
 
            versions = new_versions
328
324
        for version in versions:
329
325
            if version in self:
330
326
                yield WeaveContentFactory(version, self)
408
404
        version_id
409
405
            Symbolic name for this version.
410
406
            (Typically the revision-id of the revision that added it.)
411
 
            If None, a name will be allocated based on the hash. (sha1:SHAHASH)
412
407
 
413
408
        parents
414
409
            List or set of direct parent version numbers.
424
419
            sha1 = sha_strings(lines)
425
420
        if sha1 == nostore_sha:
426
421
            raise errors.ExistingContent
427
 
        if version_id is None:
428
 
            version_id = "sha1:" + sha1
429
422
        if version_id in self._name_map:
430
423
            return self._check_repeated_add(version_id, parents, lines, sha1)
431
424
 
582
575
            version_ids = self.versions()
583
576
        version_ids = set(version_ids)
584
577
        for lineno, inserted, deletes, line in self._walk_internal(version_ids):
585
 
            if inserted not in version_ids: continue
 
578
            # if inserted not in version_ids then it was inserted before the
 
579
            # versions we care about, but because weaves cannot represent ghosts
 
580
            # properly, we do not filter down to that
 
581
            # if inserted not in version_ids: continue
586
582
            if line[-1] != '\n':
587
583
                yield line + '\n', inserted
588
584
            else:
973
969
        super(WeaveFile, self).insert_record_stream(stream)
974
970
        self._save()
975
971
 
 
972
    @deprecated_method(one_five)
 
973
    def join(self, other, pb=None, msg=None, version_ids=None,
 
974
             ignore_missing=False):
 
975
        """Join other into self and save."""
 
976
        super(WeaveFile, self).join(other, pb, msg, version_ids, ignore_missing)
 
977
        self._save()
 
978
 
976
979
 
977
980
def _reweave(wa, wb, pb=None, msg=None):
978
981
    """Combine two weaves and return the result.
1023
1026
        wr._add(name, lines, [wr._lookup(i) for i in combined_parents[name]])
1024
1027
    return wr
1025
1028
 
1026
 
 
1027
1029
def _reweave_parent_graphs(wa, wb):
1028
1030
    """Return combined parent ancestry for two weaves.
1029
1031
 
1034
1036
            p = combined.setdefault(name, set())
1035
1037
            p.update(map(weave._idx_to_name, weave._parents[idx]))
1036
1038
    return combined
 
1039
 
 
1040
 
 
1041
def weave_toc(w):
 
1042
    """Show the weave's table-of-contents"""
 
1043
    print '%6s %50s %10s %10s' % ('ver', 'name', 'sha1', 'parents')
 
1044
    for i in (6, 50, 10, 10):
 
1045
        print '-' * i,
 
1046
    print
 
1047
    for i in range(w.num_versions()):
 
1048
        sha1 = w._sha1s[i]
 
1049
        name = w._names[i]
 
1050
        parent_str = ' '.join(map(str, w._parents[i]))
 
1051
        print '%6d %-50.50s %10.10s %s' % (i, name, sha1, parent_str)
 
1052
 
 
1053
 
 
1054
 
 
1055
def weave_stats(weave_file, pb):
 
1056
    from bzrlib.weavefile import read_weave
 
1057
 
 
1058
    wf = file(weave_file, 'rb')
 
1059
    w = read_weave(wf)
 
1060
    # FIXME: doesn't work on pipes
 
1061
    weave_size = wf.tell()
 
1062
 
 
1063
    total = 0
 
1064
    vers = len(w)
 
1065
    for i in range(vers):
 
1066
        pb.update('checking sizes', i, vers)
 
1067
        for origin, lineno, line in w._extract([i]):
 
1068
            total += len(line)
 
1069
 
 
1070
    pb.clear()
 
1071
 
 
1072
    print 'versions          %9d' % vers
 
1073
    print 'weave file        %9d bytes' % weave_size
 
1074
    print 'total contents    %9d bytes' % total
 
1075
    print 'compression ratio %9.2fx' % (float(total) / float(weave_size))
 
1076
    if vers:
 
1077
        avg = total/vers
 
1078
        print 'average size      %9d bytes' % avg
 
1079
        print 'relative size     %9.2fx' % (float(weave_size) / float(avg))
 
1080
 
 
1081
 
 
1082
def usage():
 
1083
    print """bzr weave tool
 
1084
 
 
1085
Experimental tool for weave algorithm.
 
1086
 
 
1087
usage:
 
1088
    weave init WEAVEFILE
 
1089
        Create an empty weave file
 
1090
    weave get WEAVEFILE VERSION
 
1091
        Write out specified version.
 
1092
    weave check WEAVEFILE
 
1093
        Check consistency of all versions.
 
1094
    weave toc WEAVEFILE
 
1095
        Display table of contents.
 
1096
    weave add WEAVEFILE NAME [BASE...] < NEWTEXT
 
1097
        Add NEWTEXT, with specified parent versions.
 
1098
    weave annotate WEAVEFILE VERSION
 
1099
        Display origin of each line.
 
1100
    weave merge WEAVEFILE VERSION1 VERSION2 > OUT
 
1101
        Auto-merge two versions and display conflicts.
 
1102
    weave diff WEAVEFILE VERSION1 VERSION2
 
1103
        Show differences between two versions.
 
1104
 
 
1105
example:
 
1106
 
 
1107
    % weave init foo.weave
 
1108
    % vi foo.txt
 
1109
    % weave add foo.weave ver0 < foo.txt
 
1110
    added version 0
 
1111
 
 
1112
    (create updated version)
 
1113
    % vi foo.txt
 
1114
    % weave get foo.weave 0 | diff -u - foo.txt
 
1115
    % weave add foo.weave ver1 0 < foo.txt
 
1116
    added version 1
 
1117
 
 
1118
    % weave get foo.weave 0 > foo.txt       (create forked version)
 
1119
    % vi foo.txt
 
1120
    % weave add foo.weave ver2 0 < foo.txt
 
1121
    added version 2
 
1122
 
 
1123
    % weave merge foo.weave 1 2 > foo.txt   (merge them)
 
1124
    % vi foo.txt                            (resolve conflicts)
 
1125
    % weave add foo.weave merged 1 2 < foo.txt     (commit merged version)
 
1126
 
 
1127
"""
 
1128
 
 
1129
 
 
1130
 
 
1131
def main(argv):
 
1132
    import sys
 
1133
    import os
 
1134
    try:
 
1135
        import bzrlib
 
1136
    except ImportError:
 
1137
        # in case we're run directly from the subdirectory
 
1138
        sys.path.append('..')
 
1139
        import bzrlib
 
1140
    from bzrlib.weavefile import write_weave, read_weave
 
1141
    from bzrlib.progress import ProgressBar
 
1142
 
 
1143
    try:
 
1144
        import psyco
 
1145
        psyco.full()
 
1146
    except ImportError:
 
1147
        pass
 
1148
 
 
1149
    if len(argv) < 2:
 
1150
        usage()
 
1151
        return 0
 
1152
 
 
1153
    cmd = argv[1]
 
1154
 
 
1155
    def readit():
 
1156
        return read_weave(file(argv[2], 'rb'))
 
1157
 
 
1158
    if cmd == 'help':
 
1159
        usage()
 
1160
    elif cmd == 'add':
 
1161
        w = readit()
 
1162
        # at the moment, based on everything in the file
 
1163
        name = argv[3]
 
1164
        parents = map(int, argv[4:])
 
1165
        lines = sys.stdin.readlines()
 
1166
        ver = w.add(name, parents, lines)
 
1167
        write_weave(w, file(argv[2], 'wb'))
 
1168
        print 'added version %r %d' % (name, ver)
 
1169
    elif cmd == 'init':
 
1170
        fn = argv[2]
 
1171
        if os.path.exists(fn):
 
1172
            raise IOError("file exists")
 
1173
        w = Weave()
 
1174
        write_weave(w, file(fn, 'wb'))
 
1175
    elif cmd == 'get': # get one version
 
1176
        w = readit()
 
1177
        sys.stdout.writelines(w.get_iter(int(argv[3])))
 
1178
 
 
1179
    elif cmd == 'diff':
 
1180
        w = readit()
 
1181
        fn = argv[2]
 
1182
        v1, v2 = map(int, argv[3:5])
 
1183
        lines1 = w.get(v1)
 
1184
        lines2 = w.get(v2)
 
1185
        diff_gen = bzrlib.patiencediff.unified_diff(lines1, lines2,
 
1186
                                '%s version %d' % (fn, v1),
 
1187
                                '%s version %d' % (fn, v2))
 
1188
        sys.stdout.writelines(diff_gen)
 
1189
 
 
1190
    elif cmd == 'annotate':
 
1191
        w = readit()
 
1192
        # newline is added to all lines regardless; too hard to get
 
1193
        # reasonable formatting otherwise
 
1194
        lasto = None
 
1195
        for origin, text in w.annotate(int(argv[3])):
 
1196
            text = text.rstrip('\r\n')
 
1197
            if origin == lasto:
 
1198
                print '      | %s' % (text)
 
1199
            else:
 
1200
                print '%5d | %s' % (origin, text)
 
1201
                lasto = origin
 
1202
 
 
1203
    elif cmd == 'toc':
 
1204
        weave_toc(readit())
 
1205
 
 
1206
    elif cmd == 'stats':
 
1207
        weave_stats(argv[2], ProgressBar())
 
1208
 
 
1209
    elif cmd == 'check':
 
1210
        w = readit()
 
1211
        pb = ProgressBar()
 
1212
        w.check(pb)
 
1213
        pb.clear()
 
1214
        print '%d versions ok' % w.num_versions()
 
1215
 
 
1216
    elif cmd == 'inclusions':
 
1217
        w = readit()
 
1218
        print ' '.join(map(str, w.inclusions([int(argv[3])])))
 
1219
 
 
1220
    elif cmd == 'parents':
 
1221
        w = readit()
 
1222
        print ' '.join(map(str, w._parents[int(argv[3])]))
 
1223
 
 
1224
    elif cmd == 'plan-merge':
 
1225
        # replaced by 'bzr weave-plan-merge'
 
1226
        w = readit()
 
1227
        for state, line in w.plan_merge(int(argv[3]), int(argv[4])):
 
1228
            if line:
 
1229
                print '%14s | %s' % (state, line),
 
1230
    elif cmd == 'merge':
 
1231
        # replaced by 'bzr weave-merge-text'
 
1232
        w = readit()
 
1233
        p = w.plan_merge(int(argv[3]), int(argv[4]))
 
1234
        sys.stdout.writelines(w.weave_merge(p))
 
1235
    else:
 
1236
        raise ValueError('unknown command %r' % cmd)
 
1237
 
 
1238
 
 
1239
if __name__ == '__main__':
 
1240
    import sys
 
1241
    sys.exit(main(sys.argv))