~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to tools/history2revfiles.py

  • Committer: Canonical.com Patch Queue Manager
  • Date: 2008-09-03 22:30:56 UTC
  • mfrom: (3644.2.13 index_builder_cleanup)
  • Revision ID: pqm@pqm.ubuntu.com-20080903223056-b108iytb38xkznci
(jam) Streamline BTreeBuilder.add_node et al to make btree creation
        faster.

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
#! /usr/bin/python
 
2
 
 
3
# Copyright (C) 2005 Canonical Ltd
 
4
#
 
5
# This program is free software; you can redistribute it and/or modify
 
6
# it under the terms of the GNU General Public License as published by
 
7
# the Free Software Foundation; either version 2 of the License, or
 
8
# (at your option) any later version.
 
9
#
 
10
# This program is distributed in the hope that it will be useful,
 
11
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
12
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
13
# GNU General Public License for more details.
 
14
#
 
15
# You should have received a copy of the GNU General Public License
 
16
# along with this program; if not, write to the Free Software
 
17
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
18
 
 
19
"""Experiment in converting existing bzr branches to weaves."""
 
20
 
 
21
 
 
22
import bzrlib.branch
 
23
from bzrlib.revfile import Revfile
 
24
from bzrlib.progress import ProgressBar
 
25
import tempfile
 
26
import hotshot, hotshot.stats
 
27
import sys
 
28
 
 
29
def convert():
 
30
    pb = ProgressBar()
 
31
 
 
32
    inv_rf = Revfile('revfiles/inventory', 'w')
 
33
    last_text_sha = {}
 
34
    text_rfs = {}
 
35
 
 
36
    b = bzrlib.branch.find_branch('.')
 
37
 
 
38
    revno = 1
 
39
    rev_history = b.revision_history()
 
40
    last_idx = None
 
41
    for rev_id in rev_history:
 
42
        pb.update('converting inventory', revno, len(rev_history))
 
43
        inv_xml = b.get_inventory_xml(rev_id).read()
 
44
        new_idx = inv_rf.add(inv_xml, last_idx, compress=False)
 
45
 
 
46
        tree = b.revision_tree(rev_id)
 
47
        inv = tree.inventory
 
48
 
 
49
        # for each file in the inventory, put it into its own revfile
 
50
        for file_id in inv:
 
51
            ie = inv[file_id]
 
52
            if ie.kind != 'file':
 
53
                continue
 
54
            if last_text_sha.get(file_id) == ie.text_sha1:
 
55
                # same as last time
 
56
                continue
 
57
            last_text_sha[file_id] = ie.text_sha1
 
58
 
 
59
            # new text (though possibly already stored); need to store it
 
60
            text = tree.get_file(file_id).read()
 
61
            
 
62
            if file_id not in text_rfs:
 
63
                text_rfs[file_id] = Revfile('revfiles/' + file_id, 'w')
 
64
            rf = text_rfs[file_id]
 
65
 
 
66
            last = len(rf)
 
67
            if last == 0:
 
68
                last = None
 
69
            else:
 
70
                last -= 1
 
71
            rf.add(text, last, compress=True)
 
72
        
 
73
        last_idx = new_idx
 
74
        revno += 1
 
75
 
 
76
    pb.clear()
 
77
 
 
78
 
 
79
def profile_convert(): 
 
80
    prof_f = tempfile.NamedTemporaryFile()
 
81
 
 
82
    prof = hotshot.Profile(prof_f.name)
 
83
 
 
84
    prof.runcall(convert) 
 
85
    prof.close()
 
86
 
 
87
    stats = hotshot.stats.load(prof_f.name)
 
88
    #stats.strip_dirs()
 
89
    stats.sort_stats('time')
 
90
    ## XXX: Might like to write to stderr or the trace file instead but
 
91
    ## print_stats seems hardcoded to stdout
 
92
    stats.print_stats(20)
 
93
            
 
94
 
 
95
if '-p' in sys.argv[1:]:
 
96
    profile_convert()
 
97
else:
 
98
    convert()
 
99