~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/lsprof.py

  • Committer: John Arbash Meinel
  • Date: 2010-02-16 16:08:40 UTC
  • mfrom: (4797.2.15 2.1)
  • mto: (4797.2.16 2.1)
  • mto: This revision was merged to the branch mainline in revision 5037.
  • Revision ID: john@arbash-meinel.com-20100216160840-xwbpuu0v89gq8lej
Tags: bzr-2.1.0
bring in the latest 2.1 changes

Show diffs side-by-side

added added

removed removed

Lines of Context:
3
3
# I made one modification to profile so that it returns a pair
4
4
# instead of just the Stats object
5
5
 
 
6
import cPickle
 
7
import os
6
8
import sys
7
 
from _lsprof import Profiler, profiler_entry, profiler_subentry
 
9
import thread
 
10
import threading
 
11
from _lsprof import Profiler, profiler_entry
 
12
 
8
13
 
9
14
__all__ = ['profile', 'Stats']
10
15
 
11
16
def profile(f, *args, **kwds):
12
 
    """XXX docstring"""
13
 
    p = Profiler()
14
 
    p.enable(subcalls=True)
 
17
    """Run a function profile.
 
18
 
 
19
    Exceptions are not caught: If you need stats even when exceptions are to be
 
20
    raised, pass in a closure that will catch the exceptions and transform them
 
21
    appropriately for your driver function.
 
22
 
 
23
    :return: The functions return value and a stats object.
 
24
    """
 
25
    profiler = BzrProfiler()
 
26
    profiler.start()
15
27
    try:
16
28
        ret = f(*args, **kwds)
17
29
    finally:
18
 
        p.disable()
19
 
    return ret,Stats(p.getstats())
 
30
        stats = profiler.stop()
 
31
    return ret, stats
 
32
 
 
33
 
 
34
class BzrProfiler(object):
 
35
    """Bzr utility wrapper around Profiler.
 
36
    
 
37
    For most uses the module level 'profile()' function will be suitable.
 
38
    However profiling when a simple wrapped function isn't available may
 
39
    be easier to accomplish using this class.
 
40
 
 
41
    To use it, create a BzrProfiler and call start() on it. Some arbitrary
 
42
    time later call stop() to stop profiling and retrieve the statistics
 
43
    from the code executed in the interim.
 
44
    """
 
45
 
 
46
    def start(self):
 
47
        """Start profiling.
 
48
        
 
49
        This hooks into threading and will record all calls made until
 
50
        stop() is called.
 
51
        """
 
52
        self._g_threadmap = {}
 
53
        self.p = Profiler()
 
54
        self.p.enable(subcalls=True)
 
55
        threading.setprofile(self._thread_profile)
 
56
 
 
57
    def stop(self):
 
58
        """Stop profiling.
 
59
 
 
60
        This unhooks from threading and cleans up the profiler, returning
 
61
        the gathered Stats object.
 
62
 
 
63
        :return: A bzrlib.lsprof.Stats object.
 
64
        """
 
65
        self.p.disable()
 
66
        for pp in self._g_threadmap.values():
 
67
            pp.disable()
 
68
        threading.setprofile(None)
 
69
        p = self.p
 
70
        self.p = None
 
71
        threads = {}
 
72
        for tid, pp in self._g_threadmap.items():
 
73
            threads[tid] = Stats(pp.getstats(), {})
 
74
        self._g_threadmap = None
 
75
        return Stats(p.getstats(), threads)
 
76
 
 
77
    def _thread_profile(self, f, *args, **kwds):
 
78
        # we lose the first profile point for a new thread in order to
 
79
        # trampoline a new Profile object into place
 
80
        thr = thread.get_ident()
 
81
        self._g_threadmap[thr] = p = Profiler()
 
82
        # this overrides our sys.setprofile hook:
 
83
        p.enable(subcalls=True, builtins=True)
20
84
 
21
85
 
22
86
class Stats(object):
23
87
    """XXX docstring"""
24
88
 
25
 
    def __init__(self, data):
 
89
    def __init__(self, data, threads):
26
90
        self.data = data
 
91
        self.threads = threads
27
92
 
28
93
    def sort(self, crit="inlinetime"):
29
94
        """XXX docstring"""
66
131
            e = self.data[i]
67
132
            if not isinstance(e.code, str):
68
133
                self.data[i] = type(e)((label(e.code),) + e[1:])
69
 
                if e.calls:
70
 
                    for j in range(len(e.calls)):
71
 
                        se = e.calls[j]
72
 
                        if not isinstance(se.code, str):
73
 
                            e.calls[j] = type(se)((label(se.code),) + se[1:])
 
134
            if e.calls:
 
135
                for j in range(len(e.calls)):
 
136
                    se = e.calls[j]
 
137
                    if not isinstance(se.code, str):
 
138
                        e.calls[j] = type(se)((label(se.code),) + se[1:])
 
139
        for s in self.threads.values():
 
140
            s.freeze()
 
141
 
 
142
    def calltree(self, file):
 
143
        """Output profiling data in calltree format (for KCacheGrind)."""
 
144
        _CallTreeFilter(self.data).output(file)
 
145
 
 
146
    def save(self, filename, format=None):
 
147
        """Save profiling data to a file.
 
148
 
 
149
        :param filename: the name of the output file
 
150
        :param format: 'txt' for a text representation;
 
151
            'callgrind' for calltree format;
 
152
            otherwise a pickled Python object. A format of None indicates
 
153
            that the format to use is to be found from the filename. If
 
154
            the name starts with callgrind.out, callgrind format is used
 
155
            otherwise the format is given by the filename extension.
 
156
        """
 
157
        if format is None:
 
158
            basename = os.path.basename(filename)
 
159
            if basename.startswith('callgrind.out'):
 
160
                format = "callgrind"
 
161
            else:
 
162
                ext = os.path.splitext(filename)[1]
 
163
                if len(ext) > 1:
 
164
                    format = ext[1:]
 
165
        outfile = open(filename, 'wb')
 
166
        try:
 
167
            if format == "callgrind":
 
168
                self.calltree(outfile)
 
169
            elif format == "txt":
 
170
                self.pprint(file=outfile)
 
171
            else:
 
172
                self.freeze()
 
173
                cPickle.dump(self, outfile, 2)
 
174
        finally:
 
175
            outfile.close()
 
176
 
 
177
 
 
178
class _CallTreeFilter(object):
 
179
    """Converter of a Stats object to input suitable for KCacheGrind.
 
180
 
 
181
    This code is taken from http://ddaa.net/blog/python/lsprof-calltree
 
182
    with the changes made by J.P. Calderone and Itamar applied. Note that
 
183
    isinstance(code, str) needs to be used at times to determine if the code
 
184
    object is actually an external code object (with a filename, etc.) or
 
185
    a Python built-in.
 
186
    """
 
187
 
 
188
    def __init__(self, data):
 
189
        self.data = data
 
190
        self.out_file = None
 
191
 
 
192
    def output(self, out_file):
 
193
        self.out_file = out_file
 
194
        out_file.write('events: Ticks\n')
 
195
        self._print_summary()
 
196
        for entry in self.data:
 
197
            self._entry(entry)
 
198
 
 
199
    def _print_summary(self):
 
200
        max_cost = 0
 
201
        for entry in self.data:
 
202
            totaltime = int(entry.totaltime * 1000)
 
203
            max_cost = max(max_cost, totaltime)
 
204
        self.out_file.write('summary: %d\n' % (max_cost,))
 
205
 
 
206
    def _entry(self, entry):
 
207
        out_file = self.out_file
 
208
        code = entry.code
 
209
        inlinetime = int(entry.inlinetime * 1000)
 
210
        #out_file.write('ob=%s\n' % (code.co_filename,))
 
211
        if isinstance(code, str):
 
212
            out_file.write('fi=~\n')
 
213
        else:
 
214
            out_file.write('fi=%s\n' % (code.co_filename,))
 
215
        out_file.write('fn=%s\n' % (label(code, True),))
 
216
        if isinstance(code, str):
 
217
            out_file.write('0  %s\n' % (inlinetime,))
 
218
        else:
 
219
            out_file.write('%d %d\n' % (code.co_firstlineno, inlinetime))
 
220
        # recursive calls are counted in entry.calls
 
221
        if entry.calls:
 
222
            calls = entry.calls
 
223
        else:
 
224
            calls = []
 
225
        if isinstance(code, str):
 
226
            lineno = 0
 
227
        else:
 
228
            lineno = code.co_firstlineno
 
229
        for subentry in calls:
 
230
            self._subentry(lineno, subentry)
 
231
        out_file.write('\n')
 
232
 
 
233
    def _subentry(self, lineno, subentry):
 
234
        out_file = self.out_file
 
235
        code = subentry.code
 
236
        totaltime = int(subentry.totaltime * 1000)
 
237
        #out_file.write('cob=%s\n' % (code.co_filename,))
 
238
        out_file.write('cfn=%s\n' % (label(code, True),))
 
239
        if isinstance(code, str):
 
240
            out_file.write('cfi=~\n')
 
241
            out_file.write('calls=%d 0\n' % (subentry.callcount,))
 
242
        else:
 
243
            out_file.write('cfi=%s\n' % (code.co_filename,))
 
244
            out_file.write('calls=%d %d\n' % (
 
245
                subentry.callcount, code.co_firstlineno))
 
246
        out_file.write('%d %d\n' % (lineno, totaltime))
74
247
 
75
248
_fn2mod = {}
76
249
 
77
 
def label(code):
 
250
def label(code, calltree=False):
78
251
    if isinstance(code, str):
79
252
        return code
80
253
    try:
81
254
        mname = _fn2mod[code.co_filename]
82
255
    except KeyError:
83
 
        for k, v in sys.modules.iteritems():
 
256
        for k, v in sys.modules.items():
84
257
            if v is None:
85
258
                continue
86
 
            if not hasattr(v, '__file__'):
 
259
            if getattr(v, '__file__', None) is None:
87
260
                continue
88
261
            if not isinstance(v.__file__, str):
89
262
                continue
92
265
                break
93
266
        else:
94
267
            mname = _fn2mod[code.co_filename] = '<%s>'%code.co_filename
95
 
    
96
 
    return '%s:%d(%s)' % (mname, code.co_firstlineno, code.co_name)
 
268
    if calltree:
 
269
        return '%s %s:%d' % (code.co_name, mname, code.co_firstlineno)
 
270
    else:
 
271
        return '%s:%d(%s)' % (mname, code.co_firstlineno, code.co_name)
97
272
 
98
273
 
99
274
if __name__ == '__main__':
100
275
    import os
101
276
    sys.argv = sys.argv[1:]
102
277
    if not sys.argv:
103
 
        print >> sys.stderr, "usage: lsprof.py <script> <arguments...>"
 
278
        sys.stderr.write("usage: lsprof.py <script> <arguments...>\n")
104
279
        sys.exit(2)
105
280
    sys.path.insert(0, os.path.abspath(os.path.dirname(sys.argv[0])))
106
281
    stats = profile(execfile, sys.argv[0], globals(), locals())