~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/tests/test_source.py

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2005 by Canonical Ltd
2
 
#   Authors: Robert Collins <robert.collins@canonical.com>
 
1
# Copyright (C) 2005, 2006, 2008, 2009 Canonical Ltd
3
2
#
4
3
# This program is free software; you can redistribute it and/or modify
5
4
# it under the terms of the GNU General Public License as published by
13
12
#
14
13
# You should have received a copy of the GNU General Public License
15
14
# along with this program; if not, write to the Free Software
16
 
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
15
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
17
16
 
18
17
"""These tests are tests about the source code of bzrlib itself.
19
18
 
22
21
 
23
22
# import system imports here
24
23
import os
 
24
import parser
 
25
import re
 
26
import symbol
25
27
import sys
 
28
import token
26
29
 
27
30
#import bzrlib specific imports here
28
 
from bzrlib.tests import TestCase
 
31
from bzrlib import (
 
32
    osutils,
 
33
    )
29
34
import bzrlib.branch
30
 
 
31
 
 
32
 
class TestApiUsage(TestCase):
 
35
from bzrlib.tests import (
 
36
    TestCase,
 
37
    TestSkipped,
 
38
    )
 
39
 
 
40
 
 
41
# Files which are listed here will be skipped when testing for Copyright (or
 
42
# GPL) statements.
 
43
COPYRIGHT_EXCEPTIONS = ['bzrlib/lsprof.py', 'bzrlib/_bencode_py.py',
 
44
    'bzrlib/doc_generate/sphinx_conf.py']
 
45
 
 
46
LICENSE_EXCEPTIONS = ['bzrlib/lsprof.py', 'bzrlib/_bencode_py.py',
 
47
    'bzrlib/doc_generate/sphinx_conf.py']
 
48
# Technically, 'bzrlib/lsprof.py' should be 'bzrlib/util/lsprof.py',
 
49
# (we do not check bzrlib/util/, since that is code bundled from elsewhere)
 
50
# but for compatibility with previous releases, we don't want to move it.
 
51
#
 
52
# sphinx_conf is semi-autogenerated.
 
53
 
 
54
 
 
55
class TestSourceHelper(TestCase):
 
56
 
 
57
    def source_file_name(self, package):
 
58
        """Return the path of the .py file for package."""
 
59
        if getattr(sys, "frozen", None) is not None:
 
60
            raise TestSkipped("can't test sources in frozen distributions.")
 
61
        path = package.__file__
 
62
        if path[-1] in 'co':
 
63
            return path[:-1]
 
64
        else:
 
65
            return path
 
66
 
 
67
 
 
68
class TestApiUsage(TestSourceHelper):
33
69
 
34
70
    def find_occurences(self, rule, filename):
35
71
        """Find the number of occurences of rule in a file."""
40
76
                occurences += 1
41
77
        return occurences
42
78
 
43
 
    def source_file_name(self, package):
44
 
        """Return the path of the .py file for package."""
45
 
        path = package.__file__
46
 
        if path[-1] in 'co':
47
 
            return path[:-1]
48
 
        else:
49
 
            return path
50
 
 
51
79
    def test_branch_working_tree(self):
52
80
        """Test that the number of uses of working_tree in branch is stable."""
53
81
        occurences = self.find_occurences('self.working_tree()',
55
83
        # do not even think of increasing this number. If you think you need to
56
84
        # increase it, then you almost certainly are doing something wrong as
57
85
        # the relationship from working_tree to branch is one way.
58
 
        # Note that this is an exact equality so that when the number drops, 
 
86
        # Note that this is an exact equality so that when the number drops,
59
87
        #it is not given a buffer but rather has this test updated immediately.
60
88
        self.assertEqual(0, occurences)
61
89
 
63
91
        """Test that the number of uses of working_tree in branch is stable."""
64
92
        occurences = self.find_occurences('WorkingTree',
65
93
                                          self.source_file_name(bzrlib.branch))
66
 
        # do not even think of increasing this number. If you think you need to
 
94
        # Do not even think of increasing this number. If you think you need to
67
95
        # increase it, then you almost certainly are doing something wrong as
68
96
        # the relationship from working_tree to branch is one way.
69
 
        # This number should be 4 (import NoWorkingTree and WorkingTree, 
70
 
        # raise NoWorkingTree from working_tree(), and construct a working tree
71
 
        # there) but a merge that regressed this was done before this test was
72
 
        # written. Note that this is an exact equality so that when the number
73
 
        # drops, it is not given a buffer but rather this test updated
74
 
        # immediately.
75
 
        self.assertEqual(2, occurences)
 
97
        # As of 20070809, there are no longer any mentions at all.
 
98
        self.assertEqual(0, occurences)
 
99
 
 
100
 
 
101
class TestSource(TestSourceHelper):
 
102
 
 
103
    def get_bzrlib_dir(self):
 
104
        """Get the path to the root of bzrlib"""
 
105
        source = self.source_file_name(bzrlib)
 
106
        source_dir = os.path.dirname(source)
 
107
 
 
108
        # Avoid the case when bzrlib is packaged in a zip file
 
109
        if not os.path.isdir(source_dir):
 
110
            raise TestSkipped('Cannot find bzrlib source directory. Expected %s'
 
111
                              % source_dir)
 
112
        return source_dir
 
113
 
 
114
    def get_source_files(self, extensions=None):
 
115
        """Yield all source files for bzr and bzrlib
 
116
 
 
117
        :param our_files_only: If true, exclude files from included libraries
 
118
            or plugins.
 
119
        """
 
120
        bzrlib_dir = self.get_bzrlib_dir()
 
121
        if extensions is None:
 
122
            extensions = ('.py',)
 
123
 
 
124
        # This is the front-end 'bzr' script
 
125
        bzr_path = self.get_bzr_path()
 
126
        yield bzr_path
 
127
 
 
128
        for root, dirs, files in os.walk(bzrlib_dir):
 
129
            for d in dirs:
 
130
                if d.endswith('.tmp'):
 
131
                    dirs.remove(d)
 
132
            for f in files:
 
133
                for extension in extensions:
 
134
                    if f.endswith(extension):
 
135
                        break
 
136
                else:
 
137
                    # Did not match the accepted extensions
 
138
                    continue
 
139
                yield osutils.pathjoin(root, f)
 
140
 
 
141
    def get_source_file_contents(self, extensions=None):
 
142
        for fname in self.get_source_files(extensions=extensions):
 
143
            f = open(fname, 'rb')
 
144
            try:
 
145
                text = f.read()
 
146
            finally:
 
147
                f.close()
 
148
            yield fname, text
 
149
 
 
150
    def is_our_code(self, fname):
 
151
        """Return true if it's a "real" part of bzrlib rather than external code"""
 
152
        if '/util/' in fname or '/plugins/' in fname:
 
153
            return False
 
154
        else:
 
155
            return True
 
156
 
 
157
    def is_copyright_exception(self, fname):
 
158
        """Certain files are allowed to be different"""
 
159
        if not self.is_our_code(fname):
 
160
            # We don't ask that external utilities or plugins be
 
161
            # (C) Canonical Ltd
 
162
            return True
 
163
        for exc in COPYRIGHT_EXCEPTIONS:
 
164
            if fname.endswith(exc):
 
165
                return True
 
166
        return False
 
167
 
 
168
    def is_license_exception(self, fname):
 
169
        """Certain files are allowed to be different"""
 
170
        if not self.is_our_code(fname):
 
171
            return True
 
172
        for exc in LICENSE_EXCEPTIONS:
 
173
            if fname.endswith(exc):
 
174
                return True
 
175
        return False
 
176
 
 
177
    def test_tmpdir_not_in_source_files(self):
 
178
        """When scanning for source files, we don't descend test tempdirs"""
 
179
        for filename in self.get_source_files():
 
180
            if re.search(r'test....\.tmp', filename):
 
181
                self.fail("get_source_file() returned filename %r "
 
182
                          "from within a temporary directory"
 
183
                          % filename)
 
184
 
 
185
    def test_copyright(self):
 
186
        """Test that all .py and .pyx files have a valid copyright statement"""
 
187
        incorrect = []
 
188
 
 
189
        copyright_re = re.compile('#\\s*copyright.*(?=\n)', re.I)
 
190
        copyright_canonical_re = re.compile(
 
191
            r'# Copyright \(C\) ' # Opening "# Copyright (C)"
 
192
            r'(\d+)(, \d+)*' # Followed by a series of dates
 
193
            r'.*Canonical Ltd' # And containing 'Canonical Ltd'
 
194
            )
 
195
 
 
196
        for fname, text in self.get_source_file_contents(
 
197
                extensions=('.py', '.pyx')):
 
198
            if self.is_copyright_exception(fname):
 
199
                continue
 
200
            match = copyright_canonical_re.search(text)
 
201
            if not match:
 
202
                match = copyright_re.search(text)
 
203
                if match:
 
204
                    incorrect.append((fname, 'found: %s' % (match.group(),)))
 
205
                else:
 
206
                    incorrect.append((fname, 'no copyright line found\n'))
 
207
            else:
 
208
                if 'by Canonical' in match.group():
 
209
                    incorrect.append((fname,
 
210
                        'should not have: "by Canonical": %s'
 
211
                        % (match.group(),)))
 
212
 
 
213
        if incorrect:
 
214
            help_text = ["Some files have missing or incorrect copyright"
 
215
                         " statements.",
 
216
                         "",
 
217
                         "Please either add them to the list of"
 
218
                         " COPYRIGHT_EXCEPTIONS in"
 
219
                         " bzrlib/tests/test_source.py",
 
220
                         # this is broken to prevent a false match
 
221
                         "or add '# Copyright (C)"
 
222
                         " 2007 Canonical Ltd' to these files:",
 
223
                         "",
 
224
                        ]
 
225
            for fname, comment in incorrect:
 
226
                help_text.append(fname)
 
227
                help_text.append((' '*4) + comment)
 
228
 
 
229
            self.fail('\n'.join(help_text))
 
230
 
 
231
    def test_gpl(self):
 
232
        """Test that all .py and .pyx files have a GPL disclaimer."""
 
233
        incorrect = []
 
234
 
 
235
        gpl_txt = """
 
236
# This program is free software; you can redistribute it and/or modify
 
237
# it under the terms of the GNU General Public License as published by
 
238
# the Free Software Foundation; either version 2 of the License, or
 
239
# (at your option) any later version.
 
240
#
 
241
# This program is distributed in the hope that it will be useful,
 
242
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
243
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
244
# GNU General Public License for more details.
 
245
#
 
246
# You should have received a copy of the GNU General Public License
 
247
# along with this program; if not, write to the Free Software
 
248
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
 
249
"""
 
250
        gpl_re = re.compile(re.escape(gpl_txt), re.MULTILINE)
 
251
 
 
252
        for fname, text in self.get_source_file_contents(
 
253
                extensions=('.py', '.pyx')):
 
254
            if self.is_license_exception(fname):
 
255
                continue
 
256
            if not gpl_re.search(text):
 
257
                incorrect.append(fname)
 
258
 
 
259
        if incorrect:
 
260
            help_text = ['Some files have missing or incomplete GPL statement',
 
261
                         "",
 
262
                         "Please either add them to the list of"
 
263
                         " LICENSE_EXCEPTIONS in"
 
264
                         " bzrlib/tests/test_source.py",
 
265
                         "Or add the following text to the beginning:",
 
266
                         gpl_txt
 
267
                        ]
 
268
            for fname in incorrect:
 
269
                help_text.append((' '*4) + fname)
 
270
 
 
271
            self.fail('\n'.join(help_text))
 
272
 
 
273
    def _push_file(self, dict_, fname, line_no):
 
274
        if fname not in dict_:
 
275
            dict_[fname] = [line_no]
 
276
        else:
 
277
            dict_[fname].append(line_no)
 
278
 
 
279
    def _format_message(self, dict_, message):
 
280
        files = ["%s: %s" % (f, ', '.join([str(i+1) for i in lines]))
 
281
                for f, lines in dict_.items()]
 
282
        files.sort()
 
283
        return message + '\n\n    %s' % ('\n    '.join(files))
 
284
 
 
285
    def test_coding_style(self):
 
286
        """Check if bazaar code conforms to some coding style conventions.
 
287
 
 
288
        Currently we assert that the following is not present:
 
289
         * any tab characters
 
290
         * non-unix newlines
 
291
         * no newline at end of files
 
292
 
 
293
        Print how many files have
 
294
         * trailing white space
 
295
         * lines longer than 79 chars
 
296
        """
 
297
        tabs = {}
 
298
        trailing_ws = {}
 
299
        illegal_newlines = {}
 
300
        long_lines = {}
 
301
        no_newline_at_eof = []
 
302
        for fname, text in self.get_source_file_contents(
 
303
                extensions=('.py', '.pyx')):
 
304
            if not self.is_our_code(fname):
 
305
                continue
 
306
            lines = text.splitlines(True)
 
307
            last_line_no = len(lines) - 1
 
308
            for line_no, line in enumerate(lines):
 
309
                if '\t' in line:
 
310
                    self._push_file(tabs, fname, line_no)
 
311
                if not line.endswith('\n') or line.endswith('\r\n'):
 
312
                    if line_no != last_line_no: # not no_newline_at_eof
 
313
                        self._push_file(illegal_newlines, fname, line_no)
 
314
                if line.endswith(' \n'):
 
315
                    self._push_file(trailing_ws, fname, line_no)
 
316
                if len(line) > 80:
 
317
                    self._push_file(long_lines, fname, line_no)
 
318
            if not lines[-1].endswith('\n'):
 
319
                no_newline_at_eof.append(fname)
 
320
        problems = []
 
321
        if tabs:
 
322
            problems.append(self._format_message(tabs,
 
323
                'Tab characters were found in the following source files.'
 
324
                '\nThey should either be replaced by "\\t" or by spaces:'))
 
325
        if trailing_ws:
 
326
            print ("There are %i lines with trailing white space in %i files."
 
327
                % (sum([len(lines) for f, lines in trailing_ws.items()]),
 
328
                    len(trailing_ws)))
 
329
        if illegal_newlines:
 
330
            problems.append(self._format_message(illegal_newlines,
 
331
                'Non-unix newlines were found in the following source files:'))
 
332
        if long_lines:
 
333
            print ("There are %i lines longer than 79 characters in %i files."
 
334
                % (sum([len(lines) for f, lines in long_lines.items()]),
 
335
                    len(long_lines)))
 
336
        if no_newline_at_eof:
 
337
            no_newline_at_eof.sort()
 
338
            problems.append("The following source files doesn't have a "
 
339
                "newline at the end:"
 
340
               '\n\n    %s'
 
341
               % ('\n    '.join(no_newline_at_eof)))
 
342
        if problems:
 
343
            self.fail('\n\n'.join(problems))
 
344
 
 
345
    def test_no_asserts(self):
 
346
        """bzr shouldn't use the 'assert' statement."""
 
347
        # assert causes too much variation between -O and not, and tends to
 
348
        # give bad errors to the user
 
349
        def search(x):
 
350
            # scan down through x for assert statements, report any problems
 
351
            # this is a bit cheesy; it may get some false positives?
 
352
            if x[0] == symbol.assert_stmt:
 
353
                return True
 
354
            elif x[0] == token.NAME:
 
355
                # can't search further down
 
356
                return False
 
357
            for sub in x[1:]:
 
358
                if sub and search(sub):
 
359
                    return True
 
360
            return False
 
361
        badfiles = []
 
362
        for fname, text in self.get_source_file_contents():
 
363
            if not self.is_our_code(fname):
 
364
                continue
 
365
            ast = parser.ast2tuple(parser.suite(''.join(text)))
 
366
            if search(ast):
 
367
                badfiles.append(fname)
 
368
        if badfiles:
 
369
            self.fail(
 
370
                "these files contain an assert statement and should not:\n%s"
 
371
                % '\n'.join(badfiles))