~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/osutils.py

  • Committer: Robert Collins
  • Date: 2005-12-24 02:20:45 UTC
  • mto: (1185.50.57 bzr-jam-integration)
  • mto: This revision was merged to the branch mainline in revision 1550.
  • Revision ID: robertc@robertcollins.net-20051224022045-14efc8dfa0e1a4e9
Start tests for api usage.

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
1
# Bazaar-NG -- distributed version control
2
 
 
 
2
#
3
3
# Copyright (C) 2005 by Canonical Ltd
4
 
 
 
4
#
5
5
# This program is free software; you can redistribute it and/or modify
6
6
# it under the terms of the GNU General Public License as published by
7
7
# the Free Software Foundation; either version 2 of the License, or
8
8
# (at your option) any later version.
9
 
 
 
9
#
10
10
# This program is distributed in the hope that it will be useful,
11
11
# but WITHOUT ANY WARRANTY; without even the implied warranty of
12
12
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13
13
# GNU General Public License for more details.
14
 
 
 
14
#
15
15
# You should have received a copy of the GNU General Public License
16
16
# along with this program; if not, write to the Free Software
17
17
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
18
18
 
19
 
import os, types, re, time, types
20
 
from stat import S_ISREG, S_ISDIR, S_ISLNK, ST_MODE, ST_SIZE
21
 
 
22
 
from errors import bailout
 
19
from shutil import copyfile
 
20
from stat import (S_ISREG, S_ISDIR, S_ISLNK, ST_MODE, ST_SIZE,
 
21
                  S_ISCHR, S_ISBLK, S_ISFIFO, S_ISSOCK)
 
22
from cStringIO import StringIO
 
23
import errno
 
24
import os
 
25
import re
 
26
import sha
 
27
import string
 
28
import sys
 
29
import time
 
30
import types
 
31
 
 
32
import bzrlib
 
33
from bzrlib.errors import BzrError, PathNotChild
 
34
from bzrlib.trace import mutter
 
35
 
23
36
 
24
37
def make_readonly(filename):
25
38
    """Make a filename read-only."""
26
 
    # TODO: probably needs to be fixed for windows
27
39
    mod = os.stat(filename).st_mode
28
40
    mod = mod & 0777555
29
41
    os.chmod(filename, mod)
35
47
    os.chmod(filename, mod)
36
48
 
37
49
 
38
 
_QUOTE_RE = re.compile(r'([^a-zA-Z0-9.,:/_~-])')
 
50
_QUOTE_RE = None
 
51
 
 
52
 
39
53
def quotefn(f):
40
 
    """Return shell-quoted filename"""
41
 
    ## We could be a bit more terse by using double-quotes etc
42
 
    f = _QUOTE_RE.sub(r'\\\1', f)
43
 
    if f[0] == '~':
44
 
        f[0:1] = r'\~' 
45
 
    return f
 
54
    """Return a quoted filename filename
 
55
 
 
56
    This previously used backslash quoting, but that works poorly on
 
57
    Windows."""
 
58
    # TODO: I'm not really sure this is the best format either.x
 
59
    global _QUOTE_RE
 
60
    if _QUOTE_RE == None:
 
61
        _QUOTE_RE = re.compile(r'([^a-zA-Z0-9.,:/\\_~-])')
 
62
        
 
63
    if _QUOTE_RE.search(f):
 
64
        return '"' + f + '"'
 
65
    else:
 
66
        return f
46
67
 
47
68
 
48
69
def file_kind(f):
53
74
        return 'directory'
54
75
    elif S_ISLNK(mode):
55
76
        return 'symlink'
56
 
    else:
57
 
        bailout("can't handle file kind with mode %o of %r" % (mode, f)) 
58
 
 
 
77
    elif S_ISCHR(mode):
 
78
        return 'chardev'
 
79
    elif S_ISBLK(mode):
 
80
        return 'block'
 
81
    elif S_ISFIFO(mode):
 
82
        return 'fifo'
 
83
    elif S_ISSOCK(mode):
 
84
        return 'socket'
 
85
    else:
 
86
        return 'unknown'
 
87
 
 
88
 
 
89
def kind_marker(kind):
 
90
    if kind == 'file':
 
91
        return ''
 
92
    elif kind == 'directory':
 
93
        return '/'
 
94
    elif kind == 'symlink':
 
95
        return '@'
 
96
    else:
 
97
        raise BzrError('invalid file kind %r' % kind)
 
98
 
 
99
def lexists(f):
 
100
    try:
 
101
        if hasattr(os, 'lstat'):
 
102
            os.lstat(f)
 
103
        else:
 
104
            os.stat(f)
 
105
        return True
 
106
    except OSError,e:
 
107
        if e.errno == errno.ENOENT:
 
108
            return False;
 
109
        else:
 
110
            raise BzrError("lstat/stat of (%r): %r" % (f, e))
 
111
 
 
112
def normalizepath(f):
 
113
    if hasattr(os.path, 'realpath'):
 
114
        F = os.path.realpath
 
115
    else:
 
116
        F = os.path.abspath
 
117
    [p,e] = os.path.split(f)
 
118
    if e == "" or e == "." or e == "..":
 
119
        return F(f)
 
120
    else:
 
121
        return os.path.join(F(p), e)
 
122
 
 
123
if os.name == "posix":
 
124
    # In Python 2.4.2 and older, os.path.abspath and os.path.realpath
 
125
    # choke on a Unicode string containing a relative path if
 
126
    # os.getcwd() returns a non-sys.getdefaultencoding()-encoded
 
127
    # string.
 
128
    _fs_enc = sys.getfilesystemencoding()
 
129
    def abspath(path):
 
130
        return os.path.abspath(path.encode(_fs_enc)).decode(_fs_enc)
 
131
    def realpath(path):
 
132
        return os.path.realpath(path.encode(_fs_enc)).decode(_fs_enc)
 
133
else:
 
134
    # We need to use the Unicode-aware os.path.abspath and
 
135
    # os.path.realpath on Windows systems.
 
136
    abspath = os.path.abspath
 
137
    realpath = os.path.realpath
 
138
 
 
139
def backup_file(fn):
 
140
    """Copy a file to a backup.
 
141
 
 
142
    Backups are named in GNU-style, with a ~ suffix.
 
143
 
 
144
    If the file is already a backup, it's not copied.
 
145
    """
 
146
    if fn[-1] == '~':
 
147
        return
 
148
    bfn = fn + '~'
 
149
 
 
150
    if has_symlinks() and os.path.islink(fn):
 
151
        target = os.readlink(fn)
 
152
        os.symlink(target, bfn)
 
153
        return
 
154
    inf = file(fn, 'rb')
 
155
    try:
 
156
        content = inf.read()
 
157
    finally:
 
158
        inf.close()
 
159
    
 
160
    outf = file(bfn, 'wb')
 
161
    try:
 
162
        outf.write(content)
 
163
    finally:
 
164
        outf.close()
 
165
 
 
166
if os.name == 'nt':
 
167
    import shutil
 
168
    rename = shutil.move
 
169
else:
 
170
    rename = os.rename
59
171
 
60
172
 
61
173
def isdir(f):
66
178
        return False
67
179
 
68
180
 
69
 
 
70
181
def isfile(f):
71
182
    """True if f is a regular file."""
72
183
    try:
74
185
    except OSError:
75
186
        return False
76
187
 
 
188
def islink(f):
 
189
    """True if f is a symlink."""
 
190
    try:
 
191
        return S_ISLNK(os.lstat(f)[ST_MODE])
 
192
    except OSError:
 
193
        return False
 
194
 
 
195
def is_inside(dir, fname):
 
196
    """True if fname is inside dir.
 
197
    
 
198
    The parameters should typically be passed to os.path.normpath first, so
 
199
    that . and .. and repeated slashes are eliminated, and the separators
 
200
    are canonical for the platform.
 
201
    
 
202
    The empty string as a dir name is taken as top-of-tree and matches 
 
203
    everything.
 
204
    
 
205
    >>> is_inside('src', os.path.join('src', 'foo.c'))
 
206
    True
 
207
    >>> is_inside('src', 'srccontrol')
 
208
    False
 
209
    >>> is_inside('src', os.path.join('src', 'a', 'a', 'a', 'foo.c'))
 
210
    True
 
211
    >>> is_inside('foo.c', 'foo.c')
 
212
    True
 
213
    >>> is_inside('foo.c', '')
 
214
    False
 
215
    >>> is_inside('', 'foo.c')
 
216
    True
 
217
    """
 
218
    # XXX: Most callers of this can actually do something smarter by 
 
219
    # looking at the inventory
 
220
    if dir == fname:
 
221
        return True
 
222
    
 
223
    if dir == '':
 
224
        return True
 
225
 
 
226
    if dir[-1] != os.sep:
 
227
        dir += os.sep
 
228
 
 
229
    return fname.startswith(dir)
 
230
 
 
231
 
 
232
def is_inside_any(dir_list, fname):
 
233
    """True if fname is inside any of given dirs."""
 
234
    for dirname in dir_list:
 
235
        if is_inside(dirname, fname):
 
236
            return True
 
237
    else:
 
238
        return False
 
239
 
77
240
 
78
241
def pumpfile(fromfile, tofile):
79
242
    """Copy contents of one file to another."""
80
 
    tofile.write(fromfile.read())
81
 
 
82
 
 
83
 
def uuid():
84
 
    """Return a new UUID"""
85
 
    
86
 
    ## XXX: Could alternatively read /proc/sys/kernel/random/uuid on
87
 
    ## Linux, but we need something portable for other systems;
88
 
    ## preferably an implementation in Python.
89
 
    try:
90
 
        return chomp(file('/proc/sys/kernel/random/uuid').readline())
91
 
    except IOError:
92
 
        return chomp(os.popen('uuidgen').readline())
93
 
 
94
 
 
95
 
def chomp(s):
96
 
    if s and (s[-1] == '\n'):
97
 
        return s[:-1]
98
 
    else:
99
 
        return s
 
243
    BUFSIZE = 32768
 
244
    while True:
 
245
        b = fromfile.read(BUFSIZE)
 
246
        if not b:
 
247
            break
 
248
        tofile.write(b)
100
249
 
101
250
 
102
251
def sha_file(f):
103
 
    import sha
104
 
    ## TODO: Maybe read in chunks to handle big files
105
252
    if hasattr(f, 'tell'):
106
253
        assert f.tell() == 0
107
254
    s = sha.new()
108
 
    s.update(f.read())
 
255
    BUFSIZE = 128<<10
 
256
    while True:
 
257
        b = f.read(BUFSIZE)
 
258
        if not b:
 
259
            break
 
260
        s.update(b)
 
261
    return s.hexdigest()
 
262
 
 
263
 
 
264
 
 
265
def sha_strings(strings):
 
266
    """Return the sha-1 of concatenation of strings"""
 
267
    s = sha.new()
 
268
    map(s.update, strings)
109
269
    return s.hexdigest()
110
270
 
111
271
 
112
272
def sha_string(f):
113
 
    import sha
114
273
    s = sha.new()
115
274
    s.update(f)
116
275
    return s.hexdigest()
117
276
 
118
277
 
119
 
 
120
278
def fingerprint_file(f):
121
 
    import sha
122
279
    s = sha.new()
123
280
    b = f.read()
124
281
    s.update(b)
127
284
            'sha1': s.hexdigest()}
128
285
 
129
286
 
130
 
 
131
 
def username():
132
 
    """Return email-style username.
133
 
 
134
 
    Something similar to 'Martin Pool <mbp@sourcefrog.net>'
135
 
 
136
 
    :todo: Check it's reasonably well-formed.
137
 
 
138
 
    :todo: Allow taking it from a dotfile to help people on windows
139
 
           who can't easily set variables.
140
 
 
141
 
    :todo: Cope without pwd module, which is only on unix. 
142
 
    """
143
 
    e = os.environ.get('BZREMAIL') or os.environ.get('EMAIL')
144
 
    if e: return e
145
 
 
146
 
    import socket
147
 
    
148
 
    try:
149
 
        import pwd
150
 
        uid = os.getuid()
151
 
        w = pwd.getpwuid(uid)
152
 
        gecos = w.pw_gecos
153
 
        comma = gecos.find(',')
154
 
        if comma == -1:
155
 
            realname = gecos
156
 
        else:
157
 
            realname = gecos[:comma]
158
 
        return '%s <%s@%s>' % (realname, w.pw_name, socket.getfqdn())
159
 
    except ImportError:
160
 
        pass
161
 
 
162
 
    import getpass, socket
163
 
    return '<%s@%s>' % (getpass.getuser(), socket.getfqdn())
164
 
 
165
 
 
166
 
def user_email():
167
 
    """Return just the email component of a username."""
168
 
    e = os.environ.get('BZREMAIL') or os.environ.get('EMAIL')
169
 
    if e:
170
 
        import re
171
 
        m = re.search(r'[\w+.-]+@[\w+.-]+', e)
172
 
        if not m:
173
 
            bailout('%r is not a reasonable email address' % e)
174
 
        return m.group(0)
175
 
 
176
 
 
177
 
    import getpass, socket
178
 
    return '%s@%s' % (getpass.getuser(), socket.getfqdn())
179
 
 
180
 
    
181
 
 
182
 
 
183
287
def compare_files(a, b):
184
288
    """Returns true if equal in contents"""
185
 
    # TODO: don't read the whole thing in one go.
186
289
    BUFSIZE = 4096
187
290
    while True:
188
291
        ai = a.read(BUFSIZE)
193
296
            return True
194
297
 
195
298
 
196
 
 
197
299
def local_time_offset(t=None):
198
300
    """Return offset of local zone from GMT, either at present or at time t."""
199
301
    # python2.3 localtime() can't take None
200
 
    if t is None:
 
302
    if t == None:
201
303
        t = time.time()
202
304
        
203
305
    if time.localtime(t).tm_isdst and time.daylight:
206
308
        return -time.timezone
207
309
 
208
310
    
209
 
def format_date(t, offset=0, timezone='original'):
 
311
def format_date(t, offset=0, timezone='original', date_fmt=None, 
 
312
                show_offset=True):
210
313
    ## TODO: Perhaps a global option to use either universal or local time?
211
314
    ## Or perhaps just let people set $TZ?
212
 
    import time
213
 
    
214
315
    assert isinstance(t, float)
215
316
    
216
317
    if timezone == 'utc':
224
325
        tt = time.localtime(t)
225
326
        offset = local_time_offset(t)
226
327
    else:
227
 
        bailout("unsupported timezone format %r",
228
 
                ['options are "utc", "original", "local"'])
229
 
 
230
 
    return (time.strftime("%a %Y-%m-%d %H:%M:%S", tt)
231
 
            + ' %+03d%02d' % (offset / 3600, (offset / 60) % 60))
 
328
        raise BzrError("unsupported timezone format %r" % timezone,
 
329
                       ['options are "utc", "original", "local"'])
 
330
    if date_fmt is None:
 
331
        date_fmt = "%a %Y-%m-%d %H:%M:%S"
 
332
    if show_offset:
 
333
        offset_str = ' %+03d%02d' % (offset / 3600, (offset / 60) % 60)
 
334
    else:
 
335
        offset_str = ''
 
336
    return (time.strftime(date_fmt, tt) +  offset_str)
232
337
 
233
338
 
234
339
def compact_date(when):
240
345
    """Return size of given open file."""
241
346
    return os.fstat(f.fileno())[ST_SIZE]
242
347
 
243
 
 
244
 
if hasattr(os, 'urandom'): # python 2.4 and later
 
348
# Define rand_bytes based on platform.
 
349
try:
 
350
    # Python 2.4 and later have os.urandom,
 
351
    # but it doesn't work on some arches
 
352
    os.urandom(1)
245
353
    rand_bytes = os.urandom
246
 
else:
247
 
    # FIXME: No good on non-Linux
248
 
    _rand_file = file('/dev/urandom', 'rb')
249
 
    rand_bytes = _rand_file.read
250
 
 
 
354
except (NotImplementedError, AttributeError):
 
355
    # If python doesn't have os.urandom, or it doesn't work,
 
356
    # then try to first pull random data from /dev/urandom
 
357
    if os.path.exists("/dev/urandom"):
 
358
        rand_bytes = file('/dev/urandom', 'rb').read
 
359
    # Otherwise, use this hack as a last resort
 
360
    else:
 
361
        # not well seeded, but better than nothing
 
362
        def rand_bytes(n):
 
363
            import random
 
364
            s = ''
 
365
            while n:
 
366
                s += chr(random.randint(0, 255))
 
367
                n -= 1
 
368
            return s
251
369
 
252
370
## TODO: We could later have path objects that remember their list
253
371
## decomposition (might be too tricksy though.)
266
384
    >>> splitpath('a/../b')
267
385
    Traceback (most recent call last):
268
386
    ...
269
 
    BzrError: ("sorry, '..' not allowed in path", [])
 
387
    BzrError: sorry, '..' not allowed in path
270
388
    """
271
389
    assert isinstance(p, types.StringTypes)
272
 
    ps = [f for f in p.split('/') if f != '.']
 
390
 
 
391
    # split on either delimiter because people might use either on
 
392
    # Windows
 
393
    ps = re.split(r'[\\/]', p)
 
394
 
 
395
    rps = []
273
396
    for f in ps:
274
397
        if f == '..':
275
 
            bailout("sorry, %r not allowed in path" % f)
276
 
    return ps
 
398
            raise BzrError("sorry, %r not allowed in path" % f)
 
399
        elif (f == '.') or (f == ''):
 
400
            pass
 
401
        else:
 
402
            rps.append(f)
 
403
    return rps
277
404
 
278
405
def joinpath(p):
279
406
    assert isinstance(p, list)
280
407
    for f in p:
281
 
        if (f == '..') or (f is None) or (f == ''):
282
 
            bailout("sorry, %r not allowed in path" % f)
283
 
    return '/'.join(p)
 
408
        if (f == '..') or (f == None) or (f == ''):
 
409
            raise BzrError("sorry, %r not allowed in path" % f)
 
410
    return os.path.join(*p)
284
411
 
285
412
 
286
413
def appendpath(p1, p2):
287
414
    if p1 == '':
288
415
        return p2
289
416
    else:
290
 
        return p1 + '/' + p2
 
417
        return os.path.join(p1, p2)
291
418
    
292
419
 
293
 
def extern_command(cmd, ignore_errors = False):
294
 
    mutter('external command: %s' % `cmd`)
295
 
    if os.system(cmd):
296
 
        if not ignore_errors:
297
 
            bailout('command failed')
298
 
 
 
420
def split_lines(s):
 
421
    """Split s into lines, but without removing the newline characters."""
 
422
    return StringIO(s).readlines()
 
423
 
 
424
 
 
425
def hardlinks_good():
 
426
    return sys.platform not in ('win32', 'cygwin', 'darwin')
 
427
 
 
428
 
 
429
def link_or_copy(src, dest):
 
430
    """Hardlink a file, or copy it if it can't be hardlinked."""
 
431
    if not hardlinks_good():
 
432
        copyfile(src, dest)
 
433
        return
 
434
    try:
 
435
        os.link(src, dest)
 
436
    except (OSError, IOError), e:
 
437
        if e.errno != errno.EXDEV:
 
438
            raise
 
439
        copyfile(src, dest)
 
440
 
 
441
 
 
442
def has_symlinks():
 
443
    if hasattr(os, 'symlink'):
 
444
        return True
 
445
    else:
 
446
        return False
 
447
        
 
448
 
 
449
def contains_whitespace(s):
 
450
    """True if there are any whitespace characters in s."""
 
451
    for ch in string.whitespace:
 
452
        if ch in s:
 
453
            return True
 
454
    else:
 
455
        return False
 
456
 
 
457
 
 
458
def contains_linebreaks(s):
 
459
    """True if there is any vertical whitespace in s."""
 
460
    for ch in '\f\n\r':
 
461
        if ch in s:
 
462
            return True
 
463
    else:
 
464
        return False
 
465
 
 
466
 
 
467
def relpath(base, path):
 
468
    """Return path relative to base, or raise exception.
 
469
 
 
470
    The path may be either an absolute path or a path relative to the
 
471
    current working directory.
 
472
 
 
473
    os.path.commonprefix (python2.4) has a bad bug that it works just
 
474
    on string prefixes, assuming that '/u' is a prefix of '/u2'.  This
 
475
    avoids that problem."""
 
476
    rp = abspath(path)
 
477
 
 
478
    s = []
 
479
    head = rp
 
480
    while len(head) >= len(base):
 
481
        if head == base:
 
482
            break
 
483
        head, tail = os.path.split(head)
 
484
        if tail:
 
485
            s.insert(0, tail)
 
486
    else:
 
487
        # XXX This should raise a NotChildPath exception, as its not tied
 
488
        # to branch anymore.
 
489
        raise PathNotChild(rp, base)
 
490
 
 
491
    return os.sep.join(s)
 
492
 
 
493
 
 
494
 
 
495
def terminal_width():
 
496
    """Return estimated terminal width."""
 
497
 
 
498
    # TODO: Do something smart on Windows?
 
499
 
 
500
    # TODO: Is there anything that gets a better update when the window
 
501
    # is resized while the program is running? We could use the Python termcap
 
502
    # library.
 
503
    try:
 
504
        return int(os.environ['COLUMNS'])
 
505
    except (IndexError, KeyError, ValueError):
 
506
        return 80