~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/osutils.py

  • Committer: Jelmer Vernooij
  • Date: 2005-10-17 23:14:29 UTC
  • mto: (1185.16.102)
  • mto: This revision was merged to the branch mainline in revision 1488.
  • Revision ID: jelmer@samba.org-20051017231429-fa6f49e760ed2f22
Remove executable properties from Makefile (set by bzr itself now)

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
1
# Bazaar-NG -- distributed version control
2
 
 
 
2
#
3
3
# Copyright (C) 2005 by Canonical Ltd
4
 
 
 
4
#
5
5
# This program is free software; you can redistribute it and/or modify
6
6
# it under the terms of the GNU General Public License as published by
7
7
# the Free Software Foundation; either version 2 of the License, or
8
8
# (at your option) any later version.
9
 
 
 
9
#
10
10
# This program is distributed in the hope that it will be useful,
11
11
# but WITHOUT ANY WARRANTY; without even the implied warranty of
12
12
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13
13
# GNU General Public License for more details.
14
 
 
 
14
#
15
15
# You should have received a copy of the GNU General Public License
16
16
# along with this program; if not, write to the Free Software
17
17
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
18
18
 
19
 
import os, types, re, time, errno
20
 
from stat import S_ISREG, S_ISDIR, S_ISLNK, ST_MODE, ST_SIZE
 
19
from shutil import copyfile
 
20
from stat import (S_ISREG, S_ISDIR, S_ISLNK, ST_MODE, ST_SIZE,
 
21
                  S_ISCHR, S_ISBLK, S_ISFIFO, S_ISSOCK)
 
22
from cStringIO import StringIO
 
23
import errno
 
24
import os
 
25
import re
 
26
import sha
 
27
import string
 
28
import sys
 
29
import time
 
30
import types
21
31
 
22
 
from errors import bailout, BzrError
23
 
from trace import mutter
24
32
import bzrlib
 
33
from bzrlib.errors import BzrError, NotBranchError
 
34
from bzrlib.trace import mutter
 
35
 
25
36
 
26
37
def make_readonly(filename):
27
38
    """Make a filename read-only."""
28
 
    # TODO: probably needs to be fixed for windows
29
39
    mod = os.stat(filename).st_mode
30
40
    mod = mod & 0777555
31
41
    os.chmod(filename, mod)
37
47
    os.chmod(filename, mod)
38
48
 
39
49
 
40
 
_QUOTE_RE = re.compile(r'([^a-zA-Z0-9.,:/_~-])')
 
50
_QUOTE_RE = None
 
51
 
 
52
 
41
53
def quotefn(f):
42
 
    """Return shell-quoted filename"""
43
 
    ## We could be a bit more terse by using double-quotes etc
44
 
    f = _QUOTE_RE.sub(r'\\\1', f)
45
 
    if f[0] == '~':
46
 
        f[0:1] = r'\~' 
47
 
    return f
 
54
    """Return a quoted filename filename
 
55
 
 
56
    This previously used backslash quoting, but that works poorly on
 
57
    Windows."""
 
58
    # TODO: I'm not really sure this is the best format either.x
 
59
    global _QUOTE_RE
 
60
    if _QUOTE_RE == None:
 
61
        _QUOTE_RE = re.compile(r'([^a-zA-Z0-9.,:/\\_~-])')
 
62
        
 
63
    if _QUOTE_RE.search(f):
 
64
        return '"' + f + '"'
 
65
    else:
 
66
        return f
48
67
 
49
68
 
50
69
def file_kind(f):
55
74
        return 'directory'
56
75
    elif S_ISLNK(mode):
57
76
        return 'symlink'
58
 
    else:
59
 
        raise BzrError("can't handle file kind with mode %o of %r" % (mode, f)) 
60
 
 
 
77
    elif S_ISCHR(mode):
 
78
        return 'chardev'
 
79
    elif S_ISBLK(mode):
 
80
        return 'block'
 
81
    elif S_ISFIFO(mode):
 
82
        return 'fifo'
 
83
    elif S_ISSOCK(mode):
 
84
        return 'socket'
 
85
    else:
 
86
        return 'unknown'
 
87
 
 
88
 
 
89
def kind_marker(kind):
 
90
    if kind == 'file':
 
91
        return ''
 
92
    elif kind == 'directory':
 
93
        return '/'
 
94
    elif kind == 'symlink':
 
95
        return '@'
 
96
    else:
 
97
        raise BzrError('invalid file kind %r' % kind)
 
98
 
 
99
def lexists(f):
 
100
    try:
 
101
        if hasattr(os, 'lstat'):
 
102
            os.lstat(f)
 
103
        else:
 
104
            os.stat(f)
 
105
        return True
 
106
    except OSError,e:
 
107
        if e.errno == errno.ENOENT:
 
108
            return False;
 
109
        else:
 
110
            raise BzrError("lstat/stat of (%r): %r" % (f, e))
 
111
 
 
112
def normalizepath(f):
 
113
    if hasattr(os.path, 'realpath'):
 
114
        F = os.path.realpath
 
115
    else:
 
116
        F = os.path.abspath
 
117
    [p,e] = os.path.split(f)
 
118
    if e == "" or e == "." or e == "..":
 
119
        return F(f)
 
120
    else:
 
121
        return os.path.join(F(p), e)
 
122
    
 
123
 
 
124
def backup_file(fn):
 
125
    """Copy a file to a backup.
 
126
 
 
127
    Backups are named in GNU-style, with a ~ suffix.
 
128
 
 
129
    If the file is already a backup, it's not copied.
 
130
    """
 
131
    if fn[-1] == '~':
 
132
        return
 
133
    bfn = fn + '~'
 
134
 
 
135
    if has_symlinks() and os.path.islink(fn):
 
136
        target = os.readlink(fn)
 
137
        os.symlink(target, bfn)
 
138
        return
 
139
    inf = file(fn, 'rb')
 
140
    try:
 
141
        content = inf.read()
 
142
    finally:
 
143
        inf.close()
 
144
    
 
145
    outf = file(bfn, 'wb')
 
146
    try:
 
147
        outf.write(content)
 
148
    finally:
 
149
        outf.close()
 
150
 
 
151
if os.name == 'nt':
 
152
    import shutil
 
153
    rename = shutil.move
 
154
else:
 
155
    rename = os.rename
61
156
 
62
157
 
63
158
def isdir(f):
68
163
        return False
69
164
 
70
165
 
71
 
 
72
166
def isfile(f):
73
167
    """True if f is a regular file."""
74
168
    try:
76
170
    except OSError:
77
171
        return False
78
172
 
 
173
def islink(f):
 
174
    """True if f is a symlink."""
 
175
    try:
 
176
        return S_ISLNK(os.lstat(f)[ST_MODE])
 
177
    except OSError:
 
178
        return False
 
179
 
 
180
def is_inside(dir, fname):
 
181
    """True if fname is inside dir.
 
182
    
 
183
    The parameters should typically be passed to os.path.normpath first, so
 
184
    that . and .. and repeated slashes are eliminated, and the separators
 
185
    are canonical for the platform.
 
186
    
 
187
    The empty string as a dir name is taken as top-of-tree and matches 
 
188
    everything.
 
189
    
 
190
    >>> is_inside('src', os.path.join('src', 'foo.c'))
 
191
    True
 
192
    >>> is_inside('src', 'srccontrol')
 
193
    False
 
194
    >>> is_inside('src', os.path.join('src', 'a', 'a', 'a', 'foo.c'))
 
195
    True
 
196
    >>> is_inside('foo.c', 'foo.c')
 
197
    True
 
198
    >>> is_inside('foo.c', '')
 
199
    False
 
200
    >>> is_inside('', 'foo.c')
 
201
    True
 
202
    """
 
203
    # XXX: Most callers of this can actually do something smarter by 
 
204
    # looking at the inventory
 
205
    if dir == fname:
 
206
        return True
 
207
    
 
208
    if dir == '':
 
209
        return True
 
210
 
 
211
    if dir[-1] != os.sep:
 
212
        dir += os.sep
 
213
 
 
214
    return fname.startswith(dir)
 
215
 
 
216
 
 
217
def is_inside_any(dir_list, fname):
 
218
    """True if fname is inside any of given dirs."""
 
219
    for dirname in dir_list:
 
220
        if is_inside(dirname, fname):
 
221
            return True
 
222
    else:
 
223
        return False
 
224
 
79
225
 
80
226
def pumpfile(fromfile, tofile):
81
227
    """Copy contents of one file to another."""
82
228
    tofile.write(fromfile.read())
83
229
 
84
230
 
85
 
def uuid():
86
 
    """Return a new UUID"""
87
 
    
88
 
    ## XXX: Could alternatively read /proc/sys/kernel/random/uuid on
89
 
    ## Linux, but we need something portable for other systems;
90
 
    ## preferably an implementation in Python.
91
 
    try:
92
 
        return chomp(file('/proc/sys/kernel/random/uuid').readline())
93
 
    except IOError:
94
 
        return chomp(os.popen('uuidgen').readline())
95
 
 
96
 
 
97
 
def chomp(s):
98
 
    if s and (s[-1] == '\n'):
99
 
        return s[:-1]
100
 
    else:
101
 
        return s
102
 
 
103
 
 
104
231
def sha_file(f):
105
 
    import sha
106
 
    ## TODO: Maybe read in chunks to handle big files
107
232
    if hasattr(f, 'tell'):
108
233
        assert f.tell() == 0
109
234
    s = sha.new()
110
 
    s.update(f.read())
 
235
    BUFSIZE = 128<<10
 
236
    while True:
 
237
        b = f.read(BUFSIZE)
 
238
        if not b:
 
239
            break
 
240
        s.update(b)
 
241
    return s.hexdigest()
 
242
 
 
243
 
 
244
 
 
245
def sha_strings(strings):
 
246
    """Return the sha-1 of concatenation of strings"""
 
247
    s = sha.new()
 
248
    map(s.update, strings)
111
249
    return s.hexdigest()
112
250
 
113
251
 
114
252
def sha_string(f):
115
 
    import sha
116
253
    s = sha.new()
117
254
    s.update(f)
118
255
    return s.hexdigest()
119
256
 
120
257
 
121
 
 
122
258
def fingerprint_file(f):
123
 
    import sha
124
259
    s = sha.new()
125
260
    b = f.read()
126
261
    s.update(b)
129
264
            'sha1': s.hexdigest()}
130
265
 
131
266
 
132
 
def config_dir():
133
 
    """Return per-user configuration directory.
134
 
 
135
 
    By default this is ~/.bzr.conf/
136
 
    
137
 
    TODO: Global option --config-dir to override this.
138
 
    """
139
 
    return os.path.expanduser("~/.bzr.conf")
140
 
 
141
 
 
142
 
def _auto_user_id():
143
 
    """Calculate automatic user identification.
144
 
 
145
 
    Returns (realname, email).
146
 
 
147
 
    Only used when none is set in the environment or the id file.
148
 
 
149
 
    This previously used the FQDN as the default domain, but that can
150
 
    be very slow on machines where DNS is broken.  So now we simply
151
 
    use the hostname.
152
 
    """
153
 
    import socket
154
 
 
155
 
    # XXX: Any good way to get real user name on win32?
156
 
 
157
 
    try:
158
 
        import pwd
159
 
        uid = os.getuid()
160
 
        w = pwd.getpwuid(uid)
161
 
        gecos = w.pw_gecos.decode(bzrlib.user_encoding)
162
 
        username = w.pw_name.decode(bzrlib.user_encoding)
163
 
        comma = gecos.find(',')
164
 
        if comma == -1:
165
 
            realname = gecos
166
 
        else:
167
 
            realname = gecos[:comma]
168
 
        if not realname:
169
 
            realname = username
170
 
 
171
 
    except ImportError:
172
 
        import getpass
173
 
        realname = username = getpass.getuser().decode(bzrlib.user_encoding)
174
 
 
175
 
    return realname, (username + '@' + socket.gethostname())
176
 
 
177
 
 
178
 
def _get_user_id():
179
 
    """Return the full user id from a file or environment variable.
180
 
 
181
 
    TODO: Allow taking this from a file in the branch directory too
182
 
    for per-branch ids."""
183
 
    v = os.environ.get('BZREMAIL')
184
 
    if v:
185
 
        return v.decode(bzrlib.user_encoding)
186
 
    
187
 
    try:
188
 
        return (open(os.path.join(config_dir(), "email"))
189
 
                .read()
190
 
                .decode(bzrlib.user_encoding)
191
 
                .rstrip("\r\n"))
192
 
    except IOError, e:
193
 
        if e.errno != errno.ENOENT:
194
 
            raise e
195
 
 
196
 
    v = os.environ.get('EMAIL')
197
 
    if v:
198
 
        return v.decode(bzrlib.user_encoding)
199
 
    else:    
200
 
        return None
201
 
 
202
 
 
203
 
def username():
204
 
    """Return email-style username.
205
 
 
206
 
    Something similar to 'Martin Pool <mbp@sourcefrog.net>'
207
 
 
208
 
    TODO: Check it's reasonably well-formed.
209
 
    """
210
 
    v = _get_user_id()
211
 
    if v:
212
 
        return v
213
 
    
214
 
    name, email = _auto_user_id()
215
 
    if name:
216
 
        return '%s <%s>' % (name, email)
217
 
    else:
218
 
        return email
219
 
 
220
 
 
221
 
_EMAIL_RE = re.compile(r'[\w+.-]+@[\w+.-]+')
222
 
def user_email():
223
 
    """Return just the email component of a username."""
224
 
    e = _get_user_id()
225
 
    if e:
226
 
        m = _EMAIL_RE.search(e)
227
 
        if not m:
228
 
            bailout("%r doesn't seem to contain a reasonable email address" % e)
229
 
        return m.group(0)
230
 
 
231
 
    return _auto_user_id()[1]
232
 
    
233
 
 
234
 
 
235
267
def compare_files(a, b):
236
268
    """Returns true if equal in contents"""
237
 
    # TODO: don't read the whole thing in one go.
238
269
    BUFSIZE = 4096
239
270
    while True:
240
271
        ai = a.read(BUFSIZE)
245
276
            return True
246
277
 
247
278
 
248
 
 
249
279
def local_time_offset(t=None):
250
280
    """Return offset of local zone from GMT, either at present or at time t."""
251
281
    # python2.3 localtime() can't take None
258
288
        return -time.timezone
259
289
 
260
290
    
261
 
def format_date(t, offset=0, timezone='original'):
 
291
def format_date(t, offset=0, timezone='original', date_fmt=None, 
 
292
                show_offset=True):
262
293
    ## TODO: Perhaps a global option to use either universal or local time?
263
294
    ## Or perhaps just let people set $TZ?
264
295
    assert isinstance(t, float)
274
305
        tt = time.localtime(t)
275
306
        offset = local_time_offset(t)
276
307
    else:
277
 
        bailout("unsupported timezone format %r",
278
 
                ['options are "utc", "original", "local"'])
279
 
 
280
 
    return (time.strftime("%a %Y-%m-%d %H:%M:%S", tt)
281
 
            + ' %+03d%02d' % (offset / 3600, (offset / 60) % 60))
 
308
        raise BzrError("unsupported timezone format %r" % timezone,
 
309
                       ['options are "utc", "original", "local"'])
 
310
    if date_fmt is None:
 
311
        date_fmt = "%a %Y-%m-%d %H:%M:%S"
 
312
    if show_offset:
 
313
        offset_str = ' %+03d%02d' % (offset / 3600, (offset / 60) % 60)
 
314
    else:
 
315
        offset_str = ''
 
316
    return (time.strftime(date_fmt, tt) +  offset_str)
282
317
 
283
318
 
284
319
def compact_date(when):
290
325
    """Return size of given open file."""
291
326
    return os.fstat(f.fileno())[ST_SIZE]
292
327
 
293
 
 
294
 
if hasattr(os, 'urandom'): # python 2.4 and later
 
328
# Define rand_bytes based on platform.
 
329
try:
 
330
    # Python 2.4 and later have os.urandom,
 
331
    # but it doesn't work on some arches
 
332
    os.urandom(1)
295
333
    rand_bytes = os.urandom
296
 
else:
297
 
    # FIXME: No good on non-Linux
298
 
    _rand_file = file('/dev/urandom', 'rb')
299
 
    rand_bytes = _rand_file.read
300
 
 
 
334
except (NotImplementedError, AttributeError):
 
335
    # If python doesn't have os.urandom, or it doesn't work,
 
336
    # then try to first pull random data from /dev/urandom
 
337
    if os.path.exists("/dev/urandom"):
 
338
        rand_bytes = file('/dev/urandom', 'rb').read
 
339
    # Otherwise, use this hack as a last resort
 
340
    else:
 
341
        # not well seeded, but better than nothing
 
342
        def rand_bytes(n):
 
343
            import random
 
344
            s = ''
 
345
            while n:
 
346
                s += chr(random.randint(0, 255))
 
347
                n -= 1
 
348
            return s
301
349
 
302
350
## TODO: We could later have path objects that remember their list
303
351
## decomposition (might be too tricksy though.)
316
364
    >>> splitpath('a/../b')
317
365
    Traceback (most recent call last):
318
366
    ...
319
 
    BzrError: ("sorry, '..' not allowed in path", [])
 
367
    BzrError: sorry, '..' not allowed in path
320
368
    """
321
369
    assert isinstance(p, types.StringTypes)
322
370
 
327
375
    rps = []
328
376
    for f in ps:
329
377
        if f == '..':
330
 
            bailout("sorry, %r not allowed in path" % f)
 
378
            raise BzrError("sorry, %r not allowed in path" % f)
331
379
        elif (f == '.') or (f == ''):
332
380
            pass
333
381
        else:
338
386
    assert isinstance(p, list)
339
387
    for f in p:
340
388
        if (f == '..') or (f == None) or (f == ''):
341
 
            bailout("sorry, %r not allowed in path" % f)
 
389
            raise BzrError("sorry, %r not allowed in path" % f)
342
390
    return os.path.join(*p)
343
391
 
344
392
 
349
397
        return os.path.join(p1, p2)
350
398
    
351
399
 
352
 
def extern_command(cmd, ignore_errors = False):
353
 
    mutter('external command: %s' % `cmd`)
354
 
    if os.system(cmd):
355
 
        if not ignore_errors:
356
 
            bailout('command failed')
357
 
 
 
400
def split_lines(s):
 
401
    """Split s into lines, but without removing the newline characters."""
 
402
    return StringIO(s).readlines()
 
403
 
 
404
 
 
405
def hardlinks_good():
 
406
    return sys.platform not in ('win32', 'cygwin', 'darwin')
 
407
 
 
408
 
 
409
def link_or_copy(src, dest):
 
410
    """Hardlink a file, or copy it if it can't be hardlinked."""
 
411
    if not hardlinks_good():
 
412
        copyfile(src, dest)
 
413
        return
 
414
    try:
 
415
        os.link(src, dest)
 
416
    except (OSError, IOError), e:
 
417
        if e.errno != errno.EXDEV:
 
418
            raise
 
419
        copyfile(src, dest)
 
420
 
 
421
 
 
422
def has_symlinks():
 
423
    if hasattr(os, 'symlink'):
 
424
        return True
 
425
    else:
 
426
        return False
 
427
        
 
428
 
 
429
def contains_whitespace(s):
 
430
    """True if there are any whitespace characters in s."""
 
431
    for ch in string.whitespace:
 
432
        if ch in s:
 
433
            return True
 
434
    else:
 
435
        return False
 
436
 
 
437
 
 
438
def contains_linebreaks(s):
 
439
    """True if there is any vertical whitespace in s."""
 
440
    for ch in '\f\n\r':
 
441
        if ch in s:
 
442
            return True
 
443
    else:
 
444
        return False
 
445
 
 
446
 
 
447
def relpath(base, path):
 
448
    """Return path relative to base, or raise exception.
 
449
 
 
450
    The path may be either an absolute path or a path relative to the
 
451
    current working directory.
 
452
 
 
453
    os.path.commonprefix (python2.4) has a bad bug that it works just
 
454
    on string prefixes, assuming that '/u' is a prefix of '/u2'.  This
 
455
    avoids that problem."""
 
456
    rp = os.path.abspath(path)
 
457
 
 
458
    s = []
 
459
    head = rp
 
460
    while len(head) >= len(base):
 
461
        if head == base:
 
462
            break
 
463
        head, tail = os.path.split(head)
 
464
        if tail:
 
465
            s.insert(0, tail)
 
466
    else:
 
467
        # XXX This should raise a NotChildPath exception, as its not tied
 
468
        # to branch anymore.
 
469
        raise NotBranchError("path %r is not within branch %r" % (rp, base))
 
470
 
 
471
    return os.sep.join(s)