~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/osutils.py

  • Committer: mbp at sourcefrog
  • Date: 2005-04-05 08:24:51 UTC
  • Revision ID: mbp@sourcefrog.net-20050405082451-408ebb0fd108440f
start adding quotes

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
1
# Bazaar-NG -- distributed version control
2
 
#
 
2
 
3
3
# Copyright (C) 2005 by Canonical Ltd
4
 
#
 
4
 
5
5
# This program is free software; you can redistribute it and/or modify
6
6
# it under the terms of the GNU General Public License as published by
7
7
# the Free Software Foundation; either version 2 of the License, or
8
8
# (at your option) any later version.
9
 
#
 
9
 
10
10
# This program is distributed in the hope that it will be useful,
11
11
# but WITHOUT ANY WARRANTY; without even the implied warranty of
12
12
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13
13
# GNU General Public License for more details.
14
 
#
 
14
 
15
15
# You should have received a copy of the GNU General Public License
16
16
# along with this program; if not, write to the Free Software
17
17
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
18
18
 
19
 
from shutil import copyfile
20
 
from stat import (S_ISREG, S_ISDIR, S_ISLNK, ST_MODE, ST_SIZE,
21
 
                  S_ISCHR, S_ISBLK, S_ISFIFO, S_ISSOCK)
22
 
from cStringIO import StringIO
23
 
import errno
24
 
import os
25
 
import re
26
 
import sha
27
 
import sys
28
 
import time
29
 
import types
30
 
 
31
 
import bzrlib
32
 
from bzrlib.errors import BzrError
33
 
from bzrlib.trace import mutter
34
 
 
 
19
import os, types, re, time, types
 
20
from stat import S_ISREG, S_ISDIR, S_ISLNK, ST_MODE, ST_SIZE
 
21
 
 
22
from errors import bailout
35
23
 
36
24
def make_readonly(filename):
37
25
    """Make a filename read-only."""
 
26
    # TODO: probably needs to be fixed for windows
38
27
    mod = os.stat(filename).st_mode
39
28
    mod = mod & 0777555
40
29
    os.chmod(filename, mod)
46
35
    os.chmod(filename, mod)
47
36
 
48
37
 
49
 
_QUOTE_RE = None
50
 
 
51
 
 
 
38
_QUOTE_RE = re.compile(r'([^a-zA-Z0-9.,:/_~-])')
52
39
def quotefn(f):
53
 
    """Return a quoted filename filename
54
 
 
55
 
    This previously used backslash quoting, but that works poorly on
56
 
    Windows."""
57
 
    # TODO: I'm not really sure this is the best format either.x
58
 
    global _QUOTE_RE
59
 
    if _QUOTE_RE == None:
60
 
        _QUOTE_RE = re.compile(r'([^a-zA-Z0-9.,:/\\_~-])')
61
 
        
62
 
    if _QUOTE_RE.search(f):
63
 
        return '"' + f + '"'
64
 
    else:
65
 
        return f
 
40
    """Return shell-quoted filename"""
 
41
    ## We could be a bit more terse by using double-quotes etc
 
42
    f = _QUOTE_RE.sub(r'\\\1', f)
 
43
    if f[0] == '~':
 
44
        f[0:1] = r'\~' 
 
45
    return f
66
46
 
67
47
 
68
48
def file_kind(f):
73
53
        return 'directory'
74
54
    elif S_ISLNK(mode):
75
55
        return 'symlink'
76
 
    elif S_ISCHR(mode):
77
 
        return 'chardev'
78
 
    elif S_ISBLK(mode):
79
 
        return 'block'
80
 
    elif S_ISFIFO(mode):
81
 
        return 'fifo'
82
 
    elif S_ISSOCK(mode):
83
 
        return 'socket'
84
 
    else:
85
 
        return 'unknown'
86
 
 
87
 
 
88
 
def kind_marker(kind):
89
 
    if kind == 'file':
90
 
        return ''
91
 
    elif kind == 'directory':
92
 
        return '/'
93
 
    elif kind == 'symlink':
94
 
        return '@'
95
 
    else:
96
 
        raise BzrError('invalid file kind %r' % kind)
97
 
 
98
 
 
99
 
def backup_file(fn):
100
 
    """Copy a file to a backup.
101
 
 
102
 
    Backups are named in GNU-style, with a ~ suffix.
103
 
 
104
 
    If the file is already a backup, it's not copied.
105
 
    """
106
 
    if fn[-1] == '~':
107
 
        return
108
 
    bfn = fn + '~'
109
 
 
110
 
    inf = file(fn, 'rb')
111
 
    try:
112
 
        content = inf.read()
113
 
    finally:
114
 
        inf.close()
115
 
    
116
 
    outf = file(bfn, 'wb')
117
 
    try:
118
 
        outf.write(content)
119
 
    finally:
120
 
        outf.close()
121
 
 
122
 
if os.name == 'nt':
123
 
    import shutil
124
 
    rename = shutil.move
125
 
else:
126
 
    rename = os.rename
 
56
    else:
 
57
        bailout("can't handle file kind with mode %o of %r" % (mode, f)) 
 
58
 
127
59
 
128
60
 
129
61
def isdir(f):
134
66
        return False
135
67
 
136
68
 
 
69
 
137
70
def isfile(f):
138
71
    """True if f is a regular file."""
139
72
    try:
142
75
        return False
143
76
 
144
77
 
145
 
def is_inside(dir, fname):
146
 
    """True if fname is inside dir.
147
 
    
148
 
    The parameters should typically be passed to os.path.normpath first, so
149
 
    that . and .. and repeated slashes are eliminated, and the separators
150
 
    are canonical for the platform.
151
 
    
152
 
    The empty string as a dir name is taken as top-of-tree and matches 
153
 
    everything.
154
 
    
155
 
    >>> is_inside('src', os.path.join('src', 'foo.c'))
156
 
    True
157
 
    >>> is_inside('src', 'srccontrol')
158
 
    False
159
 
    >>> is_inside('src', os.path.join('src', 'a', 'a', 'a', 'foo.c'))
160
 
    True
161
 
    >>> is_inside('foo.c', 'foo.c')
162
 
    True
163
 
    >>> is_inside('foo.c', '')
164
 
    False
165
 
    >>> is_inside('', 'foo.c')
166
 
    True
167
 
    """
168
 
    # XXX: Most callers of this can actually do something smarter by 
169
 
    # looking at the inventory
170
 
    if dir == fname:
171
 
        return True
172
 
    
173
 
    if dir == '':
174
 
        return True
175
 
 
176
 
    if dir[-1] != os.sep:
177
 
        dir += os.sep
178
 
 
179
 
    return fname.startswith(dir)
180
 
 
181
 
 
182
 
def is_inside_any(dir_list, fname):
183
 
    """True if fname is inside any of given dirs."""
184
 
    for dirname in dir_list:
185
 
        if is_inside(dirname, fname):
186
 
            return True
187
 
    else:
188
 
        return False
189
 
 
190
 
 
191
78
def pumpfile(fromfile, tofile):
192
79
    """Copy contents of one file to another."""
193
80
    tofile.write(fromfile.read())
194
81
 
195
82
 
 
83
def uuid():
 
84
    """Return a new UUID"""
 
85
    
 
86
    ## XXX: Could alternatively read /proc/sys/kernel/random/uuid on
 
87
    ## Linux, but we need something portable for other systems;
 
88
    ## preferably an implementation in Python.
 
89
    try:
 
90
        return chomp(file('/proc/sys/kernel/random/uuid').readline())
 
91
    except IOError:
 
92
        return chomp(os.popen('uuidgen').readline())
 
93
 
 
94
 
 
95
def chomp(s):
 
96
    if s and (s[-1] == '\n'):
 
97
        return s[:-1]
 
98
    else:
 
99
        return s
 
100
 
 
101
 
196
102
def sha_file(f):
 
103
    import sha
 
104
    ## TODO: Maybe read in chunks to handle big files
197
105
    if hasattr(f, 'tell'):
198
106
        assert f.tell() == 0
199
107
    s = sha.new()
200
 
    BUFSIZE = 128<<10
201
 
    while True:
202
 
        b = f.read(BUFSIZE)
203
 
        if not b:
204
 
            break
205
 
        s.update(b)
206
 
    return s.hexdigest()
207
 
 
208
 
 
209
 
 
210
 
def sha_strings(strings):
211
 
    """Return the sha-1 of concatenation of strings"""
212
 
    s = sha.new()
213
 
    map(s.update, strings)
 
108
    s.update(f.read())
214
109
    return s.hexdigest()
215
110
 
216
111
 
217
112
def sha_string(f):
 
113
    import sha
218
114
    s = sha.new()
219
115
    s.update(f)
220
116
    return s.hexdigest()
221
117
 
222
118
 
 
119
 
223
120
def fingerprint_file(f):
 
121
    import sha
224
122
    s = sha.new()
225
123
    b = f.read()
226
124
    s.update(b)
229
127
            'sha1': s.hexdigest()}
230
128
 
231
129
 
232
 
def config_dir():
233
 
    """Return per-user configuration directory.
234
 
 
235
 
    By default this is ~/.bzr.conf/
236
 
    
237
 
    TODO: Global option --config-dir to override this.
238
 
    """
239
 
    return os.path.join(os.path.expanduser("~"), ".bzr.conf")
240
 
 
241
 
 
242
 
def _auto_user_id():
243
 
    """Calculate automatic user identification.
244
 
 
245
 
    Returns (realname, email).
246
 
 
247
 
    Only used when none is set in the environment or the id file.
248
 
 
249
 
    This previously used the FQDN as the default domain, but that can
250
 
    be very slow on machines where DNS is broken.  So now we simply
251
 
    use the hostname.
252
 
    """
 
130
 
 
131
def username():
 
132
    """Return email-style username.
 
133
 
 
134
    Something similar to 'Martin Pool <mbp@sourcefrog.net>'
 
135
 
 
136
    :todo: Check it's reasonably well-formed.
 
137
 
 
138
    :todo: Allow taking it from a dotfile to help people on windows
 
139
           who can't easily set variables.
 
140
 
 
141
    :todo: Cope without pwd module, which is only on unix. 
 
142
    """
 
143
    e = os.environ.get('BZREMAIL') or os.environ.get('EMAIL')
 
144
    if e: return e
 
145
 
253
146
    import socket
254
 
 
255
 
    # XXX: Any good way to get real user name on win32?
256
 
 
 
147
    
257
148
    try:
258
149
        import pwd
259
150
        uid = os.getuid()
260
151
        w = pwd.getpwuid(uid)
261
 
        gecos = w.pw_gecos.decode(bzrlib.user_encoding)
262
 
        username = w.pw_name.decode(bzrlib.user_encoding)
 
152
        gecos = w.pw_gecos
263
153
        comma = gecos.find(',')
264
154
        if comma == -1:
265
155
            realname = gecos
266
156
        else:
267
157
            realname = gecos[:comma]
268
 
        if not realname:
269
 
            realname = username
270
 
 
 
158
        return '%s <%s@%s>' % (realname, w.pw_name, socket.getfqdn())
271
159
    except ImportError:
272
 
        import getpass
273
 
        realname = username = getpass.getuser().decode(bzrlib.user_encoding)
274
 
 
275
 
    return realname, (username + '@' + socket.gethostname())
276
 
 
277
 
 
278
 
def _get_user_id(branch):
279
 
    """Return the full user id from a file or environment variable.
280
 
 
281
 
    e.g. "John Hacker <jhacker@foo.org>"
282
 
 
283
 
    branch
284
 
        A branch to use for a per-branch configuration, or None.
285
 
 
286
 
    The following are searched in order:
287
 
 
288
 
    1. $BZREMAIL
289
 
    2. .bzr/email for this branch.
290
 
    3. ~/.bzr.conf/email
291
 
    4. $EMAIL
292
 
    """
293
 
    v = os.environ.get('BZREMAIL')
294
 
    if v:
295
 
        return v.decode(bzrlib.user_encoding)
296
 
 
297
 
    if branch:
298
 
        try:
299
 
            return (branch.controlfile("email", "r") 
300
 
                    .read()
301
 
                    .decode(bzrlib.user_encoding)
302
 
                    .rstrip("\r\n"))
303
 
        except IOError, e:
304
 
            if e.errno != errno.ENOENT:
305
 
                raise
306
 
        except BzrError, e:
307
 
            pass
308
 
    
309
 
    try:
310
 
        return (open(os.path.join(config_dir(), "email"))
311
 
                .read()
312
 
                .decode(bzrlib.user_encoding)
313
 
                .rstrip("\r\n"))
314
 
    except IOError, e:
315
 
        if e.errno != errno.ENOENT:
316
 
            raise e
317
 
 
318
 
    v = os.environ.get('EMAIL')
319
 
    if v:
320
 
        return v.decode(bzrlib.user_encoding)
321
 
    else:    
322
 
        return None
323
 
 
324
 
 
325
 
def username(branch):
326
 
    """Return email-style username.
327
 
 
328
 
    Something similar to 'Martin Pool <mbp@sourcefrog.net>'
329
 
 
330
 
    TODO: Check it's reasonably well-formed.
331
 
    """
332
 
    v = _get_user_id(branch)
333
 
    if v:
334
 
        return v
335
 
    
336
 
    name, email = _auto_user_id()
337
 
    if name:
338
 
        return '%s <%s>' % (name, email)
339
 
    else:
340
 
        return email
341
 
 
342
 
 
343
 
def user_email(branch):
 
160
        pass
 
161
 
 
162
    import getpass, socket
 
163
    return '<%s@%s>' % (getpass.getuser(), socket.getfqdn())
 
164
 
 
165
 
 
166
def user_email():
344
167
    """Return just the email component of a username."""
345
 
    e = _get_user_id(branch)
 
168
    e = os.environ.get('BZREMAIL') or os.environ.get('EMAIL')
346
169
    if e:
 
170
        import re
347
171
        m = re.search(r'[\w+.-]+@[\w+.-]+', e)
348
172
        if not m:
349
 
            raise BzrError("%r doesn't seem to contain "
350
 
                           "a reasonable email address" % e)
 
173
            bailout('%r is not a reasonable email address' % e)
351
174
        return m.group(0)
352
175
 
353
 
    return _auto_user_id()[1]
 
176
 
 
177
    import getpass, socket
 
178
    return '%s@%s' % (getpass.getuser(), socket.getfqdn())
 
179
 
 
180
    
354
181
 
355
182
 
356
183
def compare_files(a, b):
357
184
    """Returns true if equal in contents"""
 
185
    # TODO: don't read the whole thing in one go.
358
186
    BUFSIZE = 4096
359
187
    while True:
360
188
        ai = a.read(BUFSIZE)
365
193
            return True
366
194
 
367
195
 
 
196
 
368
197
def local_time_offset(t=None):
369
198
    """Return offset of local zone from GMT, either at present or at time t."""
370
199
    # python2.3 localtime() can't take None
371
 
    if t == None:
 
200
    if t is None:
372
201
        t = time.time()
373
202
        
374
203
    if time.localtime(t).tm_isdst and time.daylight:
380
209
def format_date(t, offset=0, timezone='original'):
381
210
    ## TODO: Perhaps a global option to use either universal or local time?
382
211
    ## Or perhaps just let people set $TZ?
 
212
    import time
 
213
    
383
214
    assert isinstance(t, float)
384
215
    
385
216
    if timezone == 'utc':
393
224
        tt = time.localtime(t)
394
225
        offset = local_time_offset(t)
395
226
    else:
396
 
        raise BzrError("unsupported timezone format %r" % timezone,
397
 
                       ['options are "utc", "original", "local"'])
 
227
        bailout("unsupported timezone format %r",
 
228
                ['options are "utc", "original", "local"'])
398
229
 
399
230
    return (time.strftime("%a %Y-%m-%d %H:%M:%S", tt)
400
231
            + ' %+03d%02d' % (offset / 3600, (offset / 60) % 60))
409
240
    """Return size of given open file."""
410
241
    return os.fstat(f.fileno())[ST_SIZE]
411
242
 
412
 
# Define rand_bytes based on platform.
413
 
try:
414
 
    # Python 2.4 and later have os.urandom,
415
 
    # but it doesn't work on some arches
416
 
    os.urandom(1)
 
243
 
 
244
if hasattr(os, 'urandom'): # python 2.4 and later
417
245
    rand_bytes = os.urandom
418
 
except (NotImplementedError, AttributeError):
419
 
    # If python doesn't have os.urandom, or it doesn't work,
420
 
    # then try to first pull random data from /dev/urandom
421
 
    if os.path.exists("/dev/urandom"):
422
 
        rand_bytes = file('/dev/urandom', 'rb').read
423
 
    # Otherwise, use this hack as a last resort
424
 
    else:
425
 
        # not well seeded, but better than nothing
426
 
        def rand_bytes(n):
427
 
            import random
428
 
            s = ''
429
 
            while n:
430
 
                s += chr(random.randint(0, 255))
431
 
                n -= 1
432
 
            return s
 
246
else:
 
247
    # FIXME: No good on non-Linux
 
248
    _rand_file = file('/dev/urandom', 'rb')
 
249
    rand_bytes = _rand_file.read
 
250
 
433
251
 
434
252
## TODO: We could later have path objects that remember their list
435
253
## decomposition (might be too tricksy though.)
448
266
    >>> splitpath('a/../b')
449
267
    Traceback (most recent call last):
450
268
    ...
451
 
    BzrError: sorry, '..' not allowed in path
 
269
    BzrError: ("sorry, '..' not allowed in path", [])
452
270
    """
453
271
    assert isinstance(p, types.StringTypes)
454
 
 
455
 
    # split on either delimiter because people might use either on
456
 
    # Windows
457
 
    ps = re.split(r'[\\/]', p)
458
 
 
459
 
    rps = []
 
272
    ps = [f for f in p.split('/') if f != '.']
460
273
    for f in ps:
461
274
        if f == '..':
462
 
            raise BzrError("sorry, %r not allowed in path" % f)
463
 
        elif (f == '.') or (f == ''):
464
 
            pass
465
 
        else:
466
 
            rps.append(f)
467
 
    return rps
 
275
            bailout("sorry, %r not allowed in path" % f)
 
276
    return ps
468
277
 
469
278
def joinpath(p):
470
279
    assert isinstance(p, list)
471
280
    for f in p:
472
 
        if (f == '..') or (f == None) or (f == ''):
473
 
            raise BzrError("sorry, %r not allowed in path" % f)
474
 
    return os.path.join(*p)
 
281
        if (f == '..') or (f is None) or (f == ''):
 
282
            bailout("sorry, %r not allowed in path" % f)
 
283
    return '/'.join(p)
475
284
 
476
285
 
477
286
def appendpath(p1, p2):
478
287
    if p1 == '':
479
288
        return p2
480
289
    else:
481
 
        return os.path.join(p1, p2)
 
290
        return p1 + '/' + p2
482
291
    
483
292
 
484
 
def _read_config_value(name):
485
 
    """Read a config value from the file ~/.bzr.conf/<name>
486
 
    Return None if the file does not exist"""
487
 
    try:
488
 
        f = file(os.path.join(config_dir(), name), "r")
489
 
        return f.read().decode(bzrlib.user_encoding).rstrip("\r\n")
490
 
    except IOError, e:
491
 
        if e.errno == errno.ENOENT:
492
 
            return None
493
 
        raise
494
 
 
495
 
 
496
 
def split_lines(s):
497
 
    """Split s into lines, but without removing the newline characters."""
498
 
    return StringIO(s).readlines()
499
 
 
500
 
 
501
 
def hardlinks_good():
502
 
    return sys.platform not in ('win32', 'cygwin', 'darwin')
503
 
 
504
 
 
505
 
def link_or_copy(src, dest):
506
 
    """Hardlink a file, or copy it if it can't be hardlinked."""
507
 
    if not hardlinks_good():
508
 
        copyfile(src, dest)
509
 
        return
510
 
    try:
511
 
        os.link(src, dest)
512
 
    except (OSError, IOError), e:
513
 
        if e.errno != errno.EXDEV:
514
 
            raise
515
 
        copyfile(src, dest)
 
293
def extern_command(cmd, ignore_errors = False):
 
294
    mutter('external command: %s' % `cmd`)
 
295
    if os.system(cmd):
 
296
        if not ignore_errors:
 
297
            bailout('command failed')
 
298