~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/osutils.py

  • Committer: Martin Pool
  • Date: 2005-07-27 14:19:23 UTC
  • Revision ID: mbp@sourcefrog.net-20050727141923-9f4f14835da8a2db
- clean up code that loads modules to test, taking advantage of less broken
  testLoader in python 2.4

Show diffs side-by-side

added added

removed removed

Lines of Context:
16
16
# along with this program; if not, write to the Free Software
17
17
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
18
18
 
19
 
import os, types, re, time, types
 
19
import os, types, re, time, errno, sys
20
20
from stat import S_ISREG, S_ISDIR, S_ISLNK, ST_MODE, ST_SIZE
21
21
 
22
 
from errors import bailout
 
22
from bzrlib.errors import BzrError
 
23
from bzrlib.trace import mutter
 
24
import bzrlib
23
25
 
24
26
def make_readonly(filename):
25
27
    """Make a filename read-only."""
36
38
 
37
39
 
38
40
_QUOTE_RE = re.compile(r'([^a-zA-Z0-9.,:/_~-])')
 
41
 
 
42
_SLASH_RE = re.compile(r'[\\/]+')
 
43
 
39
44
def quotefn(f):
40
 
    """Return shell-quoted filename"""
41
 
    ## We could be a bit more terse by using double-quotes etc
42
 
    f = _QUOTE_RE.sub(r'\\\1', f)
43
 
    if f[0] == '~':
44
 
        f[0:1] = r'\~' 
45
 
    return f
 
45
    """Return a quoted filename filename
 
46
 
 
47
    This previously used backslash quoting, but that works poorly on
 
48
    Windows."""
 
49
    # TODO: I'm not really sure this is the best format either.x
 
50
    if _QUOTE_RE.search(f):
 
51
        return '"' + f + '"'
 
52
    else:
 
53
        return f
46
54
 
47
55
 
48
56
def file_kind(f):
54
62
    elif S_ISLNK(mode):
55
63
        return 'symlink'
56
64
    else:
57
 
        bailout("can't handle file kind with mode %o of %r" % (mode, f)) 
 
65
        raise BzrError("can't handle file kind with mode %o of %r" % (mode, f))
 
66
 
 
67
 
 
68
def kind_marker(kind):
 
69
    if kind == 'file':
 
70
        return ''
 
71
    elif kind == 'directory':
 
72
        return '/'
 
73
    elif kind == 'symlink':
 
74
        return '@'
 
75
    else:
 
76
        raise BzrError('invalid file kind %r' % kind)
 
77
 
 
78
 
 
79
 
 
80
def backup_file(fn):
 
81
    """Copy a file to a backup.
 
82
 
 
83
    Backups are named in GNU-style, with a ~ suffix.
 
84
 
 
85
    If the file is already a backup, it's not copied.
 
86
    """
 
87
    import os
 
88
    if fn[-1] == '~':
 
89
        return
 
90
    bfn = fn + '~'
 
91
 
 
92
    inf = file(fn, 'rb')
 
93
    try:
 
94
        content = inf.read()
 
95
    finally:
 
96
        inf.close()
 
97
    
 
98
    outf = file(bfn, 'wb')
 
99
    try:
 
100
        outf.write(content)
 
101
    finally:
 
102
        outf.close()
 
103
 
 
104
def rename(path_from, path_to):
 
105
    """Basically the same as os.rename() just special for win32"""
 
106
    if sys.platform == 'win32':
 
107
        try:
 
108
            os.remove(path_to)
 
109
        except OSError, e:
 
110
            if e.errno != e.ENOENT:
 
111
                raise
 
112
    os.rename(path_from, path_to)
 
113
 
 
114
 
58
115
 
59
116
 
60
117
 
75
132
        return False
76
133
 
77
134
 
 
135
def is_inside(dir, fname):
 
136
    """True if fname is inside dir.
 
137
    
 
138
    The parameters should typically be passed to os.path.normpath first, so
 
139
    that . and .. and repeated slashes are eliminated, and the separators
 
140
    are canonical for the platform.
 
141
    
 
142
    The empty string as a dir name is taken as top-of-tree and matches 
 
143
    everything.
 
144
    
 
145
    >>> is_inside('src', 'src/foo.c')
 
146
    True
 
147
    >>> is_inside('src', 'srccontrol')
 
148
    False
 
149
    >>> is_inside('src', 'src/a/a/a/foo.c')
 
150
    True
 
151
    >>> is_inside('foo.c', 'foo.c')
 
152
    True
 
153
    >>> is_inside('foo.c', '')
 
154
    False
 
155
    >>> is_inside('', 'foo.c')
 
156
    True
 
157
    """
 
158
    # XXX: Most callers of this can actually do something smarter by 
 
159
    # looking at the inventory
 
160
    if dir == fname:
 
161
        return True
 
162
    
 
163
    if dir == '':
 
164
        return True
 
165
    
 
166
    if dir[-1] != os.sep:
 
167
        dir += os.sep
 
168
    
 
169
    return fname.startswith(dir)
 
170
 
 
171
 
 
172
def is_inside_any(dir_list, fname):
 
173
    """True if fname is inside any of given dirs."""
 
174
    for dirname in dir_list:
 
175
        if is_inside(dirname, fname):
 
176
            return True
 
177
    else:
 
178
        return False
 
179
 
 
180
 
78
181
def pumpfile(fromfile, tofile):
79
182
    """Copy contents of one file to another."""
80
183
    tofile.write(fromfile.read())
82
185
 
83
186
def uuid():
84
187
    """Return a new UUID"""
85
 
    
86
 
    ## XXX: Could alternatively read /proc/sys/kernel/random/uuid on
87
 
    ## Linux, but we need something portable for other systems;
88
 
    ## preferably an implementation in Python.
89
188
    try:
90
 
        return chomp(file('/proc/sys/kernel/random/uuid').readline())
 
189
        return file('/proc/sys/kernel/random/uuid').readline().rstrip('\n')
91
190
    except IOError:
92
191
        return chomp(os.popen('uuidgen').readline())
93
192
 
94
193
 
95
 
def chomp(s):
96
 
    if s and (s[-1] == '\n'):
97
 
        return s[:-1]
98
 
    else:
99
 
        return s
100
 
 
101
 
 
102
194
def sha_file(f):
103
195
    import sha
104
 
    ## TODO: Maybe read in chunks to handle big files
105
196
    if hasattr(f, 'tell'):
106
197
        assert f.tell() == 0
107
198
    s = sha.new()
108
 
    s.update(f.read())
 
199
    BUFSIZE = 128<<10
 
200
    while True:
 
201
        b = f.read(BUFSIZE)
 
202
        if not b:
 
203
            break
 
204
        s.update(b)
109
205
    return s.hexdigest()
110
206
 
111
207
 
117
213
 
118
214
 
119
215
 
120
 
def username():
121
 
    """Return email-style username.
122
 
 
123
 
    Something similar to 'Martin Pool <mbp@sourcefrog.net>'
124
 
 
125
 
    :todo: Check it's reasonably well-formed.
126
 
 
127
 
    :todo: Allow taking it from a dotfile to help people on windows
128
 
           who can't easily set variables.
129
 
 
130
 
    :todo: Cope without pwd module, which is only on unix. 
131
 
    """
132
 
    e = os.environ.get('BZREMAIL') or os.environ.get('EMAIL')
133
 
    if e: return e
134
 
 
 
216
def fingerprint_file(f):
 
217
    import sha
 
218
    s = sha.new()
 
219
    b = f.read()
 
220
    s.update(b)
 
221
    size = len(b)
 
222
    return {'size': size,
 
223
            'sha1': s.hexdigest()}
 
224
 
 
225
 
 
226
def config_dir():
 
227
    """Return per-user configuration directory.
 
228
 
 
229
    By default this is ~/.bzr.conf/
 
230
    
 
231
    TODO: Global option --config-dir to override this.
 
232
    """
 
233
    return os.path.expanduser("~/.bzr.conf")
 
234
 
 
235
 
 
236
def _auto_user_id():
 
237
    """Calculate automatic user identification.
 
238
 
 
239
    Returns (realname, email).
 
240
 
 
241
    Only used when none is set in the environment or the id file.
 
242
 
 
243
    This previously used the FQDN as the default domain, but that can
 
244
    be very slow on machines where DNS is broken.  So now we simply
 
245
    use the hostname.
 
246
    """
135
247
    import socket
136
 
    
 
248
 
 
249
    # XXX: Any good way to get real user name on win32?
 
250
 
137
251
    try:
138
252
        import pwd
139
253
        uid = os.getuid()
140
254
        w = pwd.getpwuid(uid)
141
 
        gecos = w.pw_gecos
 
255
        gecos = w.pw_gecos.decode(bzrlib.user_encoding)
 
256
        username = w.pw_name.decode(bzrlib.user_encoding)
142
257
        comma = gecos.find(',')
143
258
        if comma == -1:
144
259
            realname = gecos
145
260
        else:
146
261
            realname = gecos[:comma]
147
 
        return '%s <%s@%s>' % (realname, w.pw_name, socket.getfqdn())
 
262
        if not realname:
 
263
            realname = username
 
264
 
148
265
    except ImportError:
149
 
        pass
150
 
 
151
 
    import getpass, socket
152
 
    return '<%s@%s>' % (getpass.getuser(), socket.getfqdn())
153
 
 
154
 
 
 
266
        import getpass
 
267
        realname = username = getpass.getuser().decode(bzrlib.user_encoding)
 
268
 
 
269
    return realname, (username + '@' + socket.gethostname())
 
270
 
 
271
 
 
272
def _get_user_id():
 
273
    """Return the full user id from a file or environment variable.
 
274
 
 
275
    TODO: Allow taking this from a file in the branch directory too
 
276
    for per-branch ids."""
 
277
    v = os.environ.get('BZREMAIL')
 
278
    if v:
 
279
        return v.decode(bzrlib.user_encoding)
 
280
    
 
281
    try:
 
282
        return (open(os.path.join(config_dir(), "email"))
 
283
                .read()
 
284
                .decode(bzrlib.user_encoding)
 
285
                .rstrip("\r\n"))
 
286
    except IOError, e:
 
287
        if e.errno != errno.ENOENT:
 
288
            raise e
 
289
 
 
290
    v = os.environ.get('EMAIL')
 
291
    if v:
 
292
        return v.decode(bzrlib.user_encoding)
 
293
    else:    
 
294
        return None
 
295
 
 
296
 
 
297
def username():
 
298
    """Return email-style username.
 
299
 
 
300
    Something similar to 'Martin Pool <mbp@sourcefrog.net>'
 
301
 
 
302
    TODO: Check it's reasonably well-formed.
 
303
    """
 
304
    v = _get_user_id()
 
305
    if v:
 
306
        return v
 
307
    
 
308
    name, email = _auto_user_id()
 
309
    if name:
 
310
        return '%s <%s>' % (name, email)
 
311
    else:
 
312
        return email
 
313
 
 
314
 
 
315
_EMAIL_RE = re.compile(r'[\w+.-]+@[\w+.-]+')
155
316
def user_email():
156
317
    """Return just the email component of a username."""
157
 
    e = os.environ.get('BZREMAIL') or os.environ.get('EMAIL')
 
318
    e = _get_user_id()
158
319
    if e:
159
 
        import re
160
 
        m = re.search(r'[\w+.-]+@[\w+.-]+', e)
 
320
        m = _EMAIL_RE.search(e)
161
321
        if not m:
162
 
            bailout('%r is not a reasonable email address' % e)
 
322
            raise BzrError("%r doesn't seem to contain a reasonable email address" % e)
163
323
        return m.group(0)
164
324
 
165
 
 
166
 
    import getpass, socket
167
 
    return '%s@%s' % (getpass.getuser(), socket.getfqdn())
168
 
 
 
325
    return _auto_user_id()[1]
169
326
    
170
327
 
171
328
 
172
329
def compare_files(a, b):
173
330
    """Returns true if equal in contents"""
174
 
    # TODO: don't read the whole thing in one go.
175
331
    BUFSIZE = 4096
176
332
    while True:
177
333
        ai = a.read(BUFSIZE)
186
342
def local_time_offset(t=None):
187
343
    """Return offset of local zone from GMT, either at present or at time t."""
188
344
    # python2.3 localtime() can't take None
189
 
    if t is None:
 
345
    if t == None:
190
346
        t = time.time()
191
347
        
192
348
    if time.localtime(t).tm_isdst and time.daylight:
198
354
def format_date(t, offset=0, timezone='original'):
199
355
    ## TODO: Perhaps a global option to use either universal or local time?
200
356
    ## Or perhaps just let people set $TZ?
201
 
    import time
202
 
    
203
357
    assert isinstance(t, float)
204
358
    
205
359
    if timezone == 'utc':
213
367
        tt = time.localtime(t)
214
368
        offset = local_time_offset(t)
215
369
    else:
216
 
        bailout("unsupported timezone format %r",
 
370
        raise BzrError("unsupported timezone format %r",
217
371
                ['options are "utc", "original", "local"'])
218
372
 
219
373
    return (time.strftime("%a %Y-%m-%d %H:%M:%S", tt)
232
386
 
233
387
if hasattr(os, 'urandom'): # python 2.4 and later
234
388
    rand_bytes = os.urandom
 
389
elif sys.platform == 'linux2':
 
390
    rand_bytes = file('/dev/urandom', 'rb').read
235
391
else:
236
 
    # FIXME: No good on non-Linux
237
 
    _rand_file = file('/dev/urandom', 'rb')
238
 
    rand_bytes = _rand_file.read
 
392
    # not well seeded, but better than nothing
 
393
    def rand_bytes(n):
 
394
        import random
 
395
        s = ''
 
396
        while n:
 
397
            s += chr(random.randint(0, 255))
 
398
            n -= 1
 
399
        return s
239
400
 
240
401
 
241
402
## TODO: We could later have path objects that remember their list
255
416
    >>> splitpath('a/../b')
256
417
    Traceback (most recent call last):
257
418
    ...
258
 
    BzrError: ("sorry, '..' not allowed in path", [])
 
419
    BzrError: sorry, '..' not allowed in path
259
420
    """
260
421
    assert isinstance(p, types.StringTypes)
261
 
    ps = [f for f in p.split('/') if f != '.']
 
422
 
 
423
    # split on either delimiter because people might use either on
 
424
    # Windows
 
425
    ps = re.split(r'[\\/]', p)
 
426
 
 
427
    rps = []
262
428
    for f in ps:
263
429
        if f == '..':
264
 
            bailout("sorry, %r not allowed in path" % f)
265
 
    return ps
 
430
            raise BzrError("sorry, %r not allowed in path" % f)
 
431
        elif (f == '.') or (f == ''):
 
432
            pass
 
433
        else:
 
434
            rps.append(f)
 
435
    return rps
266
436
 
267
437
def joinpath(p):
268
438
    assert isinstance(p, list)
269
439
    for f in p:
270
 
        if (f == '..') or (f is None) or (f == ''):
271
 
            bailout("sorry, %r not allowed in path" % f)
272
 
    return '/'.join(p)
 
440
        if (f == '..') or (f == None) or (f == ''):
 
441
            raise BzrError("sorry, %r not allowed in path" % f)
 
442
    return os.path.join(*p)
273
443
 
274
444
 
275
445
def appendpath(p1, p2):
276
446
    if p1 == '':
277
447
        return p2
278
448
    else:
279
 
        return p1 + '/' + p2
 
449
        return os.path.join(p1, p2)
280
450
    
281
451
 
282
452
def extern_command(cmd, ignore_errors = False):
283
453
    mutter('external command: %s' % `cmd`)
284
454
    if os.system(cmd):
285
455
        if not ignore_errors:
286
 
            bailout('command failed')
287
 
 
 
456
            raise BzrError('command failed')
 
457
 
 
458
 
 
459
def _read_config_value(name):
 
460
    """Read a config value from the file ~/.bzr.conf/<name>
 
461
    Return None if the file does not exist"""
 
462
    try:
 
463
        f = file(os.path.join(config_dir(), name), "r")
 
464
        return f.read().decode(bzrlib.user_encoding).rstrip("\r\n")
 
465
    except IOError, e:
 
466
        if e.errno == errno.ENOENT:
 
467
            return None
 
468
        raise
 
469
 
 
470
 
 
471
def _get_editor():
 
472
    """Return a sequence of possible editor binaries for the current platform"""
 
473
    e = _read_config_value("editor")
 
474
    if e is not None:
 
475
        yield e
 
476
        
 
477
    if os.name == "windows":
 
478
        yield "notepad.exe"
 
479
    elif os.name == "posix":
 
480
        try:
 
481
            yield os.environ["EDITOR"]
 
482
        except KeyError:
 
483
            yield "/usr/bin/vi"
 
484
 
 
485
 
 
486
def _run_editor(filename):
 
487
    """Try to execute an editor to edit the commit message. Returns True on success,
 
488
    False on failure"""
 
489
    for e in _get_editor():
 
490
        x = os.spawnvp(os.P_WAIT, e, (e, filename))
 
491
        if x == 0:
 
492
            return True
 
493
        elif x == 127:
 
494
            continue
 
495
        else:
 
496
            break
 
497
    raise BzrError("Could not start any editor. Please specify $EDITOR or use ~/.bzr.conf/editor")
 
498
    return False
 
499
                          
 
500
 
 
501
def get_text_message(infotext, ignoreline = "default"):
 
502
    import tempfile
 
503
    
 
504
    if ignoreline == "default":
 
505
        ignoreline = "-- This line and the following will be ignored --"
 
506
        
 
507
    try:
 
508
        tmp_fileno, msgfilename = tempfile.mkstemp()
 
509
        msgfile = os.close(tmp_fileno)
 
510
        if infotext is not None and infotext != "":
 
511
            hasinfo = True
 
512
            msgfile = file(msgfilename, "w")
 
513
            msgfile.write("\n\n%s\n\n%s" % (ignoreline, infotext))
 
514
            msgfile.close()
 
515
        else:
 
516
            hasinfo = False
 
517
 
 
518
        if not _run_editor(msgfilename):
 
519
            return None
 
520
        
 
521
        started = False
 
522
        msg = []
 
523
        lastline, nlines = 0, 0
 
524
        for line in file(msgfilename, "r"):
 
525
            stripped_line = line.strip()
 
526
            # strip empty line before the log message starts
 
527
            if not started:
 
528
                if stripped_line != "":
 
529
                    started = True
 
530
                else:
 
531
                    continue
 
532
            # check for the ignore line only if there
 
533
            # is additional information at the end
 
534
            if hasinfo and stripped_line == ignoreline:
 
535
                break
 
536
            nlines += 1
 
537
            # keep track of the last line that had some content
 
538
            if stripped_line != "":
 
539
                lastline = nlines
 
540
            msg.append(line)
 
541
            
 
542
        if len(msg) == 0:
 
543
            return None
 
544
        # delete empty lines at the end
 
545
        del msg[lastline:]
 
546
        # add a newline at the end, if needed
 
547
        if not msg[-1].endswith("\n"):
 
548
            return "%s%s" % ("".join(msg), "\n")
 
549
        else:
 
550
            return "".join(msg)
 
551
    finally:
 
552
        # delete the msg file in any case
 
553
        try: os.unlink(msgfilename)
 
554
        except IOError: pass