~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/osutils.py

  • Committer: mbp at sourcefrog
  • Date: 2005-03-19 01:41:44 UTC
  • Revision ID: mbp@sourcefrog.net-20050319014144-5298a74caebaf378
fix local-time-offset calculation

Show diffs side-by-side

added added

removed removed

Lines of Context:
16
16
# along with this program; if not, write to the Free Software
17
17
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
18
18
 
19
 
import os, types, re, time, errno, sys
 
19
import os, types, re, time, types
20
20
from stat import S_ISREG, S_ISDIR, S_ISLNK, ST_MODE, ST_SIZE
21
21
 
22
 
from bzrlib.errors import BzrError
23
 
from bzrlib.trace import mutter
24
 
import bzrlib
 
22
from errors import bailout
25
23
 
26
24
def make_readonly(filename):
27
25
    """Make a filename read-only."""
38
36
 
39
37
 
40
38
_QUOTE_RE = re.compile(r'([^a-zA-Z0-9.,:/_~-])')
41
 
 
42
 
_SLASH_RE = re.compile(r'[\\/]+')
43
 
 
44
39
def quotefn(f):
45
 
    """Return a quoted filename filename
46
 
 
47
 
    This previously used backslash quoting, but that works poorly on
48
 
    Windows."""
49
 
    # TODO: I'm not really sure this is the best format either.x
50
 
    if _QUOTE_RE.search(f):
51
 
        return '"' + f + '"'
52
 
    else:
53
 
        return f
 
40
    """Return shell-quoted filename"""
 
41
    ## We could be a bit more terse by using double-quotes etc
 
42
    f = _QUOTE_RE.sub(r'\\\1', f)
 
43
    if f[0] == '~':
 
44
        f[0:1] = r'\~' 
 
45
    return f
54
46
 
55
47
 
56
48
def file_kind(f):
62
54
    elif S_ISLNK(mode):
63
55
        return 'symlink'
64
56
    else:
65
 
        raise BzrError("can't handle file kind with mode %o of %r" % (mode, f))
66
 
 
67
 
 
68
 
def kind_marker(kind):
69
 
    if kind == 'file':
70
 
        return ''
71
 
    elif kind == 'directory':
72
 
        return '/'
73
 
    elif kind == 'symlink':
74
 
        return '@'
75
 
    else:
76
 
        raise BzrError('invalid file kind %r' % kind)
77
 
 
78
 
 
79
 
 
80
 
def backup_file(fn):
81
 
    """Copy a file to a backup.
82
 
 
83
 
    Backups are named in GNU-style, with a ~ suffix.
84
 
 
85
 
    If the file is already a backup, it's not copied.
86
 
    """
87
 
    import os
88
 
    if fn[-1] == '~':
89
 
        return
90
 
    bfn = fn + '~'
91
 
 
92
 
    inf = file(fn, 'rb')
93
 
    try:
94
 
        content = inf.read()
95
 
    finally:
96
 
        inf.close()
97
 
    
98
 
    outf = file(bfn, 'wb')
99
 
    try:
100
 
        outf.write(content)
101
 
    finally:
102
 
        outf.close()
103
 
 
104
 
def rename(path_from, path_to):
105
 
    """Basically the same as os.rename() just special for win32"""
106
 
    if sys.platform == 'win32':
107
 
        try:
108
 
            os.remove(path_to)
109
 
        except OSError, e:
110
 
            if e.errno != e.ENOENT:
111
 
                raise
112
 
    os.rename(path_from, path_to)
113
 
 
114
 
 
 
57
        bailout("can't handle file kind with mode %o of %r" % (mode, f)) 
115
58
 
116
59
 
117
60
 
132
75
        return False
133
76
 
134
77
 
135
 
def is_inside(dir, fname):
136
 
    """True if fname is inside dir.
137
 
    
138
 
    The parameters should typically be passed to os.path.normpath first, so
139
 
    that . and .. and repeated slashes are eliminated, and the separators
140
 
    are canonical for the platform.
141
 
    
142
 
    >>> is_inside('src', 'src/foo.c')
143
 
    True
144
 
    >>> is_inside('src', 'srccontrol')
145
 
    False
146
 
    >>> is_inside('src', 'src/a/a/a/foo.c')
147
 
    True
148
 
    >>> is_inside('foo.c', 'foo.c')
149
 
    True
150
 
    """
151
 
    # XXX: Most callers of this can actually do something smarter by 
152
 
    # looking at the inventory
153
 
 
154
 
    if dir == fname:
155
 
        return True
156
 
    
157
 
    if dir[-1] != os.sep:
158
 
        dir += os.sep
159
 
    
160
 
    return fname.startswith(dir)
161
 
 
162
 
 
163
 
def is_inside_any(dir_list, fname):
164
 
    """True if fname is inside any of given dirs."""
165
 
    for dirname in dir_list:
166
 
        if is_inside(dirname, fname):
167
 
            return True
168
 
    else:
169
 
        return False
170
 
 
171
 
 
172
78
def pumpfile(fromfile, tofile):
173
79
    """Copy contents of one file to another."""
174
80
    tofile.write(fromfile.read())
176
82
 
177
83
def uuid():
178
84
    """Return a new UUID"""
179
 
    try:
180
 
        return file('/proc/sys/kernel/random/uuid').readline().rstrip('\n')
181
 
    except IOError:
182
 
        return chomp(os.popen('uuidgen').readline())
 
85
    
 
86
    ## XXX: Could alternatively read /proc/sys/kernel/random/uuid on
 
87
    ## Linux, but we need something portable for other systems;
 
88
    ## preferably an implementation in Python.
 
89
    bailout('uuids not allowed!')
 
90
    return chomp(os.popen('uuidgen').readline())
 
91
 
 
92
def chomp(s):
 
93
    if s and (s[-1] == '\n'):
 
94
        return s[:-1]
 
95
    else:
 
96
        return s
183
97
 
184
98
 
185
99
def sha_file(f):
186
100
    import sha
 
101
    ## TODO: Maybe read in chunks to handle big files
187
102
    if hasattr(f, 'tell'):
188
103
        assert f.tell() == 0
189
104
    s = sha.new()
190
 
    BUFSIZE = 128<<10
191
 
    while True:
192
 
        b = f.read(BUFSIZE)
193
 
        if not b:
194
 
            break
195
 
        s.update(b)
 
105
    s.update(f.read())
196
106
    return s.hexdigest()
197
107
 
198
108
 
204
114
 
205
115
 
206
116
 
207
 
def fingerprint_file(f):
208
 
    import sha
209
 
    s = sha.new()
210
 
    b = f.read()
211
 
    s.update(b)
212
 
    size = len(b)
213
 
    return {'size': size,
214
 
            'sha1': s.hexdigest()}
215
 
 
216
 
 
217
 
def config_dir():
218
 
    """Return per-user configuration directory.
219
 
 
220
 
    By default this is ~/.bzr.conf/
221
 
    
222
 
    TODO: Global option --config-dir to override this.
223
 
    """
224
 
    return os.path.expanduser("~/.bzr.conf")
225
 
 
226
 
 
227
 
def _auto_user_id():
228
 
    """Calculate automatic user identification.
229
 
 
230
 
    Returns (realname, email).
231
 
 
232
 
    Only used when none is set in the environment or the id file.
233
 
 
234
 
    This previously used the FQDN as the default domain, but that can
235
 
    be very slow on machines where DNS is broken.  So now we simply
236
 
    use the hostname.
237
 
    """
 
117
def username():
 
118
    """Return email-style username.
 
119
 
 
120
    Something similar to 'Martin Pool <mbp@sourcefrog.net>'
 
121
 
 
122
    :todo: Check it's reasonably well-formed.
 
123
 
 
124
    :todo: Allow taking it from a dotfile to help people on windows
 
125
           who can't easily set variables.
 
126
 
 
127
    :todo: Cope without pwd module, which is only on unix. 
 
128
    """
 
129
    e = os.environ.get('BZREMAIL') or os.environ.get('EMAIL')
 
130
    if e: return e
 
131
 
238
132
    import socket
239
 
 
240
 
    # XXX: Any good way to get real user name on win32?
241
 
 
 
133
    
242
134
    try:
243
135
        import pwd
244
136
        uid = os.getuid()
245
137
        w = pwd.getpwuid(uid)
246
 
        gecos = w.pw_gecos.decode(bzrlib.user_encoding)
247
 
        username = w.pw_name.decode(bzrlib.user_encoding)
 
138
        gecos = w.pw_gecos
248
139
        comma = gecos.find(',')
249
140
        if comma == -1:
250
141
            realname = gecos
251
142
        else:
252
143
            realname = gecos[:comma]
253
 
        if not realname:
254
 
            realname = username
255
 
 
 
144
        return '%s <%s@%s>' % (realname, w.pw_name, socket.getfqdn())
256
145
    except ImportError:
257
 
        import getpass
258
 
        realname = username = getpass.getuser().decode(bzrlib.user_encoding)
259
 
 
260
 
    return realname, (username + '@' + socket.gethostname())
261
 
 
262
 
 
263
 
def _get_user_id():
264
 
    """Return the full user id from a file or environment variable.
265
 
 
266
 
    TODO: Allow taking this from a file in the branch directory too
267
 
    for per-branch ids."""
268
 
    v = os.environ.get('BZREMAIL')
269
 
    if v:
270
 
        return v.decode(bzrlib.user_encoding)
271
 
    
272
 
    try:
273
 
        return (open(os.path.join(config_dir(), "email"))
274
 
                .read()
275
 
                .decode(bzrlib.user_encoding)
276
 
                .rstrip("\r\n"))
277
 
    except IOError, e:
278
 
        if e.errno != errno.ENOENT:
279
 
            raise e
280
 
 
281
 
    v = os.environ.get('EMAIL')
282
 
    if v:
283
 
        return v.decode(bzrlib.user_encoding)
284
 
    else:    
285
 
        return None
286
 
 
287
 
 
288
 
def username():
289
 
    """Return email-style username.
290
 
 
291
 
    Something similar to 'Martin Pool <mbp@sourcefrog.net>'
292
 
 
293
 
    TODO: Check it's reasonably well-formed.
294
 
    """
295
 
    v = _get_user_id()
296
 
    if v:
297
 
        return v
298
 
    
299
 
    name, email = _auto_user_id()
300
 
    if name:
301
 
        return '%s <%s>' % (name, email)
302
 
    else:
303
 
        return email
304
 
 
305
 
 
306
 
_EMAIL_RE = re.compile(r'[\w+.-]+@[\w+.-]+')
 
146
        pass
 
147
 
 
148
    import getpass, socket
 
149
    return '<%s@%s>' % (getpass.getuser(), socket.getfqdn())
 
150
 
 
151
 
307
152
def user_email():
308
153
    """Return just the email component of a username."""
309
 
    e = _get_user_id()
 
154
    e = os.environ.get('BZREMAIL') or os.environ.get('EMAIL')
310
155
    if e:
311
 
        m = _EMAIL_RE.search(e)
 
156
        import re
 
157
        m = re.search(r'[\w+.-]+@[\w+.-]+', e)
312
158
        if not m:
313
 
            raise BzrError("%r doesn't seem to contain a reasonable email address" % e)
 
159
            bailout('%r is not a reasonable email address' % e)
314
160
        return m.group(0)
315
161
 
316
 
    return _auto_user_id()[1]
 
162
 
 
163
    import getpass, socket
 
164
    return '%s@%s' % (getpass.getuser(), socket.getfqdn())
 
165
 
317
166
    
318
167
 
319
168
 
320
169
def compare_files(a, b):
321
170
    """Returns true if equal in contents"""
322
 
    BUFSIZE = 4096
323
 
    while True:
324
 
        ai = a.read(BUFSIZE)
325
 
        bi = b.read(BUFSIZE)
326
 
        if ai != bi:
327
 
            return False
328
 
        if ai == '':
329
 
            return True
 
171
    # TODO: don't read the whole thing in one go.
 
172
    result = a.read() == b.read()
 
173
    return result
330
174
 
331
175
 
332
176
 
333
177
def local_time_offset(t=None):
334
178
    """Return offset of local zone from GMT, either at present or at time t."""
335
 
    # python2.3 localtime() can't take None
336
 
    if t == None:
337
 
        t = time.time()
338
 
        
339
179
    if time.localtime(t).tm_isdst and time.daylight:
340
180
        return -time.altzone
341
181
    else:
345
185
def format_date(t, offset=0, timezone='original'):
346
186
    ## TODO: Perhaps a global option to use either universal or local time?
347
187
    ## Or perhaps just let people set $TZ?
 
188
    import time
 
189
    
348
190
    assert isinstance(t, float)
349
191
    
350
192
    if timezone == 'utc':
358
200
        tt = time.localtime(t)
359
201
        offset = local_time_offset(t)
360
202
    else:
361
 
        raise BzrError("unsupported timezone format %r",
 
203
        bailout("unsupported timezone format %r",
362
204
                ['options are "utc", "original", "local"'])
363
205
 
364
206
    return (time.strftime("%a %Y-%m-%d %H:%M:%S", tt)
377
219
 
378
220
if hasattr(os, 'urandom'): # python 2.4 and later
379
221
    rand_bytes = os.urandom
380
 
elif sys.platform == 'linux2':
381
 
    rand_bytes = file('/dev/urandom', 'rb').read
382
222
else:
383
 
    # not well seeded, but better than nothing
384
 
    def rand_bytes(n):
385
 
        import random
386
 
        s = ''
387
 
        while n:
388
 
            s += chr(random.randint(0, 255))
389
 
            n -= 1
390
 
        return s
 
223
    # FIXME: No good on non-Linux
 
224
    _rand_file = file('/dev/urandom', 'rb')
 
225
    rand_bytes = _rand_file.read
391
226
 
392
227
 
393
228
## TODO: We could later have path objects that remember their list
407
242
    >>> splitpath('a/../b')
408
243
    Traceback (most recent call last):
409
244
    ...
410
 
    BzrError: sorry, '..' not allowed in path
 
245
    BzrError: ("sorry, '..' not allowed in path", [])
411
246
    """
412
247
    assert isinstance(p, types.StringTypes)
413
 
 
414
 
    # split on either delimiter because people might use either on
415
 
    # Windows
416
 
    ps = re.split(r'[\\/]', p)
417
 
 
418
 
    rps = []
 
248
    ps = [f for f in p.split('/') if f != '.']
419
249
    for f in ps:
420
250
        if f == '..':
421
 
            raise BzrError("sorry, %r not allowed in path" % f)
422
 
        elif (f == '.') or (f == ''):
423
 
            pass
424
 
        else:
425
 
            rps.append(f)
426
 
    return rps
 
251
            bailout("sorry, %r not allowed in path" % f)
 
252
    return ps
427
253
 
428
254
def joinpath(p):
429
255
    assert isinstance(p, list)
430
256
    for f in p:
431
 
        if (f == '..') or (f == None) or (f == ''):
432
 
            raise BzrError("sorry, %r not allowed in path" % f)
433
 
    return os.path.join(*p)
 
257
        if (f == '..') or (f is None) or (f == ''):
 
258
            bailout("sorry, %r not allowed in path" % f)
 
259
    return '/'.join(p)
434
260
 
435
261
 
436
262
def appendpath(p1, p2):
437
263
    if p1 == '':
438
264
        return p2
439
265
    else:
440
 
        return os.path.join(p1, p2)
 
266
        return p1 + '/' + p2
441
267
    
442
268
 
443
269
def extern_command(cmd, ignore_errors = False):
444
270
    mutter('external command: %s' % `cmd`)
445
271
    if os.system(cmd):
446
272
        if not ignore_errors:
447
 
            raise BzrError('command failed')
448
 
 
449
 
 
450
 
def _read_config_value(name):
451
 
    """Read a config value from the file ~/.bzr.conf/<name>
452
 
    Return None if the file does not exist"""
453
 
    try:
454
 
        f = file(os.path.join(config_dir(), name), "r")
455
 
        return f.read().decode(bzrlib.user_encoding).rstrip("\r\n")
456
 
    except IOError, e:
457
 
        if e.errno == errno.ENOENT:
458
 
            return None
459
 
        raise
460
 
 
461
 
 
462
 
def _get_editor():
463
 
    """Return a sequence of possible editor binaries for the current platform"""
464
 
    e = _read_config_value("editor")
465
 
    if e is not None:
466
 
        yield e
467
 
        
468
 
    if os.name == "windows":
469
 
        yield "notepad.exe"
470
 
    elif os.name == "posix":
471
 
        try:
472
 
            yield os.environ["EDITOR"]
473
 
        except KeyError:
474
 
            yield "/usr/bin/vi"
475
 
 
476
 
 
477
 
def _run_editor(filename):
478
 
    """Try to execute an editor to edit the commit message. Returns True on success,
479
 
    False on failure"""
480
 
    for e in _get_editor():
481
 
        x = os.spawnvp(os.P_WAIT, e, (e, filename))
482
 
        if x == 0:
483
 
            return True
484
 
        elif x == 127:
485
 
            continue
486
 
        else:
487
 
            break
488
 
    raise BzrError("Could not start any editor. Please specify $EDITOR or use ~/.bzr.conf/editor")
489
 
    return False
490
 
                          
491
 
 
492
 
def get_text_message(infotext, ignoreline = "default"):
493
 
    import tempfile
494
 
    
495
 
    if ignoreline == "default":
496
 
        ignoreline = "-- This line and the following will be ignored --"
497
 
        
498
 
    try:
499
 
        tmp_fileno, msgfilename = tempfile.mkstemp()
500
 
        msgfile = os.close(tmp_fileno)
501
 
        if infotext is not None and infotext != "":
502
 
            hasinfo = True
503
 
            msgfile = file(msgfilename, "w")
504
 
            msgfile.write("\n\n%s\n\n%s" % (ignoreline, infotext))
505
 
            msgfile.close()
506
 
        else:
507
 
            hasinfo = False
508
 
 
509
 
        if not _run_editor(msgfilename):
510
 
            return None
511
 
        
512
 
        started = False
513
 
        msg = []
514
 
        lastline, nlines = 0, 0
515
 
        for line in file(msgfilename, "r"):
516
 
            stripped_line = line.strip()
517
 
            # strip empty line before the log message starts
518
 
            if not started:
519
 
                if stripped_line != "":
520
 
                    started = True
521
 
                else:
522
 
                    continue
523
 
            # check for the ignore line only if there
524
 
            # is additional information at the end
525
 
            if hasinfo and stripped_line == ignoreline:
526
 
                break
527
 
            nlines += 1
528
 
            # keep track of the last line that had some content
529
 
            if stripped_line != "":
530
 
                lastline = nlines
531
 
            msg.append(line)
532
 
            
533
 
        if len(msg) == 0:
534
 
            return None
535
 
        # delete empty lines at the end
536
 
        del msg[lastline:]
537
 
        # add a newline at the end, if needed
538
 
        if not msg[-1].endswith("\n"):
539
 
            return "%s%s" % ("".join(msg), "\n")
540
 
        else:
541
 
            return "".join(msg)
542
 
    finally:
543
 
        # delete the msg file in any case
544
 
        try: os.unlink(msgfilename)
545
 
        except IOError: pass
 
273
            bailout('command failed')
 
274