~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/osutils.py

(vila) Provide a config section matcher respecting the file order. (Vincent
 Ladeuil)

Show diffs side-by-side

added added

removed removed

Lines of Context:
28
28
lazy_import(globals(), """
29
29
from datetime import datetime
30
30
import getpass
 
31
import locale
31
32
import ntpath
32
33
import posixpath
33
34
import select
54
55
""")
55
56
 
56
57
from bzrlib.symbol_versioning import (
 
58
    DEPRECATED_PARAMETER,
57
59
    deprecated_function,
58
60
    deprecated_in,
 
61
    deprecated_passed,
 
62
    warn as warn_deprecated,
59
63
    )
60
64
 
61
65
from hashlib import (
945
949
    return os.fstat(f.fileno())[stat.ST_SIZE]
946
950
 
947
951
 
948
 
# Define rand_bytes based on platform.
949
 
try:
950
 
    # Python 2.4 and later have os.urandom,
951
 
    # but it doesn't work on some arches
952
 
    os.urandom(1)
953
 
    rand_bytes = os.urandom
954
 
except (NotImplementedError, AttributeError):
955
 
    # If python doesn't have os.urandom, or it doesn't work,
956
 
    # then try to first pull random data from /dev/urandom
 
952
# Alias os.urandom to support platforms (which?) without /dev/urandom and 
 
953
# override if it doesn't work. Avoid checking on windows where there is
 
954
# significant initialisation cost that can be avoided for some bzr calls.
 
955
 
 
956
rand_bytes = os.urandom
 
957
 
 
958
if rand_bytes.__module__ != "nt":
957
959
    try:
958
 
        rand_bytes = file('/dev/urandom', 'rb').read
959
 
    # Otherwise, use this hack as a last resort
960
 
    except (IOError, OSError):
 
960
        rand_bytes(1)
 
961
    except NotImplementedError:
961
962
        # not well seeded, but better than nothing
962
963
        def rand_bytes(n):
963
964
            import random
1979
1980
_cached_user_encoding = None
1980
1981
 
1981
1982
 
1982
 
def get_user_encoding(use_cache=True):
 
1983
def get_user_encoding(use_cache=DEPRECATED_PARAMETER):
1983
1984
    """Find out what the preferred user encoding is.
1984
1985
 
1985
1986
    This is generally the encoding that is used for command line parameters
1986
1987
    and file contents. This may be different from the terminal encoding
1987
1988
    or the filesystem encoding.
1988
1989
 
1989
 
    :param  use_cache:  Enable cache for detected encoding.
1990
 
                        (This parameter is turned on by default,
1991
 
                        and required only for selftesting)
1992
 
 
1993
1990
    :return: A string defining the preferred user encoding
1994
1991
    """
1995
1992
    global _cached_user_encoding
1996
 
    if _cached_user_encoding is not None and use_cache:
 
1993
    if deprecated_passed(use_cache):
 
1994
        warn_deprecated("use_cache should only have been used for tests",
 
1995
            DeprecationWarning, stacklevel=2) 
 
1996
    if _cached_user_encoding is not None:
1997
1997
        return _cached_user_encoding
1998
1998
 
1999
 
    if sys.platform == 'darwin':
2000
 
        # python locale.getpreferredencoding() always return
2001
 
        # 'mac-roman' on darwin. That's a lie.
2002
 
        sys.platform = 'posix'
2003
 
        try:
2004
 
            if os.environ.get('LANG', None) is None:
2005
 
                # If LANG is not set, we end up with 'ascii', which is bad
2006
 
                # ('mac-roman' is more than ascii), so we set a default which
2007
 
                # will give us UTF-8 (which appears to work in all cases on
2008
 
                # OSX). Users are still free to override LANG of course, as
2009
 
                # long as it give us something meaningful. This work-around
2010
 
                # *may* not be needed with python 3k and/or OSX 10.5, but will
2011
 
                # work with them too -- vila 20080908
2012
 
                os.environ['LANG'] = 'en_US.UTF-8'
2013
 
            import locale
2014
 
        finally:
2015
 
            sys.platform = 'darwin'
 
1999
    if os.name == 'posix' and getattr(locale, 'CODESET', None) is not None:
 
2000
        # Use the existing locale settings and call nl_langinfo directly
 
2001
        # rather than going through getpreferredencoding. This avoids
 
2002
        # <http://bugs.python.org/issue6202> on OSX Python 2.6 and the
 
2003
        # possibility of the setlocale call throwing an error.
 
2004
        user_encoding = locale.nl_langinfo(locale.CODESET)
2016
2005
    else:
2017
 
        import locale
 
2006
        # GZ 2011-12-19: On windows could call GetACP directly instead.
 
2007
        user_encoding = locale.getpreferredencoding(False)
2018
2008
 
2019
2009
    try:
2020
 
        user_encoding = locale.getpreferredencoding()
2021
 
    except locale.Error, e:
2022
 
        sys.stderr.write('bzr: warning: %s\n'
2023
 
                         '  Could not determine what text encoding to use.\n'
2024
 
                         '  This error usually means your Python interpreter\n'
2025
 
                         '  doesn\'t support the locale set by $LANG (%s)\n'
2026
 
                         "  Continuing with ascii encoding.\n"
2027
 
                         % (e, os.environ.get('LANG')))
2028
 
        user_encoding = 'ascii'
2029
 
 
2030
 
    # Windows returns 'cp0' to indicate there is no code page. So we'll just
2031
 
    # treat that as ASCII, and not support printing unicode characters to the
2032
 
    # console.
2033
 
    #
2034
 
    # For python scripts run under vim, we get '', so also treat that as ASCII
2035
 
    if user_encoding in (None, 'cp0', ''):
2036
 
        user_encoding = 'ascii'
2037
 
    else:
2038
 
        # check encoding
2039
 
        try:
2040
 
            codecs.lookup(user_encoding)
2041
 
        except LookupError:
 
2010
        user_encoding = codecs.lookup(user_encoding).name
 
2011
    except LookupError:
 
2012
        if user_encoding not in ("", "cp0"):
2042
2013
            sys.stderr.write('bzr: warning:'
2043
2014
                             ' unknown encoding %s.'
2044
2015
                             ' Continuing with ascii encoding.\n'
2045
2016
                             % user_encoding
2046
2017
                            )
2047
 
            user_encoding = 'ascii'
2048
 
 
2049
 
    if use_cache:
2050
 
        _cached_user_encoding = user_encoding
2051
 
 
 
2018
        user_encoding = 'ascii'
 
2019
    else:
 
2020
        # Get 'ascii' when setlocale has not been called or LANG=C or unset.
 
2021
        if user_encoding == 'ascii':
 
2022
            if sys.platform == 'darwin':
 
2023
                # OSX is special-cased in Python to have a UTF-8 filesystem
 
2024
                # encoding and previously had LANG set here if not present.
 
2025
                user_encoding = 'utf-8'
 
2026
            # GZ 2011-12-19: Maybe UTF-8 should be the default in this case
 
2027
            #                for some other posix platforms as well.
 
2028
 
 
2029
    _cached_user_encoding = user_encoding
2052
2030
    return user_encoding
2053
2031
 
2054
2032
 
2056
2034
    return get_terminal_encoding()
2057
2035
 
2058
2036
 
2059
 
_message_encoding = None
2060
 
 
2061
 
 
2062
 
def get_message_encoding():
2063
 
    """Return the encoding used for messages
2064
 
 
2065
 
    While the message encoding is a general setting it should usually only be
2066
 
    needed for decoding system error strings such as from OSError instances.
2067
 
    """
2068
 
    global _message_encoding
2069
 
    if _message_encoding is None:
2070
 
        if os.name == "posix":
2071
 
            import locale
2072
 
            # This is a process-global setting that can change, but should in
2073
 
            # general just get set once at process startup then be constant.
2074
 
            _message_encoding = locale.getlocale(locale.LC_MESSAGES)[1]
2075
 
        else:
2076
 
            # On windows want the result of GetACP() which this boils down to.
2077
 
            _message_encoding = get_user_encoding()
2078
 
    return _message_encoding or "ascii"
2079
 
        
2080
 
 
2081
2037
def get_host_name():
2082
2038
    """Return the current unicode host name.
2083
2039
 
2085
2041
    behaves inconsistently on different platforms.
2086
2042
    """
2087
2043
    if sys.platform == "win32":
2088
 
        import win32utils
2089
2044
        return win32utils.get_host_name()
2090
2045
    else:
2091
2046
        import socket