~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/_dirstate_helpers_py.py

  • Committer: Vincent Ladeuil
  • Date: 2017-01-17 15:02:46 UTC
  • mto: (6619.1.2 trunk)
  • mto: This revision was merged to the branch mainline in revision 6620.
  • Revision ID: v.ladeuil+lp@free.fr-20170117150246-ajkli2g5lh94s2c4
Fix test failure for recent versions of diff

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
# Copyright (C) 2007, 2008 Canonical Ltd
 
2
#
 
3
# This program is free software; you can redistribute it and/or modify
 
4
# it under the terms of the GNU General Public License as published by
 
5
# the Free Software Foundation; either version 2 of the License, or
 
6
# (at your option) any later version.
 
7
#
 
8
# This program is distributed in the hope that it will be useful,
 
9
# but WITHOUT ANY WARRANTY; without even the implied warranty of
 
10
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
11
# GNU General Public License for more details.
 
12
#
 
13
# You should have received a copy of the GNU General Public License
 
14
# along with this program; if not, write to the Free Software
 
15
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
 
16
 
 
17
"""Python implementations of Dirstate Helper functions."""
 
18
 
 
19
from __future__ import absolute_import
 
20
 
 
21
import binascii
 
22
import os
 
23
import struct
 
24
 
 
25
# We cannot import the dirstate module, because it loads this module
 
26
# All we really need is the IN_MEMORY_MODIFIED constant
 
27
from bzrlib import errors
 
28
from bzrlib.dirstate import DirState
 
29
 
 
30
 
 
31
def pack_stat(st, _b64=binascii.b2a_base64, _pack=struct.Struct('>6L').pack):
 
32
    """Convert stat values into a packed representation
 
33
 
 
34
    Not all of the fields from the stat included are strictly needed, and by
 
35
    just encoding the mtime and mode a slight speed increase could be gained.
 
36
    However, using the pyrex version instead is a bigger win.
 
37
    """
 
38
    # base64 encoding always adds a final newline, so strip it off
 
39
    return _b64(_pack(st.st_size & 0xFFFFFFFF, int(st.st_mtime) & 0xFFFFFFFF,
 
40
        int(st.st_ctime) & 0xFFFFFFFF, st.st_dev & 0xFFFFFFFF,
 
41
        st.st_ino & 0xFFFFFFFF, st.st_mode))[:-1]
 
42
 
 
43
 
 
44
def _unpack_stat(packed_stat):
 
45
    """Turn a packed_stat back into the stat fields.
 
46
 
 
47
    This is meant as a debugging tool, should not be used in real code.
 
48
    """
 
49
    (st_size, st_mtime, st_ctime, st_dev, st_ino,
 
50
     st_mode) = struct.unpack('>6L', binascii.a2b_base64(packed_stat))
 
51
    return dict(st_size=st_size, st_mtime=st_mtime, st_ctime=st_ctime,
 
52
                st_dev=st_dev, st_ino=st_ino, st_mode=st_mode)
 
53
 
 
54
 
 
55
def _bisect_path_left(paths, path):
 
56
    """Return the index where to insert path into paths.
 
57
 
 
58
    This uses the dirblock sorting. So all children in a directory come before
 
59
    the children of children. For example::
 
60
 
 
61
        a/
 
62
          b/
 
63
            c
 
64
          d/
 
65
            e
 
66
          b-c
 
67
          d-e
 
68
        a-a
 
69
        a=c
 
70
 
 
71
    Will be sorted as::
 
72
 
 
73
        a
 
74
        a-a
 
75
        a=c
 
76
        a/b
 
77
        a/b-c
 
78
        a/d
 
79
        a/d-e
 
80
        a/b/c
 
81
        a/d/e
 
82
 
 
83
    :param paths: A list of paths to search through
 
84
    :param path: A single path to insert
 
85
    :return: An offset where 'path' can be inserted.
 
86
    :seealso: bisect.bisect_left
 
87
    """
 
88
    hi = len(paths)
 
89
    lo = 0
 
90
    while lo < hi:
 
91
        mid = (lo + hi) // 2
 
92
        # Grab the dirname for the current dirblock
 
93
        cur = paths[mid]
 
94
        if _cmp_path_by_dirblock(cur, path) < 0:
 
95
            lo = mid + 1
 
96
        else:
 
97
            hi = mid
 
98
    return lo
 
99
 
 
100
 
 
101
def _bisect_path_right(paths, path):
 
102
    """Return the index where to insert path into paths.
 
103
 
 
104
    This uses a path-wise comparison so we get::
 
105
        a
 
106
        a-b
 
107
        a=b
 
108
        a/b
 
109
    Rather than::
 
110
        a
 
111
        a-b
 
112
        a/b
 
113
        a=b
 
114
    :param paths: A list of paths to search through
 
115
    :param path: A single path to insert
 
116
    :return: An offset where 'path' can be inserted.
 
117
    :seealso: bisect.bisect_right
 
118
    """
 
119
    hi = len(paths)
 
120
    lo = 0
 
121
    while lo < hi:
 
122
        mid = (lo+hi)//2
 
123
        # Grab the dirname for the current dirblock
 
124
        cur = paths[mid]
 
125
        if _cmp_path_by_dirblock(path, cur) < 0:
 
126
            hi = mid
 
127
        else:
 
128
            lo = mid + 1
 
129
    return lo
 
130
 
 
131
 
 
132
def bisect_dirblock(dirblocks, dirname, lo=0, hi=None, cache={}):
 
133
    """Return the index where to insert dirname into the dirblocks.
 
134
 
 
135
    The return value idx is such that all directories blocks in dirblock[:idx]
 
136
    have names < dirname, and all blocks in dirblock[idx:] have names >=
 
137
    dirname.
 
138
 
 
139
    Optional args lo (default 0) and hi (default len(dirblocks)) bound the
 
140
    slice of a to be searched.
 
141
    """
 
142
    if hi is None:
 
143
        hi = len(dirblocks)
 
144
    try:
 
145
        dirname_split = cache[dirname]
 
146
    except KeyError:
 
147
        dirname_split = dirname.split('/')
 
148
        cache[dirname] = dirname_split
 
149
    while lo < hi:
 
150
        mid = (lo + hi) // 2
 
151
        # Grab the dirname for the current dirblock
 
152
        cur = dirblocks[mid][0]
 
153
        try:
 
154
            cur_split = cache[cur]
 
155
        except KeyError:
 
156
            cur_split = cur.split('/')
 
157
            cache[cur] = cur_split
 
158
        if cur_split < dirname_split: lo = mid + 1
 
159
        else: hi = mid
 
160
    return lo
 
161
 
 
162
 
 
163
def cmp_by_dirs(path1, path2):
 
164
    """Compare two paths directory by directory.
 
165
 
 
166
    This is equivalent to doing::
 
167
 
 
168
       cmp(path1.split('/'), path2.split('/'))
 
169
 
 
170
    The idea is that you should compare path components separately. This
 
171
    differs from plain ``cmp(path1, path2)`` for paths like ``'a-b'`` and
 
172
    ``a/b``. "a-b" comes after "a" but would come before "a/b" lexically.
 
173
 
 
174
    :param path1: first path
 
175
    :param path2: second path
 
176
    :return: negative number if ``path1`` comes first,
 
177
        0 if paths are equal,
 
178
        and positive number if ``path2`` sorts first
 
179
    """
 
180
    if not isinstance(path1, str):
 
181
        raise TypeError("'path1' must be a plain string, not %s: %r"
 
182
                        % (type(path1), path1))
 
183
    if not isinstance(path2, str):
 
184
        raise TypeError("'path2' must be a plain string, not %s: %r"
 
185
                        % (type(path2), path2))
 
186
    return cmp(path1.split('/'), path2.split('/'))
 
187
 
 
188
 
 
189
def _cmp_path_by_dirblock(path1, path2):
 
190
    """Compare two paths based on what directory they are in.
 
191
 
 
192
    This generates a sort order, such that all children of a directory are
 
193
    sorted together, and grandchildren are in the same order as the
 
194
    children appear. But all grandchildren come after all children.
 
195
 
 
196
    :param path1: first path
 
197
    :param path2: the second path
 
198
    :return: negative number if ``path1`` comes first,
 
199
        0 if paths are equal
 
200
        and a positive number if ``path2`` sorts first
 
201
    """
 
202
    if not isinstance(path1, str):
 
203
        raise TypeError("'path1' must be a plain string, not %s: %r"
 
204
                        % (type(path1), path1))
 
205
    if not isinstance(path2, str):
 
206
        raise TypeError("'path2' must be a plain string, not %s: %r"
 
207
                        % (type(path2), path2))
 
208
    dirname1, basename1 = os.path.split(path1)
 
209
    key1 = (dirname1.split('/'), basename1)
 
210
    dirname2, basename2 = os.path.split(path2)
 
211
    key2 = (dirname2.split('/'), basename2)
 
212
    return cmp(key1, key2)
 
213
 
 
214
 
 
215
def _read_dirblocks(state):
 
216
    """Read in the dirblocks for the given DirState object.
 
217
 
 
218
    This is tightly bound to the DirState internal representation. It should be
 
219
    thought of as a member function, which is only separated out so that we can
 
220
    re-write it in pyrex.
 
221
 
 
222
    :param state: A DirState object.
 
223
    :return: None
 
224
    """
 
225
    state._state_file.seek(state._end_of_header)
 
226
    text = state._state_file.read()
 
227
    # TODO: check the crc checksums. crc_measured = zlib.crc32(text)
 
228
 
 
229
    fields = text.split('\0')
 
230
    # Remove the last blank entry
 
231
    trailing = fields.pop()
 
232
    if trailing != '':
 
233
        raise errors.DirstateCorrupt(state,
 
234
            'trailing garbage: %r' % (trailing,))
 
235
    # consider turning fields into a tuple.
 
236
 
 
237
    # skip the first field which is the trailing null from the header.
 
238
    cur = 1
 
239
    # Each line now has an extra '\n' field which is not used
 
240
    # so we just skip over it
 
241
    # entry size:
 
242
    #  3 fields for the key
 
243
    #  + number of fields per tree_data (5) * tree count
 
244
    #  + newline
 
245
    num_present_parents = state._num_present_parents()
 
246
    tree_count = 1 + num_present_parents
 
247
    entry_size = state._fields_per_entry()
 
248
    expected_field_count = entry_size * state._num_entries
 
249
    field_count = len(fields)
 
250
    # this checks our adjustment, and also catches file too short.
 
251
    if field_count - cur != expected_field_count:
 
252
        raise errors.DirstateCorrupt(state,
 
253
            'field count incorrect %s != %s, entry_size=%s, '\
 
254
            'num_entries=%s fields=%r' % (
 
255
            field_count - cur, expected_field_count, entry_size,
 
256
            state._num_entries, fields))
 
257
 
 
258
    if num_present_parents == 1:
 
259
        # Bind external functions to local names
 
260
        _int = int
 
261
        # We access all fields in order, so we can just iterate over
 
262
        # them. Grab an straight iterator over the fields. (We use an
 
263
        # iterator because we don't want to do a lot of additions, nor
 
264
        # do we want to do a lot of slicing)
 
265
        next = iter(fields).next
 
266
        # Move the iterator to the current position
 
267
        for x in xrange(cur):
 
268
            next()
 
269
        # The two blocks here are deliberate: the root block and the
 
270
        # contents-of-root block.
 
271
        state._dirblocks = [('', []), ('', [])]
 
272
        current_block = state._dirblocks[0][1]
 
273
        current_dirname = ''
 
274
        append_entry = current_block.append
 
275
        for count in xrange(state._num_entries):
 
276
            dirname = next()
 
277
            name = next()
 
278
            file_id = next()
 
279
            if dirname != current_dirname:
 
280
                # new block - different dirname
 
281
                current_block = []
 
282
                current_dirname = dirname
 
283
                state._dirblocks.append((current_dirname, current_block))
 
284
                append_entry = current_block.append
 
285
            # we know current_dirname == dirname, so re-use it to avoid
 
286
            # creating new strings
 
287
            entry = ((current_dirname, name, file_id),
 
288
                     [(# Current Tree
 
289
                         next(),                # minikind
 
290
                         next(),                # fingerprint
 
291
                         _int(next()),          # size
 
292
                         next() == 'y',         # executable
 
293
                         next(),                # packed_stat or revision_id
 
294
                     ),
 
295
                     ( # Parent 1
 
296
                         next(),                # minikind
 
297
                         next(),                # fingerprint
 
298
                         _int(next()),          # size
 
299
                         next() == 'y',         # executable
 
300
                         next(),                # packed_stat or revision_id
 
301
                     ),
 
302
                     ])
 
303
            trailing = next()
 
304
            if trailing != '\n':
 
305
                raise ValueError("trailing garbage in dirstate: %r" % trailing)
 
306
            # append the entry to the current block
 
307
            append_entry(entry)
 
308
        state._split_root_dirblock_into_contents()
 
309
    else:
 
310
        fields_to_entry = state._get_fields_to_entry()
 
311
        entries = [fields_to_entry(fields[pos:pos+entry_size])
 
312
                   for pos in xrange(cur, field_count, entry_size)]
 
313
        state._entries_to_current_state(entries)
 
314
    # To convert from format 2  => format 3
 
315
    # state._dirblocks = sorted(state._dirblocks,
 
316
    #                          key=lambda blk:blk[0].split('/'))
 
317
    # To convert from format 3 => format 2
 
318
    # state._dirblocks = sorted(state._dirblocks)
 
319
    state._dirblock_state = DirState.IN_MEMORY_UNMODIFIED