~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/delta.py

  • Committer: Michael Ellerman
  • Date: 2006-02-28 14:45:51 UTC
  • mto: (1558.1.18 Aaron's integration)
  • mto: This revision was merged to the branch mainline in revision 1586.
  • Revision ID: michael@ellerman.id.au-20060228144551-3d9941ecde4a0b0a
Update contrib/pwk for -p1 diffs from bzr

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2005, 2006 Canonical
 
1
# -*- coding: UTF-8 -*-
2
2
 
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
16
16
 
17
17
from bzrlib.inventory import InventoryEntry
18
18
from bzrlib.trace import mutter
19
 
from bzrlib import tree
20
 
 
21
19
 
22
20
class TreeDelta(object):
23
21
    """Describes changes from one tree to another.
91
89
            
92
90
 
93
91
    def show(self, to_file, show_ids=False, show_unchanged=False):
94
 
        """output this delta in status-like form to to_file."""
95
92
        def show_list(files):
96
93
            for item in files:
97
94
                path, fid, kind = item[:3]
143
140
            show_list(self.unchanged)
144
141
 
145
142
 
146
 
def compare_trees(old_tree, new_tree, want_unchanged=False, 
147
 
                  specific_files=None, extra_trees=None, 
148
 
                  require_versioned=False):
 
143
 
 
144
def compare_trees(old_tree, new_tree, want_unchanged=False, specific_files=None):
149
145
    """Describe changes from one tree to another.
150
146
 
151
147
    Returns a TreeDelta with details of added, modified, renamed, and
160
156
        the next.
161
157
 
162
158
    specific_files
163
 
        If supplied, only check for changes to specified names or
164
 
        files within them.  When mapping filenames to ids, all matches in all
165
 
        trees (including optional extra_trees) are used, and all children of
166
 
        matched directories are included.
167
 
 
168
 
    extra_trees
169
 
        If non-None, a list of more trees to use for looking up file_ids from
170
 
        paths
171
 
 
172
 
    require_versioned
173
 
        If true, an all files are required to be versioned, and
174
 
        PathsNotVersionedError will be thrown if they are not.
 
159
        If true, only check for changes to specified names or
 
160
        files within them.
175
161
    """
176
 
    # NB: show_status depends on being able to pass in non-versioned files and
177
 
    # report them as unknown
 
162
 
178
163
    old_tree.lock_read()
179
164
    try:
180
165
        new_tree.lock_read()
181
166
        try:
182
 
            trees = (new_tree, old_tree)
183
 
            if extra_trees is not None:
184
 
                trees = trees + tuple(extra_trees)
185
 
            specific_file_ids = tree.find_ids_across_trees(specific_files, 
186
 
                trees, require_versioned=require_versioned)
187
167
            return _compare_trees(old_tree, new_tree, want_unchanged,
188
 
                                  specific_file_ids)
 
168
                                  specific_files)
189
169
        finally:
190
170
            new_tree.unlock()
191
171
    finally:
192
172
        old_tree.unlock()
193
173
 
194
174
 
195
 
def _compare_trees(old_tree, new_tree, want_unchanged, specific_file_ids):
 
175
def _compare_trees(old_tree, new_tree, want_unchanged, specific_files):
196
176
 
197
177
    from osutils import is_inside_any
198
178
    
201
181
    delta = TreeDelta()
202
182
    mutter('start compare_trees')
203
183
 
204
 
    # TODO: Rather than iterating over the whole tree and then filtering, we
205
 
    # could diff just the specified files (if any) and their subtrees.  
206
 
 
207
 
    old_files = old_tree.list_files()
208
 
    new_files = new_tree.list_files()
209
 
 
210
 
    more_old = True
211
 
    more_new = True
212
 
 
213
 
    added = {}
214
 
    removed = {}
215
 
 
216
 
    def get_next(iter):
217
 
        try:
218
 
            return iter.next()
219
 
        except StopIteration:
220
 
            return None, None, None, None, None
221
 
    old_path, old_class, old_kind, old_file_id, old_entry = get_next(old_files)
222
 
    new_path, new_class, new_kind, new_file_id, new_entry = get_next(new_files)
223
 
 
224
 
 
225
 
    def check_matching(old_path, old_entry, new_path, new_entry):
226
 
        """We have matched up 2 file_ids, check for changes."""
227
 
        assert old_entry.kind == new_entry.kind
228
 
 
229
 
        if old_entry.kind == 'root_directory':
230
 
            return
231
 
 
232
 
        if specific_file_ids:
233
 
            if (old_file_id not in specific_file_ids and 
234
 
                new_file_id not in specific_file_ids):
235
 
                return
236
 
 
237
 
        # temporary hack until all entries are populated before clients 
238
 
        # get them
239
 
        old_entry._read_tree_state(old_path, old_tree)
240
 
        new_entry._read_tree_state(new_path, new_tree)
241
 
        text_modified, meta_modified = new_entry.detect_changes(old_entry)
242
 
        
243
 
        # If the name changes, or the parent_id changes, we have a rename
244
 
        # (if we move a parent, that doesn't count as a rename for the file)
245
 
        if (old_entry.name != new_entry.name 
246
 
            or old_entry.parent_id != new_entry.parent_id):
247
 
            delta.renamed.append((old_path,
248
 
                                  new_path,
249
 
                                  old_entry.file_id, old_entry.kind,
250
 
                                  text_modified, meta_modified))
251
 
        elif text_modified or meta_modified:
252
 
            delta.modified.append((new_path, new_entry.file_id, new_entry.kind,
253
 
                                   text_modified, meta_modified))
254
 
        elif want_unchanged:
255
 
            delta.unchanged.append((new_path, new_entry.file_id, new_entry.kind))
256
 
 
257
 
 
258
 
    def handle_old(path, entry):
259
 
        """old entry without a new entry match
260
 
 
261
 
        Check to see if a matching new entry was already seen as an
262
 
        added file, and switch the pair into being a rename.
263
 
        Otherwise just mark the old entry being removed.
264
 
        """
265
 
        if entry.file_id in added:
266
 
            # Actually this is a rename, we found a new file_id earlier
267
 
            # at a different location, so it is no-longer added
268
 
            x_new_path, x_new_entry = added.pop(entry.file_id)
269
 
            check_matching(path, entry, x_new_path, x_new_entry)
270
 
        else:
271
 
            # We have an old_file_id which doesn't line up with a new_file_id
272
 
            # So this file looks to be removed
273
 
            assert entry.file_id not in removed
274
 
            removed[entry.file_id] = path, entry
275
 
 
276
 
    def handle_new(path, entry):
277
 
        """new entry without an old entry match
278
 
        
279
 
        Check to see if a matching old entry was already seen as a
280
 
        removal, and change the pair into a rename.
281
 
        Otherwise just mark the new entry as an added file.
282
 
        """
283
 
        if entry.file_id in removed:
284
 
            # We saw this file_id earlier at an old different location
285
 
            # it is no longer removed, just renamed
286
 
            x_old_path, x_old_entry = removed.pop(entry.file_id)
287
 
            check_matching(x_old_path, x_old_entry, path, entry)
288
 
        else:
289
 
            # We have a new file which does not match an old file
290
 
            # mark it as added
291
 
            assert entry.file_id not in added
292
 
            added[entry.file_id] = path, entry
293
 
 
294
 
    while old_path or new_path:
295
 
        # list_files() returns files in alphabetical path sorted order
296
 
        if old_path == new_path:
297
 
            if old_file_id == new_file_id:
298
 
                # This is the common case, the files are in the same place
299
 
                # check if there were any content changes
300
 
 
301
 
                if old_file_id is None:
302
 
                    # We have 2 unversioned files, no deltas possible???
303
 
                    pass
304
 
                else:
305
 
                    check_matching(old_path, old_entry, new_path, new_entry)
306
 
            else:
307
 
                # The ids don't match, so we have to handle them both
308
 
                # separately.
309
 
                if old_file_id is not None:
310
 
                    handle_old(old_path, old_entry)
311
 
 
312
 
                if new_file_id is not None:
313
 
                    handle_new(new_path, new_entry)
314
 
 
315
 
            # The two entries were at the same path, so increment both sides
316
 
            old_path, old_class, old_kind, old_file_id, old_entry = get_next(old_files)
317
 
            new_path, new_class, new_kind, new_file_id, new_entry = get_next(new_files)
318
 
        elif new_path is None or (old_path is not None and old_path < new_path):
319
 
            # Assume we don't match, only process old_path
320
 
            if old_file_id is not None:
321
 
                handle_old(old_path, old_entry)
322
 
            # old_path came first, so increment it, trying to match up
323
 
            old_path, old_class, old_kind, old_file_id, old_entry = get_next(old_files)
324
 
        elif new_path is not None:
325
 
            # new_path came first, so increment it, trying to match up
326
 
            if new_file_id is not None:
327
 
                handle_new(new_path, new_entry)
328
 
            new_path, new_class, new_kind, new_file_id, new_entry = get_next(new_files)
329
 
 
330
 
    # Now we have a set of added and removed files, mark them all
331
 
    for old_path, old_entry in removed.itervalues():
332
 
        if specific_file_ids:
333
 
            if not old_entry.file_id in specific_file_ids:
334
 
                continue
335
 
        delta.removed.append((old_path, old_entry.file_id, old_entry.kind))
336
 
    for new_path, new_entry in added.itervalues():
337
 
        if specific_file_ids:
338
 
            if not new_entry.file_id in specific_file_ids:
339
 
                continue
340
 
        delta.added.append((new_path, new_entry.file_id, new_entry.kind))
341
 
 
 
184
    # TODO: match for specific files can be rather smarter by finding
 
185
    # the IDs of those files up front and then considering only that.
 
186
 
 
187
    for file_id in old_tree:
 
188
        if file_id in new_tree:
 
189
            old_ie = old_inv[file_id]
 
190
            new_ie = new_inv[file_id]
 
191
 
 
192
            kind = old_ie.kind
 
193
            assert kind == new_ie.kind
 
194
            
 
195
            assert kind in InventoryEntry.known_kinds, \
 
196
                   'invalid file kind %r' % kind
 
197
 
 
198
            if kind == 'root_directory':
 
199
                continue
 
200
            
 
201
            if specific_files:
 
202
                if (not is_inside_any(specific_files, old_inv.id2path(file_id)) 
 
203
                    and not is_inside_any(specific_files, new_inv.id2path(file_id))):
 
204
                    continue
 
205
 
 
206
            # temporary hack until all entries are populated before clients 
 
207
            # get them
 
208
            old_path = old_inv.id2path(file_id)
 
209
            new_path = new_inv.id2path(file_id)
 
210
            old_ie._read_tree_state(old_path, old_tree)
 
211
            new_ie._read_tree_state(new_path, new_tree)
 
212
            text_modified, meta_modified = new_ie.detect_changes(old_ie)
 
213
 
 
214
            # TODO: Can possibly avoid calculating path strings if the
 
215
            # two files are unchanged and their names and parents are
 
216
            # the same and the parents are unchanged all the way up.
 
217
            # May not be worthwhile.
 
218
            
 
219
            if (old_ie.name != new_ie.name
 
220
                or old_ie.parent_id != new_ie.parent_id):
 
221
                delta.renamed.append((old_path,
 
222
                                      new_path,
 
223
                                      file_id, kind,
 
224
                                      text_modified, meta_modified))
 
225
            elif text_modified or meta_modified:
 
226
                delta.modified.append((new_path, file_id, kind,
 
227
                                       text_modified, meta_modified))
 
228
            elif want_unchanged:
 
229
                delta.unchanged.append((new_path, file_id, kind))
 
230
        else:
 
231
            kind = old_inv.get_file_kind(file_id)
 
232
            if kind == 'root_directory':
 
233
                continue
 
234
            old_path = old_inv.id2path(file_id)
 
235
            if specific_files:
 
236
                if not is_inside_any(specific_files, old_path):
 
237
                    continue
 
238
            delta.removed.append((old_path, file_id, kind))
 
239
 
 
240
    mutter('start looking for new files')
 
241
    for file_id in new_inv:
 
242
        if file_id in old_inv or file_id not in new_tree:
 
243
            continue
 
244
        kind = new_inv.get_file_kind(file_id)
 
245
        if kind == 'root_directory':
 
246
            continue
 
247
        new_path = new_inv.id2path(file_id)
 
248
        if specific_files:
 
249
            if not is_inside_any(specific_files, new_path):
 
250
                continue
 
251
        delta.added.append((new_path, file_id, kind))
 
252
            
342
253
    delta.removed.sort()
343
254
    delta.added.sort()
344
255
    delta.renamed.sort()
345
 
    # TODO: jam 20060529 These lists shouldn't need to be sorted
346
 
    #       since we added them in alphabetical order.
347
256
    delta.modified.sort()
348
257
    delta.unchanged.sort()
349
258