~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to doc/developers/gc.txt

  • Committer: Vincent Ladeuil
  • Date: 2007-06-26 20:32:49 UTC
  • mto: (2581.1.1 cleanup-runbzr)
  • mto: This revision was merged to the branch mainline in revision 2588.
  • Revision ID: v.ladeuil+lp@free.fr-20070626203249-sqm4afiai5dxofum
Deprecate the varargs syntax and fix the tests.

* bzrlib/tests/__init__.py:
(TestCase.run_bzr): Activate the deprecation warning.
(TestCase.run_bzr_error): Add error_regexes to kwargs or run_bzr
get confused.

* bzrlib/tests/blackbox/test_selftest.py:
(TestRunBzr.test_args): Activate.

* bzrlib/tests/blackbox/test_inventory.py:
(TestInventory.assertInventoryEqual): Build the command from args
if not None.

* bzrlib/tests/blackbox/test_ls.py:
(TestLS.ls_equals): Build the command from args if not None.

* bzrlib/tests/blackbox/test_remove_tree.py:
(TestRemoveTree.test_remove_tree_lightweight_checkout_explicit):
Nice catch, we were calling run_bzr instead of run_bzr_error. This
went unnoticed for some time...

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
Garbage Collection
 
2
==================
 
3
 
 
4
Garbage collection is used to remove data from a repository that is no longer referenced.
 
5
 
 
6
Generally this involves locking the repository and scanning all its branches
 
7
then generating a new repository with less data.
 
8
 
 
9
Least work we can hope to perform
 
10
---------------------------------
 
11
 
 
12
* Read all branches to get initial references - tips + tags.
 
13
* Read through the revision graph to find unreferenced revisions. A cheap HEADS
 
14
  list might help here by allowing comparison of the initial references to the
 
15
  HEADS - any unreferenced head is garbage.
 
16
* Walk out via inventory deltas to get the full set of texts and signatures to preserve.
 
17
* Copy to a new repository
 
18
* Bait and switch back to the original
 
19
* Remove the old repository.
 
20
 
 
21
A possibility to reduce this would be to have a set of grouped 'known garbage
 
22
free' data - 'ancient history' which can be preserved in total should its HEADS
 
23
be fully referenced - and where the HEADS list is deliberate cheap (e.g. at the
 
24
top of some index).
 
25
 
 
26
possibly - null data in place without saving size.