~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to doc/developers/gc.txt

  • Committer: Vincent Ladeuil
  • Date: 2009-06-05 07:24:41 UTC
  • mto: (4413.2.1 trunk)
  • mto: This revision was merged to the branch mainline in revision 4415.
  • Revision ID: v.ladeuil+lp@free.fr-20090605072441-r2sanvt1wmz1b3jx
Fix some OSX test regressions (well actual test bugs indeed).

* bzrlib/tests/test_plugins.py:
(TestPluginPaths.test_get_standard_plugins_path): Fix parameter
order.

* bzrlib/tests/__init__.py:
(TestUIFactory.note): Delete unused kwargs. Check args to avoid
trying to expanse formats that contain '%' chars.

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
Garbage Collection
 
2
==================
 
3
 
 
4
Garbage collection is used to remove data from a repository that is no longer referenced.
 
5
 
 
6
Generally this involves locking the repository and scanning all its branches
 
7
then generating a new repository with less data.
 
8
 
 
9
Least work we can hope to perform
 
10
---------------------------------
 
11
 
 
12
* Read all branches to get initial references - tips + tags.
 
13
* Read through the revision graph to find unreferenced revisions. A cheap HEADS
 
14
  list might help here by allowing comparison of the initial references to the
 
15
  HEADS - any unreferenced head is garbage.
 
16
* Walk out via inventory deltas to get the full set of texts and signatures to preserve.
 
17
* Copy to a new repository
 
18
* Bait and switch back to the original
 
19
* Remove the old repository.
 
20
 
 
21
A possibility to reduce this would be to have a set of grouped 'known garbage
 
22
free' data - 'ancient history' which can be preserved in total should its HEADS
 
23
be fully referenced - and where the HEADS list is deliberate cheap (e.g. at the
 
24
top of some index).
 
25
 
 
26
possibly - null data in place without saving size.