~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to doc/developers/gc.txt

  • Committer: Vincent Ladeuil
  • Date: 2008-01-29 15:16:31 UTC
  • mto: (3206.1.1 trunk)
  • mto: This revision was merged to the branch mainline in revision 3207.
  • Revision ID: v.ladeuil+lp@free.fr-20080129151631-vqjd13tb405mobx6
Fix two more leaking tmp dirs, by reworking TransformPreview lock handling.

* bzrlib/tests/test_transform.py:
(TestTransformMerge): Revert previous patch and cleanly call
preview.finalize now that we can.

* bzrlib/tests/test_merge.py:
(TestMerge.test_make_preview_transform): Catch TransformPreview
leak.

* bzrlib/builtins.py:
(cmd_merge._do_preview): Finalize the TransformPreview or the
limbodir will stay in /tmp.

* bzrlib/transform.py:
(TreeTransformBase.__init__): Create the _deletiondir since it's
reffered to by finalize.
(TreeTransformBase.finalize): Delete the dir only if _deletiondir
is set.
(TreeTransform.__init__): Use a temp var for deletiondir and set
the attribute after the base class __init__ has been called.
(TransformPreview.__init__): Read locks the tree since finalize
wants to unlock it (as suggested by Aaron).

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
Garbage Collection
 
2
==================
 
3
 
 
4
Garbage collection is used to remove data from a repository that is no longer referenced.
 
5
 
 
6
Generally this involves locking the repository and scanning all its branches
 
7
then generating a new repository with less data.
 
8
 
 
9
Least work we can hope to perform
 
10
---------------------------------
 
11
 
 
12
* Read all branches to get initial references - tips + tags.
 
13
* Read through the revision graph to find unreferenced revisions. A cheap HEADS
 
14
  list might help here by allowing comparison of the initial references to the
 
15
  HEADS - any unreferenced head is garbage.
 
16
* Walk out via inventory deltas to get the full set of texts and signatures to preserve.
 
17
* Copy to a new repository
 
18
* Bait and switch back to the original
 
19
* Remove the old repository.
 
20
 
 
21
A possibility to reduce this would be to have a set of grouped 'known garbage
 
22
free' data - 'ancient history' which can be preserved in total should its HEADS
 
23
be fully referenced - and where the HEADS list is deliberate cheap (e.g. at the
 
24
top of some index).
 
25
 
 
26
possibly - null data in place without saving size.