~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/remotebranch.py

  • Committer: mbp at sourcefrog
  • Date: 2005-04-09 06:21:44 UTC
  • Revision ID: mbp@sourcefrog.net-20050409062144-e47a4b64106e4c21af99beaf
debugĀ output

Show diffs side-by-side

added added

removed removed

Lines of Context:
15
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
16
 
17
17
 
18
 
"""Proxy object for access to remote branches.
19
 
 
20
 
At the moment remote branches are only for HTTP and only for read
21
 
access.
22
 
"""
23
 
 
24
 
 
25
 
import gzip
 
18
## XXX: This is pretty slow on high-latency connections because it
 
19
## doesn't keep the HTTP connection alive.  If you have a smart local
 
20
## proxy it may be much better.  Eventually I want to switch to
 
21
## urlgrabber which should use HTTP much more efficiently.
 
22
 
 
23
 
 
24
import urllib2, gzip, zlib
 
25
from sets import Set
26
26
from cStringIO import StringIO
27
 
import os
28
 
import urllib2
29
 
import urlparse
30
 
 
31
 
from bzrlib.errors import BzrError, BzrCheckError
32
 
from bzrlib.branch import Branch, LocalBranch, BZR_BRANCH_FORMAT
33
 
from bzrlib.trace import mutter
34
 
from bzrlib.xml import serializer_v4
35
 
 
36
 
 
37
 
ENABLE_URLGRABBER = False
38
 
 
39
 
from bzrlib.errors import BzrError, NoSuchRevision
40
 
 
41
 
class GetFailed(BzrError):
42
 
    def __init__(self, url, status):
43
 
        BzrError.__init__(self, "Get %s failed with status %s" % (url, status))
44
 
        self.url = url
45
 
        self.status = status
46
 
 
47
 
if ENABLE_URLGRABBER:
48
 
    import util.urlgrabber
49
 
    import util.urlgrabber.keepalive
50
 
    util.urlgrabber.keepalive.DEBUG = 0
51
 
    def get_url(path, compressed=False):
52
 
        try:
53
 
            url = path
54
 
            if compressed:
55
 
                url += '.gz'
56
 
            mutter("grab url %s" % url)
57
 
            url_f = util.urlgrabber.urlopen(url, keepalive=1, close_connection=0)
58
 
            if url_f.status != 200:
59
 
                raise GetFailed(url, url_f.status)
60
 
            if not compressed:
61
 
                return url_f
62
 
            else:
63
 
                return gzip.GzipFile(fileobj=StringIO(url_f.read()))
64
 
        except urllib2.URLError, e:
65
 
            raise BzrError("remote fetch failed: %r: %s" % (url, e))
66
 
else:
67
 
    def get_url(url, compressed=False):
68
 
        import urllib2
 
27
 
 
28
from errors import BzrError
 
29
from revision import Revision
 
30
from inventory import Inventory
 
31
 
 
32
# h = HTTPConnection('localhost:8000')
 
33
# h = HTTPConnection('bazaar-ng.org')
 
34
 
 
35
# velocitynet.com.au transparently proxies connections and thereby
 
36
# breaks keep-alive -- sucks!
 
37
 
 
38
 
 
39
import urlgrabber.keepalive
 
40
urlgrabber.keepalive.DEBUG = 2
 
41
 
 
42
import urlgrabber
 
43
 
 
44
prefix = 'http://localhost:8000'
 
45
# prefix = 'http://bazaar-ng.org/bzr/main/'
 
46
 
 
47
def get_url(path, compressed=False):
 
48
    try:
 
49
        url = prefix + path
69
50
        if compressed:
70
51
            url += '.gz'
71
 
        mutter("get_url %s" % url)
72
 
        url_f = urllib2.urlopen(url)
73
 
        if compressed:
 
52
        url_f = urlgrabber.urlopen(url, keepalive=1, close_connection=0)
 
53
        if not compressed:
 
54
            return url_f
 
55
        else:
74
56
            return gzip.GzipFile(fileobj=StringIO(url_f.read()))
75
 
        else:
76
 
            return url_f
77
 
 
78
 
 
79
 
 
80
 
def _find_remote_root(url):
81
 
    """Return the prefix URL that corresponds to the branch root."""
82
 
    orig_url = url
83
 
    while True:
84
 
        try:
85
 
            fmt_url = url + '/.bzr/branch-format'
86
 
            ff = get_url(fmt_url)
87
 
            fmt = ff.read()
88
 
            ff.close()
89
 
 
90
 
            fmt = fmt.rstrip('\r\n')
91
 
            if fmt != BZR_BRANCH_FORMAT.rstrip('\r\n'):
92
 
                raise BzrError("sorry, branch format %r not supported at url %s"
93
 
                               % (fmt, url))
 
57
    except urllib2.URLError, e:
 
58
        raise BzrError("remote fetch failed: %r: %s" % (url, e))
 
59
 
 
60
 
 
61
got_invs = Set()
 
62
got_texts = Set()
 
63
 
 
64
print 'read history'
 
65
history = get_url('/.bzr/revision-history').readlines()
 
66
num_revs = len(history)
 
67
for i, rev_id in enumerate(history):
 
68
    rev_id = rev_id.rstrip()
 
69
    print 'read revision %d/%d' % (i, num_revs)
 
70
 
 
71
    # python gzip needs a seekable file (!!) but the HTTP response
 
72
    # isn't, so we need to buffer it
 
73
    
 
74
    rev_f = get_url('/.bzr/revision-store/%s' % rev_id,
 
75
                    compressed=True)
 
76
 
 
77
    rev = Revision.read_xml(rev_f)
 
78
    print rev.message
 
79
    inv_id = rev.inventory_id
 
80
    if inv_id not in got_invs:
 
81
        print 'get inventory %s' % inv_id
 
82
        inv_f = get_url('/.bzr/inventory-store/%s' % inv_id,
 
83
                        compressed=True)
 
84
        inv = Inventory.read_xml(inv_f)
 
85
        print '%4d inventory entries' % len(inv)
 
86
 
 
87
        for path, ie in inv.iter_entries():
 
88
            text_id = ie.text_id
 
89
            if text_id == None:
 
90
                continue
 
91
            if text_id in got_texts:
 
92
                continue
 
93
            print '  fetch %s text {%s}' % (path, text_id)
 
94
            text_f = get_url('/.bzr/text-store/%s' % text_id,
 
95
                             compressed=True)
 
96
            got_texts.add(text_id)
94
97
            
95
 
            return url
96
 
        except urllib2.URLError:
97
 
            pass
98
 
 
99
 
        scheme, host, path = list(urlparse.urlparse(url))[:3]
100
 
        # discard params, query, fragment
101
 
        
102
 
        # strip off one component of the path component
103
 
        idx = path.rfind('/')
104
 
        if idx == -1 or path == '/':
105
 
            raise BzrError('no branch root found for URL %s'
106
 
                           ' or enclosing directories'
107
 
                           % orig_url)
108
 
        path = path[:idx]
109
 
        url = urlparse.urlunparse((scheme, host, path, '', '', ''))
110
 
        
111
 
 
112
 
 
113
 
class RemoteBranch(LocalBranch):
114
 
    def __init__(self, baseurl, find_root=True):
115
 
        """Create new proxy for a remote branch."""
116
 
        if find_root:
117
 
            self.base = _find_remote_root(baseurl)
118
 
        else:
119
 
            self.base = baseurl
120
 
            self._check_format()
121
 
 
122
 
        self.inventory_store = RemoteStore(baseurl + '/.bzr/inventory-store/')
123
 
        self.text_store = RemoteStore(baseurl + '/.bzr/text-store/')
124
 
        self.revision_store = RemoteStore(baseurl + '/.bzr/revision-store/')
125
 
 
126
 
    def __str__(self):
127
 
        b = getattr(self, 'baseurl', 'undefined')
128
 
        return '%s(%r)' % (self.__class__.__name__, b)
129
 
 
130
 
    __repr__ = __str__
131
 
 
132
 
    def setup_caching(self, cache_root):
133
 
        """Set up cached stores located under cache_root"""
134
 
        from bzrlib.meta_store import CachedStore
135
 
        for store_name in ('inventory_store', 'text_store', 'revision_store'):
136
 
            if not isinstance(getattr(self, store_name), CachedStore):
137
 
                cache_path = os.path.join(cache_root, store_name)
138
 
                os.mkdir(cache_path)
139
 
                new_store = CachedStore(getattr(self, store_name), cache_path)
140
 
                setattr(self, store_name, new_store)
141
 
 
142
 
    def controlfile(self, filename, mode):
143
 
        if mode not in ('rb', 'rt', 'r'):
144
 
            raise BzrError("file mode %r not supported for remote branches" % mode)
145
 
        return get_url(self.base + '/.bzr/' + filename, False)
146
 
 
147
 
 
148
 
    def lock_read(self):
149
 
        # no locking for remote branches yet
150
 
        pass
151
 
 
152
 
    def lock_write(self):
153
 
        from errors import LockError
154
 
        raise LockError("write lock not supported for remote branch %s"
155
 
                        % self.base)
156
 
 
157
 
    def unlock(self):
158
 
        pass
159
 
    
160
 
 
161
 
    def relpath(self, path):
162
 
        if not path.startswith(self.base):
163
 
            raise BzrError('path %r is not under base URL %r'
164
 
                           % (path, self.base))
165
 
        pl = len(self.base)
166
 
        return path[pl:].lstrip('/')
167
 
 
168
 
 
169
 
    def get_revision(self, revision_id):
170
 
        try:
171
 
            revf = self.revision_store[revision_id]
172
 
        except KeyError:
173
 
            raise NoSuchRevision(self, revision_id)
174
 
        r = serializer_v4.read_revision(revf)
175
 
        if r.revision_id != revision_id:
176
 
            raise BzrCheckError('revision stored as {%s} actually contains {%s}'
177
 
                                % (revision_id, r.revision_id))
178
 
        return r
179
 
 
180
 
 
181
 
class RemoteStore(object):
182
 
    def __init__(self, baseurl):
183
 
        self._baseurl = baseurl
184
 
        
185
 
 
186
 
    def _path(self, name):
187
 
        if '/' in name:
188
 
            raise ValueError('invalid store id', name)
189
 
        return self._baseurl + '/' + name
190
 
        
191
 
    def __getitem__(self, fileid):
192
 
        p = self._path(fileid)
193
 
        try:
194
 
            return get_url(p, compressed=True)
195
 
        except urllib2.URLError:
196
 
            raise KeyError(fileid)
197
 
    
198
 
 
199
 
    
 
98
        got_invs.add(inv_id)
 
99
 
 
100
    print '----'