~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/remotebranch.py

  • Committer: Martin Pool
  • Date: 2005-05-19 09:59:49 UTC
  • Revision ID: mbp@sourcefrog.net-20050519095949-2aaed7613265e594
- More cleanups for set type

- Clean up Inventory cmp method

- Remove the Inventory.id_set and Tree.id_set methods: don't built
  sets when just using the dictionaries will do.

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
#! /usr/bin/env python
 
2
 
1
3
# Copyright (C) 2005 Canonical Ltd
2
4
 
3
5
# This program is free software; you can redistribute it and/or modify
15
17
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
18
 
17
19
 
18
 
## XXX: This is pretty slow on high-latency connections because it
19
 
## doesn't keep the HTTP connection alive.  If you have a smart local
20
 
## proxy it may be much better.  Eventually I want to switch to
21
 
## urlgrabber which should use HTTP much more efficiently.
22
 
 
23
 
 
24
 
import urllib2, gzip, zlib
25
 
from sets import Set
 
20
"""Proxy object for access to remote branches.
 
21
 
 
22
At the moment remote branches are only for HTTP and only for read
 
23
access.
 
24
"""
 
25
 
 
26
 
 
27
import gzip
26
28
from cStringIO import StringIO
27
 
 
28
 
from errors import BzrError
29
 
from revision import Revision
30
 
from inventory import Inventory
31
 
 
32
 
# h = HTTPConnection('localhost:8000')
33
 
# h = HTTPConnection('bazaar-ng.org')
 
29
import urllib2
 
30
 
 
31
from errors import BzrError, BzrCheckError
 
32
from branch import Branch, BZR_BRANCH_FORMAT
 
33
from trace import mutter
34
34
 
35
35
# velocitynet.com.au transparently proxies connections and thereby
36
36
# breaks keep-alive -- sucks!
37
37
 
38
38
 
39
 
import urlgrabber.keepalive
40
 
urlgrabber.keepalive.DEBUG = 2
41
 
 
42
 
import urlgrabber
43
 
 
44
 
prefix = 'http://localhost:8000'
45
 
# prefix = 'http://bazaar-ng.org/bzr/main/'
46
 
 
47
 
def get_url(path, compressed=False):
48
 
    try:
49
 
        url = prefix + path
 
39
ENABLE_URLGRABBER = True
 
40
 
 
41
 
 
42
if ENABLE_URLGRABBER:
 
43
    import urlgrabber
 
44
    import urlgrabber.keepalive
 
45
    urlgrabber.keepalive.DEBUG = 0
 
46
    def get_url(path, compressed=False):
 
47
        try:
 
48
            url = path
 
49
            if compressed:
 
50
                url += '.gz'
 
51
            mutter("grab url %s" % url)
 
52
            url_f = urlgrabber.urlopen(url, keepalive=1, close_connection=0)
 
53
            if not compressed:
 
54
                return url_f
 
55
            else:
 
56
                return gzip.GzipFile(fileobj=StringIO(url_f.read()))
 
57
        except urllib2.URLError, e:
 
58
            raise BzrError("remote fetch failed: %r: %s" % (url, e))
 
59
else:
 
60
    def get_url(url, compressed=False):
 
61
        import urllib2
50
62
        if compressed:
51
63
            url += '.gz'
52
 
        url_f = urlgrabber.urlopen(url, keepalive=1, close_connection=0)
53
 
        if not compressed:
 
64
        mutter("get_url %s" % url)
 
65
        url_f = urllib2.urlopen(url)
 
66
        if compressed:
 
67
            return gzip.GzipFile(fileobj=StringIO(url_f.read()))
 
68
        else:
54
69
            return url_f
 
70
 
 
71
 
 
72
 
 
73
def _find_remote_root(url):
 
74
    """Return the prefix URL that corresponds to the branch root."""
 
75
    orig_url = url
 
76
    while True:
 
77
        try:
 
78
            ff = get_url(url + '/.bzr/branch-format')
 
79
 
 
80
            fmt = ff.read()
 
81
            ff.close()
 
82
 
 
83
            fmt = fmt.rstrip('\r\n')
 
84
            if fmt != BZR_BRANCH_FORMAT.rstrip('\r\n'):
 
85
                raise BzrError("sorry, branch format %r not supported at url %s"
 
86
                               % (fmt, url))
 
87
            
 
88
            return url
 
89
        except urllib2.URLError:
 
90
            pass
 
91
 
 
92
        try:
 
93
            idx = url.rindex('/')
 
94
        except ValueError:
 
95
            raise BzrError('no branch root found for URL %s' % orig_url)
 
96
 
 
97
        url = url[:idx]        
 
98
        
 
99
 
 
100
 
 
101
class RemoteBranch(Branch):
 
102
    def __init__(self, baseurl, find_root=True, lock_mode='r'):
 
103
        """Create new proxy for a remote branch."""
 
104
        if lock_mode not in ('', 'r'):
 
105
            raise BzrError('lock mode %r is not supported for remote branches'
 
106
                           % lock_mode)
 
107
 
 
108
        if find_root:
 
109
            self.baseurl = _find_remote_root(baseurl)
55
110
        else:
56
 
            return gzip.GzipFile(fileobj=StringIO(url_f.read()))
57
 
    except urllib2.URLError, e:
58
 
        raise BzrError("remote fetch failed: %r: %s" % (url, e))
59
 
 
60
 
 
61
 
got_invs = Set()
62
 
got_texts = Set()
63
 
 
64
 
print 'read history'
65
 
history = get_url('/.bzr/revision-history').readlines()
66
 
num_revs = len(history)
67
 
for i, rev_id in enumerate(history):
68
 
    rev_id = rev_id.rstrip()
69
 
    print 'read revision %d/%d' % (i, num_revs)
70
 
 
71
 
    # python gzip needs a seekable file (!!) but the HTTP response
72
 
    # isn't, so we need to buffer it
 
111
            self.baseurl = baseurl
 
112
            self._check_format()
 
113
 
 
114
        self.inventory_store = RemoteStore(baseurl + '/.bzr/inventory-store/')
 
115
        self.text_store = RemoteStore(baseurl + '/.bzr/text-store/')
 
116
 
 
117
    def __str__(self):
 
118
        return '%s(%r)' % (self.__class__.__name__, self.baseurl)
 
119
 
 
120
    __repr__ = __str__
 
121
 
 
122
    def controlfile(self, filename, mode):
 
123
        if mode not in ('rb', 'rt', 'r'):
 
124
            raise BzrError("file mode %r not supported for remote branches" % mode)
 
125
        return get_url(self.baseurl + '/.bzr/' + filename, False)
 
126
 
 
127
    def _need_readlock(self):
 
128
        # remote branch always safe for read
 
129
        pass
 
130
 
 
131
    def _need_writelock(self):
 
132
        raise BzrError("cannot get write lock on HTTP remote branch")
 
133
 
 
134
    def relpath(self, path):
 
135
        if not path.startswith(self.baseurl):
 
136
            raise BzrError('path %r is not under base URL %r'
 
137
                           % (path, self.baseurl))
 
138
        pl = len(self.baseurl)
 
139
        return path[pl:].lstrip('/')
 
140
 
 
141
    def get_revision(self, revision_id):
 
142
        from revision import Revision
 
143
        revf = get_url(self.baseurl + '/.bzr/revision-store/' + revision_id,
 
144
                       True)
 
145
        r = Revision.read_xml(revf)
 
146
        if r.revision_id != revision_id:
 
147
            raise BzrCheckError('revision stored as {%s} actually contains {%s}'
 
148
                                % (revision_id, r.revision_id))
 
149
        return r
 
150
 
 
151
 
 
152
class RemoteStore:
 
153
    def __init__(self, baseurl):
 
154
        self._baseurl = baseurl
 
155
        
 
156
 
 
157
    def _path(self, name):
 
158
        if '/' in name:
 
159
            raise ValueError('invalid store id', name)
 
160
        return self._baseurl + '/' + name
 
161
        
 
162
    def __getitem__(self, fileid):
 
163
        p = self._path(fileid)
 
164
        return get_url(p, compressed=True)
73
165
    
74
 
    rev_f = get_url('/.bzr/revision-store/%s' % rev_id,
75
 
                    compressed=True)
76
 
 
77
 
    rev = Revision.read_xml(rev_f)
78
 
    print rev.message
79
 
    inv_id = rev.inventory_id
80
 
    if inv_id not in got_invs:
81
 
        print 'get inventory %s' % inv_id
82
 
        inv_f = get_url('/.bzr/inventory-store/%s' % inv_id,
 
166
 
 
167
def simple_walk():
 
168
    """For experimental purposes, traverse many parts of a remote branch"""
 
169
    from revision import Revision
 
170
    from branch import Branch
 
171
    from inventory import Inventory
 
172
 
 
173
    got_invs = {}
 
174
    got_texts = {}
 
175
 
 
176
    print 'read history'
 
177
    history = get_url('/.bzr/revision-history').readlines()
 
178
    num_revs = len(history)
 
179
    for i, rev_id in enumerate(history):
 
180
        rev_id = rev_id.rstrip()
 
181
        print 'read revision %d/%d' % (i, num_revs)
 
182
 
 
183
        # python gzip needs a seekable file (!!) but the HTTP response
 
184
        # isn't, so we need to buffer it
 
185
 
 
186
        rev_f = get_url('/.bzr/revision-store/%s' % rev_id,
83
187
                        compressed=True)
84
 
        inv = Inventory.read_xml(inv_f)
85
 
        print '%4d inventory entries' % len(inv)
86
 
 
87
 
        for path, ie in inv.iter_entries():
88
 
            text_id = ie.text_id
89
 
            if text_id == None:
90
 
                continue
91
 
            if text_id in got_texts:
92
 
                continue
93
 
            print '  fetch %s text {%s}' % (path, text_id)
94
 
            text_f = get_url('/.bzr/text-store/%s' % text_id,
95
 
                             compressed=True)
96
 
            got_texts.add(text_id)
97
 
            
98
 
        got_invs.add(inv_id)
99
 
 
100
 
    print '----'
 
188
 
 
189
        rev = Revision.read_xml(rev_f)
 
190
        print rev.message
 
191
        inv_id = rev.inventory_id
 
192
        if inv_id not in got_invs:
 
193
            print 'get inventory %s' % inv_id
 
194
            inv_f = get_url('/.bzr/inventory-store/%s' % inv_id,
 
195
                            compressed=True)
 
196
            inv = Inventory.read_xml(inv_f)
 
197
            print '%4d inventory entries' % len(inv)
 
198
 
 
199
            for path, ie in inv.iter_entries():
 
200
                text_id = ie.text_id
 
201
                if text_id == None:
 
202
                    continue
 
203
                if text_id in got_texts:
 
204
                    continue
 
205
                print '  fetch %s text {%s}' % (path, text_id)
 
206
                text_f = get_url('/.bzr/text-store/%s' % text_id,
 
207
                                 compressed=True)
 
208
                got_texts[text_id] = True
 
209
 
 
210
            got_invs.add[inv_id] = True
 
211
 
 
212
        print '----'
 
213
 
 
214
 
 
215
def try_me():
 
216
    BASE_URL = 'http://bazaar-ng.org/bzr/bzr.dev/'
 
217
    b = RemoteBranch(BASE_URL)
 
218
    ## print '\n'.join(b.revision_history())
 
219
    from log import show_log
 
220
    show_log(b)
 
221
 
 
222
 
 
223
if __name__ == '__main__':
 
224
    try_me()
 
225