~bzr-pqm/bzr/bzr.dev

« back to all changes in this revision

Viewing changes to bzrlib/smart/medium.py

  • Committer: Andrew Bennetts
  • Date: 2008-08-07 00:25:38 UTC
  • mfrom: (3612 +trunk)
  • mto: This revision was merged to the branch mainline in revision 3613.
  • Revision ID: andrew.bennetts@canonical.com-20080807002538-mtl1fcgy2fdabha4
Merge from bzr.dev.

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Copyright (C) 2006-2010 Canonical Ltd
 
1
# Copyright (C) 2006 Canonical Ltd
2
2
#
3
3
# This program is free software; you can redistribute it and/or modify
4
4
# it under the terms of the GNU General Public License as published by
12
12
#
13
13
# You should have received a copy of the GNU General Public License
14
14
# along with this program; if not, write to the Free Software
15
 
# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
 
15
# Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
16
16
 
17
17
"""The 'medium' layer for the smart servers and clients.
18
18
 
25
25
"""
26
26
 
27
27
import os
 
28
import socket
28
29
import sys
29
30
import urllib
30
31
 
31
32
from bzrlib.lazy_import import lazy_import
32
33
lazy_import(globals(), """
33
 
import atexit
34
 
import socket
35
 
import thread
36
 
import weakref
37
 
 
38
34
from bzrlib import (
39
 
    debug,
40
35
    errors,
 
36
    osutils,
41
37
    symbol_versioning,
42
 
    trace,
43
 
    ui,
44
38
    urlutils,
45
39
    )
46
 
from bzrlib.smart import client, protocol, request, vfs
 
40
from bzrlib.smart import protocol
47
41
from bzrlib.transport import ssh
48
42
""")
49
 
from bzrlib import osutils
50
 
 
51
 
# Throughout this module buffer size parameters are either limited to be at
52
 
# most _MAX_READ_SIZE, or are ignored and _MAX_READ_SIZE is used instead.
53
 
# For this module's purposes, MAX_SOCKET_CHUNK is a reasonable size for reads
54
 
# from non-sockets as well.
55
 
_MAX_READ_SIZE = osutils.MAX_SOCKET_CHUNK
 
43
 
 
44
 
 
45
# We must not read any more than 64k at a time so we don't risk "no buffer
 
46
# space available" errors on some platforms.  Windows in particular is likely
 
47
# to give error 10053 or 10055 if we read more than 64k from a socket.
 
48
_MAX_READ_SIZE = 64 * 1024
 
49
 
56
50
 
57
51
def _get_protocol_factory_for_bytes(bytes):
58
52
    """Determine the right protocol factory for 'bytes'.
86
80
    return protocol_factory, bytes
87
81
 
88
82
 
89
 
def _get_line(read_bytes_func):
90
 
    """Read bytes using read_bytes_func until a newline byte.
91
 
 
92
 
    This isn't particularly efficient, so should only be used when the
93
 
    expected size of the line is quite short.
94
 
 
95
 
    :returns: a tuple of two strs: (line, excess)
96
 
    """
97
 
    newline_pos = -1
98
 
    bytes = ''
99
 
    while newline_pos == -1:
100
 
        new_bytes = read_bytes_func(1)
101
 
        bytes += new_bytes
102
 
        if new_bytes == '':
103
 
            # Ran out of bytes before receiving a complete line.
104
 
            return bytes, ''
105
 
        newline_pos = bytes.find('\n')
106
 
    line = bytes[:newline_pos+1]
107
 
    excess = bytes[newline_pos+1:]
108
 
    return line, excess
109
 
 
110
 
 
111
83
class SmartMedium(object):
112
84
    """Base class for smart protocol media, both client- and server-side."""
113
85
 
114
86
    def __init__(self):
115
87
        self._push_back_buffer = None
116
 
 
 
88
        
117
89
    def _push_back(self, bytes):
118
90
        """Return unused bytes to the medium, because they belong to the next
119
91
        request(s).
153
125
 
154
126
    def _get_line(self):
155
127
        """Read bytes from this request's response until a newline byte.
156
 
 
 
128
        
157
129
        This isn't particularly efficient, so should only be used when the
158
130
        expected size of the line is quite short.
159
131
 
160
132
        :returns: a string of bytes ending in a newline (byte 0x0A).
161
133
        """
162
 
        line, excess = _get_line(self.read_bytes)
163
 
        self._push_back(excess)
 
134
        newline_pos = -1
 
135
        bytes = ''
 
136
        while newline_pos == -1:
 
137
            new_bytes = self.read_bytes(1)
 
138
            bytes += new_bytes
 
139
            if new_bytes == '':
 
140
                # Ran out of bytes before receiving a complete line.
 
141
                return bytes
 
142
            newline_pos = bytes.find('\n')
 
143
        line = bytes[:newline_pos+1]
 
144
        self._push_back(bytes[newline_pos+1:])
164
145
        return line
165
 
 
166
 
    def _report_activity(self, bytes, direction):
167
 
        """Notify that this medium has activity.
168
 
 
169
 
        Implementations should call this from all methods that actually do IO.
170
 
        Be careful that it's not called twice, if one method is implemented on
171
 
        top of another.
172
 
 
173
 
        :param bytes: Number of bytes read or written.
174
 
        :param direction: 'read' or 'write' or None.
175
 
        """
176
 
        ui.ui_factory.report_transport_activity(self, bytes, direction)
177
 
 
 
146
 
178
147
 
179
148
class SmartServerStreamMedium(SmartMedium):
180
149
    """Handles smart commands coming over a stream.
185
154
    One instance is created for each connected client; it can serve multiple
186
155
    requests in the lifetime of the connection.
187
156
 
188
 
    The server passes requests through to an underlying backing transport,
 
157
    The server passes requests through to an underlying backing transport, 
189
158
    which will typically be a LocalTransport looking at the server's filesystem.
190
159
 
191
160
    :ivar _push_back_buffer: a str of bytes that have been read from the stream
236
205
 
237
206
    def _serve_one_request(self, protocol):
238
207
        """Read one request from input, process, send back a response.
239
 
 
 
208
        
240
209
        :param protocol: a SmartServerRequestProtocol.
241
210
        """
242
211
        try:
274
243
    def _serve_one_request_unguarded(self, protocol):
275
244
        while protocol.next_read_size():
276
245
            # We can safely try to read large chunks.  If there is less data
277
 
            # than MAX_SOCKET_CHUNK ready, the socket will just return a
278
 
            # short read immediately rather than block.
279
 
            bytes = self.read_bytes(osutils.MAX_SOCKET_CHUNK)
 
246
            # than _MAX_READ_SIZE ready, the socket wil just return a short
 
247
            # read immediately rather than block.
 
248
            bytes = self.read_bytes(_MAX_READ_SIZE)
280
249
            if bytes == '':
281
250
                self.finished = True
282
251
                return
283
252
            protocol.accept_bytes(bytes)
284
 
 
 
253
        
285
254
        self._push_back(protocol.unused_data)
286
255
 
287
256
    def _read_bytes(self, desired_count):
288
 
        return osutils.read_bytes_from_socket(
289
 
            self.socket, self._report_activity)
 
257
        # We ignore the desired_count because on sockets it's more efficient to
 
258
        # read large chunks (of _MAX_READ_SIZE bytes) at a time.
 
259
        return self.socket.recv(_MAX_READ_SIZE)
290
260
 
291
261
    def terminate_due_to_error(self):
292
262
        # TODO: This should log to a server log file, but no such thing
295
265
        self.finished = True
296
266
 
297
267
    def _write_out(self, bytes):
298
 
        tstart = osutils.timer_func()
299
 
        osutils.send_all(self.socket, bytes, self._report_activity)
300
 
        if 'hpss' in debug.debug_flags:
301
 
            thread_id = thread.get_ident()
302
 
            trace.mutter('%12s: [%s] %d bytes to the socket in %.3fs'
303
 
                         % ('wrote', thread_id, len(bytes),
304
 
                            osutils.timer_func() - tstart))
 
268
        osutils.send_all(self.socket, bytes)
305
269
 
306
270
 
307
271
class SmartServerPipeStreamMedium(SmartServerStreamMedium):
368
332
    request.finished_reading()
369
333
 
370
334
    It is up to the individual SmartClientMedium whether multiple concurrent
371
 
    requests can exist. See SmartClientMedium.get_request to obtain instances
372
 
    of SmartClientMediumRequest, and the concrete Medium you are using for
 
335
    requests can exist. See SmartClientMedium.get_request to obtain instances 
 
336
    of SmartClientMediumRequest, and the concrete Medium you are using for 
373
337
    details on concurrency and pipelining.
374
338
    """
375
339
 
384
348
    def accept_bytes(self, bytes):
385
349
        """Accept bytes for inclusion in this request.
386
350
 
387
 
        This method may not be called after finished_writing() has been
 
351
        This method may not be be called after finished_writing() has been
388
352
        called.  It depends upon the Medium whether or not the bytes will be
389
353
        immediately transmitted. Message based Mediums will tend to buffer the
390
354
        bytes until finished_writing() is called.
421
385
    def _finished_reading(self):
422
386
        """Helper for finished_reading.
423
387
 
424
 
        finished_reading checks the state of the request to determine if
 
388
        finished_reading checks the state of the request to determine if 
425
389
        finished_reading is allowed, and if it is hands off to _finished_reading
426
390
        to perform the action.
427
391
        """
441
405
    def _finished_writing(self):
442
406
        """Helper for finished_writing.
443
407
 
444
 
        finished_writing checks the state of the request to determine if
 
408
        finished_writing checks the state of the request to determine if 
445
409
        finished_writing is allowed, and if it is hands off to _finished_writing
446
410
        to perform the action.
447
411
        """
467
431
        read_bytes checks the state of the request to determing if bytes
468
432
        should be read. After that it hands off to _read_bytes to do the
469
433
        actual read.
470
 
 
 
434
        
471
435
        By default this forwards to self._medium.read_bytes because we are
472
436
        operating on the medium's stream.
473
437
        """
474
438
        return self._medium.read_bytes(count)
475
439
 
476
440
    def read_line(self):
477
 
        line = self._read_line()
 
441
        line = self._medium._get_line()
478
442
        if not line.endswith('\n'):
479
443
            # end of file encountered reading from server
480
444
            raise errors.ConnectionReset(
481
 
                "Unexpected end of message. Please check connectivity "
482
 
                "and permissions, and report a bug if problems persist.")
 
445
                "please check connectivity and permissions",
 
446
                "(and try -Dhpss if further diagnosis is required)")
483
447
        return line
484
448
 
485
 
    def _read_line(self):
486
 
        """Helper for SmartClientMediumRequest.read_line.
487
 
 
488
 
        By default this forwards to self._medium._get_line because we are
489
 
        operating on the medium's stream.
490
 
        """
491
 
        return self._medium._get_line()
492
 
 
493
 
 
494
 
class _DebugCounter(object):
495
 
    """An object that counts the HPSS calls made to each client medium.
496
 
 
497
 
    When a medium is garbage-collected, or failing that when atexit functions
498
 
    are run, the total number of calls made on that medium are reported via
499
 
    trace.note.
500
 
    """
501
 
 
502
 
    def __init__(self):
503
 
        self.counts = weakref.WeakKeyDictionary()
504
 
        client._SmartClient.hooks.install_named_hook(
505
 
            'call', self.increment_call_count, 'hpss call counter')
506
 
        atexit.register(self.flush_all)
507
 
 
508
 
    def track(self, medium):
509
 
        """Start tracking calls made to a medium.
510
 
 
511
 
        This only keeps a weakref to the medium, so shouldn't affect the
512
 
        medium's lifetime.
513
 
        """
514
 
        medium_repr = repr(medium)
515
 
        # Add this medium to the WeakKeyDictionary
516
 
        self.counts[medium] = dict(count=0, vfs_count=0,
517
 
                                   medium_repr=medium_repr)
518
 
        # Weakref callbacks are fired in reverse order of their association
519
 
        # with the referenced object.  So we add a weakref *after* adding to
520
 
        # the WeakKeyDict so that we can report the value from it before the
521
 
        # entry is removed by the WeakKeyDict's own callback.
522
 
        ref = weakref.ref(medium, self.done)
523
 
 
524
 
    def increment_call_count(self, params):
525
 
        # Increment the count in the WeakKeyDictionary
526
 
        value = self.counts[params.medium]
527
 
        value['count'] += 1
528
 
        try:
529
 
            request_method = request.request_handlers.get(params.method)
530
 
        except KeyError:
531
 
            # A method we don't know about doesn't count as a VFS method.
532
 
            return
533
 
        if issubclass(request_method, vfs.VfsRequest):
534
 
            value['vfs_count'] += 1
535
 
 
536
 
    def done(self, ref):
537
 
        value = self.counts[ref]
538
 
        count, vfs_count, medium_repr = (
539
 
            value['count'], value['vfs_count'], value['medium_repr'])
540
 
        # In case this callback is invoked for the same ref twice (by the
541
 
        # weakref callback and by the atexit function), set the call count back
542
 
        # to 0 so this item won't be reported twice.
543
 
        value['count'] = 0
544
 
        value['vfs_count'] = 0
545
 
        if count != 0:
546
 
            trace.note('HPSS calls: %d (%d vfs) %s',
547
 
                       count, vfs_count, medium_repr)
548
 
 
549
 
    def flush_all(self):
550
 
        for ref in list(self.counts.keys()):
551
 
            self.done(ref)
552
 
 
553
 
_debug_counter = None
554
 
 
555
449
 
556
450
class SmartClientMedium(SmartMedium):
557
451
    """Smart client is a medium for sending smart protocol requests over."""
567
461
        # _remote_version_is_before tracks the bzr version the remote side
568
462
        # can be based on what we've seen so far.
569
463
        self._remote_version_is_before = None
570
 
        # Install debug hook function if debug flag is set.
571
 
        if 'hpss' in debug.debug_flags:
572
 
            global _debug_counter
573
 
            if _debug_counter is None:
574
 
                _debug_counter = _DebugCounter()
575
 
            _debug_counter.track(self)
576
464
 
577
465
    def _is_remote_before(self, version_tuple):
578
466
        """Is it possible the remote side supports RPCs for a given version?
603
491
        """
604
492
        if (self._remote_version_is_before is not None and
605
493
            version_tuple > self._remote_version_is_before):
606
 
            # We have been told that the remote side is older than some version
607
 
            # which is newer than a previously supplied older-than version.
608
 
            # This indicates that some smart verb call is not guarded
609
 
            # appropriately (it should simply not have been tried).
610
 
            trace.mutter(
 
494
            raise AssertionError(
611
495
                "_remember_remote_is_before(%r) called, but "
612
496
                "_remember_remote_is_before(%r) was called previously."
613
 
                , version_tuple, self._remote_version_is_before)
614
 
            if 'hpss' in debug.debug_flags:
615
 
                ui.ui_factory.show_warning(
616
 
                    "_remember_remote_is_before(%r) called, but "
617
 
                    "_remember_remote_is_before(%r) was called previously."
618
 
                    % (version_tuple, self._remote_version_is_before))
619
 
            return
 
497
                % (version_tuple, self._remote_version_is_before))
620
498
        self._remote_version_is_before = version_tuple
621
499
 
622
500
    def protocol_version(self):
656
534
 
657
535
    def disconnect(self):
658
536
        """If this medium maintains a persistent connection, close it.
659
 
 
 
537
        
660
538
        The default implementation does nothing.
661
539
        """
662
 
 
 
540
        
663
541
    def remote_path_from_transport(self, transport):
664
542
        """Convert transport into a path suitable for using in a request.
665
 
 
 
543
        
666
544
        Note that the resulting remote path doesn't encode the host name or
667
545
        anything but path, so it is only safe to use it in requests sent over
668
546
        the medium from the matching transport.
696
574
 
697
575
    def _flush(self):
698
576
        """Flush the output stream.
699
 
 
 
577
        
700
578
        This method is used by the SmartClientStreamMediumRequest to ensure that
701
579
        all data for a request is sent, to avoid long timeouts or deadlocks.
702
580
        """
713
591
 
714
592
class SmartSimplePipesClientMedium(SmartClientStreamMedium):
715
593
    """A client medium using simple pipes.
716
 
 
 
594
    
717
595
    This client does not manage the pipes: it assumes they will always be open.
718
 
 
719
 
    Note that if readable_pipe.read might raise IOError or OSError with errno
720
 
    of EINTR, it must be safe to retry the read.  Plain CPython fileobjects
721
 
    (such as used for sys.stdin) are safe.
722
596
    """
723
597
 
724
598
    def __init__(self, readable_pipe, writeable_pipe, base):
729
603
    def _accept_bytes(self, bytes):
730
604
        """See SmartClientStreamMedium.accept_bytes."""
731
605
        self._writeable_pipe.write(bytes)
732
 
        self._report_activity(len(bytes), 'write')
733
606
 
734
607
    def _flush(self):
735
608
        """See SmartClientStreamMedium._flush()."""
737
610
 
738
611
    def _read_bytes(self, count):
739
612
        """See SmartClientStreamMedium._read_bytes."""
740
 
        bytes = osutils.until_no_eintr(self._readable_pipe.read, count)
741
 
        self._report_activity(len(bytes), 'read')
742
 
        return bytes
 
613
        return self._readable_pipe.read(count)
743
614
 
744
615
 
745
616
class SmartSSHClientMedium(SmartClientStreamMedium):
746
617
    """A client medium using SSH."""
747
 
 
 
618
    
748
619
    def __init__(self, host, port=None, username=None, password=None,
749
620
            base=None, vendor=None, bzr_remote_path=None):
750
621
        """Creates a client that will connect on the first use.
751
 
 
 
622
        
752
623
        :param vendor: An optional override for the ssh vendor to use. See
753
624
            bzrlib.transport.ssh for details on ssh vendors.
754
625
        """
 
626
        SmartClientStreamMedium.__init__(self, base)
755
627
        self._connected = False
756
628
        self._host = host
757
629
        self._password = password
758
630
        self._port = port
759
631
        self._username = username
760
 
        # for the benefit of progress making a short description of this
761
 
        # transport
762
 
        self._scheme = 'bzr+ssh'
763
 
        # SmartClientStreamMedium stores the repr of this object in its
764
 
        # _DebugCounter so we have to store all the values used in our repr
765
 
        # method before calling the super init.
766
 
        SmartClientStreamMedium.__init__(self, base)
767
632
        self._read_from = None
768
633
        self._ssh_connection = None
769
634
        self._vendor = vendor
770
635
        self._write_to = None
771
636
        self._bzr_remote_path = bzr_remote_path
772
 
 
773
 
    def __repr__(self):
774
 
        if self._port is None:
775
 
            maybe_port = ''
776
 
        else:
777
 
            maybe_port = ':%s' % self._port
778
 
        return "%s(%s://%s@%s%s/)" % (
779
 
            self.__class__.__name__,
780
 
            self._scheme,
781
 
            self._username,
782
 
            self._host,
783
 
            maybe_port)
 
637
        if self._bzr_remote_path is None:
 
638
            symbol_versioning.warn(
 
639
                'bzr_remote_path is required as of bzr 0.92',
 
640
                DeprecationWarning, stacklevel=2)
 
641
            self._bzr_remote_path = os.environ.get('BZR_REMOTE_PATH', 'bzr')
784
642
 
785
643
    def _accept_bytes(self, bytes):
786
644
        """See SmartClientStreamMedium.accept_bytes."""
787
645
        self._ensure_connection()
788
646
        self._write_to.write(bytes)
789
 
        self._report_activity(len(bytes), 'write')
790
647
 
791
648
    def disconnect(self):
792
649
        """See SmartClientMedium.disconnect()."""
822
679
        if not self._connected:
823
680
            raise errors.MediumNotConnected(self)
824
681
        bytes_to_read = min(count, _MAX_READ_SIZE)
825
 
        bytes = self._read_from.read(bytes_to_read)
826
 
        self._report_activity(len(bytes), 'read')
827
 
        return bytes
 
682
        return self._read_from.read(bytes_to_read)
828
683
 
829
684
 
830
685
# Port 4155 is the default port for bzr://, registered with IANA.
831
 
BZR_DEFAULT_INTERFACE = None
 
686
BZR_DEFAULT_INTERFACE = '0.0.0.0'
832
687
BZR_DEFAULT_PORT = 4155
833
688
 
834
689
 
835
690
class SmartTCPClientMedium(SmartClientStreamMedium):
836
691
    """A client medium using TCP."""
837
 
 
 
692
    
838
693
    def __init__(self, host, port, base):
839
694
        """Creates a client that will connect on the first use."""
840
695
        SmartClientStreamMedium.__init__(self, base)
846
701
    def _accept_bytes(self, bytes):
847
702
        """See SmartClientMedium.accept_bytes."""
848
703
        self._ensure_connection()
849
 
        osutils.send_all(self._socket, bytes, self._report_activity)
 
704
        osutils.send_all(self._socket, bytes)
850
705
 
851
706
    def disconnect(self):
852
707
        """See SmartClientMedium.disconnect()."""
860
715
        """Connect this medium if not already connected."""
861
716
        if self._connected:
862
717
            return
 
718
        self._socket = socket.socket()
 
719
        self._socket.setsockopt(socket.IPPROTO_TCP, socket.TCP_NODELAY, 1)
863
720
        if self._port is None:
864
721
            port = BZR_DEFAULT_PORT
865
722
        else:
866
723
            port = int(self._port)
867
724
        try:
868
 
            sockaddrs = socket.getaddrinfo(self._host, port, socket.AF_UNSPEC,
869
 
                socket.SOCK_STREAM, 0, 0)
870
 
        except socket.gaierror, (err_num, err_msg):
871
 
            raise errors.ConnectionError("failed to lookup %s:%d: %s" %
872
 
                    (self._host, port, err_msg))
873
 
        # Initialize err in case there are no addresses returned:
874
 
        err = socket.error("no address found for %s" % self._host)
875
 
        for (family, socktype, proto, canonname, sockaddr) in sockaddrs:
876
 
            try:
877
 
                self._socket = socket.socket(family, socktype, proto)
878
 
                self._socket.setsockopt(socket.IPPROTO_TCP,
879
 
                                        socket.TCP_NODELAY, 1)
880
 
                self._socket.connect(sockaddr)
881
 
            except socket.error, err:
882
 
                if self._socket is not None:
883
 
                    self._socket.close()
884
 
                self._socket = None
885
 
                continue
886
 
            break
887
 
        if self._socket is None:
 
725
            self._socket.connect((self._host, port))
 
726
        except socket.error, err:
888
727
            # socket errors either have a (string) or (errno, string) as their
889
728
            # args.
890
729
            if type(err.args) is str:
897
736
 
898
737
    def _flush(self):
899
738
        """See SmartClientStreamMedium._flush().
900
 
 
901
 
        For TCP we do no flushing. We may want to turn off TCP_NODELAY and
 
739
        
 
740
        For TCP we do no flushing. We may want to turn off TCP_NODELAY and 
902
741
        add a means to do a flush, but that can be done in the future.
903
742
        """
904
743
 
906
745
        """See SmartClientMedium.read_bytes."""
907
746
        if not self._connected:
908
747
            raise errors.MediumNotConnected(self)
909
 
        return osutils.read_bytes_from_socket(
910
 
            self._socket, self._report_activity)
 
748
        # We ignore the desired_count because on sockets it's more efficient to
 
749
        # read large chunks (of _MAX_READ_SIZE bytes) at a time.
 
750
        return self._socket.recv(_MAX_READ_SIZE)
911
751
 
912
752
 
913
753
class SmartClientStreamMediumRequest(SmartClientMediumRequest):
926
766
 
927
767
    def _accept_bytes(self, bytes):
928
768
        """See SmartClientMediumRequest._accept_bytes.
929
 
 
 
769
        
930
770
        This forwards to self._medium._accept_bytes because we are operating
931
771
        on the mediums stream.
932
772
        """
935
775
    def _finished_reading(self):
936
776
        """See SmartClientMediumRequest._finished_reading.
937
777
 
938
 
        This clears the _current_request on self._medium to allow a new
 
778
        This clears the _current_request on self._medium to allow a new 
939
779
        request to be created.
940
780
        """
941
781
        if self._medium._current_request is not self:
942
782
            raise AssertionError()
943
783
        self._medium._current_request = None
944
 
 
 
784
        
945
785
    def _finished_writing(self):
946
786
        """See SmartClientMediumRequest._finished_writing.
947
787
 
949
789
        """
950
790
        self._medium._flush()
951
791
 
952