home *** CD-ROM | disk | FTP | other *** search
/ Maximum CD 2011 January / maximum-cd-2011-01.iso / DiscContents / xbmc-9.11.exe / system / python / python24.zlib / httplib.py < prev    next >
Encoding:
Python Source  |  2004-11-07  |  44.3 KB  |  1,367 lines

  1. """HTTP/1.1 client library
  2.  
  3. <intro stuff goes here>
  4. <other stuff, too>
  5.  
  6. HTTPConnection go through a number of "states", which defines when a client
  7. may legally make another request or fetch the response for a particular
  8. request. This diagram details these state transitions:
  9.  
  10.     (null)
  11.       |
  12.       | HTTPConnection()
  13.       v
  14.     Idle
  15.       |
  16.       | putrequest()
  17.       v
  18.     Request-started
  19.       |
  20.       | ( putheader() )*  endheaders()
  21.       v
  22.     Request-sent
  23.       |
  24.       | response = getresponse()
  25.       v
  26.     Unread-response   [Response-headers-read]
  27.       |\____________________
  28.       |                     |
  29.       | response.read()     | putrequest()
  30.       v                     v
  31.     Idle                  Req-started-unread-response
  32.                      ______/|
  33.                    /        |
  34.    response.read() |        | ( putheader() )*  endheaders()
  35.                    v        v
  36.        Request-started    Req-sent-unread-response
  37.                             |
  38.                             | response.read()
  39.                             v
  40.                           Request-sent
  41.  
  42. This diagram presents the following rules:
  43.   -- a second request may not be started until {response-headers-read}
  44.   -- a response [object] cannot be retrieved until {request-sent}
  45.   -- there is no differentiation between an unread response body and a
  46.      partially read response body
  47.  
  48. Note: this enforcement is applied by the HTTPConnection class. The
  49.       HTTPResponse class does not enforce this state machine, which
  50.       implies sophisticated clients may accelerate the request/response
  51.       pipeline. Caution should be taken, though: accelerating the states
  52.       beyond the above pattern may imply knowledge of the server's
  53.       connection-close behavior for certain requests. For example, it
  54.       is impossible to tell whether the server will close the connection
  55.       UNTIL the response headers have been read; this means that further
  56.       requests cannot be placed into the pipeline until it is known that
  57.       the server will NOT be closing the connection.
  58.  
  59. Logical State                  __state            __response
  60. -------------                  -------            ----------
  61. Idle                           _CS_IDLE           None
  62. Request-started                _CS_REQ_STARTED    None
  63. Request-sent                   _CS_REQ_SENT       None
  64. Unread-response                _CS_IDLE           <response_class>
  65. Req-started-unread-response    _CS_REQ_STARTED    <response_class>
  66. Req-sent-unread-response       _CS_REQ_SENT       <response_class>
  67. """
  68.  
  69. import errno
  70. import mimetools
  71. import socket
  72. from urlparse import urlsplit
  73.  
  74. try:
  75.     from cStringIO import StringIO
  76. except ImportError:
  77.     from StringIO import StringIO
  78.  
  79. __all__ = ["HTTP", "HTTPResponse", "HTTPConnection", "HTTPSConnection",
  80.            "HTTPException", "NotConnected", "UnknownProtocol",
  81.            "UnknownTransferEncoding", "UnimplementedFileMode",
  82.            "IncompleteRead", "InvalidURL", "ImproperConnectionState",
  83.            "CannotSendRequest", "CannotSendHeader", "ResponseNotReady",
  84.            "BadStatusLine", "error"]
  85.  
  86. HTTP_PORT = 80
  87. HTTPS_PORT = 443
  88.  
  89. _UNKNOWN = 'UNKNOWN'
  90.  
  91. # connection states
  92. _CS_IDLE = 'Idle'
  93. _CS_REQ_STARTED = 'Request-started'
  94. _CS_REQ_SENT = 'Request-sent'
  95.  
  96. # status codes
  97. # informational
  98. CONTINUE = 100
  99. SWITCHING_PROTOCOLS = 101
  100. PROCESSING = 102
  101.  
  102. # successful
  103. OK = 200
  104. CREATED = 201
  105. ACCEPTED = 202
  106. NON_AUTHORITATIVE_INFORMATION = 203
  107. NO_CONTENT = 204
  108. RESET_CONTENT = 205
  109. PARTIAL_CONTENT = 206
  110. MULTI_STATUS = 207
  111. IM_USED = 226
  112.  
  113. # redirection
  114. MULTIPLE_CHOICES = 300
  115. MOVED_PERMANENTLY = 301
  116. FOUND = 302
  117. SEE_OTHER = 303
  118. NOT_MODIFIED = 304
  119. USE_PROXY = 305
  120. TEMPORARY_REDIRECT = 307
  121.  
  122. # client error
  123. BAD_REQUEST = 400
  124. UNAUTHORIZED = 401
  125. PAYMENT_REQUIRED = 402
  126. FORBIDDEN = 403
  127. NOT_FOUND = 404
  128. METHOD_NOT_ALLOWED = 405
  129. NOT_ACCEPTABLE = 406
  130. PROXY_AUTHENTICATION_REQUIRED = 407
  131. REQUEST_TIMEOUT = 408
  132. CONFLICT = 409
  133. GONE = 410
  134. LENGTH_REQUIRED = 411
  135. PRECONDITION_FAILED = 412
  136. REQUEST_ENTITY_TOO_LARGE = 413
  137. REQUEST_URI_TOO_LONG = 414
  138. UNSUPPORTED_MEDIA_TYPE = 415
  139. REQUESTED_RANGE_NOT_SATISFIABLE = 416
  140. EXPECTATION_FAILED = 417
  141. UNPROCESSABLE_ENTITY = 422
  142. LOCKED = 423
  143. FAILED_DEPENDENCY = 424
  144. UPGRADE_REQUIRED = 426
  145.  
  146. # server error
  147. INTERNAL_SERVER_ERROR = 500
  148. NOT_IMPLEMENTED = 501
  149. BAD_GATEWAY = 502
  150. SERVICE_UNAVAILABLE = 503
  151. GATEWAY_TIMEOUT = 504
  152. HTTP_VERSION_NOT_SUPPORTED = 505
  153. INSUFFICIENT_STORAGE = 507
  154. NOT_EXTENDED = 510
  155.  
  156. class HTTPMessage(mimetools.Message):
  157.  
  158.     def addheader(self, key, value):
  159.         """Add header for field key handling repeats."""
  160.         prev = self.dict.get(key)
  161.         if prev is None:
  162.             self.dict[key] = value
  163.         else:
  164.             combined = ", ".join((prev, value))
  165.             self.dict[key] = combined
  166.  
  167.     def addcontinue(self, key, more):
  168.         """Add more field data from a continuation line."""
  169.         prev = self.dict[key]
  170.         self.dict[key] = prev + "\n " + more
  171.  
  172.     def readheaders(self):
  173.         """Read header lines.
  174.  
  175.         Read header lines up to the entirely blank line that terminates them.
  176.         The (normally blank) line that ends the headers is skipped, but not
  177.         included in the returned list.  If a non-header line ends the headers,
  178.         (which is an error), an attempt is made to backspace over it; it is
  179.         never included in the returned list.
  180.  
  181.         The variable self.status is set to the empty string if all went well,
  182.         otherwise it is an error message.  The variable self.headers is a
  183.         completely uninterpreted list of lines contained in the header (so
  184.         printing them will reproduce the header exactly as it appears in the
  185.         file).
  186.  
  187.         If multiple header fields with the same name occur, they are combined
  188.         according to the rules in RFC 2616 sec 4.2:
  189.  
  190.         Appending each subsequent field-value to the first, each separated
  191.         by a comma. The order in which header fields with the same field-name
  192.         are received is significant to the interpretation of the combined
  193.         field value.
  194.         """
  195.         # XXX The implementation overrides the readheaders() method of
  196.         # rfc822.Message.  The base class design isn't amenable to
  197.         # customized behavior here so the method here is a copy of the
  198.         # base class code with a few small changes.
  199.  
  200.         self.dict = {}
  201.         self.unixfrom = ''
  202.         self.headers = hlist = []
  203.         self.status = ''
  204.         headerseen = ""
  205.         firstline = 1
  206.         startofline = unread = tell = None
  207.         if hasattr(self.fp, 'unread'):
  208.             unread = self.fp.unread
  209.         elif self.seekable:
  210.             tell = self.fp.tell
  211.         while True:
  212.             if tell:
  213.                 try:
  214.                     startofline = tell()
  215.                 except IOError:
  216.                     startofline = tell = None
  217.                     self.seekable = 0
  218.             line = self.fp.readline()
  219.             if not line:
  220.                 self.status = 'EOF in headers'
  221.                 break
  222.             # Skip unix From name time lines
  223.             if firstline and line.startswith('From '):
  224.                 self.unixfrom = self.unixfrom + line
  225.                 continue
  226.             firstline = 0
  227.             if headerseen and line[0] in ' \t':
  228.                 # XXX Not sure if continuation lines are handled properly
  229.                 # for http and/or for repeating headers
  230.                 # It's a continuation line.
  231.                 hlist.append(line)
  232.                 self.addcontinue(headerseen, line.strip())
  233.                 continue
  234.             elif self.iscomment(line):
  235.                 # It's a comment.  Ignore it.
  236.                 continue
  237.             elif self.islast(line):
  238.                 # Note! No pushback here!  The delimiter line gets eaten.
  239.                 break
  240.             headerseen = self.isheader(line)
  241.             if headerseen:
  242.                 # It's a legal header line, save it.
  243.                 hlist.append(line)
  244.                 self.addheader(headerseen, line[len(headerseen)+1:].strip())
  245.                 continue
  246.             else:
  247.                 # It's not a header line; throw it back and stop here.
  248.                 if not self.dict:
  249.                     self.status = 'No headers'
  250.                 else:
  251.                     self.status = 'Non-header line where header expected'
  252.                 # Try to undo the read.
  253.                 if unread:
  254.                     unread(line)
  255.                 elif tell:
  256.                     self.fp.seek(startofline)
  257.                 else:
  258.                     self.status = self.status + '; bad seek'
  259.                 break
  260.  
  261. class HTTPResponse:
  262.  
  263.     # strict: If true, raise BadStatusLine if the status line can't be
  264.     # parsed as a valid HTTP/1.0 or 1.1 status line.  By default it is
  265.     # false because it prevents clients from talking to HTTP/0.9
  266.     # servers.  Note that a response with a sufficiently corrupted
  267.     # status line will look like an HTTP/0.9 response.
  268.  
  269.     # See RFC 2616 sec 19.6 and RFC 1945 sec 6 for details.
  270.  
  271.     def __init__(self, sock, debuglevel=0, strict=0, method=None):
  272.         self.fp = sock.makefile('rb', 0)
  273.         self.debuglevel = debuglevel
  274.         self.strict = strict
  275.         self._method = method
  276.  
  277.         self.msg = None
  278.  
  279.         # from the Status-Line of the response
  280.         self.version = _UNKNOWN # HTTP-Version
  281.         self.status = _UNKNOWN  # Status-Code
  282.         self.reason = _UNKNOWN  # Reason-Phrase
  283.  
  284.         self.chunked = _UNKNOWN         # is "chunked" being used?
  285.         self.chunk_left = _UNKNOWN      # bytes left to read in current chunk
  286.         self.length = _UNKNOWN          # number of bytes left in response
  287.         self.will_close = _UNKNOWN      # conn will close at end of response
  288.  
  289.     def _read_status(self):
  290.         # Initialize with Simple-Response defaults
  291.         line = self.fp.readline()
  292.         if self.debuglevel > 0:
  293.             print "reply:", repr(line)
  294.         if not line:
  295.             # Presumably, the server closed the connection before
  296.             # sending a valid response.
  297.             raise BadStatusLine(line)
  298.         try:
  299.             [version, status, reason] = line.split(None, 2)
  300.         except ValueError:
  301.             try:
  302.                 [version, status] = line.split(None, 1)
  303.                 reason = ""
  304.             except ValueError:
  305.                 # empty version will cause next test to fail and status
  306.                 # will be treated as 0.9 response.
  307.                 version = ""
  308.         if not version.startswith('HTTP/'):
  309.             if self.strict:
  310.                 self.close()
  311.                 raise BadStatusLine(line)
  312.             else:
  313.                 # assume it's a Simple-Response from an 0.9 server
  314.                 self.fp = LineAndFileWrapper(line, self.fp)
  315.                 return "HTTP/0.9", 200, ""
  316.  
  317.         # The status code is a three-digit number
  318.         try:
  319.             status = int(status)
  320.             if status < 100 or status > 999:
  321.                 raise BadStatusLine(line)
  322.         except ValueError:
  323.             raise BadStatusLine(line)
  324.         return version, status, reason
  325.  
  326.     def begin(self):
  327.         if self.msg is not None:
  328.             # we've already started reading the response
  329.             return
  330.  
  331.         # read until we get a non-100 response
  332.         while True:
  333.             version, status, reason = self._read_status()
  334.             if status != CONTINUE:
  335.                 break
  336.             # skip the header from the 100 response
  337.             while True:
  338.                 skip = self.fp.readline().strip()
  339.                 if not skip:
  340.                     break
  341.                 if self.debuglevel > 0:
  342.                     print "header:", skip
  343.  
  344.         self.status = status
  345.         self.reason = reason.strip()
  346.         if version == 'HTTP/1.0':
  347.             self.version = 10
  348.         elif version.startswith('HTTP/1.'):
  349.             self.version = 11   # use HTTP/1.1 code for HTTP/1.x where x>=1
  350.         elif version == 'HTTP/0.9':
  351.             self.version = 9
  352.         else:
  353.             raise UnknownProtocol(version)
  354.  
  355.         if self.version == 9:
  356.             self.chunked = 0
  357.             self.will_close = 1
  358.             self.msg = HTTPMessage(StringIO())
  359.             return
  360.  
  361.         self.msg = HTTPMessage(self.fp, 0)
  362.         if self.debuglevel > 0:
  363.             for hdr in self.msg.headers:
  364.                 print "header:", hdr,
  365.  
  366.         # don't let the msg keep an fp
  367.         self.msg.fp = None
  368.  
  369.         # are we using the chunked-style of transfer encoding?
  370.         tr_enc = self.msg.getheader('transfer-encoding')
  371.         if tr_enc and tr_enc.lower() == "chunked":
  372.             self.chunked = 1
  373.             self.chunk_left = None
  374.         else:
  375.             self.chunked = 0
  376.  
  377.         # will the connection close at the end of the response?
  378.         self.will_close = self._check_close()
  379.  
  380.         # do we have a Content-Length?
  381.         # NOTE: RFC 2616, S4.4, #3 says we ignore this if tr_enc is "chunked"
  382.         length = self.msg.getheader('content-length')
  383.         if length and not self.chunked:
  384.             try:
  385.                 self.length = int(length)
  386.             except ValueError:
  387.                 self.length = None
  388.         else:
  389.             self.length = None
  390.  
  391.         # does the body have a fixed length? (of zero)
  392.         if (status == NO_CONTENT or status == NOT_MODIFIED or
  393.             100 <= status < 200 or      # 1xx codes
  394.             self._method == 'HEAD'):
  395.             self.length = 0
  396.  
  397.         # if the connection remains open, and we aren't using chunked, and
  398.         # a content-length was not provided, then assume that the connection
  399.         # WILL close.
  400.         if not self.will_close and \
  401.            not self.chunked and \
  402.            self.length is None:
  403.             self.will_close = 1
  404.  
  405.     def _check_close(self):
  406.         conn = self.msg.getheader('connection')
  407.         if self.version == 11:
  408.             # An HTTP/1.1 proxy is assumed to stay open unless
  409.             # explicitly closed.
  410.             conn = self.msg.getheader('connection')
  411.             if conn and "close" in conn.lower():
  412.                 return True
  413.             return False
  414.  
  415.         # Some HTTP/1.0 implementations have support for persistent
  416.         # connections, using rules different than HTTP/1.1.
  417.  
  418.         # For older HTTP, Keep-Alive indiciates persistent connection.
  419.         if self.msg.getheader('keep-alive'):
  420.             return False
  421.  
  422.         # At least Akamai returns a "Connection: Keep-Alive" header,
  423.         # which was supposed to be sent by the client.
  424.         if conn and "keep-alive" in conn.lower():
  425.             return False
  426.  
  427.         # Proxy-Connection is a netscape hack.
  428.         pconn = self.msg.getheader('proxy-connection')
  429.         if pconn and "keep-alive" in pconn.lower():
  430.             return False
  431.  
  432.         # otherwise, assume it will close
  433.         return True
  434.  
  435.     def close(self):
  436.         if self.fp:
  437.             self.fp.close()
  438.             self.fp = None
  439.  
  440.     def isclosed(self):
  441.         # NOTE: it is possible that we will not ever call self.close(). This
  442.         #       case occurs when will_close is TRUE, length is None, and we
  443.         #       read up to the last byte, but NOT past it.
  444.         #
  445.         # IMPLIES: if will_close is FALSE, then self.close() will ALWAYS be
  446.         #          called, meaning self.isclosed() is meaningful.
  447.         return self.fp is None
  448.  
  449.     # XXX It would be nice to have readline and __iter__ for this, too.
  450.  
  451.     def read(self, amt=None):
  452.         if self.fp is None:
  453.             return ''
  454.  
  455.         if self.chunked:
  456.             return self._read_chunked(amt)
  457.  
  458.         if amt is None:
  459.             # unbounded read
  460.             if self.length is None:
  461.                 s = self.fp.read()
  462.             else:
  463.                 s = self._safe_read(self.length)
  464.                 self.length = 0
  465.             self.close()        # we read everything
  466.             return s
  467.  
  468.         if self.length is not None:
  469.             if amt > self.length:
  470.                 # clip the read to the "end of response"
  471.                 amt = self.length
  472.  
  473.         # we do not use _safe_read() here because this may be a .will_close
  474.         # connection, and the user is reading more bytes than will be provided
  475.         # (for example, reading in 1k chunks)
  476.         s = self.fp.read(amt)
  477.         if self.length is not None:
  478.             self.length -= len(s)
  479.  
  480.         return s
  481.  
  482.     def _read_chunked(self, amt):
  483.         assert self.chunked != _UNKNOWN
  484.         chunk_left = self.chunk_left
  485.         value = ''
  486.  
  487.         # XXX This accumulates chunks by repeated string concatenation,
  488.         # which is not efficient as the number or size of chunks gets big.
  489.         while True:
  490.             if chunk_left is None:
  491.                 line = self.fp.readline()
  492.                 i = line.find(';')
  493.                 if i >= 0:
  494.                     line = line[:i] # strip chunk-extensions
  495.                 chunk_left = int(line, 16)
  496.                 if chunk_left == 0:
  497.                     break
  498.             if amt is None:
  499.                 value += self._safe_read(chunk_left)
  500.             elif amt < chunk_left:
  501.                 value += self._safe_read(amt)
  502.                 self.chunk_left = chunk_left - amt
  503.                 return value
  504.             elif amt == chunk_left:
  505.                 value += self._safe_read(amt)
  506.                 self._safe_read(2)  # toss the CRLF at the end of the chunk
  507.                 self.chunk_left = None
  508.                 return value
  509.             else:
  510.                 value += self._safe_read(chunk_left)
  511.                 amt -= chunk_left
  512.  
  513.             # we read the whole chunk, get another
  514.             self._safe_read(2)      # toss the CRLF at the end of the chunk
  515.             chunk_left = None
  516.  
  517.         # read and discard trailer up to the CRLF terminator
  518.         ### note: we shouldn't have any trailers!
  519.         while True:
  520.             line = self.fp.readline()
  521.             if line == '\r\n':
  522.                 break
  523.  
  524.         # we read everything; close the "file"
  525.         self.close()
  526.  
  527.         return value
  528.  
  529.     def _safe_read(self, amt):
  530.         """Read the number of bytes requested, compensating for partial reads.
  531.  
  532.         Normally, we have a blocking socket, but a read() can be interrupted
  533.         by a signal (resulting in a partial read).
  534.  
  535.         Note that we cannot distinguish between EOF and an interrupt when zero
  536.         bytes have been read. IncompleteRead() will be raised in this
  537.         situation.
  538.  
  539.         This function should be used when <amt> bytes "should" be present for
  540.         reading. If the bytes are truly not available (due to EOF), then the
  541.         IncompleteRead exception can be used to detect the problem.
  542.         """
  543.         s = ''
  544.         while amt > 0:
  545.             chunk = self.fp.read(amt)
  546.             if not chunk:
  547.                 raise IncompleteRead(s)
  548.             s += chunk
  549.             amt -= len(chunk)
  550.         return s
  551.  
  552.     def getheader(self, name, default=None):
  553.         if self.msg is None:
  554.             raise ResponseNotReady()
  555.         return self.msg.getheader(name, default)
  556.  
  557.     def getheaders(self):
  558.         """Return list of (header, value) tuples."""
  559.         if self.msg is None:
  560.             raise ResponseNotReady()
  561.         return self.msg.items()
  562.  
  563.  
  564. class HTTPConnection:
  565.  
  566.     _http_vsn = 11
  567.     _http_vsn_str = 'HTTP/1.1'
  568.  
  569.     response_class = HTTPResponse
  570.     default_port = HTTP_PORT
  571.     auto_open = 1
  572.     debuglevel = 0
  573.     strict = 0
  574.  
  575.     def __init__(self, host, port=None, strict=None):
  576.         self.sock = None
  577.         self._buffer = []
  578.         self.__response = None
  579.         self.__state = _CS_IDLE
  580.         self._method = None
  581.  
  582.         self._set_hostport(host, port)
  583.         if strict is not None:
  584.             self.strict = strict
  585.  
  586.     def _set_hostport(self, host, port):
  587.         if port is None:
  588.             i = host.rfind(':')
  589.             j = host.rfind(']')         # ipv6 addresses have [...]
  590.             if i > j:
  591.                 try:
  592.                     port = int(host[i+1:])
  593.                 except ValueError:
  594.                     raise InvalidURL("nonnumeric port: '%s'" % host[i+1:])
  595.                 host = host[:i]
  596.             else:
  597.                 port = self.default_port
  598.             if host and host[0] == '[' and host[-1] == ']':
  599.                 host = host[1:-1]
  600.         self.host = host
  601.         self.port = port
  602.  
  603.     def set_debuglevel(self, level):
  604.         self.debuglevel = level
  605.  
  606.     def connect(self):
  607.         """Connect to the host and port specified in __init__."""
  608.         msg = "getaddrinfo returns an empty list"
  609.         for res in socket.getaddrinfo(self.host, self.port, 0,
  610.                                       socket.SOCK_STREAM):
  611.             af, socktype, proto, canonname, sa = res
  612.             try:
  613.                 self.sock = socket.socket(af, socktype, proto)
  614.                 if self.debuglevel > 0:
  615.                     print "connect: (%s, %s)" % (self.host, self.port)
  616.                 self.sock.connect(sa)
  617.             except socket.error, msg:
  618.                 if self.debuglevel > 0:
  619.                     print 'connect fail:', (self.host, self.port)
  620.                 if self.sock:
  621.                     self.sock.close()
  622.                 self.sock = None
  623.                 continue
  624.             break
  625.         if not self.sock:
  626.             raise socket.error, msg
  627.  
  628.     def close(self):
  629.         """Close the connection to the HTTP server."""
  630.         if self.sock:
  631.             self.sock.close()   # close it manually... there may be other refs
  632.             self.sock = None
  633.         if self.__response:
  634.             self.__response.close()
  635.             self.__response = None
  636.         self.__state = _CS_IDLE
  637.  
  638.     def send(self, str):
  639.         """Send `str' to the server."""
  640.         if self.sock is None:
  641.             if self.auto_open:
  642.                 self.connect()
  643.             else:
  644.                 raise NotConnected()
  645.  
  646.         # send the data to the server. if we get a broken pipe, then close
  647.         # the socket. we want to reconnect when somebody tries to send again.
  648.         #
  649.         # NOTE: we DO propagate the error, though, because we cannot simply
  650.         #       ignore the error... the caller will know if they can retry.
  651.         if self.debuglevel > 0:
  652.             print "send:", repr(str)
  653.         try:
  654.             self.sock.sendall(str)
  655.         except socket.error, v:
  656.             if v[0] == 32:      # Broken pipe
  657.                 self.close()
  658.             raise
  659.  
  660.     def _output(self, s):
  661.         """Add a line of output to the current request buffer.
  662.  
  663.         Assumes that the line does *not* end with \\r\\n.
  664.         """
  665.         self._buffer.append(s)
  666.  
  667.     def _send_output(self):
  668.         """Send the currently buffered request and clear the buffer.
  669.  
  670.         Appends an extra \\r\\n to the buffer.
  671.         """
  672.         self._buffer.extend(("", ""))
  673.         msg = "\r\n".join(self._buffer)
  674.         del self._buffer[:]
  675.         self.send(msg)
  676.  
  677.     def putrequest(self, method, url, skip_host=0, skip_accept_encoding=0):
  678.         """Send a request to the server.
  679.  
  680.         `method' specifies an HTTP request method, e.g. 'GET'.
  681.         `url' specifies the object being requested, e.g. '/index.html'.
  682.         `skip_host' if True does not add automatically a 'Host:' header
  683.         `skip_accept_encoding' if True does not add automatically an
  684.            'Accept-Encoding:' header
  685.         """
  686.  
  687.         # if a prior response has been completed, then forget about it.
  688.         if self.__response and self.__response.isclosed():
  689.             self.__response = None
  690.  
  691.  
  692.         # in certain cases, we cannot issue another request on this connection.
  693.         # this occurs when:
  694.         #   1) we are in the process of sending a request.   (_CS_REQ_STARTED)
  695.         #   2) a response to a previous request has signalled that it is going
  696.         #      to close the connection upon completion.
  697.         #   3) the headers for the previous response have not been read, thus
  698.         #      we cannot determine whether point (2) is true.   (_CS_REQ_SENT)
  699.         #
  700.         # if there is no prior response, then we can request at will.
  701.         #
  702.         # if point (2) is true, then we will have passed the socket to the
  703.         # response (effectively meaning, "there is no prior response"), and
  704.         # will open a new one when a new request is made.
  705.         #
  706.         # Note: if a prior response exists, then we *can* start a new request.
  707.         #       We are not allowed to begin fetching the response to this new
  708.         #       request, however, until that prior response is complete.
  709.         #
  710.         if self.__state == _CS_IDLE:
  711.             self.__state = _CS_REQ_STARTED
  712.         else:
  713.             raise CannotSendRequest()
  714.  
  715.         # Save the method we use, we need it later in the response phase
  716.         self._method = method
  717.         if not url:
  718.             url = '/'
  719.         str = '%s %s %s' % (method, url, self._http_vsn_str)
  720.  
  721.         self._output(str)
  722.  
  723.         if self._http_vsn == 11:
  724.             # Issue some standard headers for better HTTP/1.1 compliance
  725.  
  726.             if not skip_host:
  727.                 # this header is issued *only* for HTTP/1.1
  728.                 # connections. more specifically, this means it is
  729.                 # only issued when the client uses the new
  730.                 # HTTPConnection() class. backwards-compat clients
  731.                 # will be using HTTP/1.0 and those clients may be
  732.                 # issuing this header themselves. we should NOT issue
  733.                 # it twice; some web servers (such as Apache) barf
  734.                 # when they see two Host: headers
  735.  
  736.                 # If we need a non-standard port,include it in the
  737.                 # header.  If the request is going through a proxy,
  738.                 # but the host of the actual URL, not the host of the
  739.                 # proxy.
  740.  
  741.                 netloc = ''
  742.                 if url.startswith('http'):
  743.                     nil, netloc, nil, nil, nil = urlsplit(url)
  744.  
  745.                 if netloc:
  746.                     self.putheader('Host', netloc.encode("idna"))
  747.                 elif self.port == HTTP_PORT:
  748.                     self.putheader('Host', self.host.encode("idna"))
  749.                 else:
  750.                     self.putheader('Host', "%s:%s" % (self.host.encode("idna"), self.port))
  751.  
  752.             # note: we are assuming that clients will not attempt to set these
  753.             #       headers since *this* library must deal with the
  754.             #       consequences. this also means that when the supporting
  755.             #       libraries are updated to recognize other forms, then this
  756.             #       code should be changed (removed or updated).
  757.  
  758.             # we only want a Content-Encoding of "identity" since we don't
  759.             # support encodings such as x-gzip or x-deflate.
  760.             if not skip_accept_encoding:
  761.                 self.putheader('Accept-Encoding', 'identity')
  762.  
  763.             # we can accept "chunked" Transfer-Encodings, but no others
  764.             # NOTE: no TE header implies *only* "chunked"
  765.             #self.putheader('TE', 'chunked')
  766.  
  767.             # if TE is supplied in the header, then it must appear in a
  768.             # Connection header.
  769.             #self.putheader('Connection', 'TE')
  770.  
  771.         else:
  772.             # For HTTP/1.0, the server will assume "not chunked"
  773.             pass
  774.  
  775.     def putheader(self, header, value):
  776.         """Send a request header line to the server.
  777.  
  778.         For example: h.putheader('Accept', 'text/html')
  779.         """
  780.         if self.__state != _CS_REQ_STARTED:
  781.             raise CannotSendHeader()
  782.  
  783.         str = '%s: %s' % (header, value)
  784.         self._output(str)
  785.  
  786.     def endheaders(self):
  787.         """Indicate that the last header line has been sent to the server."""
  788.  
  789.         if self.__state == _CS_REQ_STARTED:
  790.             self.__state = _CS_REQ_SENT
  791.         else:
  792.             raise CannotSendHeader()
  793.  
  794.         self._send_output()
  795.  
  796.     def request(self, method, url, body=None, headers={}):
  797.         """Send a complete request to the server."""
  798.  
  799.         try:
  800.             self._send_request(method, url, body, headers)
  801.         except socket.error, v:
  802.             # trap 'Broken pipe' if we're allowed to automatically reconnect
  803.             if v[0] != 32 or not self.auto_open:
  804.                 raise
  805.             # try one more time
  806.             self._send_request(method, url, body, headers)
  807.  
  808.     def _send_request(self, method, url, body, headers):
  809.         # honour explicitly requested Host: and Accept-Encoding headers
  810.         header_names = dict.fromkeys([k.lower() for k in headers])
  811.         skips = {}
  812.         if 'host' in header_names:
  813.             skips['skip_host'] = 1
  814.         if 'accept-encoding' in header_names:
  815.             skips['skip_accept_encoding'] = 1
  816.  
  817.         self.putrequest(method, url, **skips)
  818.  
  819.         if body and ('content-length' not in header_names):
  820.             self.putheader('Content-Length', str(len(body)))
  821.         for hdr, value in headers.iteritems():
  822.             self.putheader(hdr, value)
  823.         self.endheaders()
  824.  
  825.         if body:
  826.             self.send(body)
  827.  
  828.     def getresponse(self):
  829.         "Get the response from the server."
  830.  
  831.         # if a prior response has been completed, then forget about it.
  832.         if self.__response and self.__response.isclosed():
  833.             self.__response = None
  834.  
  835.         #
  836.         # if a prior response exists, then it must be completed (otherwise, we
  837.         # cannot read this response's header to determine the connection-close
  838.         # behavior)
  839.         #
  840.         # note: if a prior response existed, but was connection-close, then the
  841.         # socket and response were made independent of this HTTPConnection
  842.         # object since a new request requires that we open a whole new
  843.         # connection
  844.         #
  845.         # this means the prior response had one of two states:
  846.         #   1) will_close: this connection was reset and the prior socket and
  847.         #                  response operate independently
  848.         #   2) persistent: the response was retained and we await its
  849.         #                  isclosed() status to become true.
  850.         #
  851.         if self.__state != _CS_REQ_SENT or self.__response:
  852.             raise ResponseNotReady()
  853.  
  854.         if self.debuglevel > 0:
  855.             response = self.response_class(self.sock, self.debuglevel,
  856.                                            strict=self.strict,
  857.                                            method=self._method)
  858.         else:
  859.             response = self.response_class(self.sock, strict=self.strict,
  860.                                            method=self._method)
  861.  
  862.         response.begin()
  863.         assert response.will_close != _UNKNOWN
  864.         self.__state = _CS_IDLE
  865.  
  866.         if response.will_close:
  867.             # this effectively passes the connection to the response
  868.             self.close()
  869.         else:
  870.             # remember this, so we can tell when it is complete
  871.             self.__response = response
  872.  
  873.         return response
  874.  
  875. # The next several classes are used to define FakeSocket,a socket-like
  876. # interface to an SSL connection.
  877.  
  878. # The primary complexity comes from faking a makefile() method.  The
  879. # standard socket makefile() implementation calls dup() on the socket
  880. # file descriptor.  As a consequence, clients can call close() on the
  881. # parent socket and its makefile children in any order.  The underlying
  882. # socket isn't closed until they are all closed.
  883.  
  884. # The implementation uses reference counting to keep the socket open
  885. # until the last client calls close().  SharedSocket keeps track of
  886. # the reference counting and SharedSocketClient provides an constructor
  887. # and close() method that call incref() and decref() correctly.
  888.  
  889. class SharedSocket:
  890.  
  891.     def __init__(self, sock):
  892.         self.sock = sock
  893.         self._refcnt = 0
  894.  
  895.     def incref(self):
  896.         self._refcnt += 1
  897.  
  898.     def decref(self):
  899.         self._refcnt -= 1
  900.         assert self._refcnt >= 0
  901.         if self._refcnt == 0:
  902.             self.sock.close()
  903.  
  904.     def __del__(self):
  905.         self.sock.close()
  906.  
  907. class SharedSocketClient:
  908.  
  909.     def __init__(self, shared):
  910.         self._closed = 0
  911.         self._shared = shared
  912.         self._shared.incref()
  913.         self._sock = shared.sock
  914.  
  915.     def close(self):
  916.         if not self._closed:
  917.             self._shared.decref()
  918.             self._closed = 1
  919.             self._shared = None
  920.  
  921. class SSLFile(SharedSocketClient):
  922.     """File-like object wrapping an SSL socket."""
  923.  
  924.     BUFSIZE = 8192
  925.  
  926.     def __init__(self, sock, ssl, bufsize=None):
  927.         SharedSocketClient.__init__(self, sock)
  928.         self._ssl = ssl
  929.         self._buf = ''
  930.         self._bufsize = bufsize or self.__class__.BUFSIZE
  931.  
  932.     def _read(self):
  933.         buf = ''
  934.         # put in a loop so that we retry on transient errors
  935.         while True:
  936.             try:
  937.                 buf = self._ssl.read(self._bufsize)
  938.             except socket.sslerror, err:
  939.                 if (err[0] == socket.SSL_ERROR_WANT_READ
  940.                     or err[0] == socket.SSL_ERROR_WANT_WRITE):
  941.                     continue
  942.                 if (err[0] == socket.SSL_ERROR_ZERO_RETURN
  943.                     or err[0] == socket.SSL_ERROR_EOF):
  944.                     break
  945.                 raise
  946.             except socket.error, err:
  947.                 if err[0] == errno.EINTR:
  948.                     continue
  949.                 if err[0] == errno.EBADF:
  950.                     # XXX socket was closed?
  951.                     break
  952.                 raise
  953.             else:
  954.                 break
  955.         return buf
  956.  
  957.     def read(self, size=None):
  958.         L = [self._buf]
  959.         avail = len(self._buf)
  960.         while size is None or avail < size:
  961.             s = self._read()
  962.             if s == '':
  963.                 break
  964.             L.append(s)
  965.             avail += len(s)
  966.         all = "".join(L)
  967.         if size is None:
  968.             self._buf = ''
  969.             return all
  970.         else:
  971.             self._buf = all[size:]
  972.             return all[:size]
  973.  
  974.     def readline(self):
  975.         L = [self._buf]
  976.         self._buf = ''
  977.         while 1:
  978.             i = L[-1].find("\n")
  979.             if i >= 0:
  980.                 break
  981.             s = self._read()
  982.             if s == '':
  983.                 break
  984.             L.append(s)
  985.         if i == -1:
  986.             # loop exited because there is no more data
  987.             return "".join(L)
  988.         else:
  989.             all = "".join(L)
  990.             # XXX could do enough bookkeeping not to do a 2nd search
  991.             i = all.find("\n") + 1
  992.             line = all[:i]
  993.             self._buf = all[i:]
  994.             return line
  995.  
  996.     def readlines(self, sizehint=0):
  997.         total = 0
  998.         list = []
  999.         while True:
  1000.             line = self.readline()
  1001.             if not line:
  1002.                 break
  1003.             list.append(line)
  1004.             total += len(line)
  1005.             if sizehint and total >= sizehint:
  1006.                 break
  1007.         return list
  1008.  
  1009.     def fileno(self):
  1010.         return self._sock.fileno()
  1011.  
  1012.     def __iter__(self):
  1013.         return self
  1014.  
  1015.     def next(self):
  1016.         line = self.readline()
  1017.         if not line:
  1018.             raise StopIteration
  1019.         return line
  1020.  
  1021. class FakeSocket(SharedSocketClient):
  1022.  
  1023.     class _closedsocket:
  1024.         def __getattr__(self, name):
  1025.             raise error(9, 'Bad file descriptor')
  1026.  
  1027.     def __init__(self, sock, ssl):
  1028.         sock = SharedSocket(sock)
  1029.         SharedSocketClient.__init__(self, sock)
  1030.         self._ssl = ssl
  1031.  
  1032.     def close(self):
  1033.         SharedSocketClient.close(self)
  1034.         self._sock = self.__class__._closedsocket()
  1035.  
  1036.     def makefile(self, mode, bufsize=None):
  1037.         if mode != 'r' and mode != 'rb':
  1038.             raise UnimplementedFileMode()
  1039.         return SSLFile(self._shared, self._ssl, bufsize)
  1040.  
  1041.     def send(self, stuff, flags = 0):
  1042.         return self._ssl.write(stuff)
  1043.  
  1044.     sendall = send
  1045.  
  1046.     def recv(self, len = 1024, flags = 0):
  1047.         return self._ssl.read(len)
  1048.  
  1049.     def __getattr__(self, attr):
  1050.         return getattr(self._sock, attr)
  1051.  
  1052.  
  1053. class HTTPSConnection(HTTPConnection):
  1054.     "This class allows communication via SSL."
  1055.  
  1056.     default_port = HTTPS_PORT
  1057.  
  1058.     def __init__(self, host, port=None, key_file=None, cert_file=None,
  1059.                  strict=None):
  1060.         HTTPConnection.__init__(self, host, port, strict)
  1061.         self.key_file = key_file
  1062.         self.cert_file = cert_file
  1063.  
  1064.     def connect(self):
  1065.         "Connect to a host on a given (SSL) port."
  1066.  
  1067.         sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
  1068.         sock.connect((self.host, self.port))
  1069.         ssl = socket.ssl(sock, self.key_file, self.cert_file)
  1070.         self.sock = FakeSocket(sock, ssl)
  1071.  
  1072.  
  1073. class HTTP:
  1074.     "Compatibility class with httplib.py from 1.5."
  1075.  
  1076.     _http_vsn = 10
  1077.     _http_vsn_str = 'HTTP/1.0'
  1078.  
  1079.     debuglevel = 0
  1080.  
  1081.     _connection_class = HTTPConnection
  1082.  
  1083.     def __init__(self, host='', port=None, strict=None):
  1084.         "Provide a default host, since the superclass requires one."
  1085.  
  1086.         # some joker passed 0 explicitly, meaning default port
  1087.         if port == 0:
  1088.             port = None
  1089.  
  1090.         # Note that we may pass an empty string as the host; this will throw
  1091.         # an error when we attempt to connect. Presumably, the client code
  1092.         # will call connect before then, with a proper host.
  1093.         self._setup(self._connection_class(host, port, strict))
  1094.  
  1095.     def _setup(self, conn):
  1096.         self._conn = conn
  1097.  
  1098.         # set up delegation to flesh out interface
  1099.         self.send = conn.send
  1100.         self.putrequest = conn.putrequest
  1101.         self.endheaders = conn.endheaders
  1102.         self.set_debuglevel = conn.set_debuglevel
  1103.  
  1104.         conn._http_vsn = self._http_vsn
  1105.         conn._http_vsn_str = self._http_vsn_str
  1106.  
  1107.         self.file = None
  1108.  
  1109.     def connect(self, host=None, port=None):
  1110.         "Accept arguments to set the host/port, since the superclass doesn't."
  1111.  
  1112.         if host is not None:
  1113.             self._conn._set_hostport(host, port)
  1114.         self._conn.connect()
  1115.  
  1116.     def getfile(self):
  1117.         "Provide a getfile, since the superclass' does not use this concept."
  1118.         return self.file
  1119.  
  1120.     def putheader(self, header, *values):
  1121.         "The superclass allows only one value argument."
  1122.         self._conn.putheader(header, '\r\n\t'.join(values))
  1123.  
  1124.     def getreply(self):
  1125.         """Compat definition since superclass does not define it.
  1126.  
  1127.         Returns a tuple consisting of:
  1128.         - server status code (e.g. '200' if all goes well)
  1129.         - server "reason" corresponding to status code
  1130.         - any RFC822 headers in the response from the server
  1131.         """
  1132.         try:
  1133.             response = self._conn.getresponse()
  1134.         except BadStatusLine, e:
  1135.             ### hmm. if getresponse() ever closes the socket on a bad request,
  1136.             ### then we are going to have problems with self.sock
  1137.  
  1138.             ### should we keep this behavior? do people use it?
  1139.             # keep the socket open (as a file), and return it
  1140.             self.file = self._conn.sock.makefile('rb', 0)
  1141.  
  1142.             # close our socket -- we want to restart after any protocol error
  1143.             self.close()
  1144.  
  1145.             self.headers = None
  1146.             return -1, e.line, None
  1147.  
  1148.         self.headers = response.msg
  1149.         self.file = response.fp
  1150.         return response.status, response.reason, response.msg
  1151.  
  1152.     def close(self):
  1153.         self._conn.close()
  1154.  
  1155.         # note that self.file == response.fp, which gets closed by the
  1156.         # superclass. just clear the object ref here.
  1157.         ### hmm. messy. if status==-1, then self.file is owned by us.
  1158.         ### well... we aren't explicitly closing, but losing this ref will
  1159.         ### do it
  1160.         self.file = None
  1161.  
  1162. if hasattr(socket, 'ssl'):
  1163.     class HTTPS(HTTP):
  1164.         """Compatibility with 1.5 httplib interface
  1165.  
  1166.         Python 1.5.2 did not have an HTTPS class, but it defined an
  1167.         interface for sending http requests that is also useful for
  1168.         https.
  1169.         """
  1170.  
  1171.         _connection_class = HTTPSConnection
  1172.  
  1173.         def __init__(self, host='', port=None, key_file=None, cert_file=None,
  1174.                      strict=None):
  1175.             # provide a default host, pass the X509 cert info
  1176.  
  1177.             # urf. compensate for bad input.
  1178.             if port == 0:
  1179.                 port = None
  1180.             self._setup(self._connection_class(host, port, key_file,
  1181.                                                cert_file, strict))
  1182.  
  1183.             # we never actually use these for anything, but we keep them
  1184.             # here for compatibility with post-1.5.2 CVS.
  1185.             self.key_file = key_file
  1186.             self.cert_file = cert_file
  1187.  
  1188.  
  1189. class HTTPException(Exception):
  1190.     # Subclasses that define an __init__ must call Exception.__init__
  1191.     # or define self.args.  Otherwise, str() will fail.
  1192.     pass
  1193.  
  1194. class NotConnected(HTTPException):
  1195.     pass
  1196.  
  1197. class InvalidURL(HTTPException):
  1198.     pass
  1199.  
  1200. class UnknownProtocol(HTTPException):
  1201.     def __init__(self, version):
  1202.         self.args = version,
  1203.         self.version = version
  1204.  
  1205. class UnknownTransferEncoding(HTTPException):
  1206.     pass
  1207.  
  1208. class UnimplementedFileMode(HTTPException):
  1209.     pass
  1210.  
  1211. class IncompleteRead(HTTPException):
  1212.     def __init__(self, partial):
  1213.         self.args = partial,
  1214.         self.partial = partial
  1215.  
  1216. class ImproperConnectionState(HTTPException):
  1217.     pass
  1218.  
  1219. class CannotSendRequest(ImproperConnectionState):
  1220.     pass
  1221.  
  1222. class CannotSendHeader(ImproperConnectionState):
  1223.     pass
  1224.  
  1225. class ResponseNotReady(ImproperConnectionState):
  1226.     pass
  1227.  
  1228. class BadStatusLine(HTTPException):
  1229.     def __init__(self, line):
  1230.         self.args = line,
  1231.         self.line = line
  1232.  
  1233. # for backwards compatibility
  1234. error = HTTPException
  1235.  
  1236. class LineAndFileWrapper:
  1237.     """A limited file-like object for HTTP/0.9 responses."""
  1238.  
  1239.     # The status-line parsing code calls readline(), which normally
  1240.     # get the HTTP status line.  For a 0.9 response, however, this is
  1241.     # actually the first line of the body!  Clients need to get a
  1242.     # readable file object that contains that line.
  1243.  
  1244.     def __init__(self, line, file):
  1245.         self._line = line
  1246.         self._file = file
  1247.         self._line_consumed = 0
  1248.         self._line_offset = 0
  1249.         self._line_left = len(line)
  1250.  
  1251.     def __getattr__(self, attr):
  1252.         return getattr(self._file, attr)
  1253.  
  1254.     def _done(self):
  1255.         # called when the last byte is read from the line.  After the
  1256.         # call, all read methods are delegated to the underlying file
  1257.         # object.
  1258.         self._line_consumed = 1
  1259.         self.read = self._file.read
  1260.         self.readline = self._file.readline
  1261.         self.readlines = self._file.readlines
  1262.  
  1263.     def read(self, amt=None):
  1264.         if self._line_consumed:
  1265.             return self._file.read(amt)
  1266.         assert self._line_left
  1267.         if amt is None or amt > self._line_left:
  1268.             s = self._line[self._line_offset:]
  1269.             self._done()
  1270.             if amt is None:
  1271.                 return s + self._file.read()
  1272.             else:
  1273.                 return s + self._file.read(amt - len(s))
  1274.         else:
  1275.             assert amt <= self._line_left
  1276.             i = self._line_offset
  1277.             j = i + amt
  1278.             s = self._line[i:j]
  1279.             self._line_offset = j
  1280.             self._line_left -= amt
  1281.             if self._line_left == 0:
  1282.                 self._done()
  1283.             return s
  1284.  
  1285.     def readline(self):
  1286.         if self._line_consumed:
  1287.             return self._file.readline()
  1288.         assert self._line_left
  1289.         s = self._line[self._line_offset:]
  1290.         self._done()
  1291.         return s
  1292.  
  1293.     def readlines(self, size=None):
  1294.         if self._line_consumed:
  1295.             return self._file.readlines(size)
  1296.         assert self._line_left
  1297.         L = [self._line[self._line_offset:]]
  1298.         self._done()
  1299.         if size is None:
  1300.             return L + self._file.readlines()
  1301.         else:
  1302.             return L + self._file.readlines(size)
  1303.  
  1304. def test():
  1305.     """Test this module.
  1306.  
  1307.     A hodge podge of tests collected here, because they have too many
  1308.     external dependencies for the regular test suite.
  1309.     """
  1310.  
  1311.     import sys
  1312.     import getopt
  1313.     opts, args = getopt.getopt(sys.argv[1:], 'd')
  1314.     dl = 0
  1315.     for o, a in opts:
  1316.         if o == '-d': dl = dl + 1
  1317.     host = 'www.python.org'
  1318.     selector = '/'
  1319.     if args[0:]: host = args[0]
  1320.     if args[1:]: selector = args[1]
  1321.     h = HTTP()
  1322.     h.set_debuglevel(dl)
  1323.     h.connect(host)
  1324.     h.putrequest('GET', selector)
  1325.     h.endheaders()
  1326.     status, reason, headers = h.getreply()
  1327.     print 'status =', status
  1328.     print 'reason =', reason
  1329.     print "read", len(h.getfile().read())
  1330.     print
  1331.     if headers:
  1332.         for header in headers.headers: print header.strip()
  1333.     print
  1334.  
  1335.     # minimal test that code to extract host from url works
  1336.     class HTTP11(HTTP):
  1337.         _http_vsn = 11
  1338.         _http_vsn_str = 'HTTP/1.1'
  1339.  
  1340.     h = HTTP11('www.python.org')
  1341.     h.putrequest('GET', 'http://www.python.org/~jeremy/')
  1342.     h.endheaders()
  1343.     h.getreply()
  1344.     h.close()
  1345.  
  1346.     if hasattr(socket, 'ssl'):
  1347.  
  1348.         for host, selector in (('sourceforge.net', '/projects/python'),
  1349.                                ):
  1350.             print "https://%s%s" % (host, selector)
  1351.             hs = HTTPS()
  1352.             hs.set_debuglevel(dl)
  1353.             hs.connect(host)
  1354.             hs.putrequest('GET', selector)
  1355.             hs.endheaders()
  1356.             status, reason, headers = hs.getreply()
  1357.             print 'status =', status
  1358.             print 'reason =', reason
  1359.             print "read", len(hs.getfile().read())
  1360.             print
  1361.             if headers:
  1362.                 for header in headers.headers: print header.strip()
  1363.             print
  1364.  
  1365. if __name__ == '__main__':
  1366.     test()
  1367.