Python - HTTP 响应
http 或超文本传输协议适用于客户端服务器模型。 通常 Web 浏览器是客户端,托管网站的计算机是服务器。 在收到来自客户端的请求后,服务器生成响应并将其以特定格式发送回客户端。
在接收并解释请求消息后,服务器以 HTTP 响应消息进行响应:
- 状态行
- 零个或多个标头(通用|响应|实体)字段后跟 CRLF
- 一个空行(即,CRLF 之前没有任何内容的行)指示标头字段的结尾
- 可选的消息正文
以下部分解释了 HTTP 响应消息中使用的每个实体。
消息状态行
状态行由协议版本和数字状态代码及其关联的文本短语组成。 元素由空格 SP 字符分隔。
Status-Line = HTTP-Version SP Status-Code SP Reason-Phrase CRLF
HTTP 版本
支持HTTP 1.1版本的服务器会返回如下版本信息:
HTTP-Version = HTTP/1.1
状态码
Status-Code 元素是一个 3 位整数,其中 Status-Code 的第一位定义响应的类别,最后两位没有任何分类作用。 第一位有5个值:
S.N. | 状态码和描述 |
---|---|
1 | 1xx: Informational 这意味着请求已收到,并且该过程正在继续。 |
2 | 2xx: Success 表示动作被成功接收、理解、接受。 |
3 | 3xx: Redirection 这意味着必须采取进一步的行动才能完成请求。 |
4 | 4xx: Client Error 这意味着请求包含错误的语法或无法实现。 |
5 | 5xx: Server Error 这意味着服务器未能完成有效的请求。 |
HTTP 状态码是可扩展的,HTTP 应用程序不需要理解所有已注册状态码的含义。
使用 Python 请求
在下面的 python 程序中,使用 urllib3 模块发出 http GET 请求并接收包含数据的响应。 它还提供响应代码,该代码也由模块中的函数管理。 PoolManager 对象处理连接池的所有细节,还处理线程安全。
import urllib3 http = urllib3.PoolManager() resp = http.request('GET', 'http://tutorialspoint.com/robots.txt') print resp.data # get the status of the response print resp.status
当运行上面的程序时,得到以下输出 −
User-agent: * Disallow: /tmp Disallow: /logs Disallow: /rate/* Disallow: /cgi-bin/* Disallow: /videotutorials/video_course_view.php?* Disallow: /videotutorials/course_view.php?* Disallow: /videos/* Disallow: /*/*_question_bank/* Disallow: //*/*/*/*/src/* 200