Python - HTTP 响应

http 或超文本传输协议适用于客户端服务器模型。 通常 Web 浏览器是客户端,托管网站的计算机是服务器。 在收到来自客户端的请求后,服务器生成响应并将其以特定格式发送回客户端。

在接收并解释请求消息后,服务器以 HTTP 响应消息进行响应:

  • 状态行
  • 零个或多个标头(通用|响应|实体)字段后跟 CRLF
  • 一个空行(即,CRLF 之前没有任何内容的行)指示标头字段的结尾
  • 可选的消息正文

以下部分解释了 HTTP 响应消息中使用的每个实体。


消息状态行

状态行由协议版本和数字状态代码及其关联的文本短语组成。 元素由空格 SP 字符分隔。

Status-Line = HTTP-Version SP Status-Code SP Reason-Phrase CRLF

HTTP 版本

支持HTTP 1.1版本的服务器会返回如下版本信息:

HTTP-Version = HTTP/1.1

状态码

Status-Code 元素是一个 3 位整数,其中 Status-Code 的第一位定义响应的类别,最后两位没有任何分类作用。 第一位有5个值:

S.N. 状态码和描述
1 1xx: Informational

这意味着请求已收到,并且该过程正在继续。

2 2xx: Success

表示动作被成功接收、理解、接受。

3 3xx: Redirection

这意味着必须采取进一步的行动才能完成请求。

4 4xx: Client Error

这意味着请求包含错误的语法或无法实现。

5 5xx: Server Error

这意味着服务器未能完成有效的请求。

HTTP 状态码是可扩展的,HTTP 应用程序不需要理解所有已注册状态码的含义。


使用 Python 请求

在下面的 python 程序中,使用 urllib3 模块发出 http GET 请求并接收包含数据的响应。 它还提供响应代码,该代码也由模块中的函数管理。 PoolManager 对象处理连接池的所有细节,还处理线程安全。

import urllib3
http = urllib3.PoolManager()

resp = http.request('GET', 'http://tutorialspoint.com/robots.txt')
print resp.data

# get the status of the response
print resp.status

当运行上面的程序时,得到以下输出 −

User-agent: *
Disallow: /tmp
Disallow: /logs
Disallow: /rate/*
Disallow: /cgi-bin/*
Disallow: /videotutorials/video_course_view.php?*
Disallow: /videotutorials/course_view.php?*
Disallow: /videos/*
Disallow: /*/*_question_bank/*
Disallow: //*/*/*/*/src/*

200