1. 首页
  2. 编程语言
  3. Python
  4. python爬虫入门教程--快速理解HTTP协议(一)

python爬虫入门教程--快速理解HTTP协议(一)

上传者: 2021-07-07 16:58:14上传 PDF文件 160.76 KB 热度 8次

HTTP 协议本身是非常简单的。它规定,只能由客户端主动发起请求,服务器接收请求处理后返回响应结果,同时 HTTP 是一种无状态的协议,协议本身不记录客户端的历史请求记录。HTTP 请求由3部分组成,分别是请求行、请求首部、请求体,首部和请求体是可选的,并不是每个请求都需要的。HTTP协议中最常用的请求方法有:GET、POST、PUT、DELETE。响应行同样也是3部分组成,由服务端支持的 HTTP 协议版本号、状态码、以及对状态码的简短原因描述组成。状态码是响应行中很重要的一个字段。404 表示请求的资源在服务器找不到。从结果来看,它与协议中规范的格式是一样的,第一行是响应行,状态码是200,表明请求成功。第三部分就是真正的响应体 HTML 文本。

用户评论