news 2026/6/10 12:33:36

10.2 Requests库入门

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
10.2 Requests库入门

文章目录

  • 前言
  • 一、Requests简介
  • 二、 快速上手
    • 2.1 发送请求
    • 2.2 传递参数
    • 2.3 响应内容
    • 2.4 自定义请求头
    • 2.5 重定向与历史记录
    • 2.6 错误与异常处理

前言

爬虫本质上是一种自动化程序,它通过模拟客户端向服务器发送网络请求,获取响应数据,并依据预设规则对数据进行解析与存储。在 Python 生态中,提及爬虫便不得不提及其核心库之一 —— Requests。


一、Requests简介

根据官方文档的描述:
Requests 是唯一一个非转基因的 Python HTTP 库,可供人类安全使用。
警告:非专业使用其他 HTTP 库可能导致危险的副作用,包括但不限于:安全缺陷、冗余代码、重复造轮子、啃文档、抑郁、头痛,甚至死亡。
这段介绍生动地概括了 Requests 库的特点,此处不再赘述。安装方式为在终端中执行命令:pip install requests。

二、 快速上手

2.1 发送请求

首先导入 Requests 模块:

pythonimportrequests

发起一个 GET 请求获取网页:

python r=requests.get('http://xxx.xxx')

此时我们获得了一个 Response 对象 r,可通过它进一步获取响应信息。Requests 提供了直观的 API 来支持常见 HTTP 方法,示例如下:

python r=requests.head('http://xxx.xxx/get')r=requests.post('http://xxx.xxx/post',data={'key':'value'})r=requests.put('http://xxx.xxx/put',data={'key':'value'})r=requests.delete('http://xxx.xxx/delete')

通常建议为请求设置超时时间,通过 timeout 参数指定(单位为秒):

python r=requests.head('http://xxx.xxx/get',timeout=1)

2.2 传递参数

使用 GET 请求时,参数通常以键值对形式附在 URL 问号之后,如 http://xxx.xxx/get?key=val。Requests 支持通过 params 参数以字典形式传入参数:

python params={'key1':'val1','key2':'val2'}r=requests.get("http://xxx.xxx/get",params=params)

也支持将列表作为值传入:

python params={'key1':'val1','key2':['val2','val3']}

注:字典中值为 None 的键不会被添加到 URL 查询字符串中。

2.3 响应内容

获取服务器返回的内容,以 https://api.github.com 为例:

pythonimportrequests r=requests.get('https://api.github.com')print(r.text)# 输出示例:# {"current_user_url":"https://api.github.com/user","current_user...

访问 r.text 时,Requests 会自动推测编码格式,可通过 r.encoding 查看或修改:

python r.encoding='GBK'# 修改编码
  1. 二进制内容
    如图片等二进制数据,可通过 r.content 获取:
pythonfromPILimportImagefromioimportBytesIO i=Image.open(BytesIO(r.content))
  1. JSON 内容
    Requests 内置了 JSON 解码器,可方便地解析 JSON 响应:
pythonimportrequests r=requests.get('https://api.github.com')data=r.json()

注意:调用 r.json() 成功并不代表请求成功。某些服务器可能在错误响应中也返回 JSON 数据(如 HTTP 500 错误信息)。因此建议通过 r.status_code(状态码 200 表示成功)或 r.raise_for_status()(成功时返回 None)进一步验证。

2.4 自定义请求头

如需添加请求头,可通过 headers 参数传入字典:

python url='http://xxx.xxx'headers={'user-agent':'xxx'}r=requests.get(url,headers=headers)

注意:自定义请求头的优先级低于某些特定配置。例如,若在 .netrc 中设置了认证信息,通过 headers 设置的 Authorization 将不会生效;若使用 auth 参数,则 .netrc 的配置将被覆盖。所有请求头值必须为字符串、字节串或 Unicode(通常不建议使用 Unicode)。

2.5 重定向与历史记录

默认情况下,Requests 会自动处理除 HEAD 外的所有重定向。可通过 history 属性查看重定向历史,该列表按请求时间从晚到早排序:

pythonimportrequests r=requests.get('http://github.com')print(r.history)# 输出示例:[<Response [301]>]

若需禁用重定向,可在 GET、POST、PUT、DELETE、OPTIONS、PATCH 请求中设置 allow_redirects=False:

python r=requests.get('http://xxx.xxx',allow_redirects=False)

2.6 错误与异常处理

网络问题(如 DNS 失败、连接拒绝)会抛出 ConnectionError;
HTTP 返回非成功状态码时,Response.raise_for_status() 会抛出 HTTPError;
请求超时会抛出 Timeout;
超过最大重定向次数会抛出 TooManyRedirects。
所有 Requests 显式抛出的异常均继承自 requests.exceptions.RequestException。


版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/9 21:33:40

Spring4Shell CVE-2022-22965原理及复现

Spring4Shell&#xff08;正式编号为 CVE-2022-22965&#xff09;是 2022 年 3 月底发现的一个存在于 Spring Framework 中的远程代码执行&#xff08;RCE&#xff09;高危漏洞。由于 Spring 框架在 Java 生态中的核心地位&#xff0c;该漏洞曾引发了全行业的广泛关注&#xff…

作者头像 李华
网站建设 2026/6/10 11:50:49

拥抱大数据领域数据可视化,提升数据分析效率

拥抱大数据领域数据可视化&#xff0c;提升数据分析效率关键词&#xff1a;大数据、数据可视化、数据分析效率、可视化工具、可视化方法摘要&#xff1a;本文深入探讨了大数据领域的数据可视化&#xff0c;旨在帮助大家通过数据可视化来提升数据分析效率。首先介绍了数据可视化…

作者头像 李华
网站建设 2026/6/10 12:00:50

数字孪生在航空发动机总体性能中的应用前景

截至2026年初&#xff0c;数字孪生技术在航空发动机总体性能优化中的应用已从概念验证迈向规模化落地阶段&#xff0c;展现出广阔的应用前景。其核心价值在于通过构建高保真、多物理场耦合、全生命周期覆盖的虚拟镜像&#xff0c;实现对发动机设计、制造、试验、运维等各环节性…

作者头像 李华
网站建设 2026/6/9 18:45:55

雷军又发奖了!1000万奖金花落“玄戒”,未来5年还要砸2000亿搞研发

1月8日一早&#xff0c;科技圈就被雷军的一条消息刷屏了。小米不仅开了个隆重的技术大奖颁奖礼&#xff0c;雷军还在社交平台上大大方方地宣布&#xff1a;今年的千万技术大奖&#xff0c;被“玄戒O1”团队稳稳拿下了。能在小米这么多顶尖项目里脱颖而出&#xff0c;拿到这沉甸…

作者头像 李华
网站建设 2026/6/10 12:01:55

基于51单片机的排队叫号系统—两块单片机串行通信

基于51单片机的排队叫号系统 &#xff08;仿真&#xff0b;程序原理图&#xff0b;设计报告&#xff09; 功能介绍 具体功能&#xff1a; 1.主机通过4个按键模拟4个柜台号&#xff0c;按下按键实现叫号&#xff1b; 2.柜台叫号后&#xff0c;LCD1602显示被叫的号码及叫号的柜…

作者头像 李华
网站建设 2026/6/10 12:02:24

10分钟玩转阿里通义Z-Image-Turbo:零基础搭建你的AI绘画工坊

10分钟玩转阿里通义Z-Image-Turbo&#xff1a;零基础搭建你的AI绘画工坊 作为一名数字艺术爱好者&#xff0c;你是否曾被AI生成图像的无限创意所吸引&#xff0c;却又被复杂的模型部署和GPU配置劝退&#xff1f;阿里通义Z-Image-Turbo作为一款高性能文生图模型&#xff0c;能够…

作者头像 李华