Session提高requests的抓取速度小技巧

292 阅读 0 评论 193 点赞

我是靠谱客的博主激动往事，这篇文章主要介绍Session提高requests的抓取速度小技巧，现在分享给大家，希望可以做个参考。

使用requests抓取数据的时候，爬虫会模拟浏览器的行为，但是可能不知道，当打开一个网页的时候，requests.get()可能速度很快，但是如果几十个上百个网址的时候呢，这个差距就出来了，例如下面。

import requests
import time

start = time.time()

for _ in range(100):
    resp = requests.get('https://baidu.com').content.decode()
end = time.time()
print(f'访问一百次网页，耗时：{end - start}')

结果是用时20s，时间太长了，如果网站更多，那就更久。但是我们可以改变一下。

import requests
import time

start = time.time()
session = requests.Session()
for _ in range(100):
    resp = session.get('https://baidu.com').content.decode()
end = time.time()
print(f'访问一百次网页，耗时：{end - start}')

结果是用时5S，怎么样这速度就提升了很大了吧，主要就是Session()方法是，爬虫在模拟浏览器的时候，打开另一个网址是相当于重新开了一个窗口用来访问，并不是重新开一个浏览器去访问。这样爬虫不仅行为更像人类，而且节省了很多爬虫后台模拟打开浏览器的行为所浪费的时间。

最后

以上就是激动往事最近收集整理的关于Session提高requests的抓取速度小技巧的全部内容，更多相关Session提高requests内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(193)

本文分类：Python爬虫技巧日常总结
浏览次数：292 次浏览
发布日期：2024-07-23 17:10:02

相关文章

Python之多线程爬虫抓取网页图片的示例代码

Python之多线程爬虫抓取网页图片的示例代码

SQL注入

python3多进程爬虫_爬虫系列（三）——多进程爬虫

python3多进程爬虫_爬虫系列（三）——多进程爬虫

C#常见几道面试题

Session提高requests的抓取速度小技巧

Session提高requests的抓取速度小技巧

【Python】Python应用Redis作为缓存来提高数据存取效率1.问题描述2.解决方法

【Python】Python应用Redis作为缓存来提高数据存取效率1.问题描述2.解决方法

python requests爬网页加速

python requests爬网页加速

python redis处理高并发-Python-Redis：内存优化/性能策略

python redis处理高并发-Python-Redis：内存优化/性能策略

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部