Scrapy性能调优及检测性能问题的步骤

277 阅读 0 评论 183 点赞

我是靠谱客的博主背后野狼，这篇文章主要介绍Scrapy性能调优及检测性能问题的步骤，现在分享给大家，希望可以做个参考。

前面已经说过，Scrapy的瓶颈被设置在下载器这个地方。要获得最高的性能，可以从一个低的CONCURRENT_REQUESTS开始，一直增加这个值，直到达到了以下某个限制：

CPU使用率达到80-90%
目标网站的延迟显著上升
scraper（即爬虫和pipeline）中的所有Response对象占用的总内存大小不超过5MB

同时还要保证以下条件：

在任何时候都要保证调度器的队列（mqs/dqs）中有一些Request，以保证下载器中的请求数量
永远不要使用阻塞的代码或者CPU密集型的代码（这种情况下应该使用另一个线程处理）

这里写图片描述

上图总结了诊断并修复Scrapy性能问题的步骤。

最后

以上就是背后野狼最近收集整理的关于Scrapy性能调优及检测性能问题的步骤的全部内容，更多相关Scrapy性能调优及检测性能问题内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(183)

本文分类：scrapy
浏览次数：277 次浏览
发布日期：2024-07-23 06:55:01

相关文章

解决Scrapy性能问题——案例二（含有阻塞的代码）

解决Scrapy性能问题——案例二（含有阻塞的代码）

scrapy 速度优化

python scrapy抓取返回为json数据格式的内容

python scrapy抓取返回为json数据格式的内容

嫌多(线程/进程)太慢？嫌Scrapy太麻烦？没事，异步高调走起！——瓜子二手车

嫌多(线程/进程)太慢？嫌Scrapy太麻烦？没事，异步高调走起！——瓜子二手车

Scrapy性能调优及检测性能问题的步骤

Scrapy性能调优及检测性能问题的步骤

php获取网址返回json,4、Scrapy框架，爬取网站返回json数据（spider源码)

php获取网址返回json,4、Scrapy框架，爬取网站返回json数据（spider源码)

安装scrapy速度慢解决方法速度贼快

安装scrapy速度慢解决方法速度贼快

Mysql调优之慢sql抓取

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部