scrapy无法循环抓取

289 阅读 0 评论 191 点赞

我是靠谱客的博主野性水蜜桃，这篇文章主要介绍scrapy无法循环抓取，现在分享给大家，希望可以做个参考。

最近在学习scrapy，写好了大概的样子，但是却发现无法循环抓取，最后自己想着以前貌似有个例子说过原因。

之前写的如下：

name = 'dmoz'
allowed_domains = ['dmoz.org']
start_urls = ['http://www.123.info/']

修改之后如下：

name = 'dmoz'
allowed_domains = ['123.info']
start_urls = ['http://www.123.info/']

为了实现yield当前站循环抓取，需要将allowed_domains改为与url一致的域名才行，也就是如果想抓取123.info的全站链接，需要将allowed_domains设置为123.info就可以通过Request实现循环抓取了

最后

以上就是野性水蜜桃最近收集整理的关于scrapy无法循环抓取的全部内容，更多相关scrapy无法循环抓取内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(191)

本文分类：爬虫
浏览次数：289 次浏览
发布日期：2024-05-01 10:15:01

相关文章

python 大文件的读取

python框架django的使用_Python Django框架用法完全攻略

python框架django的使用_Python Django框架用法完全攻略

Python以遍历的方式删除列表元素以remove的方式删除需要技术！！！通过创建新列表的方式绕路走比较合适

Python以遍历的方式删除列表元素以remove的方式删除需要技术！！！通过创建新列表的方式绕路走比较合适

Python Tricks（六）—— 删除一个可迭代序列中等于某值的全部元素

Python Tricks（六）—— 删除一个可迭代序列中等于某值的全部元素

scrapy无法循环抓取

Scrapy如何实现多个爬虫循环顺序爬取

Scrapy如何实现多个爬虫循环顺序爬取

python中可迭代对象，迭代器，生成器的区别和联系

python中可迭代对象，迭代器，生成器的区别和联系

C4D中无法连接对象+删除？

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部