02-27 提高scrapy爬取效率的方法
1、增加并发(增加并发线程数)scrapy默认开启的线程为32个,可以适当增加。在setting文件中修改为 1002、降低日志级别在运行scrapy时会有大量日志信息输出,为了减少日志信息的输出,降低CPU的使用率,可以设置输出错误日志 LOG_LEVEL='ERROR' 或者 'INFO'3、禁止cookie如果不是真的需要cookie,则在爬取数据时可以禁止cookie,从而减少CPU的使用率。在setting中写 COOKIES_ENABLED=False4、禁止重试:对