我是靠谱客的博主 个性纸飞机,最近开发中收集的这篇文章主要介绍python cookie池_Python爬虫scrapy框架Cookie池(微博Cookie池)的使用,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

下载代码Cookie池(这里主要是微博登录,也可以自己配置置其他的站点网址)

d36af58ca2b3946011ae3a70afd75342.png

下载安装过后注意看网页下面的相关基础配置和操作!!!!!!!!!!!!!

自己的设置主要有下面几步:

1、配置其他设置

1be6f85225226823747ea8538fe61916.png

2、设置使用的浏览器

e91f407dd4f11c5e1eb0b12bda425819.png

dc98d2af8a0d60448f91452da2c6451e.png

3、设置模拟登陆

cc7e3580a90f091b7fbf4c5abef0717c.png

源码cookies.py的修改(以下两处不修改可能会产生bug):

152a158e3172651c0e0d6cfb8584363c.png

abde2fe08abfe7396ec604002ac547ca.png

4、获取cookie

随机获取Cookies: http://localhost:5000/weibo/random(注意:cookie使用时是需要后期处理的!!)

9f847b3cd56f9d76d81d5221cba0f7bc.png

简单的处理方式,如下代码(偶尔需要对获取的cookie处理):

def get_cookie(self):

return requests.get('http://127.0.0.1:5000/weibo/random').text

def stringToDict(self,cookie):

itemDict = {}

items = cookie.replace(':', '=').split(',')

for item in items:

key = item.split('=')[0].replace(' ', '').strip(' "')

value = item.split('=')[1].strip(' "')

itemDict[key] = value

return itemDict

scrapy爬虫的使用示例(爬取微博):

middlewares.py中自定义请求中间件

def start_requests(self):

ua = UserAgent()

headers = {

'User-Agent': ua.random,

}

cookies = self.stringToDict(str(self.get_cookie().strip('{|}')))

yield scrapy.Request(url=self.start_urls[0], headers=headers,

cookies=cookies, callback=self.parse)

cookies = self.stringToDict(str(self.get_cookie().strip('{|}')))

yield scrapy.Request(url=self.start_urls[0], headers=headers,

cookies=cookies, callback=self.parse)

settings.py 中的配置:

a441907ee6c1cb2756ab7d42f211594b.png

5、录入账号和密码:

e02856cebf93ba423e6f4825b7aad5f9.png

格式规定(账号----密码)

df207cc11be210fbf18bac1fea1c5cfb.png

6、验证:(注意:使用cmd)

13c7a9af973c0296373d3629f5b4c7ed.png

7、使用时注意保持cmd打开运行!!

使用时一定要打开cmd,并运行如第6步。

得到Cookie是判断是否处理处理Cookie(几乎都需要!!)类比第4步!!!

到此这篇关于Python爬虫scrapy框架Cookie池(微博Cookie池)的使用的文章就介绍到这了,更多相关scrapy Cookie池内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

最后

以上就是个性纸飞机为你收集整理的python cookie池_Python爬虫scrapy框架Cookie池(微博Cookie池)的使用的全部内容,希望文章能够帮你解决python cookie池_Python爬虫scrapy框架Cookie池(微博Cookie池)的使用所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(39)

评论列表共有 0 条评论

立即
投稿
返回
顶部