大气电脑

文章
2
资源
0
加入时间
2年10月24天

爬虫小白第一篇 西刺代理

爬取西刺代理流程图背景环境:python3.6模块: urllib.request(获取html)chardet(判断html的编码)bs4.Beautiful(提取代理IP)github地址(https://github.com/tonyxinminghui/spider/blob/master/xici_spider.py) 获取html难点选择用什么模块获取html西刺代理