爬虫小白第一篇 西刺代理
爬取西刺代理流程图背景环境:python3.6模块: urllib.request(获取html)chardet(判断html的编码)bs4.Beautiful(提取代理IP)github地址(https://github.com/tonyxinminghui/spider/blob/master/xici_spider.py) 获取html难点选择用什么模块获取html西刺代理