Python 多线程爬取西刺代理
最后再使用另一段代码,将其转换为一个SSR代理工具直接能识别的格式,{‘http’: ‘http://119.101.112.31:9999’}然后再依次找到tr标签里面的所有td标签,然后只提取出里面的[1,2,5,9]这四个标签的位置,其他的不提取。西刺代理是一个国内IP代理,由于代理倒闭了,所以我就把原来的代码放出来供大家学习吧。首先找到所有的tr标签,与class="odd"的标签,然后提取出来。最后可以写出提取单一页面的代码,提取后将其保存到文件中。完整多线程版代码