甜美豆芽

文章
3
资源
0
加入时间
2年10月17天

selenium+python headless访问网页

最近学python爬虫,发现请求的页面如果是内容是异步加载的,则没办法用BeautifulSoup这些库爬取异步加载的数据。selenium是自动化测试工具,可以调用浏览器加载页面数据(包括异步加载的数据),通过selenium可以很便捷爬取页面所有信息先下载python的selenium库pip install selenium1、selenium+phantomjs(已夭折)官网:http:/...