自觉西装

文章
3
资源
0
加入时间
2年10月17天

Python豆瓣爬虫(1)urllib库

学完了Python基础的一些语法之后,也想通过以项目代练的方式对之前的知识进行熟练巩固。再者说,Python的库非常的强大,也只有在不断的实践过程中才能熟能生巧。所以开始想试一下爬虫这一方面,爬虫就是通过模拟浏览器访问网页服务器的形式,将页面上所需的页面爬取下来为我们所用的技术,这样的数据来源无疑对于大数据分析来说是非常好的。关于爬虫的发展和介绍这里不多做赘述(其实是我也没去了解过),直接就来讲讲要用到的一些库和工具:urllib库:Python自带,用来获取网页回应访问的信息,即获取访问页面的