自觉西装

文章
3
资源
0
加入时间
2年10月17天

Python豆瓣爬虫(1)urllib库

学完了Python基础的一些语法之后,也想通过以项目代练的方式对之前的知识进行熟练巩固。再者说,Python的库非常的强大,也只有在不断的实践过程中才能熟能生巧。所以开始想试一下爬虫这一方面,爬虫就是通过模拟浏览器访问网页服务器的形式,将页面上所需的页面爬取下来为我们所用的技术,这样的数据来源无疑对于大数据分析来说是非常好的。关于爬虫的发展和介绍这里不多做赘述(其实是我也没去了解过),直接就来讲讲要用到的一些库和工具:urllib库:Python自带,用来获取网页回应访问的信息,即获取访问页面的

re模块中match和search的区别及使用

python的正则匹配如果看懂了,很有逻辑,还是比较好用的。但是如果不熟悉的话,感觉函数太多,难以区分。match和search是正则匹配中常用的两个函数。在用之前我们首先想,如果我想找某字符串的头上有没有指定的某个字符串,我们该怎么办?python专门给我们提供了一个函数,它就是match。match只会匹配字符串头,如果字符串头有想要查找的模式,那就返回成功,如果没有那么就返回none。...

Nginx配置优化详解

大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装,修改这里或那里的几行配置,好了,你已经有了一