阔达唇彩

文章
5
资源
0
加入时间
2年10月21天

python基础爬虫篇

headers是头文件,常见的网页一般都需要用headers进行一定程度的伪装,user-agent参数可以被视为必加内容,这是证明你从浏览器发出的请求而非从python中发出的请求,而cookie是用于维持你登录状态的一个参数,如果该网页没有登录状态需要维持,那么也可以选择不加,只添加user-agent参数就好。在这一区域我们只能观察和分析网页的静态内容,但也是我们用于抓取网页内容的重要环节。xx就是我们需要的内容了,反复通过这样的方式获取到各种内容,用一定的数据处理的方式整理一下,存储起来