【爬虫学习】爬虫基本流程1 爬虫的流程2 什么是request和response3 Request内容4 response内容5 能抓取什么数据6 解析方式7 为什么我抓到的和浏览器中的不一样8 怎么解决javascript渲染问题9 怎么保存数据

353 阅读 0 评论 233 点赞

我是靠谱客的博主还单身西装，这篇文章主要介绍【爬虫学习】爬虫基本流程1 爬虫的流程2 什么是request和response3 Request内容4 response内容5 能抓取什么数据6 解析方式7 为什么我抓到的和浏览器中的不一样8 怎么解决javascript渲染问题9 怎么保存数据，现在分享给大家，希望可以做个参考。

标签（空格分隔）：数据挖掘爬虫

1 爬虫的流程

1、发起请求；
2、获取相应内容；
3、解析网络内容；
4、保存数据（结构化存储）；

2 什么是request和response

User -> Server : Request
Server -> User : Response

3 Request内容

1、请求方式：get,post,head,put,delete
2、get和post的区别：请求的参数包含的部分不同；get请求可以直接通过输入访问，post只能由提交表单进行实现。
3、请求url：
4、请求头：浏览器的配置信息；
5、请求体：post内容请求体；

4 response内容

1、响应状态码；
2、响应头；
3、响应体；

5 能抓取什么数据

只要能获取到，都可以抓；

6 解析方式

1、直接处理；
2、json解析；
3、正则表达式；
4、BeautifulSoup提取；
5、pyquery和xpath提取；

7 为什么我抓到的和浏览器中的不一样

微博的话很多用的都是js格式。原生的html代码没有那么多微博的信息的。

8 怎么解决javascript渲染问题

1、分析ajax请求，返回的json字符串；
2、使用webdriver进行加载一个文件
3、splash库进行；
4、用另外的库进行模拟；

9 怎么保存数据

1、文本；
2、关系型数据库；
3、非关系型数据库；
4、二进制文件；

最后

以上就是还单身西装最近收集整理的关于【爬虫学习】爬虫基本流程1 爬虫的流程2 什么是request和response3 Request内容4 response内容5 能抓取什么数据6 解析方式7 为什么我抓到的和浏览器中的不一样8 怎么解决javascript渲染问题9 怎么保存数据的全部内容，更多相关【爬虫学习】爬虫基本流程1内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

本文分类：个人技能
浏览次数：353 次浏览
发布日期：2023-11-21 15:50:04

【爬虫学习】爬虫基本流程1 爬虫的流程2 什么是request和response3 Request内容4 response内容5 能抓取什么数据6 解析方式7 为什么我抓到的和浏览器中的不一样8 怎么解决javascript渲染问题9 怎么保存数据

1 爬虫的流程

2 什么是request和response

3 Request内容

4 response内容

5 能抓取什么数据

6 解析方式

7 为什么我抓到的和浏览器中的不一样

8 怎么解决javascript渲染问题

9 怎么保存数据

最后

评论列表共有 0 条评论

发表评论取消回复

【爬虫学习】爬虫基本流程1 爬虫的流程2 什么是request和response3 Request内容4 response内容5 能抓取什么数据6 解析方式7 为什么我抓到的和浏览器中的不一样8 怎么解决javascript渲染问题9 怎么保存数据

1 爬虫的流程

2 什么是request和response

3 Request内容

4 response内容

5 能抓取什么数据

6 解析方式

7 为什么我抓到的和浏览器中的不一样

8 怎么解决javascript渲染问题

9 怎么保存数据

最后

相关文章

评论列表共有 0 条评论

发表评论 取消回复

发表评论取消回复