概述
第5章 解析网页
我们已经能够使用requests库从网页把整个源代码爬取下来了,接下来需要从每个网页中提取一些数据。本章主要介绍使用3种方法提取网页中的数据,分别是正则表达式、BeautifulSoup和lxml。
3种方法各有千秋,想要快速学习的读者可以先挑选一种自己喜欢的方法学习,3种方法都能够解析网页。你也可以先阅读本章的最后一节,在了解3种方法各自的优缺点后,再选择一种方法开始学习。
目录
第5章 解析网页
5.1 使用正则表达式解析网页
最后
以上就是会撒娇溪流为你收集整理的《Python网络爬虫从入门到实践 第2版》第5章 解析网页第5章 解析网页的全部内容,希望文章能够帮你解决《Python网络爬虫从入门到实践 第2版》第5章 解析网页第5章 解析网页所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复