会撒娇溪流

文章
8
资源
0
加入时间
3年1月8天

《Python网络爬虫从入门到实践 第2版》第5章 解析网页第5章 解析网页

第5章 解析网页 我们已经能够使用requests库从网页把整个源代码爬取下来了,接下来需要从每个网页中提取一些数据。本章主要介绍使用3种方法提取网页中的数据,分别是正则表达式、BeautifulSoup和lxml。 3种方法各有千秋,想要快速学习的读者可以先挑选一种自己喜欢的方法学习,3种方法都能够解析网页。你也可以先阅读本章的最后一节,在了解3种方法各自的优缺点后,再选择一种方法开始学习。...