爬虫系列(一):解析网页的常见方式汇总——re、bs4、xpath——以链家租房信息爬取为例
这是本人第 2 篇博客,也是爬虫系列的第 1 篇博客。爬虫是我很早之前就开始接触的工具,主要用于爬取新浪财经的数据,毕竟当时没有Wind账号,找起数据很苦逼,只能自立更生。接下来一年左右,个人自由时间较为宽裕,想利用这段时间将自己的编程技能体系化,爬虫是我进行梳理的第一大部分,记录在此,供自己日后查阅,也希望可以帮助新入门者少走一些弯路。注:爬虫系列所有案例仅供个人学习使用。本文将以链家北京租房信息页面爬取为例,重点介绍如何通过re、bs4、xpath三种方式解析网页内容,抓取租房信息的相关内.