数据分析职位爬虫与分析
本人用R语言中的rvest包(需要加载xml2)爬取了猎聘网的一些数据,关键词为’数据分析’,网址是这个,然后利用python中的pandas进行分析。爬虫简单介绍一下,rvest包支持Xpath,是我目前接触到的R语言爬虫最好的包。首先观察一下网页翻页的变化,发现第二页是在网址后面加了一个’&curPage=1’,尝试让最后是’0’,发现又回到了第一页,这个网站的页数是从’0’开始的,而R中的索引