爬虫第三天:执行JS脚本
解析执行 JS 脚本代码,获取数据信息前一篇 讲解了如何使用 XPath 解析 HTML 的 DOM 元素。要想拿到全部的博客文章,前提是拿取到页面的分页信息;如今面临的问题是如何获取博客的分页信息???通过浏览器 F12 -> Network 中查看我们的爬取的页面 ‘https://blog.csdn.net/menglinjie’ 返回的信息,发现其中并没有页码信息,如下图所示,<div class="pagination-box" id=&