我是靠谱客的博主 知性狗,这篇文章主要介绍爬虫1 科研之友单个学者主页爬取网页数据框架,现在分享给大家,希望可以做个参考。

爬取源数据:以科研之友为例

复制代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
""" 科研之友单个学者主页爬取网页数据框架 """ import requests headers = {'User-Agent': 'Mozilla/5.0'} def getHTMLText(url): try: r = requests.get(url, headers=headers) r.raise_for_status() r.encoding = 'r.apparent_encoding' demo = r.text print(demo) except: print("爬取失败") if __name__ == "__main__": url = "https://www.scholarmate.com/psnweb/outside/homepage?des3PsnId=77pmYOP1McoHSjoS0FT1BQ%3D%3D" print(getHTMLText(url))

最后

以上就是知性狗最近收集整理的关于爬虫1 科研之友单个学者主页爬取网页数据框架的全部内容,更多相关爬虫1内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(67)

评论列表共有 0 条评论

立即
投稿
返回
顶部