爬虫1 科研之友单个学者主页爬取网页数据框架

336 阅读 0 评论 222 点赞

我是靠谱客的博主知性狗，这篇文章主要介绍爬虫1 科研之友单个学者主页爬取网页数据框架，现在分享给大家，希望可以做个参考。

爬取源数据：以科研之友为例

"""
科研之友单个学者主页爬取网页数据框架
"""
import requests
headers = {'User-Agent': 'Mozilla/5.0'}
def getHTMLText(url):
try:
r = requests.get(url, headers=headers)
r.raise_for_status()
r.encoding = 'r.apparent_encoding'
demo = r.text
print(demo)
except:
print("爬取失败")
if __name__ == "__main__":
url = "https://www.scholarmate.com/psnweb/outside/homepage?des3PsnId=77pmYOP1McoHSjoS0FT1BQ%3D%3D"
print(getHTMLText(url))