如何使用:(request模块的编码流程)
-指定url
-发起请求
-获取响应数据
-持久化存储
# 需求:爬取搜狗首页的页面数据
import requests
if __name__=='__main__':
# 指定url
url='https://www.sogou.com/'
# 发起请求
# get方法会返回一个响应对象
response=requests.get(url=url)
# 获取响应数据,text返回的是字符串形式的响应数据
page_text=response.text
print(page_text)
# 持久化存储
with open('./sogou.html','w',encoding='utf-8') as fp:
fp.write(page_text)
print('爬取数据成功!!!')
最后
以上就是善良犀牛最近收集整理的关于爬取搜狗首页的页面数据的全部内容,更多相关爬取搜狗首页内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复