我是靠谱客的博主 含糊外套,最近开发中收集的这篇文章主要介绍python爬取网页存入到Excel,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

from requests_html import HTMLSession
import xlwt
# 建立会话
session = HTMLSession()
url = 'https://www.jianshu.com/p/85f4624485b9'
read = session.get(url)
select = 'body > div.note > div.post > div.article > div.show-content > div > p > a'
def get_url_element(select):
url_list = []
url_element = read.html.find(select)
try:
for result in url_element:
# 返回网页元素 对应的文字描述
get_text = result.text
# 将返回数组转为list
返回HTML中的绝对路径链接
get_links = list(result.absolute_links)[0]
url_list.append(get_text)
url_list.append(get_links)
return url_list
except:
None
# 创建Excel对象
workExcel = xlwt.Workbook()
# 添加表名
sheet = workExcel.add_sheet('sheet')
data = get_url_element(select)
# 将list转化为dictionary
df = dict(zip(data[0::2],data[1::2]))
row = 0
# 迭代字典
for i,j in df.items():
sheet.write(row,0,i)
sheet.write(row,1,j)
row += 1
workExcel.save('E:\firstExcel\output.xls')

转载于:https://my.oschina.net/u/3867704/blog/3024564

最后

以上就是含糊外套为你收集整理的python爬取网页存入到Excel的全部内容,希望文章能够帮你解决python爬取网页存入到Excel所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(50)

评论列表共有 0 条评论

立即
投稿
返回
顶部