python 爬虫实战（一）爬取豆瓣图书top250

318 阅读 0 评论 210 点赞

我是靠谱客的博主虚拟茉莉，这篇文章主要介绍python 爬虫实战（一）爬取豆瓣图书top250，现在分享给大家，希望可以做个参考。

import requests
from lxml import etree
with open('booktop250.txt','w',encoding='utf-8') as f:
for i in range(0,226,25):
url = 'https://book.douban.com/top250?start={}'.format(i)
data = requests.get(url).text
page = etree.HTML(data)
file = page.xpath('//*[@id="content"]/div/div[1]/div/table')
for div in file:
title = div.xpath('./tr/td[2]/div[1]/a/@title')
pf = div.xpath('./tr/td[2]/div[2]/span[2]/text()')
words = div.xpath('./tr/td[2]/p[2]/span/text()')
f.write("n""{}{}{}".format(title,pf,words))
print("ALL IS OVER!")

最后

以上就是虚拟茉莉最近收集整理的关于python 爬虫实战（一）爬取豆瓣图书top250的全部内容，更多相关python内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(210)

本文分类：python爬虫
浏览次数：318 次浏览
发布日期：2024-01-15 15:55:24

相关文章

python 爬取豆瓣图书，保存为CSV格式

python 爬取豆瓣图书，保存为CSV格式

学习Python爬虫案例-获得豆瓣Top250的电影数据

学习Python爬虫案例-获得豆瓣Top250的电影数据

通过python爬取豆瓣前250条电影信息

通过python爬取豆瓣前250条电影信息

跟随B站视频学Python爬虫过程（6）：豆瓣电影TOP250并存Excel（使用urllib, bs, re, xlwt库）

跟随B站视频学Python爬虫过程（6）：豆瓣电影TOP250并存Excel（使用urllib, bs, re, xlwt库）

python 爬虫实战（一）爬取豆瓣图书top250

python 爬虫实战（一）爬取豆瓣图书top250

爬取豆瓣前250电影数据

Python爬虫之爬取豆瓣电影（二）

Python爬虫之爬取豆瓣电影（二）

工具猿之python爬虫-豆瓣图书TOP250

工具猿之python爬虫-豆瓣图书TOP250

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部