我是靠谱客的博主 长情板栗,最近开发中收集的这篇文章主要介绍python 爬取微博展开全文数据 BeautifulSoup,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

最近,被逼无奈开始自学python爬虫。爬取微博网页版话题下的发布微博内容数据,发现有的微博需要点击展开全文按钮才能获得全文数据,否则只有部分数据。探索了一下发现大多都是selenium+python的代码,在这儿保存一个自己解决的BeautifulSoup下展开全文的方法。

for i in range(0,len(data)):
    if data[i].select("a[action-type='fl_unfold']")!=[]:
        content = data[i].find_all("p",style="display: none")
        if content[0].get_text().replace("/r/n", "").strip().endswith('收起全文d'):
            nr_info = content[0].get_text().replace("/r/n", "").strip()
            nr = filter_tags(db.escape_string(emoji.demojize(nr_info)))
            print(nr)
    else:
        nr_info=soup.select('div > div.card-feed > div.content > p.txt')  #微博内容
        if len(nr_info)>0:
            nr_info = nr_info[0].get_text().replace("/r/n", "").strip()
            nr = filter_tags(db.escape_string(emoji.demojize(nr_info)))
            print(nr)
        else:
            print("内容为空")

学习参考的内容:(浏览器收藏夹快放不下了)

Python中使用Beautiful Soup库的超详细教程 - 知乎

https://www.jb51.net/article/209456.htm

selenium+python抓取微博时遇到“展开全文”_m0_37435073的博客-CSDN博客

最后

以上就是长情板栗为你收集整理的python 爬取微博展开全文数据 BeautifulSoup的全部内容,希望文章能够帮你解决python 爬取微博展开全文数据 BeautifulSoup所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(42)

评论列表共有 0 条评论

立即
投稿
返回
顶部