我是靠谱客的博主 体贴汉堡,最近开发中收集的这篇文章主要介绍beautifulsoup的get_text方法没有获取到字符串或者字符串为空,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

问题:

今天写爬虫时用beautifulsoup解析网页代码发生了很诡异的事情:使用.prettify()方法打印出的代码正常,并且包含文本数据,但是用.get_text()死活获取不到文本数据,又试了.string和.text,同样获取不到文本

解决:

搜索了很久,并未在互联网上找到有效的解决方案,但是折腾了好久,最后重新把bs4的文档全部重读了一遍,突然感觉是解析器的问题,于是果断换个解析器试试,在这里我用的是html5lib,需要用pip安装下,重新运行代码,果然正常了,坑爹啊,浪费几个小时时间,记录下来给后来者参考。

最后

以上就是体贴汉堡为你收集整理的beautifulsoup的get_text方法没有获取到字符串或者字符串为空的全部内容,希望文章能够帮你解决beautifulsoup的get_text方法没有获取到字符串或者字符串为空所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(45)

评论列表共有 0 条评论

立即
投稿
返回
顶部