概述
问题:
今天写爬虫时用beautifulsoup解析网页代码发生了很诡异的事情:使用.prettify()方法打印出的代码正常,并且包含文本数据,但是用.get_text()死活获取不到文本数据,又试了.string和.text,同样获取不到文本
解决:
搜索了很久,并未在互联网上找到有效的解决方案,但是折腾了好久,最后重新把bs4的文档全部重读了一遍,突然感觉是解析器的问题,于是果断换个解析器试试,在这里我用的是html5lib,需要用pip安装下,重新运行代码,果然正常了,坑爹啊,浪费几个小时时间,记录下来给后来者参考。
最后
以上就是体贴汉堡为你收集整理的beautifulsoup的get_text方法没有获取到字符串或者字符串为空的全部内容,希望文章能够帮你解决beautifulsoup的get_text方法没有获取到字符串或者字符串为空所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复