问题:
今天写爬虫时用beautifulsoup解析网页代码发生了很诡异的事情:使用.prettify()方法打印出的代码正常,并且包含文本数据,但是用.get_text()死活获取不到文本数据,又试了.string和.text,同样获取不到文本
解决:
搜索了很久,并未在互联网上找到有效的解决方案,但是折腾了好久,最后重新把bs4的文档全部重读了一遍,突然感觉是解析器的问题,于是果断换个解析器试试,在这里我用的是html5lib,需要用pip安装下,重新运行代码,果然正常了,坑爹啊,浪费几个小时时间,记录下来给后来者参考。
最后
以上就是体贴汉堡最近收集整理的关于beautifulsoup的get_text方法没有获取到字符串或者字符串为空的全部内容,更多相关beautifulsoup内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复