概述
我有一些HTML代码,其中包含许多< table> s.
我正在尝试在第二个表中获取信息.有没有办法在不使用soup.findAll(‘table’)的情况下执行此操作?
当我使用soup.findAll(‘table’)时,我收到一个错误:
ValueError: too many values to unpack
有没有办法在某些代码中获取第n个标记,或者不需要遍历所有表的其他方式?或者我应该看看是否可以在表格中添加标题? (比如< table title =“things”>)
如果有帮助,每个表上方还有标题(< h4>标题< / h4>).
谢谢.
编辑
这是我在问这个问题时的想法:
当有更多时,我正在将对象解包为两个值.我认为这只会给我列表中的前两个东西,但当然,它一直给我上面提到的错误.我不知道返回值是一个列表,并认为它是一个特殊的对象或东西,我是基于我的朋友的代码.
我认为这个错误意味着页面上有太多的表,并且它无法处理所有这些表,所以我想要一种方法来实现它而不使用我正在使用的方法.我可能应该停止假设.
现在我知道它返回一个列表,我可以在for循环中使用它或者使用soup.findAll(‘table’)[someNumber]从中获取一个值.我了解了拆包的内容以及如何使用它.谢谢所有帮助过的人.
希望能把事情搞清楚,既然我知道我在做什么我的问题没有比我提出的那样有意义,所以我想我只是在这里记下我在想什么.
编辑2:
这个问题现在已经很老了,但我仍然看到我从未真正清楚自己在做什么.
如果它对任何人有帮助,我试图解包findAll(…)结果,其中我不知道它们的数量.
useless_table, table_i_want, another_useless_table = soup.findAll("table");
由于我在页面中没有总是猜到的表的数量,并且元组中的所有值都需要解压缩,所以我收到了ValueError:
ValueError: too many values to unpack
所以,我一直在寻找方法来获取返回的元组中的第二个(或哪个索引)表,而不会遇到有关使用了多少个表的错误.
最后
以上就是不安乌龟为你收集整理的python中beautifulsoup是什么_Python中的BeautifulSoup – 获取类型的第n个标记的全部内容,希望文章能够帮你解决python中beautifulsoup是什么_Python中的BeautifulSoup – 获取类型的第n个标记所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复