概述
python的BeautifulSoup用法
首先导入模块
from bs4 import BeautifulSoup
soup=BeautifulSoup(opener)
1.tag标签法
soup.head.title
如果是一层层的标签包下去只取每层标签第一个
2.contents法
比如三元素:[u'n','<html>xxxx</html>',u'n']
soup.contents 返回列表,不是单一元素
soup.contents[x].contents 是对各列表的取值
3..next法
只对单一元素进行.next,比如
soup.contents[1]=u'HTML'
soup.contents[2]=u'n'
则soup.content[1].next等价于soup.contents[2]
搜索法
.find('p') 返回字符串
.findall('p') 返回列表
4. .attrs[x]取属性值法
在上述各方法获取标签体之后,通过对标签实施attrs得到一个内部属性列表
在标签后新增.attrs['id']取得该标签内部id的属性值
soup.contents[3].attrs[1]='/'
最后
以上就是笨笨溪流为你收集整理的python的BeautifulSoup用法的全部内容,希望文章能够帮你解决python的BeautifulSoup用法所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复