饱满发箍

文章
3
资源
0
加入时间
3年0月21天

Html 页面信息抽取

from lxml import etree# 读取html或htm文件with open(path) as f: a = f.read()# 解析页面元素结构selector=etree.HTML(a)# 用xpath获取元素位置上的文字title = selector.xpath('//head/title/text()')[0].split()[0]...