Python爬虫笔记(二)
使用lxml中的语法,利用etree进行解析html文件,将其转换为etree语法。Xpath语法:例如获得了html中的文字,现在要处理文字中的逻辑,使用可以使用lxml中。from lxml import etreeparser = etree.HTMLParser(encoding='utf-8')html = etree.parse("tencent.html",parser=p...