python3爬虫(5): Beautiful Soup介绍
1. 简介Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.安装方法:pip install beautifulsoup4网页解析器由于Beautiful Soup是对HTML文件进行提取数据,因此,需要安装网页解析器。Beautiful Soup支持Python标准库中的HTML解析器,还支持一些第三方的解析器,其中一个是 lxml .根据操作系统不同,可以选择下列方法来安装lxml: $ pip install lxml另一个可供选择的解析器是纯P