Python爬虫初级(四)—— 信息组织与提取方法信息标记的三种形式三种信息标记形式的比较信息提取的一般方法基于 BeautifulSoup 库的内容查找方法
信息标记的三种形式信息的标记:标记后的信息可形成信息组织结构,增加信息维度标记后的信息可用于通信、存储或展示标记的结构和信息一样具有重要价值标记后的信息更利于程序理解和运用国际公认的信息标记的三种形式分别是 XML、JSON、YAML,下面分别介绍这三者:XML 即 eXtensible Markup Language,采用了以标签为主来构建信息和表达信息的方式,比如:<...