Python使用xlm库爬取信息前言使用步骤
文章目录前言使用步骤1.引入库2.下级数据前言记录第一次爬虫记录,以京客隆超市店铺信息为目标,拿到店铺的全部信息,并生成excel表格使用步骤1.引入库在爬取网站信息是首先我们要了解该页面的组成,了解该页面的下级分类,找到你所需要的元素,通过xpath定位来获取页面的信息,需要一定的WEb元素定位的知识,只有找到正确的位置才能进行下面的操作,基本操作就是只要用到url,就设置伪装头,然后解析页面源码,在通过xpath获得文本这里用到etree.HTML方法把html的文本内容解析成htm.