爬虫入门基础知识1、爬虫基础知识
1、爬虫基础知识1.1 爬虫的分类爬虫种类说明通用爬虫搜索引擎的一部分,将互联网的网页下载到本地,形成镜像聚焦爬虫面向特定的需求,在网页抓取的时候对内容已经进行了筛选更多的是面向聚焦爬虫1.1.1搜索引擎工作原理1.1.1.1抓取网页 搜索引擎网络爬虫1、首先选取一部分种子url,将这些URL放入到等待抓取的url队列中。2、取出待抓取的url地址,解析等到主机的ip,将url对应的网页下载下来,存储进已经下载的网页库中,并且将这些已经完成url地址抓取