python爬虫进阶|异步协程前言一、基本概念二、异步协程
python爬虫进阶 | 异步协程前言一、基本概念二、异步协程前言之前爬虫使用的是requests+多线程/多进程,后来随着前几天的深入了解,才发现,对于爬虫来说,真正的瓶颈并不是CPU的处理速度,而是对于网页抓取时候的往返时间,因为如果采用requests+多线程/多进程,他本身是阻塞式的编程,所以时间都花费在了等待网页结果的返回和对爬取到的数据的写入上面。而如果采用非阻塞编程,那么就没有这个困扰。这边首先要理解一下阻塞和非阻塞的区别。阻塞调用是指调用结果返回之前,当前线程会被挂起(线程进入非