爬虫的简单步骤及urllib模块
一. 爬虫的步骤(1)浏览器向DNS服务器请求解析该URL中的域名所对应的IP地址(2)解析出IP地址后,根据IP地址和默认端口,和服务器建立TCP连接(3)浏览器发出读取文件的http请求,该请求报文作为TCP三次握手的第三个报文的数据发送给服务器(4)服务器对浏览器请求做出响应,并把对应的html文件发送给浏览器(5)释放TCP连接(6)浏览器将该HMTL渲染并显示内容二. ...