跟随B站视频学Python爬虫过程(6):豆瓣电影TOP250并存Excel(使用urllib, bs, re, xlwt库)
出于督促自己学习以及未来回顾和分享的目的,记录一下自己的学习过程。B站视频号:BV12E411A7ZQep15-25. 完成爬取信息,处理数据,保存到Excel。具体流程为:1. 找到目标网页的URL,如果存在多页,需要确定URL定位和页数的关系;2. 引入所需要的库:Urllib,BS4,BeautifulSoup,Re,Xlwt;3. 结构顺序为:爬取网页源代码→解析源代码→获得所需数据信息→整理并保存数据代码实现:# -*- coding = utf-8 -*-# @T