概述
库:re;selenium;requests
源码:
from selenium import webdriver
import re
import requests
import re
import requests
def open_img(items):
for item in items:
item = re.sub('&','&',item)
rsp =requests.get(item)
yield rsp.content
for item in items:
item = re.sub('&','&',item)
rsp =requests.get(item)
yield rsp.content
url ='https://wenku.baidu.com/view/4e3d35d969eae009581becd5.html?from=search' #可修改成别的ppt网址
browser =webdriver.Chrome()
try:
browser.get(url)
html =browser.page_source
pattern =re.compile('<div class="ppt-page-item.*?src="(.*?)".*?>',re.S)
items =re.findall(pattern,html)
n =0
for i in open_img(items):
with open('%d.jpeg'%n,'wb') as file:
file.write(i)·
n +=1
print('第%d张图片下载完成'%n)
finally:
browser.close()
input()
转载于:https://www.cnblogs.com/vvlj/p/9662534.html
最后
以上就是称心白昼为你收集整理的python爬百度文库课件的全部内容,希望文章能够帮你解决python爬百度文库课件所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复