概述
HTML 或 XML 文件中提取数据的 Python 库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间.
爬取该地址的 图片。。。
URL = 'http://www.ifanxu.com/alipay_red_packet/'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36',
}
response = requests.get(URL, headers=headers)
html_doc = response.content.decode('utf-8')
soup = BeautifulSoup(html_doc, 'lxml')
print(html_doc)
浏览器 F12 查看
获得 selector 地址 ====与XPath 区别
标题地址
title = soup.select('#post-2266 > header > h1')
print(title)
图片地址
#post-2266 > div > p:nth-child(1) > a > img
//*[@id="post-2266"]/div/p[1]/a/img
img = soup.select('#post-2266 > div > p:nth-child(1) > a > img')
print(img)
执行结果如下:
最后把图片保存到本地
urllib.request.urlretrieve (img1,'test.jpg')
最后
以上就是玩命水蜜桃为你收集整理的python爬虫爬取网页图片_Python爬虫 爬取网页图片 使用BeautifulSoup的全部内容,希望文章能够帮你解决python爬虫爬取网页图片_Python爬虫 爬取网页图片 使用BeautifulSoup所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复