第1个爬虫程序

346 阅读 0 评论 229 点赞

我是靠谱客的博主优秀马里奥，这篇文章主要介绍第1个爬虫程序，现在分享给大家，希望可以做个参考。

知识点：
1 Beautifulsoup库：自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码。
2 urllib库：主要用到request.urlopen(url)方法，请求爬取一个网站。
3 类的设计（属性和方法）

代码：
import urllib.request
from bs4 import Beautifulsoup

news = “https://sports.sina.com.cn/”
Scraper(news).scrape()

class Scraper:
def init(self, site):
self.site = site
def scrape(self):
html = urllib.request.urlopen(self.site).read()
parser = “html.parser”
bs = Beautifulsoup(html, parser)
for tag in bs.find_all(“a”):
print(tag.get(“href”))

最后

以上就是优秀马里奥最近收集整理的关于第1个爬虫程序的全部内容，更多相关第1个爬虫程序内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

本文分类：爬虫
浏览次数：346 次浏览
发布日期：2023-09-17 11:35:35

第1个爬虫程序

最后

评论列表共有 0 条评论

发表评论取消回复

第1个爬虫程序

最后

相关文章

评论列表共有 0 条评论

发表评论 取消回复

发表评论取消回复