我是靠谱客的博主 魁梧香烟,最近开发中收集的这篇文章主要介绍1. Scrapy的优点 | 安装Scrapy以及Python虚拟环境,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

Scrapy有什么优点值得学习

  • 内置支持使用扩展的 CSS 选择器和 XPath 表达式从 HTML/XML 源中选择和提取数据,以及使用正则表达式提取的辅助方法。
  • 一个交互式 shell 控制台(支持 IPython),用于尝试使用 CSS 和 XPath 表达式来抓取数据,在编写或调试蜘蛛时非常有用。
  • 内置支持以多种格式(JSON、CSV、XML)生成提要导出并将它们存储在多个后端(FTP、S3、本地文件系统) 强大的编码支持和自动检测,用于处理外来、非标准和损坏的编码声明。
  • 强大的可扩展性支持,允许您使用信号和定义良好的 API(中间件、扩展和管道)插入自己的功能。
  • 用于处理的各种内置扩展和中间件: cookie 和会话处理 HTTP 功能,如压缩、身份验证、缓存、用户代理欺骗、robot.txt、爬行深度限制。

安装Python和Python的虚拟环境

安装Python可以通过Python官网来访问并下载最新版的Python。安装Python的虚拟环境,首先通过cd命令定位到你需要安装虚拟环境的位置。通过以下命令创建一个Python的虚拟环境。

python -m venv 文件夹名称

之后你将会得到以下的一个目录结构。这是我运行python -m venv Spider的目录结构

/Spider
  pyvenv.cfg
  /Include
  /Lib
  /Scripts
       ...
       activate.bat
       ...

之后只需要在命令行中运行activate.bat,就可以打开Python的虚拟环境了。我们可以通过使用pip,python等其他命令来执行我们的程序。有一点,这个虚拟环境中运行pip是没有任何的包的,也就是说虚拟环境和Python的真实环境是隔离开的,我们运行或者安装其他包的时候不会破坏Python原有的环境。

在虚拟环境中安装Scrapy

pip install scrapy

在此您可能会遇到如下问题 AttributeError: ‘module’ object has no attribute ‘OP_NO_TLSv1_1’¶原因是你安装的pyOpenSSL版本不支持Twisted版本,重新安装Twisted就可以了

pip install twisted[tls]

最后

以上就是魁梧香烟为你收集整理的1. Scrapy的优点 | 安装Scrapy以及Python虚拟环境的全部内容,希望文章能够帮你解决1. Scrapy的优点 | 安装Scrapy以及Python虚拟环境所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(64)

评论列表共有 0 条评论

立即
投稿
返回
顶部