爬虫处理gzip压缩格式网站的方法

319 阅读 0 评论 211 点赞

我是靠谱客的博主紧张小蚂蚁，这篇文章主要介绍爬虫处理gzip压缩格式网站的方法，现在分享给大家，希望可以做个参考。

#coding:utf-8
import urllib2
import re
import zlib
url_address = 'http://www.sina.com.cn'
f = urllib2.urlopen(url_address)
buf = f.read()
buf = zlib.decompress(buf, 16+zlib.MAX_WBITS);
#buf = buf.replace("n","")
print buf

最后

以上就是紧张小蚂蚁最近收集整理的关于爬虫处理gzip压缩格式网站的方法的全部内容，更多相关爬虫处理gzip压缩格式网站内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(211)

本文分类：笔记
浏览次数：319 次浏览
发布日期：2024-01-20 19:10:24

相关文章

使用urllib爬取压缩过的网页

使用urllib爬取压缩过的网页

安卓学习笔记---Caused by: java.lang.NullPointerException: println needs a message错误

安卓学习笔记---Caused by: java.lang.NullPointerException: println needs a message错误

negroni-gzip源代码分析negroni-gzip源码分析

negroni-gzip源代码分析negroni-gzip源码分析

GSoap启用gzip压缩源码解析

GSoap启用gzip压缩源码解析

爬虫处理gzip压缩格式网站的方法

爬虫处理gzip压缩格式网站的方法

关于HTTP2.0 gzip和br解压缩

关于HTTP2.0 gzip和br解压缩

HTTP返回GZIP内容的解压及中文显示

HTTP返回GZIP内容的解压及中文显示

android native日志,java - What is in android.util.Log#println_native()? - Stack Overflow

android native日志,java - What is in android.util.Log#println_native()? - Stack Overflow

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部