我是靠谱客的博主 紧张小蚂蚁,这篇文章主要介绍爬虫处理gzip压缩格式网站的方法,现在分享给大家,希望可以做个参考。

#coding:utf-8
import urllib2
import re
import zlib
url_address = 'http://www.sina.com.cn'
f = urllib2.urlopen(url_address)
buf = f.read()
buf = zlib.decompress(buf, 16+zlib.MAX_WBITS);
#buf = buf.replace("n","")
print buf

最后

以上就是紧张小蚂蚁最近收集整理的关于爬虫处理gzip压缩格式网站的方法的全部内容,更多相关爬虫处理gzip压缩格式网站内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(61)

评论列表共有 0 条评论

立即
投稿
返回
顶部