#coding:utf-8
import urllib2
import re
import zlib
url_address = 'http://www.sina.com.cn'
f = urllib2.urlopen(url_address)
buf = f.read()
buf = zlib.decompress(buf, 16+zlib.MAX_WBITS);
#buf = buf.replace("n","")
print buf
最后
以上就是紧张小蚂蚁最近收集整理的关于爬虫处理gzip压缩格式网站的方法的全部内容,更多相关爬虫处理gzip压缩格式网站内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复