我是靠谱客的博主 紧张小蚂蚁,最近开发中收集的这篇文章主要介绍爬虫处理gzip压缩格式网站的方法,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

#coding:utf-8
import urllib2
import re
import zlib
url_address = 'http://www.sina.com.cn'
f = urllib2.urlopen(url_address)
buf = f.read()
buf = zlib.decompress(buf, 16+zlib.MAX_WBITS);
#buf = buf.replace("n","")
print buf

最后

以上就是紧张小蚂蚁为你收集整理的爬虫处理gzip压缩格式网站的方法的全部内容,希望文章能够帮你解决爬虫处理gzip压缩格式网站的方法所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(62)

评论列表共有 0 条评论

立即
投稿
返回
顶部