我是靠谱客的博主 要减肥篮球,最近开发中收集的这篇文章主要介绍python爬取网页小说去除nbsp_html的空格和 怎么去除?,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

同楼主,这个问题我也碰到了。

用html_parser好像不也行

bvqjue?w=1110&h=324

replace也不解决不完全,我希望把所有数据(房间类型,面积,位置,详细位置,发布时间,价格)放一行

bvqjuy?w=1061&h=414

最后没办法只能这样了

import requests ##导入requests

from bs4 import BeautifulSoup ##导入bs4中的BeautifulSoup

res = requests.get('http://sz.58.com/nanshan/zufang/0/j2/?minprice=0_1600&PGTID=0d300008-0071-367d-7e8f-38bb92b6eebc&ClickID=2')

res.encoding='utf-8'

soup=BeautifulSoup(res.text,'html.parser')

for info in soup.select('li'):

a=info.select('.des .room')[0].text.replace(" ","")

b=info.select('.des .add')[0].text.replace(" ","")

c=info.select('.listliright .sendTime')[0].text.replace(" ","")

d=info.select('.listliright .money')[0].text

print(a,b,c,d)

print(".....................................................")

bvqjyz?w=864&h=300

最后

以上就是要减肥篮球为你收集整理的python爬取网页小说去除nbsp_html的空格和 怎么去除?的全部内容,希望文章能够帮你解决python爬取网页小说去除nbsp_html的空格和 怎么去除?所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(39)

评论列表共有 0 条评论

立即
投稿
返回
顶部