python爬取网页小说去除nbsp_html的空格和怎么去除？

254 阅读 0 评论 168 点赞

我是靠谱客的博主要减肥篮球，这篇文章主要介绍python爬取网页小说去除nbsp_html的空格和怎么去除？，现在分享给大家，希望可以做个参考。

同楼主，这个问题我也碰到了。

用html_parser好像不也行

bvqjue?w=1110&h=324

replace也不解决不完全，我希望把所有数据（房间类型，面积，位置，详细位置，发布时间，价格）放一行

bvqjuy?w=1061&h=414

最后没办法只能这样了

import requests ##导入requests

from bs4 import BeautifulSoup ##导入bs4中的BeautifulSoup

res = requests.get('http://sz.58.com/nanshan/zufang/0/j2/?minprice=0_1600&PGTID=0d300008-0071-367d-7e8f-38bb92b6eebc&ClickID=2')

res.encoding='utf-8'

soup=BeautifulSoup(res.text,'html.parser')

for info in soup.select('li'):

a=info.select('.des .room')[0].text.replace(" ","")

b=info.select('.des .add')[0].text.replace(" ","")

c=info.select('.listliright .sendTime')[0].text.replace(" ","")

d=info.select('.listliright .money')[0].text

print(a,b,c,d)

print(".....................................................")

bvqjyz?w=864&h=300

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

python爬取网页小说去除nbsp_html的空格和 怎么去除？