selenium关于正则表达式匹配webdriver.Chrome().page_source中文的问题

254 阅读 0 评论 168 点赞

我是靠谱客的博主谨慎绿草，这篇文章主要介绍selenium关于正则表达式匹配webdriver.Chrome().page_source中文的问题，现在分享给大家，希望可以做个参考。

本文以网站https://mm.taobao.com/self/model_album.htm?user_id=687471686 点击打开链接为例子，介绍如何匹配总页数，如下图所示。

webdriver.Chrome().page_source的类型为Unicode，所以匹配字符串也要是unicode，测试代码如下：

from selenium import webdriver
import time
import re
if __name__ == '__main__':
browser = webdriver.Chrome()
browser.get('https://mm.taobao.com/self/model_album.htm?user_id=687471686')
time.sleep(2)
r = re.findall(ur'共(d+)页 到第', browser.page_source)
print r

输出：

[u'5']

如果re.findall(ur'共(d+)页到第', browser.page_source)修改为re.findall(r'共(d+)页到第', browser.page_source)将无法匹配成功。

最后

以上就是谨慎绿草最近收集整理的关于selenium关于正则表达式匹配webdriver.Chrome().page_source中文的问题的全部内容，更多相关selenium关于正则表达式匹配webdriver.Chrome().page_source中文内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(168)

本文分类：Python
浏览次数：254 次浏览
发布日期：2024-01-15 14:55:24

相关文章

python从js文件中取数据_取的脚本标签中的变量数据，Python或内容从JS加

python从js文件中取数据_取的脚本标签中的变量数据，Python或内容从JS加

uva12387 - Alphabet Soup链接题解代码

uva12387 - Alphabet Soup链接题解代码

python3爬虫(5)： Beautiful Soup介绍

python3爬虫(5)： Beautiful Soup介绍

py3爬虫--beautiful-soup库的使用Beautiful soup安装引入解析库安装解析器基本使用标签选择器标准选择器css 选择器总结

py3爬虫--beautiful-soup库的使用Beautiful soup安装引入解析库安装解析器基本使用标签选择器标准选择器css 选择器总结

selenium关于正则表达式匹配webdriver.Chrome().page_source中文的问题

selenium关于正则表达式匹配webdriver.Chrome().page_source中文的问题

selenium 爬页面源码（page_source ）

selenium 爬页面源码（page_source ）

ChromeDriver中的PageSource返回的问题

ChromeDriver中的PageSource返回的问题

python3 网络爬虫开发实战-使用Beautiful Soup

python3 网络爬虫开发实战-使用Beautiful Soup

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部