Python3 提取中文的正则表达式

318 阅读 0 评论 210 点赞

我是靠谱客的博主昏睡小白菜，这篇文章主要介绍Python3 提取中文的正则表达式，现在分享给大家，希望可以做个参考。

import re
# 测试文本
test = '<h1>hello 你好, world 世界</h1>'
# 中文匹配正则
chinese_pattern = '[u4e00-u9fa5]+'
says = re.findall(chinese_pattern, test)
# 输出提取的内容
hi = ''
for say in says:
# print(say)
hi += say + ','
hi = hi.strip(',')
# 打印结果：你好,世界
print(hi)

最后

以上就是昏睡小白菜最近收集整理的关于Python3 提取中文的正则表达式的全部内容，更多相关Python3内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(210)

本文分类：我用 Python3
浏览次数：318 次浏览
发布日期：2024-01-15 17:40:25

相关文章

[原创]手把手教你写网络爬虫（2）：迷你爬虫架构

[原创]手把手教你写网络爬虫（2）：迷你爬虫架构

巧用find命令管理文件名为乱码的文件

巧用find命令管理文件名为乱码的文件

【Android 教程系列第 9 篇】升级 Android Studio 到 Arctic Fox 2020.3.1 后，使用搜索功能时出现中文乱码的问题

结束语

【Android 教程系列第 9 篇】升级 Android Studio 到 Arctic Fox 2020.3.1 后，使用搜索功能时出现中文乱码的问题结束语

Java使用正则表达式仅获取中文Java 代码

Java使用正则表达式仅获取中文Java 代码

Python3 提取中文的正则表达式

Python3 提取中文的正则表达式

python 用正则表达式提取单个中文或者多个中文组合重点：假如你想输出 '这年头猪都会上树' 也是可以的，上面的match_obj其实都是list类型，通过''.join(match_obj)即可。

python 用正则表达式提取单个中文或者多个中文组合重点：假如你想输出 '这年头猪都会上树' 也是可以的，上面的match_obj其实都是list类型，通过''.join(match_obj)即可。

用正则表达式寻找中文

python爬取内容乱码_【提问】PYTHON 爬取下来的中文数据显示乱码

python爬取内容乱码_【提问】PYTHON 爬取下来的中文数据显示乱码

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部