re模块使用

278 阅读 0 评论 184 点赞

我是靠谱客的博主昏睡枫叶，这篇文章主要介绍re模块使用，现在分享给大家，希望可以做个参考。

常用语法

re.match(pattern, string)　　　　 # 从头匹配，返回一个match对象，需要使用.group方法打印实体

str1 = 'abc123'
result1 = re.match(r'([a-z]{3})',str1)
print result1.group()
#返回abc

str2 = '123abc'
result2 = re.match(r'([a-z]){3}',str2)
print result2
#返回None，如果使用group方法会出现错误

match返回值使用方法

import re
a = 'abc123'
result = re.search(r'd{3}',a)
print result.start()
#返回匹配的开始位置，结果为3
print result.end()
#返回匹配的技术位置，结果为6
print result.span()
#已元组形式返回开始和技术位置，结果为（3,6）
print result.group() #返回匹配字符串，多个匹配项可在括号增加数字只匹配其中一个，结果为123

View Code

re.search(pattern, string)　　　　# 匹配整个字符串，直到找到一个匹配

str2 = '123abc'
result2 = re.search(r'([a-z]){3}',str2)
print result2.group()
#返回abc

re.split()　　　　　　　　　　　 # 将匹配到的格式当做分割点对字符串分割成列表

str1 = 'abc 456 qwe'
result1 = re.split(r's',str1)
print result1
#返回['abc', '456', 'qwe']

re.findall()　　　　　　　　　　 # 找到所有要匹配的字符并返回列表格式

str1 = 'ab1c456qw2e'
result1 = re.findall(r'd',str1)
print result1
#返回['1', '4', '5', '6', '2']

re.sub(pattern, repl, string, count,flag) # 替换匹配到的字符

str1 = 'abc 456 qwe'
result1 = re.sub(r's','.',str1)
print result1
#返回abc.456.qwe

正则常用量

代码/语法	说明
*	重复零次或更多次
+	重复一次或更多次
?	重复零次或一次
{n}	重复n次
{n,}	重复n次或更多次
{n,m}	重复n到m次

正则格式

模式	描述
^	匹配字符串的开头
$	匹配字符串的末尾。
.	匹配任意字符，除了换行符，当re.DOTALL标记被指定时，则可以匹配包括换行符的任意字符。
[...]	用来表示一组字符,单独列出：[amk] 匹配 'a'，'m'或'k'
[^...]	不在[]中的字符：[^abc] 匹配除了a,b,c之外的字符。
re*	匹配0个或多个的表达式。
re+	匹配1个或多个的表达式。
re?	匹配0个或1个由前面的正则表达式定义的片段，非贪婪方式
re{ n}
re{ n,}	精确匹配n个前面表达式。
re{ n, m}	匹配 n 到 m 次由前面的正则表达式定义的片段，贪婪方式
a\| b	匹配a或b
(re)	G匹配括号内的表达式，也表示一个组
(?imx)	正则表达式包含三种可选标志：i, m, 或 x 。只影响括号中的区域。
(?-imx)	正则表达式关闭 i, m, 或 x 可选标志。只影响括号中的区域。
(?: re)	类似 (...), 但是不表示一个组
(?imx: re)	在括号中使用i, m, 或 x 可选标志
(?-imx: re)	在括号中不使用i, m, 或 x 可选标志
(?#...)	注释.
(?= re)	前向肯定界定符。如果所含正则表达式，以 ... 表示，在当前位置成功匹配时成功，否则失败。但一旦所含表达式已经尝试，匹配引擎根本没有提高；模式的剩余部分还要尝试界定符的右边。
(?! re)	前向否定界定符。与肯定界定符相反；当所含表达式不能在字符串当前位置匹配时成功
(?> re)	匹配的独立模式，省去回溯。
w	匹配字母数字
W	匹配非字母数字
s	匹配任意空白字符，等价于 [tnrf].
S	匹配任意非空字符
d	匹配任意数字，等价于 [0-9].
D	匹配任意非数字
A	匹配字符串开始
Z	匹配字符串结束，如果是存在换行，只匹配到换行前的结束字符串。c
z	匹配字符串结束
G	匹配最后匹配完成的位置。
b	匹配一个单词边界，也就是指单词和空格间的位置。例如， 'erb' 可以匹配"never" 中的 'er'，但不能匹配 "verb" 中的 'er'。
B	匹配非单词边界。'erB' 能匹配 "verb" 中的 'er'，但不能匹配 "never" 中的 'er'。
n, t, 等.	匹配一个换行符。匹配一个制表符。等
1...9	匹配第n个分组的子表达式。
10	匹配第n个分组的子表达式，如果它经匹配。否则指的是八进制字符码的表达式。

一些常用实例

1. 匹配手机号

import re
str1 = 'My phone number is 13655555555'
result1 = re.search(r'(1)(d{10})',str1)
if result1:
print result1.group()
else:
print 'not match'
#返回13655555555
#此段代码存在bug如果用户输入一个12位的数字，会匹配前11位，而不会报not match，此问题待解决

View Code

2.匹配邮箱

import re
str1 = 'My e-mail is 123@qq.com'
result1 = re.search(r'[w]*@[S]*',str1)
if result1:
print result1.group()
else:
print 'not match'
#返回123@qq.com

View Code

3.匹配IPv4地址

import re
ip_addr = "inet 192.168.60.223 netmask 0xffffff00 broadcast 192.168.60.255"
m = re.search("d{1,3}.d{1,3}.d{1,3}.d{1,3}", ip_addr)
print(m.group())

View Code

转载于:https://www.cnblogs.com/journey0813/p/7352783.html