我是靠谱客的博主 优美大船,最近开发中收集的这篇文章主要介绍linux 查找pcre源码,pcre使用例子,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

1. PCRE简介

PCRE(Perl Compatible Regular Expressions即:perl语言兼容正则表达式)是一个用C语言编写的正则表达式函数库,由菲利普.海泽(Philip Hazel)编写。PCRE是一个轻量级的函数库,比Boost之中的正则表达式库小得多。PCRE十分易用,同时功能也很强大,性能超过了POSIX正则表达式库和一些经典的正则表达式库。

和Boost正则表达式库的比较显示,双方的性能相差无几,PCRE在匹配简单字符串时更快,Boost则在匹配较长字符串时胜出---但两者差距很小,考虑到PCRE的大小和易用性,我们可以认为PCRE更值得考虑。

PCRE被广泛使用在许多开源软件之中,最著名的莫过于Apache HTTP服务器和PHP脚本语言、R脚本语言,此外,正如从其名字所能看到的,PCRE也是perl语言的缺省正则库。

PCRE是用C语言实现的,其C++实现版本是PCRE++。

2. 正则表达式定义

一个正则表达式就是由普通字符(例如字符 a 到 z)以及特殊字符(称为元字符)组成的文字模式。该模式描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。

例如下面一些正则表达式:

^(-?d+)(.d+)?$     匹配浮点数

^[A-Za-z]+$            匹配由26个英文字母组成的字符串

^[A-Z]+$              匹配由26个英文字母的大写组成的字符串

^[a-z]+$             匹配由26个英文字母的小写组成的字符串

^[A-Za-z0-9]+$       匹配由数字和26个英文字母组成的字符串

^w+$                匹配由数字、26个英文字母或者下划线组成的字符串

^[w-]+(.[w-]+)*@[w-]+(.[w-]+)+$     匹配email地址

当然,可能你会问上面这些表达式为什么是这样写。这里就暂时不做多讲,因为本文主要讲的是PCRE库的应用,所以想了解更多的话,可以看我下面的[附录1],里面有全部正则表式用到的元字符说明。或参考网址正则表达式语言元素msdn文档。

3. PCRE正则表达式的定义

用于描述字符排列和匹配模式的一种语法规则。它主要用于字符串的模式分割、匹配、查找及替换操作。正则中重要的几个概念有:元字符、转义、模式单元(重复)、反义、引用和断言。

常用的元字符(Meta-character)

元字符    说明

A     匹配字符串串首的原子

Z     匹配字符串串尾的原子

b     匹配单词的边界/bis/匹配头为is的字符串/isb/ 匹配尾为is的字符串 /bisb/ 定界

B     匹配除单词边界之外的任意字符   /Bis/   匹配单词“This”中的“is”

d     匹配一个数字;等价于[0-9]

D     匹配除数字以外任何一个字符;等价于[^0-9]

w     匹配一个英文字母、数字或下划线;等价于[0-9a-zA-Z_]

W     匹配除英文字母、数字和下划线以外任何一个字符;等价于[^0-9a-zA-Z_]

s     匹配一个空白字符;等价于[ftv]

S     匹配除空白字符以外任何一个字符;等价于[^ftv]

f     匹配一个换页符等价于 x0c 或 cL

匹配一个换行符;等价于 x0a 或 cJ

匹配一个回车符等价于x0d 或 cM

t     匹配一个制表符;等价于 x09或cl

v     匹配一个垂直制表符;等价于x0b或ck

oNN    匹配一个八进制数字

xNN    匹配一个十六进制数字

cC     匹配一个控制字符

模式修正符(Pattern Modifiers)

模式修正符在忽略大小写、匹配多行中使用特别多,掌握了这一个修正符,往往能解决我们遇到的很多问题。

i     -可同时匹配大小写字母

M     -将字符串视为多行

S     -将字符串视为单行,换行符做普通字符看待,使“.”匹配任何字符

X     -模式中的空白忽略不计

U     -匹配到最近的字符串

e     -将替换的字符串作为表达使用

格式:/apple/i匹配“apple”或“Apple”等,忽略大小写。 当然这里还有很多种情况,在这里就不一一描述出来了。

4. PCRE的函数简介

PCRE是一个NFA正则引擎,不然不能提供完全与Perl一致的正则语法功能。但它同时也实现了DFA,只是满足数学意义上的正则。

PCRE提供了19个接口函数。

这里只介绍了几个主要和常用的接口函数,另外的可通过PCRE源码文档进行了解。注意,使用PCRE主要是使用下面介绍的前四个函数,对这四个函数有了了解,使用PCRE库的时候就会简单很多了。

下面所讲的函数,都在PCRE头文件上定义申明:#include 。

1.pcre_compile

函数原型:

pcre *pcre_compile(const char *pattern, int options, const char **errptr, int *erroffset, const unsigned char *tableptr)

功能:将一个正则表达式编译成一个内部表示,在匹配多个字符串时,可以加速匹配。其同pcre_compile2功能一样只是缺少一个参数errorcodeptr。

参数说明:

pattern   正则表达式

options   为0,或者其他参数选项

errptr   出错消息

erroffset  出错位置

tableptr  指向一个字符数组的指针,可以设置为空NULL。

2. pcre_compile2

函数原型:

pcre *pcre_compile2(const char *pattern, int options, int *errorcodeptr, const char **errptr, int *erroffset, const unsigned char *tableptr)

功能:将一个正则表达式编译成一个内

最后

以上就是优美大船为你收集整理的linux 查找pcre源码,pcre使用例子的全部内容,希望文章能够帮你解决linux 查找pcre源码,pcre使用例子所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(63)

评论列表共有 0 条评论

立即
投稿
返回
顶部