我是靠谱客的博主 沉默小馒头,这篇文章主要介绍PHP正则表达式核心技术完全详解 第11节 贪婪匹配与懒惰匹配 (禁止贪婪),现在分享给大家,希望可以做个参考。

作者:极客小俊 一个专注于web技术的80后
我不用拼过聪明人,我只需要拼过那些懒人 我就一定会超越大部分人!
CSDN@极客小俊,原创文章, B站技术分享
B站视频 : ???? Bilibili.com ????
个人博客: ???? cnblogs.com ????

在这里插入图片描述

PHP正则表达式_贪婪匹配与懒惰匹配 (禁止贪婪)


什么是贪婪匹配呢?
废话不多说 先看一段代码案例把 如下:

复制代码
1
2
3
4
5
6
7
8
$string='aaaaaaabbbbbbbbbbbbccccccc'; //如下 $pattern='/ab+/'; //或者说是如下 $pattern='/ab.+/'; preg_match($pattern, $string,$arr); show($arr);

php正则表达式默认就是贪婪的 解决贪婪匹配 的办法就是用 ? 号
所以阻止贪婪一般加? 来解决
代码如下:

复制代码
1
2
3
4
5
6
7
8
$string='aaaaaaabbbbbbbbbbbbccccccc'; //如下 $pattern='/ab+?/'; //或者说是如下 $pattern='/ab.+?/'; preg_match($pattern, $string,$arr); show($arr);

小案例1:
这里跟加不加s 视为单行字符有关系, 因为加了s 视为单行以后会产生贪婪匹配、所以阻止贪婪后 在进行全局搜索匹配!
代码如下:

复制代码
1
2
3
4
5
6
7
8
9
10
11
12
$string='test test http://www.163.com test test <a href="http://www.baidu.com">百度</a> test test test <a href="http://www.sina.com">新浪</a>'; //匹配网址 $pattern='/http://(ftp|www).w+.(com|org|net)/'; //匹配href的内容 这里不加? 就会出现贪婪匹配 $pattern='/href="(.+?)"/s'; preg_match_all($pattern, $string,$arr); show($arr);

小案例2:
删除某一个class文件中的所有注释 例如:Car.class.php文件
内容如下:

复制代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
<?php /** * @description * @author 3# */ interface Car{ function run(); } /** * * @description 宝马车类 * */ class Bmw implements Car{ public function run(){ echo '宝马车子在跑!!'; } } /** * @description 奔驰车类 * */ class Bz implements Car{ public function run(){ echo '奔驰车子在跑!!'; } } // $Bmw=new Bmw(); // $Bmw->run(); // echo '<br>'; // $Bz=new Bz(); // $Bz->run(); ?>

然后处理这个Car.class.php中的注释,把里面的注释都删掉
通常我们是如下处理的

复制代码
1
2
3
4
5
6
7
8
9
10
//载入文件 $file='./Car.class.php'; $content=file_get_contents($file); //正则匹配 $pattern='//**.**//s'; //替换为空 $result=preg_replace($pattern, '', $content); //最后把处理好的字符重新写入带文件中 file_put_contents($file, $result);

以上这样处理看似没什么问题,但是当你打开Car.class.php这个文件的时候你要大吃一惊的!! 现在Car.class.php里面应该只剩下 下面这个类了 其他的都不见了!!

复制代码
1
2
3
4
5
6
class Bz implements Car{ public function run(){ echo '奔驰车子在跑!!'; } }

原因:如果这样替换会产生如下情况: 原因是;贪婪匹配 .* 匹配了/* 开始一直到 /结尾、 中间无论什么内容都被视为 . 的范畴之内了!

正确的做法是加上? 号 阻止贪婪匹配
代码如下:

复制代码
1
2
3
4
5
6
7
8
9
10
//载入文件 $file='./Car.class.php'; $content=file_get_contents($file); //正则匹配 并且禁止贪婪 $pattern='//**.*?*//s'; //替换为空 $result=preg_replace($pattern, '', $content); //最后把处理好的字符重新写入带文件中 file_put_contents($file, $result);

结果Car.class.php文件中的注释就全部删除了 ,Car.class.php文件中的代码如下:

复制代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
interface Car{ function run(); } class Bmw implements Car{ public function run(){ echo '宝马车子在跑!!'; } } class Bz implements Car{ public function run(){ echo '奔驰车子在跑!!'; } }

小案例3:
查找a出现1次到5次, 也包含之间的, 这种默认也是贪婪的,因为它会取出最大匹配的那一次! 也就是5次
如下代码:

复制代码
1
2
3
4
5
$string='cbaaaaaa'; $pattern='/ba{1,5}/is'; preg_match($pattern, $string,$arr); show($arr);

加上 ? 号 以后 就可以阻止贪婪匹配 并且取出最小匹配次数
如下代码:

复制代码
1
2
3
4
5
$string='cbaaaaaa'; $pattern='/ba{1,5}?/is'; preg_match($pattern, $string,$arr); show($arr);

小提示: ??两个 问号就是完全取最小的
一个? 号表示取 0或者 1
两个?号就表示禁止贪婪 取完全最小值0,
例如:案例中一个?号表示还是取了1个a ,但是两个??问号就一定没有a了 因为两个?? 号表示0、等同于这样写: /ba{0}/
代码如下:

复制代码
1
2
3
4
5
$string='cbaaaaaa'; $pattern='/ba??/is'; preg_match($pattern, $string,$arr); show($arr);

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

"点赞" "评论" "收藏"

大家的支持就是我坚持下去的动力!

如果以上内容有任何错误或者不准确的地方,欢迎在下面 ???? 留个言指出、或者你有更好的想法,欢迎一起交流学习

最后

以上就是沉默小馒头最近收集整理的关于PHP正则表达式核心技术完全详解 第11节 贪婪匹配与懒惰匹配 (禁止贪婪)的全部内容,更多相关PHP正则表达式核心技术完全详解内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(68)

评论列表共有 0 条评论

立即
投稿
返回
顶部