网站首页 > 基础教程 正文
作者:极客小俊
一个专注于web技术的80后
你不用拼过聪明人,你只需要拼过那些懒人 你就一定会超越大部分人!
PHP正则表达式中的贪婪匹配与 (禁止贪婪)
贪婪匹配
什么是贪婪匹配呢? 废话不多说 先看一段代码案例把 如下:
$string='aaaaaaabbbbbbbbbbbbccccccc';
//如下
$pattern='/ab+/';
//或者说是如下
$pattern='/ab.+/';
preg_match($pattern, $string,$arr);
show($arr);
php正则表达式默认就是贪婪的 解决贪婪匹配 的办法就是用 ? 号 所以阻止贪婪一般加? 来解决 代码如下:
$string='aaaaaaabbbbbbbbbbbbccccccc';
//如下
$pattern='/ab+?/';
//或者说是如下
$pattern='/ab.+?/';
preg_match($pattern, $string,$arr);
show($arr);
小案例1: 这里跟加不加s 视为单行字符有关系, 因为加了s 视为单行以后会产生贪婪匹配、所以阻止贪婪后 在进行全局搜索匹配! 代码如下:
$string='test test http://www.163.com test test <a href="http://www.baidu.com">百度</a>
test test test <a href="http://www.sina.com">新浪</a>';
//匹配网址
$pattern='/http:\/\/(ftp|www)\.\w+.(com|org|net)/';
//匹配href的内容 这里不加? 就会出现贪婪匹配
$pattern='/href="(.+?)"/s';
?
preg_match_all($pattern, $string,$arr);
show($arr);
?
小案例2: 删除某一个class文件中的所有注释 例如:Car.class.php文件 内容如下:
<?php
?
/**
* @description
* @author 3#
*/
interface Car{
function run();
}
?
?
/**
*
* @description 宝马车类
*
*/
class Bmw implements Car{
public function run(){
echo '宝马车子在跑!!';
}
}
?
?
/**
* @description 奔驰车类
*
*/
class Bz implements Car{
public function run(){
echo '奔驰车子在跑!!';
}
}
?
?
// $Bmw=new Bmw();
// $Bmw->run();
// echo '<br>';
// $Bz=new Bz();
// $Bz->run();
?
?>
然后处理这个Car.class.php中的注释,把里面的注释都删掉 通常我们是如下处理的
//载入文件
$file='./Car.class.php';
$content=file_get_contents($file);
//正则匹配
$pattern='/\/\*\*.*\*\//s';
//替换为空
$result=preg_replace($pattern, '', $content);
//最后把处理好的字符重新写入带文件中
file_put_contents($file, $result);
以上这样处理看似没什么问题,但是当你打开Car.class.php这个文件的时候你要大吃一惊的!! 现在Car.class.php里面应该只剩下 下面这个类了 其他的都不见了!!
class Bz implements Car{
public function run(){
echo '奔驰车子在跑!!';
}
}
原因:如果这样替换会产生如下情况: 原因是;贪婪匹配 .* 匹配了/* 开始一直到 /结尾、 中间无论什么内容都被视为 . 的范畴之内了!
禁止贪婪
正确的做法是加上? 号 阻止贪婪匹配 代码如下:
//载入文件
$file='./Car.class.php';
$content=file_get_contents($file);
//正则匹配 并且禁止贪婪
$pattern='/\/\*\*.*?\*\//s';
//替换为空
$result=preg_replace($pattern, '', $content);
//最后把处理好的字符重新写入带文件中
file_put_contents($file, $result);
结果Car.class.php文件中的注释就全部删除了 ,Car.class.php文件中的代码如下:
interface Car{
function run();
}
?
?
?
class Bmw implements Car{
public function run(){
echo '宝马车子在跑!!';
}
}
?
?
?
class Bz implements Car{
public function run(){
echo '奔驰车子在跑!!';
}
}
小案例3: 查找a出现1次到5次, 也包含之间的, 这种默认也是贪婪的,因为它会取出最大匹配的那一次! 也就是5次 如下代码:
$string='cbaaaaaa';
$pattern='/ba{1,5}/is';
preg_match($pattern, $string,$arr);
show($arr);
加上 ? 号 以后 就可以阻止贪婪匹配 并且取出最小匹配次数 如下代码:
$string='cbaaaaaa';
$pattern='/ba{1,5}?/is';
preg_match($pattern, $string,$arr);
show($arr);
小提示: ??两个 问号就是完全取最小的 一个? 号表示取 0或者 1 两个?号就表示禁止贪婪 取完全最小值0, 例如:案例中一个?号表示还是取了1个a ,但是两个??问号就一定没有a了 因为两个?? 号表示0、等同于这样写: /ba{0}/ 代码如下:
$string='cbaaaaaa';
$pattern='/ba??/is';
preg_match($pattern, $string,$arr);
show($arr);
极客小俊@今日头条,首发原创文章
如果喜欢话请 "点赞 评论 收藏" 一键三连
大家的支持就是我坚持下去的动力!
猜你喜欢
- 2025-01-03 C之正则表达式
- 2025-01-03 Wordpress建站教程:网站添加自动Tag标签内链 提升SEO优化效果
- 2025-01-03 Thinkphp3.2.3及以下版本漏洞整理
- 2025-01-03 laravel通过artisan命令一键生成增_删_改_查验证命令
- 2025-01-03 2小时快速搭建一个高可用的IM系统
- 2025-01-03 FCKeditor上传漏洞的总结分析
- 2025-01-03 php从远程URL获取(mp4 mp3)音视频的流媒体数据
- 2025-01-03 记一次靶场实战【网络安全】
- 2025-01-03 滑动解锁提交评论插件_一招屏蔽WordPress垃圾评论
- 2025-01-03 浅解用PHP实现MVC
- 最近发表
- 标签列表
-
- gitpush (61)
- pythonif (68)
- location.href (57)
- tail-f (57)
- pythonifelse (59)
- deletesql (62)
- c++模板 (62)
- css3动画 (57)
- c#event (59)
- linuxgzip (68)
- 字符串连接 (73)
- nginx配置文件详解 (61)
- html标签 (69)
- c++初始化列表 (64)
- exec命令 (59)
- canvasfilltext (58)
- mysqlinnodbmyisam区别 (63)
- arraylistadd (66)
- node教程 (59)
- console.table (62)
- c++time_t (58)
- phpcookie (58)
- mysqldatesub函数 (63)
- window10java环境变量设置 (66)
- c++虚函数和纯虚函数的区别 (66)