资讯专栏INFORMATION COLUMN

正则表达式位数和零宽断言

AlphaGooo / 3448人阅读

摘要:正则表达式位数和零宽断言之前的文章里,已经给大家展示了正则的匹配流程,希望大家能够好好回顾下。下面我们主要讨论两部分的内容正则表达式的位数,零宽断言正则表达式的位数在有需要正则表达式,很常见的操作就百度一下。

正则表达式位数和零宽断言

之前的文章里,已经给大家展示了正则的匹配流程,希望大家能够好好回顾下。https://segmentfault.com/a/11...
下面我们主要讨论两部分的内容:1. 正则表达式的位数,2. 零宽断言


正则表达式的位数

在有需要正则表达式,很常见的操作就百度一下。看能不能找到满足我需求的。有时候你会找到的,比如手机校验,密码校验,邮箱校验。但是很多人往往都看不懂网上的正则的意思。这个就是学习正则的一个误区。
在我看来,我们学习正则应该是:了解其匹配过程,再看懂正则表达式,最后才是自己写正则表达式。
下面主要讲的就是怎么看懂正则表达式。而看懂正则表达式的关键--表达式匹配的字符位数。
我们拿例子来说吧。

// 第一个例子,表达式匹配4个字符,一个“非语法关键字”的字符会占一位。
var reg1 = /abcd/;

// 第一个例子, 表达式匹配了5个字符(先是ab,再是abc里的任意一个,接着是cd)。说明下:[]范围内的内容能占一位,不管里面放了多少东西都是或的意思。
var reg2 = /ab[abc]cd/;

// 第三个例子, 匹配了5个或以上(先是ab,再是abc里的任意一个,接着是c,最后是一个d或者很多个d),这类的功能类似的*,{1,5}
var reg3 = /ab[abc]cd+/;

// 第四个例子,匹配4个(三个字符abd,和一个[])。  像^, $这类的标示位置的语法是不会占一个字符的,只是对位置的一些要求。
var reg4 = /^ab[abc]d$/

// 第五个例子(这个是个真实例子,不知道大家能否快速看清),匹配无数字符(首选匹配##item#七个字符,接着匹配任意字符的任意个,接着匹配字符#item##)
// 这个里面的?是不要贪婪模式,其实这里说是遇到第一个#item##。关于贪婪模式,希望大家自己查阅下。
var reg5 = /((##item#)([w|W])+?(#item##))/

我是通过例子,想尽量说的直白点,让大家更容易理解。我这里面的例子并没有列全情况,如果大家有什么不理解的正则,不确定里面匹配多少位数,欢迎在下面留言,我看到就会给大家解答。
下面我们说说零宽断言


零宽断言

在说清楚零宽断言,我们需要简单介绍下为啥会有这个。它的存在是为了解决什么问题呢?
这个存在是解决我们一些特定的要求,且不需要展占位数。比如:字符串的开头和结尾用"#"替换(/^|$/, 需要找到开头和结尾,又没有真实字符),数字字符串每隔三位添加一个逗号,字符串里b的后面不能是数字等等,这些都是对位置的条件,但这些条件本身又没有占位。

表示位置,又不占字符的语法总共就这些:^ $  B (?=) (?!)
^(脱字符)匹配开头,在多行匹配中匹配行开头。
$(美元符号)匹配结尾,在多行匹配中匹配行结尾。
b是单词边界,具体就是w和W之间的位置,也包括w和^之间的位置,也包括w和$之间的位置。
B就是b的反面的意思,非单词边界。例如在字符串中所有位置中,扣掉b,剩下的都是B的。
以上4个比较简单,尤其是^ 和$,这里就不多说了。下面主要说说这两个(?=)和(?!)
(?= P)表示的此刻位置后面应该是P模式,这个模式不单单是字符,也可能是复杂正则。比如(?= l),(?= [abc]ede), (?= d +)
(?!p) 表示的此刻位置后面应该是P模式的以外的位置,和上一个正好相反。
举几个例子帮助理解下

// 第一个例子, 正则的表达式,要求在cate后位置的后面应该是一个数字。再之后应该是数字位,再之后是ok。d是不能少的,也很好的说明了(?=)是不占位。
var reg6 = /cate(?=d)dok/
var str = "cate3ok"
str.match(reg6); // cate3ok

// 第二个例子,如果我们想在##p#和#p##之前的字符串里有ok字符这段字符串。
var reg7 = /##p#(?=.*ok).*#p##/
var str1 = "##p#fsdfsdokdfsdfs#p##"
reg7.test(str1);

// 第三个例子,如果我们想在##p#和#p##之前的字符串里有ok字符这段字符串。如果字符串里有两段##p#怎么办呢?
var reg7 = /##p#(?=.*ok).*#p##/
var str1 = "##p#fsokfs#p####p#fsfs#p##"
str1.match(reg7) // ##p#fsokfs#p####p#fsfs#p##   这个结果就不是我们想要的了。不知大家能否想明白?

// 我们把正则改下
var reg8 = /##p#(?=.*ok).*?#p##/
str1.match(reg8) //##p#fsokfs#p##
// 好像是对了哦,但是我们把字符串改下, 两段##p#换个位置
var str2 = "##p#fsfs#p####p#fsokfs#p##";
str2.match(reg8) // ##p#fsfs#p##  又不对了。 这个地方不知能否想明白。

// 我们再把正则改下
var reg9 = /##p#(?=(.(?!#p##))*ok).*?#p##/;
str2.match(reg9); // ##p#fsokfs#p##  这次就对上了。

我想对最后的正则进行解释下。 首选是?#p## 这个地方的?是告诉正则我不用贪婪模式,(?=(.(?!#p##)).*ok).* 这部分里我们先不看里面的?部分,把它当成P(?=p.*ok).*, 这部分意思,我们需要任意字符,在任意字符的后面任意位置应该出现一个OK。最后里面的?部分,其实也是对这个任意字符的条件,要求任意字符后面不能是#p##字符串。这样就实现了啦。

我知道这个可能很难理解清楚,希望大家还是多看看,多想想。如果有问题,还是欢迎下面留言。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/54123.html

相关文章

  • 正则达式位数零宽断言

    摘要:正则表达式位数和零宽断言之前的文章里,已经给大家展示了正则的匹配流程,希望大家能够好好回顾下。下面我们主要讨论两部分的内容正则表达式的位数,零宽断言正则表达式的位数在有需要正则表达式,很常见的操作就百度一下。 正则表达式位数和零宽断言 之前的文章里,已经给大家展示了正则的匹配流程,希望大家能够好好回顾下。https://segmentfault.com/a/11...下面我们主要讨论两...

    1treeS 评论0 收藏0
  • 正则达式位数零宽断言

    摘要:正则表达式位数和零宽断言之前的文章里,已经给大家展示了正则的匹配流程,希望大家能够好好回顾下。下面我们主要讨论两部分的内容正则表达式的位数,零宽断言正则表达式的位数在有需要正则表达式,很常见的操作就百度一下。 正则表达式位数和零宽断言 之前的文章里,已经给大家展示了正则的匹配流程,希望大家能够好好回顾下。https://segmentfault.com/a/11...下面我们主要讨论两...

    Amio 评论0 收藏0
  • JS正则达式一条龙讲解,从原理和语法到JS正则、ES6正则扩展,最后再到正则实践思路

    摘要:控制权和传动这两个词可能在搜一些博文或者资料的时候会遇到,这里做一个解释先控制权是指哪一个正则子表达式可能为一个普通字符元字符或元字符序列组成在匹配字符串,那么控制权就在哪。 温馨提示:文章很长很长,保持耐心,必要时可以跳着看,当然用来查也是不错的。 正则啊,就像一座灯塔,当你在字符串的海洋不知所措的时候,总能给你一点思路;正则啊,就像一台验钞机,在你不知道用户提交的钞票真假的时候,...

    Michael_Lin 评论0 收藏0
  • 正则与JS中的正则

    摘要:注意本文将正则与中的正则分开讨论。正则零宽断言更多参考各种语言对于正则不同支持参考单行模式与多行模式通过设置正则表达式后的修饰符可开启对应的匹配模式单行模式和多行模式。 最近这段时间帮同学处理一些文档, 涉及到一些结构化文档的工作大部分都得使用正则表达式, 之前对于正则的认识大多来源于语言书上那几页的介绍, 自己也没有用过几次。这里将我之前感到模糊的概念作个整理。因为对JS了解多点,所...

    firim 评论0 收藏0
  • 正则达式基础笔记

    摘要:参考资料慕课网鬼斧神工之正则表达式正则表达式后向引用详解正则表达式分钟入门教程什么是正则表达式正则表达式是字符串的搜索和匹配的工具。贪婪模式懒惰模式后向引用分组捕获的内容可以在表达式或其他程序中作进一步的处理。 参考资料 慕课网-鬼斧神工之正则表达式正则表达式后向引用详解正则表达式30分钟入门教程 什么是正则表达式? 正则表达式是字符串的搜索和匹配的工具。 正则表达式工具 一个测试正...

    Enlightenment 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<