摘要:当我们指定标志后,每次运行,正则表达式本身会更新属性,表示上次匹配到的最后索引使用全局匹配,直到结束仍没有匹配到全局匹配类似搜索,因此不能使用,那样只会最多匹配一次。正则表达式还可以指定标志,表示忽略大小写,标志,表示执行多行匹配。
如果有对字符串进行匹配的需求。自然会想到用正则
如 号码:010-8123123
var reg = /^d{3}-d{7}$/" or var reg = new RegExp("^d{3}-d{7}$");//这种写法因为字符串的转译问题需要2个实际上是1个
在正则表达式中,如果直接给出字符,就是精确匹配。用d可以匹配一个数字,w可以匹配一个字母或数字,所以:
"00d"可以匹配"007",但无法匹配"00A"; "ffffd"可以匹配"010"; "ww"可以匹配"js"; .可以匹配任意字符,所以: "js."可以匹配"jsp"、"jss"、"js!"等等。
要匹配变长的字符,在正则表达式中,用*表示任意个字符(包括0个),用+表示至少一个字符,用?表示0个或1个字符,用{n}表示n个字符,用{n,m}表示n-m个字符:
来看一个复杂的例子:d{3}s+d{3,8}。 我们来从左到右解读一下: d{3}表示匹配3个数字,例如"010"; s可以匹配一个空格(也包括Tab等空白符),所以s+表示至少有一个空格,例如匹配" "," "等; d{3,8}表示3-8个数字,例如"1234567"
进阶
要做更精确地匹配,可以用[]表示范围,比如:
[0-9a-zA-Z\_]可以匹配一个数字、字母或者下划线; [0-9a-zA-Z\_]+可以匹配至少由一个数字、字母或者下划线组成的字符串,比如"a100","0_Z","js2015"等等; [a-zA-Z\_$][0-9a-zA-Z\_$]*可以匹配由字母或下划线、$开头,后接任意个由一个数字、字母或者下划线、$组成的字符串,也就是JavaScript允许的变量名; [a-zA-Z\_$][0-9a-zA-Z\_$]{0, 19}更精确地限制了变量的长度是1-20个字符(前面1个字符+后面最多19个字符)。 A|B可以匹配A或B,所以(J|j)ava(S|s)cript可以匹配"JavaScript"、"Javascript"、"javaScript"或者"javascript"。 ^表示行的开头,^d表示必须以数字开头。 $表示行的结束,d$表示必须以数字结束。 你可能注意到了,js也可以匹配"jsp",但是加上^js$就变成了整行匹配,就只能匹配"js"了。
先看看如何判断正则表达式是否匹配:
var re = /^d{3}-d{3,8}$/; re.test("010-12345"); // true re.test("010-1234x"); // false re.test("010 12345"); // false
切分字符串
用正则表达式切分字符串比用固定的字符更灵活,请看正常的切分代码:
"a b c".split(" "); // ["a", "b", "", "", "c"]
无法识别连续的空格,用正则表达式试试:
"a b c".split(/s+/); // ["a", "b", "c"]
无论多少个空格都可以正常分割。加入,试试:
"a,b, c d".split(/[s,]+/); // ["a", "b", "c", "d"]
再加入;试试
"a,b;; c d".split(/[s,;]+/); // ["a", "b", "c", "d"]
分组
用()表示的就是要提取的分组(Group)。比如:
^(d{3})-(d{3,8})$ 分别定义了两个组,可以直接从匹配的字符串中提取出区号和本地号码:
var re = /^(d{3})-(d{3,8})$/; re.exec("010-12345"); // ["010-12345", "010", "12345"] re.exec("010 12345"); // null
如果正则表达式中定义了组,就可以在RegExp对象上用exec()方法提取出子串来
exec()方法在匹配成功后,会返回一个Array,第一个元素是正则表达式匹配到的整个字符串,后面的字符串表示匹配成功的子串。
exec()方法在匹配失败时返回null。
提取子串非常有用。来看一个更凶残的例子:
var re = /^(0[0-9]|1[0-9]|2[0-3]|[0-9]):(0[0-9]|1[0-9]|2[0-9]|3[0-9]|4[0-9]|5[0-9]|[0-9]):(0[0-9]|1[0-9]|2[0-9]|3[0-9]|4[0-9]|5[0-9]|[0-9])$/; re.exec("19:05:30"); // ["19:05:30", "19", "05", "30"]
贪婪匹配
需要特别指出的是,正则匹配默认是贪婪匹配,也就是匹配尽可能多的字符。举例如下,匹配出数字后面的0:
var re = /^(d+)(0*)$/; re.exec("102300"); // ["102300", "102300", ""]
由于d+采用贪婪匹配,直接把后面的0全部匹配了,结果0*只能匹配空字符串了。
必须让d+采用非贪婪匹配(也就是尽可能少匹配),才能把后面的0匹配出来,加个?就可以让d+采用非贪婪匹配:
var re = /^(d+?)(0*)$/; re.exec("102300"); // ["102300", "1023", "00"]
全局匹配可以多次执行exec()方法来搜索一个匹配的字符串。当我们指定g标志后,每次运行exec(),正则表达式本身会更新lastIndex属性,表示上次匹配到的最后索引:
var s = "JavaScript, VBScript, JScript and ECMAScript"; var re=/[a-zA-Z]+Script/g; // 使用全局匹配: re.exec(s); // ["JavaScript"] re.lastIndex; // 10 re.exec(s); // ["VBScript"] re.lastIndex; // 20 re.exec(s); // ["JScript"] re.lastIndex; // 29 re.exec(s); // ["ECMAScript"] re.lastIndex; // 44 re.exec(s); // null,直到结束仍没有匹配到
全局匹配类似搜索,因此不能使用/^...$/,那样只会最多匹配一次。
正则表达式还可以指定i标志,表示忽略大小写,m标志,表示执行多行匹配。
转发自廖雪峰老师的博客:https://www.liaoxuefeng.com/w...
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/91858.html
摘要:正则表达式一直是里比较难以掌握的点。在中创建正则的两种方式使用字面量这就是正则表达式的字面量语法,表示正则表达式的模式,为正则表达式的标志。字面量形式的正则表达式一般使用较多,也推荐大家尽可能使用这种形式,简洁易读,符合正常的使用习惯。 正则表达式一直是js里比较难以掌握的点。 看不懂,学不会,记不住。 每次需要用到正则的时候,都需要再去查找资料。 今天花时间把正则的知识点总结下,希望...
摘要:选择分组和引用正则表达式的语法还包括指定选择项子表达式分组和引用前一子表达式的特殊字符。带圆括号的表达式的另一个用途是允许在同一正则表达式的后部引用前面的子表达式。 正则表达式(regular expression)是一个描述字符模式的对象。JavaScript的 RegExp类 表示正则表达式,String和RegExp都定义了方法,后者使用正则表达式进 行强大的模式匹配和文本检索与...
阅读 1504·2023-04-26 02:08
阅读 3090·2021-10-14 09:42
阅读 6956·2021-09-22 15:34
阅读 3205·2019-08-30 13:16
阅读 2683·2019-08-26 13:49
阅读 1319·2019-08-26 11:59
阅读 1216·2019-08-26 10:31
阅读 2118·2019-08-23 17:19