资讯专栏INFORMATION COLUMN

javascript 正则命名分组

Galence / 301人阅读

摘要:早已实现了正则命名分组提案,只是我们很少使用,本文将介绍的正则命名分组。所有这些问题,都可以通过正则命名分组来解决。该名称必须是合法的标识符。

前言

以往我们只是习惯于通过数组下标来访问正则匹配到的分组,但分组达到4、5个时,标识起来就会非常麻烦。V8早已实现了正则命名分组提案,只是我们很少使用,本文将介绍JS的正则命名分组。

以往的做法

假设要使用正则匹配一个日期的年月日,以往我们会这样做:

const RE_DATE = /(d{4})-(d{2})-(d{2})/;

const matchObj = RE_DATE.exec("1999-12-31");
const year = matchObj[1]; // 1999
const month = matchObj[2]; // 12
const day = matchObj[3]; // 31

这里有几个缺点:

要找到一个分组的位置,你必须要去数括号的位置,有时嵌套起来会更令人头疼。

后面维护代码的同学阅读起来,还要根据下标找到正则里面对应的括号,并且要再次阅读括号里面的正则才知道含义。

当你调整正则捕获分组的数量、顺序或嵌套时,你必要还要对下面的代码做调整。

所有这些问题,都可以通过正则命名分组来解决。

现在的玩法

现在你只需要给分组里面一个命名标识即可:

(?d{4})

这里,我们用变量year标记了上一个捕获组#1。 该名称必须是合法的JavaScript标识符。 匹配后,您可以通过matchObj.groups.year访问捕获的字符串。

让我们通过命名分组重写前面的代码:

const RE_DATE = /(?d{4})-(?d{2})-(?d{2})/;

const matchObj = RE_DATE.exec("1999-12-31");
const year = matchObj.groups.year; // 1999
const month = matchObj.groups.month; // 12
const day = matchObj.groups.day; // 31

如果正则里面有了命名分组,那么匹配结果会多了一个groups 的属性,这个属性中包含了一切命名分组的捕获结果。配合上解构大法使用又是一股清流:

const {groups: {day, year}} = RE_DATE.exec("1999-12-31");
console.log(year); // 1999
console.log(day); // 31

当然,即使你使用了命名分组,那么返回的结果还可以通过以往的数组下标方式访问:

const year2 = matchObj[1]; // 1999
const month2 = matchObj[2]; // 12
const day2 = matchObj[3]; // 31

命名分组具有以下优点:

找到分组的“ID”更容易。

匹配的代码变得自描述性,因为分组的ID描述了捕获的内容。

如果更改分组的顺序,则不必更改匹配的代码。

分组的名称也使正则表达式更易于理解,因为您可以直接看到每个组的用途。

反向引用

反向引用命名分组k
看下面这个匹配重复单词的例子:

const RE_TWICE = /^(?[a-z]+)!k$/;
RE_TWICE.test("abc!abc"); // true
RE_TWICE.test("abc!ab"); // false

同时也可以使用以往的反向引用方式:

const RE_TWICE = /^(?[a-z]+)!1$/;
RE_TWICE.test("abc!abc"); // true
RE_TWICE.test("abc!ab"); // false
replace( )

字符串方法replace()以两种方式支持命名分组:

方式一
const RE_DATE = /(?d{4})-(?d{2})-(?d{2})/;
console.log("1999-12-31".replace(RE_DATE,
    "$/$/$"));
    // 12/31/1999

如果replace不一定是直接返回新的拼接字符串,那么可以看看下面的办法:

方式二
const RE_DATE = /(?d{4})-(?d{2})-(?d{2})/;
console.log("1999-12-31".replace(
    RE_DATE,
    (g, y, m, d, offset, input, {year, month, day}) =>
        month+"/"+day+"/"+year));
    // 12/31/1999

看看这replace的callback形参密密麻麻看得心慌慌,很多都用不上,那么我们看看更简单的写法:

console.log("1999-12-31".replace(RE_DATE,
    (...args) => {
        const {year, month, day} = args.slice(-1)[0];
        return month+"/"+day+"/"+year;
    }));
    // 12/31/1999

这里配合上spread operator直取最后一个参数,再接上一个解构大法,结果又是一股清流。

命名分组没有匹配结果?

如果可选的命名组不被匹配,则其属性值被设置为undefined,但key是仍存在:

const RE_OPT_A = /^(?a+)?$/;
const matchObj = RE_OPT_A.exec("");

// We have a match:
console.log(matchObj[0] === ""); // true

// Group  didn’t match anything:
console.log(matchObj.groups.as === undefined); // true

// But property as exists:
console.log("as" in matchObj.groups); // true
异常情况

分组名不能有重复项:

/(?a)(?b)/ // SyntaxError: Duplicate capture group name

反向引用一个不存在的分组名:

/k/u // SyntaxError: Invalid named capture referenced

/k/.test("k") // true, 非 Unicode 下为了向后兼容,k 前面的  会被丢弃

在 reaplce() 方法的替换字符串中引用一个不存在的分组:

"abc".replace(/(?.*)/, "$") // SyntaxError: Invalid replacement string

"abc".replace(/(.*)/, "$") // "$",不包含命名分组时会向后兼容
最后

Chrome60 已支持命名分组

通过babel插件处理兼容问题

babel-plugin-transform-modern-regexp

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/108016.html

相关文章

  • 精通正则表达式

    摘要:文章同步于正则表达式是一种处理字符串匹配的语言。如果同时使用其它元字符,我们就能构造出功能更强大的正则表达式。 文章同步于 Github blog 正则表达式(Regular Expression)是一种处理字符串匹配的语言。 很可能你使用过 Windows/Dos 下用于文件查找的通配符(wildcard),也就是 * 和 ? 。如果你想查找某个目录下的所有的Word文档的话,你会搜...

    elarity 评论0 收藏0
  • Javascript正则匹配不含某子串

    摘要:在中就体现成用正则表达式进行文件名匹配。字符串匹配恩,那么不包括呢显然,这就需要用到正则的位置匹配了和都是不正确的,匹配前面不是的的位置。参考正则表达式分钟入门教程正则表达式匹配不包含某个字符串通俗易懂还有图 问题重现 不知道各位旁友在webpack的使用中,有没有碰到下面的问题情景: 在使用了css Module的情况下,同时又希望用一些global的布局,其实在css Module...

    huaixiaoz 评论0 收藏0
  • 正则表达式前端使用手册

    摘要:非贪婪模式尽可能少的匹配所搜索的字符串,而默认的贪婪模式则尽可能多的匹配所搜索的字符串。 导读 你有没有在搜索文本的时候绞尽脑汁, 试了一个又一个表达式, 还是不行. 你有没有在表单验证的时候, 只是做做样子(只要不为空就好), 然后烧香拜佛, 虔诚祈祷, 千万不要出错. 你有没有在使用sed 和 grep 命令的时候, 感觉莫名其妙, 明明应该支持的元字符, 却就是匹配不到. 甚至,...

    zhoutao 评论0 收藏0
  • 正则表达式在 ES2018 中的新写法

    摘要:自从年推出标准第版以来,正则表达式已成为语言的一部分。最后,如果在正则表达式中使用了命名捕获组,则将它们放在属性中。支持与相同语法的命名组已经模仿了的正则表达式语法。下面是一个例子此正则表达式在句子中查找连续的重复单词。 翻译:疯狂的技术宅原文:https://www.smashingmagazine.... 本文首发微信公众号:jingchengyideng欢迎关注,每天都给你推...

    lanffy 评论0 收藏0
  • 正则表达式学习总结

    摘要:在默认的模式下,元字符和分别匹配字符串的开头和结尾处,模式改变了这俩元字符的定义,让他们匹配一行的开头和结尾。可以使用非捕获元字符或来忽略对这部分正则表达式的保存。 一、背景 工作上遇到一个这样的需求: 用正则表达式将一个字符串中的span标签替换为img标签,并将原span标签的内容放到img标签的src中,问题详细描述:点我 看到这个需求,我知道应该可以用正则表达式,可是由于之前没...

    darkbaby123 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<