资讯专栏INFORMATION COLUMN

JavaScript正则表达式-基础入门

Amos / 3409人阅读

摘要:正则表达式基础入门字符类,如为匹配任何字符组成的字符重复如为匹配一到三个单词选择分组和引用指定匹配位置修饰符直接量字符可用于模式匹配的方法对象基本要素字符类方括号内的任意字符不在方括号内的任意字符除换行符和其他行终止符之外的任意字符任何字

JavaScript正则表达式-基础入门

字符类,如 /w/ 为匹配任何ASCII字符组成的字符

重复, 如 /w{1,3}/ 为匹配一到三个单词

选择、分组和引用

指定匹配位置

修饰符

直接量字符

可用于模式匹配的String方法

RegExp对象

基本要素

字符类
[...] 方括号内的任意字符
1 不在方括号内的任意字符
. 除换行符和其他Unicode行终止符之外的任意字符
w 任何ASCII字符组成的单词,等价于[a-zA-Z0-9]
W 任何不适ASCII字符组成的单词,等价于2
s 任何Unicode空白符
S 任何非Unicode空白符的字符,注意w和S不同
d 任何ASCII数字,等价于[0-9]
D 除了ASCII数字之外的任何字符,等价于3
[] 退格直接量(特例)
    // 匹配字符串中的 "b"
    "abc".search( /[b]/ )                    // 1

    // 匹配字符串中的 方括号内规定的数字
    "abc123abc".search( /[2-5]/ )      // 4
重复
{n,m} 匹配前一项至少n次,但不能超过m次
{n, } 匹配前一项n次或者更多次
{n} 匹配前一项n次
? 尽可能多地匹配前一项0或者1次
+ 尽可能多地匹配前一项1次或多次
* 尽可能多地匹配前一项0或多次
{n,m}? 尽可能少地匹配前一项至少n次,但不能超过m次
?? 尽可能少地匹配前一项0或者1次
+? 尽可能少地匹配前一项1次或多次
*? 尽可能少地匹配前一项0或多次
    // 匹配2~4个数字,{n,m}中的逗号两边不能有空格
    "a1ab12abc123".search( /d{2,4}/ )               // 4

    // 精确匹配三个字母和一个可选的数字
    "at12a3abcd1abc123".search( /[a-zA-Z]{3}d?/ )   // 6

    // 匹配前后带有一个或多个空格的字符串"JavaScript"
    "JavaScripttttt is notJavaScript( JavaScript )".search( /s+JavaScripts+/ );       // 32

    // 尽可能多
    "aaa".match( /a+/ );            // ["aaa"]
    // 尽可能少
    "aaa".match( /a+?/ );           // ["a"]
选择

字符 "|" 用于提供可选择的字符
注意两点:

1. 匹配次序 从左到右
2. 如果左边的选择匹配成功,就忽略右边的匹配项
    // 匹配三个数字或者是4个小写字母
    "1ab12ab123abcd".match( /d{3}|[a-z]{4}/ )              // ["123"]
分组和引用

(...)有三个作用:

1. 把多带带的项组合成子表达式
2. 在完成的模式中定义子模式
3. 允许在同一正则表达式的后部引用前面的子表达式 , 使用1代表第一个左括号的内容,2代表第二个左括号的内容,依次类推
    // 1.匹配字符串"Java",其后的"Script"可有可无
    "JavaSScript".match( /Java(Script)?/ )                    // ["Java", undefined]

    // 2.匹配左右为字母中间为数字的字符串,同时取出中间的字符串
    "123abc454cba321".match( /[a-z]+(d+)[a-z]+/ )   // ["abc454cba", "454"]

    // 3.允许在同一正则表达式的后面引用前面的子表达式
    ""Java"S"cript"".match( /[""][^""]*[""]/ );             // [""Java""]    引号左右不匹配
    ""Java"S"cript"".match( /([""])[^""]*1/ );            // [""S"", """]    引号左右匹配
(...) 将几个项组合为一个单元,这个单元可通过"*"、"+"、"?"和"|"等符号加以修饰
(?:...) 只组合,把项目组合到一个单元,但不记忆与该组相匹配的字符
n 和第n个分组第一次匹配的字符相匹配,组是圆括号中的子表达式,组索引是从左到右的左括号数
指定匹配位置
^ 匹配字符串的开头,在多行检索中,匹配一行的开头
$ 匹配字符串的借位,在多行检索中,匹配一行的结尾
b 匹配一个单词的边界(区分[b]匹配的是退格符)
B 匹配非单词边界的位置
(?=p) 零宽正向先行断言,要求接下来的字符都与p匹配,但不能包括匹配p的那些字符
(?!p) 零宽负向先行断言,要求接下来的字符不与p匹配

b、^ 和 $ 称为正则表达式的锚,定位搜索字符串的特定位置

    // 匹配单词的边界,即位于w字符和W之间的边界
    "htmlhtml html".search( /html/ )                // 0
    "htmlhtml html".search( /html/ )             // 4

    // 匹配一个单词
    " JavaScript".match( /^JavaScript$/ )         // null
    "JavaScript".match( /^JavaScript$/ )          // ["JavaScript"]

(?=p)(?!p)指定接下来的字符是否与p匹配

    // 第二个不能匹配是因为Java后面不是空格符
    "JavaScript is good.".match( /[Jj]ava(Script)?(?=s)/ )             // ["JavaScript", "Script"]
    "Javais good.".match( /[Jj]ava(Script)?(?=s)/ )                      //  null
修饰符
i 执行不区分大小写的匹配
g 执行一个全局匹配
m 多行匹配模式,^匹配一行的开头和字符串的开头,$匹配行的结束和字符串的结束

修饰符用在“/”符号之后

    // i 即为igonre case
    "JAVASCRIPT".match( /javascript/ )              // null
    "JAVASCRIPT".match( /javascript/i )             // ["JAVASCRIPT"]

    // g 即为global
    "JavaScript Java".match( /Java/ )                  // ["Java"]
    "JavaScript Java".match( /Java/g )                // ["Java", "Java"]

    // m 即为multiline
    "JavaScript
Java".match( /^Java$/ )                      // null
    "JavaScript
Java".match( /^Java$/m )                   // ["Java"]
直接量符号
o NUL字符(u0000)
制表符(u0009)
换行符(u00A)
v 垂直制表符(u000B)
f 换页符(u000C)
回车符(u000D)
xnn 由16进制数nn指定的拉丁字符
uxxxx 由16进制数xxxx指定的Unicode字符
cX 控制字符
可用于模式匹配的String方法
        // search(),返回与之匹配子串的起始位置
        "JavaScript".search( /script/i );                   // 4

        // match() , 返回由匹配结果组成的数组
        "Java is not JavaScript".match( /java(script)?/gi )                 // ["Java", "JavaScript"]

        // replace(), 检索和替换
        "java is not JavaScript".replace( /java/i , "C++" ).replace( /javascript/i , "C")                   // "C++ is not C"

        // split() , 将字符串拆分为一个子串组成的数组
        " 1  ,    2,    3    ,4     ,     5 ".trim().split( /s*,s*/ )                 // ["1", "2", "3", "4", "5"]
RegExp对象

RegExp()为一个构造函数

    // 第一个参数为 正则表达式的主体部分,第二个参数为 修饰符
    let reg = new RegExp( "java(script)?" , "gi" );
    "Java is not JavaScript".match( reg )                       // ["Java", "JavaScript"]
小结

此文章是参照了《JavaScript: The Definitive Guide》中的第十章,想仔细了解JavaScript的正则表达式可以去翻阅此书籍。

解析一个URL使用/(w+)://([w.]+)/(S*)/

    "Welcome to https://segmentfault.com/t/javascript".match( /(w+)://([w.]+)/(S*)/ )          
    // ["https://segmentfault.com/t/javascript", "https", "segmentfault.com", "t/javascript"]

... ↩

a-zA-Z0-9 ↩

0-9 ↩

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/81818.html

相关文章

  • 前端计划——JavaScript正则达式快速入门

    摘要:前言正则表达式时处理字符串中常用的手法,本文以简单的方式,快速展示了中正则相关的基础知识点。文末还提供了几个简单的正则相关面试题。接下来是正则部分,注意后面的并不匹配,也就是比如,实际匹配的值是和,在和后面加上,就完成了预期。 前言:正则表达式时处理字符串中常用的手法,本文以简单的方式,快速展示了JavaScript中正则相关的基础知识点。文末还提供了几个简单的正则相关面试题。个人总结...

    Xufc 评论0 收藏0
  • TRY REGEX:正则达式交互式入门教程 翻译&解答

    摘要:写一个正则表达式来测试变量中是否包含字符串。用函数给出不使用字符,但和等价的正则表达式。第十四课标志全局匹配标志第二个常用的标志是全局匹配标志,用字母表示。写出一个正则表达式来检验合法性。非捕获组的主要用途是给一个组赋予量词。 TRY REGEX 是一个交互式的正则表达式学习项目项目地址:https://github.com/callumacra...在线地址:http://tryre...

    李义 评论0 收藏0
  • 前端资源系列(4)-前端学习资源分享&前端面试资源汇总

    摘要:特意对前端学习资源做一个汇总,方便自己学习查阅参考,和好友们共同进步。 特意对前端学习资源做一个汇总,方便自己学习查阅参考,和好友们共同进步。 本以为自己收藏的站点多,可以很快搞定,没想到一入汇总深似海。还有很多不足&遗漏的地方,欢迎补充。有错误的地方,还请斧正... 托管: welcome to git,欢迎交流,感谢star 有好友反应和斧正,会及时更新,平时业务工作时也会不定期更...

    princekin 评论0 收藏0
  • 前端文档收集

    摘要:系列种优化页面加载速度的方法随笔分类中个最重要的技术点常用整理网页性能管理详解离线缓存简介系列编写高性能有趣的原生数组函数数据访问性能优化方案实现的大排序算法一怪对象常用方法函数收集数组的操作面向对象和原型继承中关键词的优雅解释浅谈系列 H5系列 10种优化页面加载速度的方法 随笔分类 - HTML5 HTML5中40个最重要的技术点 常用meta整理 网页性能管理详解 HTML5 ...

    jsbintask 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<