资讯专栏INFORMATION COLUMN

身份证号码的正则表达式及验证详解(JavaScript,Regex)

laznrbfe / 3569人阅读

摘要:简言在做用户实名验证时,常会用到身份证号码的正则表达式及校验方案。身份证号码说明居民身份证号码,正确正式的称谓应该是公民身份号码。也有说法表述开头是外国人取得中国身份证号码的前两位编码,但本人并未得到证实。

简言

在做用户实名验证时,常会用到身份证号码的正则表达式及校验方案。本文列举了两种验证方案,大家可以根据自己的项目实际情况,选择适合的方案。

身份证号码说明

居民身份证号码,正确、正式的称谓应该是“公民身份号码”。根据【中华人民共和国国家标准 GB 11643-1999】中有关公民身份号码的规定,公民身份号码是特征组合码,由十七位数字本体码和一位数字校验码组成。排列顺序从左至右依次为:六位数字地址码,八位数字出生日期码,三位数字顺序码和一位数字校验码。

以北京市朝阳区一女性身份证号码为例,身份证号码所表示的含义如下图所示:

注:该身份证号码来源于国标【GB 11643-1999】。

下面我们就从零开始完成一个完整的身份证号码校验过程。

方案1 (简单) 1.1 分部规则

我们首先提出方案1,并分步做如下规则定义:

1.1.1 地址码规则:

地址码长6位

以数字1-9开头

后5位为0-9的数字

根据以上规则,写出地址码的正则表达式: /^[1-9]d{5}/

1.1.2 年份码规则:

年份码长4位

以数字18,19或20开头

剩余两位为0-9的数字

根据以上规则,写出年份码的正则表达式: /(18|19|20)d{2}/。如果不需要18开头的年份,可以去掉18。

1.1.3 月份码规则:

月份码长2位

第一位数字为0,第二位数字为1-9

或者第一位数字为1,第二位数字为0-2

根据以上规则,写出月份码的正则表达式: /((0[1-9])|(1[0-2]))/

1.1.4 日期码规则:

日期码长2位

第一位数字为0-2,第二位数字为1-9

或者是10,20,30,31

根据以上规则,写出日期码的正则表达式 :/(([0-2][1-9])|10|20|30|31)/

1.1.5 顺序码规则:

顺序码长3位

顺序码是数字

根据以上规则,写出顺序码的正则表达式 :/d{3}/

1.1.6 校验码规则:

校验码长1位

可以是数字,字母x或字母X

根据以上规则,写出校验码的正则表达式 :/[0-9Xx]/

1.2 方案1正则表达式

综合以上6条规则,给出完整的正则表达式及测试程序如下:

var p = /^[1-9]d{5}(18|19|20)d{2}((0[1-9])|(1[0-2]))(([0-2][1-9])|10|20|30|31)d{3}[0-9Xx]$/;
//输出 true
console.log(p.test("11010519491231002X"));
//输出 false 不能以0开头
console.log(p.test("01010519491231002X"));
//输出 false 年份不能以17开头
console.log(p.test("11010517491231002X"));
//输出 false 月份不能为13
console.log(p.test("11010519491331002X"));
//输出 false 日期不能为32
console.log(p.test("11010519491232002X"));
//输出 false 不能以a结尾
console.log(p.test("11010519491232002a"));

演示代码

1.3 方案1分析

方案1只是做了基本的格式判定,存在三个主要的不足:

地址码判定不够精确。例:我国并不存在16,26开头的地区,却可通过验证

日期判定不够精确。例:19490231也可通过验证,而2月并不存在31日

校验码是由17位本体码计算得出,方案1并未校验此码

方案2 (全面)

根据方案1的不足,引入方案2进而改进方案1的不足。

2.1 省级地址码校验

华北:北京11,天津12,河北13,山西14,内蒙古15

东北: 辽宁21,吉林22,黑龙江23

华东: 上海31,江苏32,浙江33,安徽34,福建35,江西36,山东37

华中: 河南41,湖北42,湖南43

华南: 广东44,广西45,海南46

西南: 四川51,贵州52,云南53,西藏54,重庆50

西北: 陕西61,甘肃62,青海63,宁夏64,新疆65

特别:台湾71,香港81,澳门82

根据上述地址码做身份证号码的前两位校验,进一步的提高准确率。当前的地址码以2013版的行政区划代码【GB/T2260】为标准。由于区划代码的历史演变,使得地址码后四位校验变得不太可能。以三胖的身份证号为例,本人号码是2321开头,而当前行政区划代码表中并无此代码。因此本文只做前两位省级地址码的校验。

也有说法表述91开头是外国人取得中国身份证号码的前两位编码,但本人并未得到证实。如有持91开头身份证或认识马布里的,请帮忙确认相关信息。

根据以上分析,给出省级地址码校验及测试程序如下:
var checkProv = function (val) {
    var pattern = /^[1-9][0-9]/;
    var provs = {11:"北京",12:"天津",13:"河北",14:"山西",15:"内蒙古",21:"辽宁",22:"吉林",23:"黑龙江 ",31:"上海",32:"江苏",33:"浙江",34:"安徽",35:"福建",36:"江西",37:"山东",41:"河南",42:"湖北 ",43:"湖南",44:"广东",45:"广西",46:"海南",50:"重庆",51:"四川",52:"贵州",53:"云南",54:"西藏 ",61:"陕西",62:"甘肃",63:"青海",64:"宁夏",65:"新疆",71:"台湾",81:"香港",82:"澳门"};
    if(pattern.test(val)) {
        if(provs[val]) {
            return true;
        }
    }
    return false;
}
//输出 true,37是山东
console.log(checkProv(37));
//输出 false,16不存在
console.log(checkProv(16));

演示代码

2.2 出生日期码校验 出生日期码的校验不做解释,直接给出如下函数及测试程序:
var checkDate = function (val) {
    var pattern = /^(18|19|20)d{2}((0[1-9])|(1[0-2]))(([0-2][1-9])|10|20|30|31)$/;
    if(pattern.test(val)) {
        var year = val.substring(0, 4);
        var month = val.substring(4, 6);
        var date = val.substring(6, 8);
        var date2 = new Date(year+"-"+month+"-"+date);
        if(date2 && date2.getMonth() == (parseInt(month) - 1)) {
            return true;
        }
    }
    return false;
}
//输出 true
console.log(checkDate("20180212"));
//输出 false 2月没有31日
console.log(checkDate("20180231"));

演示代码

2.3 校验码校验

校验码的计算略复杂,先给出如下公式:

其中 ai 表示身份证本体码的第 i 位值,而 Wi 表示第 i 位的加权因子值。

加权因子表 【表1】:
i 1 2 3 4 5 6 7 8
Wi 7 9 10 5 8 4 2 1
9 10 11 12 13 14 15 16 17
6 3 7 9 10 5 8 4 2
X与校验码换算表 【表2】
X 0 1 2 3 4 5 6 7 8 9 10
a18 1 0 X 9 8 7 6 5 4 3 2
算法过程:

根据身份证主体码(前17位)分别与对应的加权因子(表1)计算乘积再求和,根据所得结果与11取模得到X值。

根据 X 值查询表2,得出a18即校验码值。

校验码计算程序及测试见如下代码:
var checkCode = function (val) {
    var p = /^[1-9]d{5}(18|19|20)d{2}((0[1-9])|(1[0-2]))(([0-2][1-9])|10|20|30|31)d{3}[0-9Xx]$/;
    var factor = [ 7, 9, 10, 5, 8, 4, 2, 1, 6, 3, 7, 9, 10, 5, 8, 4, 2 ];
    var parity = [ 1, 0, "X", 9, 8, 7, 6, 5, 4, 3, 2 ];
    var code = val.substring(17);
    if(p.test(val)) {
        var sum = 0;
        for(var i=0;i<17;i++) {
            sum += val[i]*factor[i];
        }
        if(parity[sum % 11] == code.toUpperCase()) {
            return true;
        }
    }
    return false;
}
// 输出 true, 校验码相符
console.log(checkCode("11010519491231002X"));
// 输出 false, 校验码不符
console.log(checkCode("110105194912310021"));

演示代码

2.4 方案2整体代码
var checkID = function (val) {
    if(checkCode(val)) {
        var date = val.substring(6,14);
        if(checkDate(date)) {
            if(checkProv(val.substring(0,2))) {
                return true;
            }
        }
    }
    return false;
}
//输出 true
console.log(checkID("11010519491231002X"));
//输出 false,校验码不符
console.log(checkID("110105194912310021"));
//输出 false,日期码不符
console.log(checkID("110105194902310026"));
//输出 false,地区码不符
console.log(checkID("160105194912310029"));

演示代码

以上为三胖对身份证号码验证的理解和分析,如有不足请大家予以指正。

知名物理学家史蒂芬•霍金于2018年3月14日去世,享年76岁。一个博学又有趣的人,一路走好!

世间再无霍金,时间永留简史!

原文地址

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/93433.html

相关文章

  • 15位、18位份证号码正则达式

    摘要:例也可通过验证,而月并不存在日校验码是由位本体码计算得出,方案并未校验此码这个链接中的位正则表达式错的,最后顺序码应该是位。 身份证正则表达式 在项目中遇到身份证号码验证,百度了一些资料,太简单的和太复杂的pass,综合了一些案例,取长补短,形成了个折中版本的,正则表达式如下: var reg =/(^[1-9]d{5}(18|19|([23]d))d{2}((0[1-9])|(10|...

    galois 评论0 收藏0
  • 正则达式详解实战

    摘要:如果你还没正式开始正则表达式,请快速浏览跳过本章节。就是一个等同于但更简略的正则表达式。如果想查找全部,就要加标识全局匹配规则正则表达式搜索字符串指定的值,从而去匹配字符串。正则表达式都是用来操作字符串的。 正则表达式 Create by jsliang on 2018-11-14 10:41:20 Recently revised in 2018-11-19 08:46:37 ...

    simon_chen 评论0 收藏0
  • 如何判断用户浏览器以一些前端常用正则表单验证

    摘要:前言在我们做用户授权登录微信授权,以及根据对应浏览器做对应的操作的时候,经常会遇到需要判断用户使用的浏览器的需求,以及在需要用户输入信息的时候,有需要验证的一些正则。 前言 在我们做用户授权登录(微信,qq授权),以及根据对应浏览器做对应的操作的时候,经常会遇到需要判断用户使用的浏览器的需求,以及在需要用户输入信息的时候,有需要验证的一些正则。如果喜欢的话可以点波赞/关注,支持一下,希...

    JiaXinYi 评论0 收藏0
  • form表单验证包括(强悍身份验证和银行卡验证),不只是正则

    摘要:银行卡验证银行卡验证身份证验证身份证号码为位或者位,位时全为数字,位前位为数字,最后一位是校验位,可能为数字或字符。 银行卡验证: /** * 银行卡验证 * @param {*string} str */ function isBankCard(str) { var regex = /^(998801|998802|622525|622526|435744|435745...

    ShevaKuilin 评论0 收藏0
  • 还不会正则达式?看这篇!

    摘要:匹配次匹配次匹配次匹配次匹配次,等价于匹配次,等价于元字符在正则表达式中有一些具有特殊含义的字母,被称为元字符,简言之,元字符就是描述字符的字符,它用于对字符表达式的内容转换及各种操作信息进行描述。 showImg(https://segmentfault.com/img/remote/1460000018489886?w=2000&h=1125); 正则表达式是很多程序员,甚至是一些...

    go4it 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<