整体介绍

什么是正则表达式 1)什么是正则表达式 正则表达式的基本使用 1)正则表达式的创建 2)元字符 3)方括号表示法 4)量词 5)修饰符 正则表达式和字符串 1)正则表达式的相关方法 2)字符串的相关方法 正则表达式的应用 1)正则表达式的应用

开源中国在线正则表达式测试

什么是正则表达式

正则表达式(regular expression)描述了字符串的““构成模式”,经常被用于检查字符串是否符合预定的格式要求

正则表达式“按位”描述规则

正则表达式“按位”描述规则,是指它是一位一位的描述字符串的构成形式 比如检查字符串是不是这样的:以字母m开头,然后是3个数字,最后以字母n结尾

正则表达式的创建

使用 /内容/ 的语法形式,可以快速创建正则表达式 也可以使用new RegExp(‘内容’)的形式,创建正则表达式 使用typeof运算符检查正则表达式的类型,结果是object

<script>
        // 创建正则表达式方法1
        var regexp1 = /^\d{6}$/;
        // 创建正则表达式方法2
        var regexp2 = new RegExp('^\\d{6}$');
 
        var str = '555666';
 
        console.log(regexp1.test(str));     // true
        console.log(regexp2.test(str));     // true
 
        console.log(typeof regexp1);        // object
        console.log(typeof regexp2);        // object
    </script>

object是引用类型值,/\d/ == /\d/答案是false

元字符

元字符”是指一位指定类型的字符

开头和结尾

元字符注意事项

◆如果使用new RegExp()写法,反斜杠需要多写一个 ◆比如/^\d$/new RegExp('^\\d$')是相同的意思

<script>
        // 题目1:某快递公司运单号形式是这样的:123-4567-890,请使用正则表达式检查某字符串是否符合此格式
 
        // 正则表达式
        var regexp1 = /^\d\d\d-\d\d\d\d-\d\d\d$/;
        // 待测试的字符串
        var str1 = '444-5555-000';
        console.log(regexp1.test(str1));
 
        // 题目2:某产品的验证秘钥形式是这样的:□□□-□□□□-□□□,其中□表示字母数字或者下划线,请使用正则表达式检查某字符串是否符合此格式
 
        // 正则表达式
        var regexp2 = /^\w\w\w-\w\w\w\w-\w\w\w$/;
        // 待测试的字符串
        var str2 = 'abc-__ab-123';
        console.log(regexp2.test(str2));
 
    </script>

字符的转义

在特殊字符之前的反斜杠\表示下一个字符不是特殊字符,应该按照字面理解

不管一个符号有没有特殊意义,都可以在其之前加上一个\以确保它表达的是这个符号本身

// 题目3:某产品批号形式为:123.45^67#89,请使用正则表达式检查某字符串是否符合此格式
var regexp3 = /^\d\d\d\.\d\d\^\d\d\#\d\d$/;
// 待测试的字符串
var str3 = '666.66^66#66';
console.log(regexp3.test(str3));

不是一个元字符,可以不加\,但是我们还是需要加一个确保它表达的是这个符号本身

方括号表示法

使用方括号,比如[xyz],可以创建一个字符集合,表示匹配方括号中的任意字符

比如某学校的学号规定:第1位是一个字母,b表示本科生,y表示研究生,后面是7位数字,用正则表示为: /^[by]\d{7}$/

可以使用短横-来指定一个字符范围,^表示否定

<script>
        // 某学校的学号规定:第1位是一个字母,b表示本科生,y表示研究生,后面是7位数字,用正则表示为:
        // 学号字符串
        var str1 = 'm4444555';
 
        // 用正则表达式进行检查
        console.log(/^[by]\d{7}$/.test(str1));
 
        // *******************************************
        // 题目1:请验证某字符串是否是5位字母,大小写均可
        var str2 = 'abcde';
        var str3 = 'abcd5';
        console.log(/^[a-zA-Z]{5}$/.test(str2));
        console.log(/^[a-zA-Z]{5}$/.test(str3));
 
        // 题目2:请验证某字符串是否是5位,且仅由小写字母、点构成
        var str4 = 'mnp..';
        var str5 = 'mnp.#';
        console.log(/^[a-z\.]{5}$/.test(str4));
        console.log(/^[a-z\.]{5}$/.test(str5));
 
        // 题目3:请验证某字符串是否是4位小写字母,且最后一位不能是m字母
        var str6 = 'abcd';
        var str7 = 'abcm';
        var str8 = 'ab1c';
        console.log(/^[a-z]{3}[a-ln-z]$/.test(str6));
        console.log(/^[a-z]{3}[a-ln-z]$/.test(str7));
        console.log(/^[a-z]{3}[a-ln-z]$/.test(str8));
    </script>

量词

<script>
        // 题目1:请验证字符串是否符合手机号码的规则:11位数字,并且肯定以1开头
        var str1 = '13812345678';
        var str2 = '138123456789';
        var str3 = '38123456789';
        var regexp1 = /^1\d{10}$/;
        console.log(regexp1.test(str1));
        console.log(regexp1.test(str2));
        console.log(regexp1.test(str3));
 
        // 题目2:请验证某字符串是否是这样的:以字母开头,中间是任意位数字(最少1位)构成,并以字母结尾
        var str4 = 'a123123123b';
        var str5 = 'abcd';
        var str6 = 'a1b';
        var regexp2 = /^[a-zA-Z]\d+[a-zA-Z]$/;
        console.log(regexp2.test(str4));
        console.log(regexp2.test(str5));
        console.log(regexp2.test(str6));
 
        // 题目3:请验证某字符串是否符合网址规则:以www.开头,中间是任意位的字符(字母数字下划线,最少一位),最后以.com结尾,也可以以.com.cn结尾
        var str7 = 'www.imooc.com';
        var str8 = 'www.sina.com.cn';
        var str9 = 'www.news.cn';
        var regexp3 = /^www\.\w+\.com(\.cn)?$/;
        console.log(regexp3.test(str7));
        console.log(regexp3.test(str8));
        console.log(regexp3.test(str9));
    </script>

修饰符

修饰符也叫作标志(flags),用于使用正则表达式实现高级搜索

修饰符的使用:

正则表达式相关方法

◆正则表达式可以“打点”调用哪些方法呢?

test()方法

正则表达式的test()方法用来测试某字符串是否匹配此正侧表达式,它返回true或false

exec()方法

exec()方法功能是:在一个指定字符串中执行一个搜索匹配查找,返回一个结果数组或null

exe()方法的逐条遍历

使用循环语句简化:

<script>
        var str = 'abc123def456ghi789';
        var regexp = /\d+/g;    // +表示贪婪的,尽可能多的匹配
        var result1 = regexp.exec(str);
        var result2 = regexp.exec(str);
        var result3 = regexp.exec(str);
        var result4 = regexp.exec(str);
        console.log(result1);
        console.log(result2);
        console.log(result3);
        console.log(result4);
 
        // 使用循环语句来循环执行exec,寻找所有的匹配结果
        var result;
        while (result = regexp.exec(str)) {
            console.log(result);
        }
    </script>

字符串的相关方法

字符串有哪些方法可以使用正则表达式呢?

<script>
        var str = 'abc123def4567ghi89';
 
        // search()方法,很像indexOf(),返回查找到的第一个下标,如果找不到就是-1
        var result1 = str.search(/\d+/g);
        var result2 = str.search(/m/g);
        console.log(result1);       // 3
        console.log(result2);       // -1
 
        // match()方法,返回查找到的数组,找不到就是null
        var result3 = str.match(/\d+/g);
        console.log(result3);       // ["123", "4567", "89"]
 
        // replace()方法,进行替换
        var result4 = str.replace(/[a-z]+/g, '*');      // 注意+表示贪婪的,尽可能多的连续匹配小写字母
        console.log(result4);       // *123*4567*89
 
        // split()方法,进行字符串拆为数组
        var result5 = str.split(/\d+/g);
        console.log(result5);       // ["abc", "def", "ghi", ""]
    </script>

正则表达式的应用

用正则表达式进行表单验证

◆用正则表达式进行表单验证是正则表达式最重要的实际应用 ◆实际上,很多正则表达式不需要我们自己写,可以通过搜索引擎查找,可以拿来即用

<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Document</title>
    <style>
        .warning {
            color: red;
            display: none;
        }
    </style>
</head>
 
<body>
    <div>
        <p>
            请输入中文姓名:
            <input type="text" id="nameField">
            <span class="warning" id="nameWarning">输入的姓名不合法</span>
        </p>
        <p>
            请输入手机号码:
            <input type="text" id="telField">
            <span class="warning" id="telWarning">输入的手机号码不合法</span>
        </p>
        <p>
            请输入Email:
            <input type="text" id="emailField">
            <span class="warning" id="emailWarning">输入的Email不合法</span>
        </p>
    </div>
    <script>
        var nameField = document.getElementById('nameField');
        var telField = document.getElementById('telField');
        var emailField = document.getElementById('emailField');
        var nameWarning = document.getElementById('nameWarning');
        var telWarning = document.getElementById('telWarning');
        var emailWarning = document.getElementById('emailWarning');
 
        // 当文本框失去焦点,就是光标不在文本框中了
        nameField.onblur = function () {
            // 得到姓名
            var name = nameField.value;
            if (/^[\u4E00-\u9FA5]{2,4}$/.test(name)) {
                // 如果通过校验
                nameWarning.style.display = 'none';
            } else {
                // 如果没有通过校验
                nameWarning.style.display = 'inline';
            }
        };
 
        telField.onblur = function () {
            // 得到电话
            var tel = telField.value;
            if (/^1\d{10}$/.test(tel)) {
                // 如果通过校验
                telWarning.style.display = 'none';
            } else {
                // 如果没有通过校验
                telWarning.style.display = 'inline';
            }
        };
 
        emailField.onblur = function () {
            // 得到email
            var email = emailField.value;
            // 合法的email都是[email protected]
 
            if (/^\w{2,}\@\w{2,}\.[a-z]{2,4}(\.[a-z]{2,4})?$/.test(email)) {
                // 如果通过校验
                emailWarning.style.display = 'none';
            } else {
                // 如果没有通过校验
                emailWarning.style.display = 'inline';
            }
        };
    </script>
</body>

拓展

字符范围匹配

元字符匹配

多次重复匹配

定位匹配

模式

贪婪模式

在满足条件的情况下尽可能多匹配到字符串

非贪婪模式

在满足条件的情况下尽可能少匹配到字符串

表达式分组

◆分组将”正则”分组为多个子表达式