JavaScript正则表达式是RegExp对象,用于匹配、提取和替换文本;字面量写法为/pattern/flags;test()返回布尔值,match()返回匹配数组;replace()是否全局替换取决于g标志;需警惕灾难性回溯与环境兼容性。
JavaScript 正则表达式不是“一种字符串”,而是一个用于描述、匹配和操作文本模式的对象——它由 RegExp 构造函数或字面量(如 /abc/)创建,核心能力是「在字符串中查找、提取、替换符合特定规则的子串」。
最常用也最安全的写法是字面量形式:/pattern/flags。斜杠之间是模式主体,后面可跟标志(flag),比如 g(全局)、i(忽略大小写)、m(多行模式)。
常见错误现象:
.,却写了 /a.b/(这会匹配 aXb),正确应为 /a\.b/
g,后续调用 exec() 时因 lastIndex 残留导致匹配跳过或失败"/" + str + "/",必须用 new RegExp(str)
test() 只返回布尔值,适合做条件判断;match() 返回匹配结果数组(含 index、input 等属性),适合提取内容。
使用场景差异:
/^[^\s@]+@[^\s@]+\.[^\s@]+$/.test(email) 更轻量logLine.match(/(\d{4})-(\d{2})-(\d{2}) (\d{2}:\d{2}:\d{2})/) 能拿到分组g 标志时,match() 返回纯匹配数组(无分组信息),此时若需捕获组,得用 exec() 循环调用取决于正则是否带 g 标志,以及传入的第二个参数类型。
关键细节:
"a a a".replace(/a/, "b") → "b a a"(无 g,只替换第一个)"a a a".replace(/a/g, "b") → "b b b"(有 g,全部替换)(match
, p1, p2, offset, string),其中 p1、p2 是捕获组内容$1、$2 表示捕获组,但它们是字面字符串,不是变量——"x1y".replace(/(\d)/, "[$1]") → "x[1]y"
正则本身不慢,但滥用回溯、嵌套量词或超长输入会导致「灾难性回溯」,让 JS 主线程卡死。
容易被忽略的点:
.* 在非贪婪模式下仍是潜在风险源,尤其配合后续可选匹配时(如 /a.*?b.*?c/ 遇到不满足的字符串可能尝试指数级路径)RegExp 实例不要在循环里反复创建(如 for (...) { /abc/.test(s); }),应提前定义常量u(Unicode)或 y(粘性)标志,用前需检测或降级String.prototype.replaceAll() 替代 replace(/.../g, ...),但注意它只接受字符串或 RegExp,且不支持函数回调中的捕获组引用真正难的从来不是写出一个能跑的正则,而是预判它在边界输入下的行为、回溯深度、以及跨环境的一致性——调试时多看 RegExp.lastIndex 和浏览器开发者工具里的「正则测试器」,比背语法更重要。
来电咨询