JavaScript正则表达式如何写_它有哪些应用场景?

JavaScript正则表达式通过RegExp对象或字面量创建,核心是理解匹配目标;常用字面量(如/^\d{3}-\d{4}$/)和构造函数(new RegExp())两种方式,配合i/g/m等标志,广泛用于表单验证、文本提取替换及路由匹配等场景。

JavaScript正则表达式用 RegExp 对象或字面量(如 /pattern/flags)来创建,核心是通过模式匹配字符串中的特定结构。写法关键在于掌握元字符、量词、分组和标志位,而不是死记硬背——理解“想匹配什么”比记住所有符号更重要。

基础写法:两种创建方式

常用写法有两种,效果一致,但适用场景不同:

  • 字面量写法/^\d{3}-\d{4}$/,适合静态、固定模式,简洁高效
  • 构造函数写法new RegExp('^\\d{3}-\\d{4}$'),适合动态拼接(比如用户输入的关键词),注意反斜杠要双写

常见标志(flags):i(忽略大小写)、g(全局匹配)、m(多行模式)。例如 /hello/gi 会找所有形式的 “hello”。

表单验证:最常用也最实在的场景

前端表单里几乎离不开正则,比如判断邮箱、手机号、密码强度:

  • 邮箱:/^[^\s@]+@[^\s@]+\.[^\s@]+$/(基础版,不追求 RFC 完全合规,够用)
  • 国内手机号:/^1[3-9]\d{9}$/(匹配 11 位以 13–19 开头的号码)
  • 密码至少8位含字母和数字:^(?=.*[a-zA-Z])(?=.*\d).{8,}$(用正向先行断言组合条件)

注意:正则只做前端校验,后端必须重复验证——它防不住绕过 JS 的请求。

文本提取与替换:处理用户输入或 API 返回内容

从一段文字中抓关键信息,或批量清理格式:

  • 提取所有 URL:/(https?:\/\/[^\s]+)/g,配合 match()exec()
  • 把多个空格/换行替换成单个空格:str.replace(/\s+/g, ' ').trim()
  • 给中文标点加空格(排版需求):str.replace(/([,。!?;:])/g, ' $1 ')

replace() 时,第二个参数可以是字符串,也可以是函数,后者适合需要逻辑判断的替换(比如把数字加括号)。

路由匹配与语法高亮:进阶但实用的方向

在前端路由(如手写 SPA 路由)或代码编辑器中也会用到:

  • 简易路由匹配:/^\/user\/(\d+)$/ 可提取 ID,再用 exec() 拿到分组 [1]
  • 高亮 HTML 标签://g(简单场景),配合 replace() 包上 ...

这类场景对性能和准确性要求更高,建议先测试边界情况(比如嵌套标签、注释),必要时改用专用解析器。

基本上就这些。正则不是越复杂越好,而是刚好够用、易读、易维护。写完记得用在线工具(如 regex101.com)调试,边试边调,比硬想靠谱得多。