python3 re如何匹配满足条件的选项？

舞夢輝影 2025-11-27 00:00:00 次阅读

在Python3中使用re模块需编写正则表达式并选择匹配函数：1. re.match从开头匹配，re.search查找首个匹配项；2. re.findall返回所有匹配字符串，re.finditer返回匹配对象迭代器；3. 用()分组捕获，通过.group()获取子串；4. 使用flags如re.I、re.M、re.S调整匹配模式，实现忽略大小写、多行匹配等。

在 Python3 中使用 re 模块匹配满足条件的文本，关键在于编写正确的正则表达式并选择合适的匹配函数。下面介绍几种常见用法和场景。

1. 基本匹配：re.match 和 re.search

re.match 从字符串开头尝试匹配，如果开头不匹配就返回 None。

re.search 在整个字符串中搜索第一个满足条件的子串。

例如，检查字符串是否以数字开头：

import re
text = "123abc"
result = re.match(r'\d+', text)  # 匹配开头的数字
if result:
    print("匹配成功:", result.group())  # 输出: 123

2. 查找所有匹配项：re.findall 和 re.finditer

想要找出所有符合规则的内容，使用 re.findall 返回字符串列表，或 re.finditer 返回匹配对象迭代器。

比如提取所有邮箱地址：

text = "联系我 at alice@example.com 或 bob@test.org"
emails = re.findall(r'\b[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}\b', text)
print(emails)  # 输出: ['alice@example.com', 'bob@test.org']

3. 根据条件分组捕获

用括号 () 将需要提取的部分括起来，通过 .group(1) 等获取对应组。

例如提取日期中的年月日：

text = "今天是2025-04-05"
match = re.search(r'(\d{4})-(\d{2})-(\d{2})', text)
if match:
    year, month, day = match.groups()
    print(f"年: {year}, 月: {month}, 日: {day}")

4. 使用修饰符扩展匹配条件

通过 flags 参数改变匹配行为，常用如：

re.IGNORECASE 或 re.I：忽略大小写
re.MULTILINE 或 re.M：多行模式，^ 和 $ 匹配每行开头结尾
re.DOTALL 或 re.S：让 . 匹配包括换行在内的所有字符

示例：忽略大小写查找单词

text = "Python is great. PYTHON rocks. python everywhere."
matches = re.findall(r'\bpython\b', text, flags=re.IGNORECASE)
print(matches)  # 输出: ['Python', 'PYTHON', 'python']

基本上就这些。根据你要匹配的内容设计正则表达式，再选对方法，就能准确抓取符合条件的选项。