python-第13-正则表达式 | 河岳日星的博客

符号	意思
`\S`	非空格的字符（字母、数字、符号都算）
`\s`	空格、换行、制表符等空白字符
`\d`	数字 0-9
`+`	前面的东西至少出现 1 次，越多越好

import re

text = "我的邮箱是 zhangsan@163.com，另一个是 lisi@qq.com"

# 1. 找第一个邮箱
email = re.search(r'\S+@\S+', text)    # 一串非空格 + @ + 一串非空格
if email:
    print("找到邮箱:", email.group())  # 输出: zhangsan@163.com

# 2. 找所有邮箱
emails = re.findall(r'\S+@\S+', text)   # 
print("所有邮箱:", emails)  # 输出: ['zhangsan@163.com', 'lisi@qq.com']

# 3. 分割字符串
words = re.split(r'[，。；！？]', text)  # 遇到 ， 。 ； ！ ？ 这些符号，就切一刀！
print("分词结果:", words)

# 4. 替换数字为 *
text2 = "电话：138-1234-5678"
new_text = re.sub(r'\d', '*', text2)   # 把所有数字（\d）都替换成星号（*）
print("替换后:", new_text)  # 输出: 电话：***-****-****

✅ 2. 正则模式语法（元字符）
| 元字符 | 含义 | 示例 |
| :— | :— | :— |
| . | 匹配任意字符（除了换行） | a.c → 匹配 abc, a1c |
| ^ | 行开头 | ^hello → 只匹配以 hello 开头的行 |
| $ | 行结尾 | world$ → 只匹配以 world 结尾的行 |
| * | 前一个字符重复 0 次或多次 | a* → 匹配 "", "a", "aa" |
| + | 前一个字符重复 1 次或多次 | a+ → 匹配 "a", "aa"，不匹配 "" |
| ? | 前一个字符重复 0 或 1 次 | a? → 匹配 "", "a" |
| {m} | 重复 m 次 | a{3} → 匹配 "aaa" |
| {m,n} | 重复 m 到 n 次 | a{2,4} → 匹配 "aa", "aaa", "aaaa" |
| [] | 字符集合 | [abc] → 匹配 a、b、c 中任意一个 |
| \ | 转义字符 | \. → 匹配点号（不是任意字符） |

graph LR
A[遇到文本处理问题] –> B{我能用正则解决吗？}
B – 能 –> C[回忆核心方法：search/findall/sub]
C –> D[写出大致模式：比如 \d+ 或 @\S+]
D –> E[让 AI 帮我完善细节或调试]
E –> F[运行验证 → 成功！]
B – 不能 –> G[考虑其他方案：字符串方法 / 解析库]