答案是使用正则表达式提取文件名中的数字。通过re.findall(r'\d+', filename)可匹配所有数字串,如需整数则转换类型;结合os.listdir()可批量处理目录下文件;若只提取特定位置的数字,可用^\d+匹配开头、\d+(?=\.\w+$)匹配结尾,根据命名规则选择合适模式即可准确获取所需数字。
要从文件名中提取数字,可以使用正则表达式或字符串处理方法。最常用且高效的方式是使用 re 模块来匹配文件名中的数字部分。
使用正则表达式提取数字
导入 re 模块,用 re.findall() 找出所有数字片段:
import refilename = "data_2025_file_45.txt" numbers = re.findall(r'\d+', filename) print(numbers) # 输出: ['2025', '45']
\d+ 表示匹配一个或多个连续的数字。返回的是字符串列表,如需整数可转换:
numbers_int = [int(n) for n in numbers] print(numbers_int) # 输出: [2025, 45]
从多个文件中提取数字
结合 os.listdir() 或 pathlib 遍历目录:
import os import refolder = "./data/" for file in os.listdir(folder): match = re.findall(r'\d+', file) if match: print(f"{file} -> {match}")
只提取特定位置的数字
如果只想取文件名开头或结尾的数字,可用更精确的正则:
- 开头数字:^\\d+
- 结尾数字(在扩展名前):\\d+(?=\\.txt
) 或 \\d+(?=\\.)
# 提取以数字结尾的文件(不含扩展名) filename = "image_123.jpg" number_at_end = re.findall(r'(\d+)(?=\.\w+$)', filename) print(number_at_end) # 输出: ['123']
基本上就这些。根据命名规则选择合适的正则模式,就能准确读取文件名中的数字。

) 或 \\d+(?=\\.)







