Python中如何读取文件名中的数字?

答案是使用正则表达式提取文件名中的数字。通过re.findall(r'\d+', filename)可匹配所有数字串,如需整数则转换类型;结合os.listdir()可批量处理目录下文件;若只提取特定位置的数字,可用^\d+匹配开头、\d+(?=\.\w+$)匹配结尾,根据命名规则选择合适模式即可准确获取所需数字。

要从文件名中提取数字,可以使用正则表达式或字符串处理方法。最常用且高效的方式是使用 re 模块来匹配文件名中的数字部分。

使用正则表达式提取数字

导入 re 模块,用 re.findall() 找出所有数字片段:

import re

filename = "data_2025_file_45.txt" numbers = re.findall(r'\d+', filename) print(numbers) # 输出: ['2025', '45']

\d+ 表示匹配一个或多个连续的数字。返回的是字符串列表,如需整数可转换:

numbers_int = [int(n) for n in numbers]
print(numbers_int)  # 输出: [2025, 45]

从多个文件中提取数字

结合 os.listdir()pathlib 遍历目录:

import os
import re

folder = "./data/" for file in os.listdir(folder): match = re.findall(r'\d+', file) if match: print(f"{file} -> {match}")

只提取特定位置的数字

如果只想取文件名开头或结尾的数字,可用更精确的正则:

  • 开头数字:^\\d+
  • 结尾数字(在扩展名前):\\d+(?=\\.txt)\\d+(?=\\.)
# 提取以数字结尾的文件(不含扩展名)
filename = "image_123.jpg"
number_at_end = re.findall(r'(\d+)(?=\.\w+$)', filename)
print(number_at_end)  # 输出: ['123']

基本上就这些。根据命名规则选择合适的正则模式,就能准确读取文件名中的数字。