智能图片分类：基于文件名自动创建并命名文件夹的Python实现

## 1. 为什么你需要这个“图片管家”？你是不是也遇到过这样的烦恼？手机相册里几千张照片，想找一张去年旅游拍的风景照，结果翻到手抽筋也找不到。或者，你是个搞机器学习的爱好者，从网上下载了一堆猫猫狗狗的图片想训练个模型，结果所有图片都堆在一个文件夹里，手动分类分到眼花缭乱，效率低还容易出错。我之前接手过一个项目，需要处理上万张产品图片，每张图片的名字都包含了产品型号和颜色信息，比如 `iPhone15_ProMax_深空黑_001.jpg`、`iPhone15_ProMax_银色_002.jpg`。老板要求按型号和颜色分门别类放好。一开始我傻乎乎地手动新建文件夹、复制粘贴，干了半小时就头晕脑胀，还差点把银色和金色的图片搞混。那一刻我就想，必须得写个脚本让电脑自己干这个活儿。这就是我们今天要聊的 **“智能图片分类”脚本**。它不是什么高深莫测的AI，而是一个用Python写的、非常接地气的自动化工具。它的核心逻辑超级简单：**读取图片文件名 -> 提取关键信息（比如产品型号、拍摄日期）-> 根据这个信息自动创建对应的文件夹 -> 把图片“请”进它该去的文件夹里**。整个过程完全自动化，你只需要把脚本扔进图片堆里，泡杯咖啡的功夫，回来就看到一个整整齐齐、一目了然的文件夹结构。无论是整理个人相册（按年份-月份分类），还是处理工作上的素材库（按项目-类别分类），甚至是给机器学习数据集做预处理（按标签分类），它都能大显身手。说白了，它就是你的“图片管家”，帮你把杂乱无章变成井井有条。 ## 2. 动手之前：理清思路，准备好你的“工具箱” 在开始敲代码之前，我们得先想明白这个“管家”要怎么工作。不能一上来就埋头写，那样很容易写出又乱又难维护的代码。我根据自己踩过的坑，总结了一个清晰的四步走思路： 1. **巡逻扫描**：让脚本知道要去哪里找那些“无家可归”的图片。 2. **解读身份**：分析每一张图片的文件名，像侦探一样从中提取出可以作为“家庭地址”（文件夹名）的关键词。 3. **安家落户**：根据提取出的关键词，在指定的目标位置创建好一个个“家”（文件夹）。如果这个“家”已经存在了，就别重复建。 4. **搬家入住**：最后，把每张图片精准地复制或移动到属于它的那个文件夹里。思路清晰了，我们来看看需要哪些工具。这个脚本的核心依赖就两个Python标准库，你不需要安装任何额外的第三方包，非常轻量： - **`os` 库**：这是我们的“文件系统指挥官”。所有和文件夹、路径相关的操作，比如列出文件夹里所有文件、检查某个路径是否存在、创建新文件夹，都得靠它。 - **`shutil` 库**：这是我们的“文件搬运工”。它的 `copy` 或 `move` 函数，能高效、安全地把文件从一个地方复制或移动到另一个地方。你电脑上只需要有一个Python环境（建议Python 3.6以上版本）就能直接开干。你可以打开命令行，输入 `python --version` 检查一下。如果没有，去Python官网下载安装一个，过程很简单。为了让你更直观地理解我们最终要实现的效果，我画了一个简单的流程图。你可以看到，原始的一堆杂乱图片，经过脚本处理后，是如何根据文件名中的信息，被自动归类到不同文件夹中的。 ``` [杂乱图片堆] --(脚本处理)--> [分类文件夹A] |-- 图片A_001.jpg |-- 图片A_002.jpg [分类文件夹B] |-- 图片B_001.jpg |-- 图片B_002.jpg ``` ## 3. 从零开始：一步步构建你的分类脚本好了，热身完毕，我们进入实战环节。我会把代码拆解成几个核心功能块，并配上详细的注释和不同的场景例子，保证你能看懂每一行代码在干什么。 ### 3.1 核心引擎：文件名解析与文件夹创建函数这是整个脚本的大脑，我们把它写成一个独立的函数，这样逻辑清晰，也方便以后修改和复用。 ```python import os import shutil def classify_images_by_name(source_dir, target_root_dir): """ 根据图片文件名自动分类图片到对应文件夹。参数: source_dir (str): 存放原始图片的源文件夹路径。 target_root_dir (str): 分类后图片存放的目标根目录路径。 """ # 第一步：安全检查，确保源文件夹存在 if not os.path.exists(source_dir): print(f"错误：源文件夹 '{source_dir}' 不存在！") return # 第二步：获取源文件夹下所有图片文件（这里假设是.jpg和.png，你可以按需扩展） all_files = os.listdir(source_dir) # 过滤出图片文件，避免把非图片文件也处理了 image_extensions = ('.jpg', '.jpeg', '.png', '.gif', '.bmp') image_files = [f for f in all_files if f.lower().endswith(image_extensions)] if not image_files: print(f"提示：在 '{source_dir}' 中没有找到图片文件。") return print(f"找到 {len(image_files)} 张待处理的图片。") # 第三步：从每个图片文件名中提取分类关键词（文件夹名） # 这是最灵活的一步，需要根据你文件名的命名规则来定制 folder_names = set() # 用集合来自动去重 name_to_folder_map = {} # 建立一个映射：图片文件名 -> 它该去的文件夹名 for img_file in image_files: # 示例1：文件名如 "旅游_西藏_2023-10.jpg"，我们想按“旅游”分类 # folder_name = img_file.split('_')[0] # 示例2：文件名如 "20231015_家庭聚会.jpg"，我们想按日期“20231015”分类 # folder_name = img_file.split('_')[0] # 示例3：文件名如 "cat_01.jpg", "dog_05.png"，我们想按动物类型分类 # 这里用更通用的方法：去掉数字和文件扩展名，取第一个‘_’前的部分 # 先去掉扩展名 name_without_ext = os.path.splitext(img_file)[0] # 假设命名格式是“类别_编号”，我们取类别 parts = name_without_ext.split('_') if parts: # 确保分割后至少有一部分 folder_name = parts[0] else: folder_name = "未分类" # 如果文件名不符合预期，扔到“未分类”文件夹 folder_names.add(folder_name) name_to_folder_map[img_file] = folder_name print(f"将创建 {len(folder_names)} 个分类文件夹：{list(folder_names)}") # 第四步：在目标根目录下创建所有需要的分类文件夹 # 确保目标根目录存在 os.makedirs(target_root_dir, exist_ok=True) for folder in folder_names: folder_path = os.path.join(target_root_dir, folder) if not os.path.exists(folder_path): os.mkdir(folder_path) print(f"创建文件夹：{folder_path}") else: print(f"文件夹已存在：{folder_path}") # 第五步：将每张图片复制（或移动）到对应的分类文件夹 copied_count = 0 for img_file, target_folder in name_to_folder_map.items(): source_path = os.path.join(source_dir, img_file) target_path = os.path.join(target_root_dir, target_folder, img_file) # 使用shutil.copy2可以保留文件的元数据（如创建时间） shutil.copy2(source_path, target_path) # 如果确定是移动而不是复制，可以用 shutil.move(source_path, target_path) copied_count += 1 # 可以打印进度，处理大量文件时建议每100张打印一次 if copied_count % 100 == 0: print(f"已处理 {copied_count} 张图片...") print(f"处理完成！成功分类并复制了 {copied_count} 张图片到 '{target_root_dir}'。") ``` **代码解读与个性化定制点：** 1. **文件过滤**：`image_files = [f for f in all_files if f.lower().endswith(image_extensions)]` 这行代码用了一个列表推导式，只保留扩展名是图片格式的文件。你可以修改 `image_extensions` 元组来支持更多格式，比如 `.webp`, `.tiff`。 2. **核心解析逻辑**：`folder_name = parts[0]` 这一行是**关键中的关键**。它决定了如何从文件名中提取文件夹名。我给出了三个示例，你需要根据自己图片的命名习惯来修改。 - 如果你的图片名是 `风景_夏日海滩_001.jpg`，用 `split('_')[0]` 得到“风景”。 - 如果你的图片名是 `2023-08-01_生日派对.jpg`，用 `split('_')[0]` 得到“2023-08-01”，这会创建一个以日期命名的文件夹。 - 如果你的命名规则更复杂，比如 `产品-手机-型号-小米13_Ultra_蓝色.jpg`，你可能需要用 `split('-')[0]` 得到“产品”，或者用更高级的正则表达式来提取。 3. **创建文件夹**：`os.makedirs(target_root_dir, exist_ok=True)` 中的 `exist_ok=True` 参数非常有用，它意味着“如果文件夹已经存在，别报错，继续”。这保证了脚本可以安全地多次运行。 4. **复制 vs 移动**：我使用了 `shutil.copy2`，这是**复制**操作，原始图片还在原处。如果你确认分类后源文件不需要了，可以换成 `shutil.move` 来**移动**文件，这样能节省磁盘空间。**但务必谨慎，移动操作不可逆，建议先复制测试无误后再改用移动。** ### 3.2 让脚本跑起来：主程序与参数配置大脑（函数）有了，现在我们需要给它下达指令，告诉它具体从哪里拿图片，放到哪里去。 ```python if __name__ == '__main__': # ！！！在这里配置你的路径！！！ # 源文件夹路径：存放着你所有杂乱图片的文件夹 SOURCE_DIR = './我的混乱相册' # 例如：绝对路径 'C:/Users/你的名字/Pictures/待整理' # 目标根目录路径：分类后的大本营，脚本会在这里面创建子文件夹 TARGET_ROOT_DIR = './整理好的相册' print("=" * 50) print("智能图片分类脚本启动...") print(f"源目录: {SOURCE_DIR}") print(f"目标根目录: {TARGET_ROOT_DIR}") print("=" * 50) # 调用我们的核心函数 classify_images_by_name(SOURCE_DIR, TARGET_ROOT_DIR) print("脚本执行完毕！") ``` **使用步骤：** 1. **准备环境**：将上面的两段代码保存到一个文件中，比如命名为 `auto_image_classifier.py`。 2. **修改路径**：用文本编辑器（如VSCode、Sublime Text甚至记事本）打开这个 `.py` 文件。找到 `SOURCE_DIR` 和 `TARGET_ROOT_DIR` 这两个变量，把等号右边的路径改成你电脑上真实的文件夹路径。 - **注意**：Windows系统路径中的反斜杠 `\` 在Python字符串中需要转义，写成 `\\`，或者更简单的方法，直接使用正斜杠 `/`，Python都能识别，例如 `'C:/Users/你的名字/Pictures/待整理'`。 3. **运行脚本**：打开命令行（终端），导航到你的脚本所在目录，然后输入命令：`python auto_image_classifier.py`，按下回车。接下来，你就能在命令行窗口中看到脚本运行的实时日志，比如“找到XXX张图片”、“将创建XXX个文件夹”、“已处理XXX张图片...”，最后显示“处理完成！”。这时，你去 `TARGET_ROOT_DIR` 指定的文件夹看看，里面应该已经按照你的规则，创建好了子文件夹，并且图片都乖乖地待在里面了。 ## 4. 应对复杂情况：高级技巧与实战优化基础的脚本能解决80%的问题，但实际工作中总会遇到一些“刺头”。别担心，我分享几个进阶玩法，让你的“图片管家”更聪明、更健壮。 ### 4.1 处理多种命名规则与异常现实中的文件名可能五花八门。有些文件名里没有下划线，用的是空格、横杠或者点号分隔。我们可以让解析逻辑更强大。 ```python def extract_folder_name(filename): """ 一个更健壮的文件名解析函数，尝试多种分隔符。 """ name_without_ext = os.path.splitext(filename)[0] # 尝试用常见分隔符分割 separators = ['_', '-', ' ', '.'] for sep in separators: if sep in name_without_ext: parts = name_without_ext.split(sep) # 返回第一个非空的部分作为文件夹名 for part in parts: if part: # 跳过空字符串 return part # 如果没有任何分隔符，返回整个文件名（不含扩展名） return name_without_ext if name_without_ext else "未命名" ``` 然后在主循环里，把原来的解析逻辑替换成调用这个函数：`folder_name = extract_folder_name(img_file)`。这样，无论文件名是 `猫-01.jpg`、`狗 02.png` 还是 `鸟.03.jpeg`，都能正确提取出“猫”、“狗”、“鸟”。 ### 4.2 按日期归档：从文件名或图片信息中提取时间整理相册时，按年/月归档是最自然的方式。如果文件名里包含日期（如 `IMG_20231027_123456.jpg`），我们可以用正则表达式精准提取。 ```python import re def extract_date_from_filename(filename): """ 尝试从文件名中提取日期（格式如20231027）。返回格式为‘2023-10’的字符串，用于创建年-月文件夹。 """ # 匹配8位连续数字（YYYYMMDD）或带分隔符的日期 pattern1 = r'(\d{4})(\d{2})(\d{2})' # 20231027 pattern2 = r'(\d{4})[-_](\d{2})[-_](\d{2})' # 2023-10-27 或 2023_10_27 match = re.search(pattern1, filename) or re.search(pattern2, filename) if match: # 提取年月 year = match.group(1) month = match.group(2) return f"{year}-{month}" # 例如 "2023-10" return "未知日期" # 未找到日期信息 ``` 在主循环中，你可以这样用：`folder_name = extract_date_from_filename(img_file)`。脚本就会创建像 `2023-10`、`2024-01` 这样的文件夹，并把对应日期的图片放进去。 ### 4.3 性能与安全考量当你要处理成千上万张图片时，效率和安全就很重要了。 - **进度反馈**：我在核心函数的复制循环里加了一句 `if copied_count % 100 == 0:`，每处理100张图片就打印一次进度。对于海量文件，这能让你知道脚本还在正常运行，而不是卡死了。 - **避免覆盖**：如果目标文件夹里已经存在同名的图片怎么办？`shutil.copy2` 会直接覆盖。为了避免意外丢失文件，可以在复制前加一个检查： ```python if os.path.exists(target_path): # 可以给重名文件添加后缀 base, ext = os.path.splitext(img_file) counter = 1 while os.path.exists(target_path): new_name = f"{base}_副本{counter}{ext}" target_path = os.path.join(target_root_dir, target_folder, new_name) counter += 1 print(f"文件重名，重命名为：{new_name}") shutil.copy2(source_path, target_path) ``` - **日志记录**：除了在屏幕打印，还可以把重要的操作（如创建了哪些文件夹、移动了哪些文件）写入一个日志文件，方便事后追溯。 ```python import logging logging.basicConfig(filename='image_classify.log', level=logging.INFO, format='%(asctime)s - %(message)s') # 在创建文件夹或复制文件成功后，添加 logging.info(f"创建文件夹：{folder_path}") logging.info(f"复制文件：{img_file} -> {target_folder}") ``` ## 5. 举一反三：不止于图片，更多应用场景这个脚本的核心思想是 **“根据文件名模式进行自动化分类”**。一旦你掌握了这个思路，它的用途就远远不止整理图片了。 - **文档管理**：你有一堆合同扫描件，命名格式是 `合同_甲方公司_2023签字版.pdf`。用这个脚本，可以自动按“甲方公司”创建文件夹，把所有同一公司的合同归到一起。 - **代码/素材库整理**：下载的UI素材包，文件名叫 `button_primary_red.png`、`icon_home_blue.svg`。脚本可以按组件类型（button, icon）或颜色（red, blue）进行自动分类。 - **数据集预处理（机器学习）**：这是非常常见的需求。比如你有一个人脸识别数据集，图片命名是 `person1_001.jpg`, `person1_002.jpg`, `person2_001.jpg`。运行脚本，就能自动为每个人（person1, person2）创建独立的文件夹，极大方便了后续的模型训练流程。 - **音乐/视频分类**：音乐文件通常内嵌了丰富的元数据（ID3标签），如歌手、专辑。你可以结合 `mutagen`（用于音频）或 `moviepy`（用于视频）这类库，先读取元数据中的信息作为分类依据，再调用我们的文件夹创建和文件移动逻辑。这样就能实现按歌手或专辑自动整理音乐库。 **关键在于**：将脚本中的“文件名解析”部分，替换成针对你特定文件类型的“信息提取器”。文件搬运和文件夹管理的逻辑是完全通用的。这就像搭积木，你只需要更换最前面的那个“识别模块”，后面的“执行模块”可以一直复用。我自己就用这个脚本的变体管理过数百个项目的源代码压缩包、整理过孩子从出生到现在的上万张生活照、甚至帮财务同事分类过电子发票。每次看到原本需要手动操作几小时的工作，被几十行代码在几分钟内搞定，那种成就感，就是编程最大的乐趣之一。希望这个工具和这些思路，也能成为你解决重复性工作的利器。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇 Cholesky分解实战：用Python手把手实现对称正定矩阵的高效分解

目录

智能图片分类：基于文件名自动创建并命名文件夹的Python实现

Python内容推荐

python实现遍历文件夹图片并重命名

python实现将文件夹内的每张图片批量分割成多张

python按顺序重命名文件并分类转移到各个文件夹中的实现代码

python爬虫自动创建文件夹的功能

CNN实现图片分类，python代码

python实现图片文件批量重命名

python 获取指定文件夹下所有文件名称并写入列表的实例

python批量复制图片到另一个文件夹

文件夹下所有图片的读取以及显示（python程序）

python 实现对文件夹中的图像连续重命名方法

使用python将图片按标签分入不同文件夹的方法

python如何获取当前文件夹下所有文件名详解

python实现本地图片转存并重命名的示例代码

python 移动图片到另外一个文件夹的实例

python实现自动网页截图并裁剪图片

python重命名文件夹中所有文件名（包括子文件夹中的文件）

python实现批量修改文件名

python实现两张图片拼接为一张图片并保存

python 批量处理给文件夹重命名后转存到另一个文件夹中

Python根据文件名批量转移图片的方法

python按顺序重命名文件并分类转移到各个文件夹中的实现代码

Python实现获取照片拍摄日期并重命名的方法

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构

Java线程池运行时状态怎么实时掌握？有哪些靠谱的监控手段？

桌面工具软件项目效益评估及市场预测分析

告别遮挡！UniApp中WebView与原生导航栏的和谐共处方案（附完整可运行代码）