Python里怎么高效地遍历整个文件夹树，包括所有子目录和文件？

Python遍历文件夹文件的核心方法包括`os.listdir()`结合递归、`os.walk()`以及函数式编程实现。`os.walk()`是最常用且高效的方法，能直接处理多层级目录遍历 [ref_2][ref_3][ref_4]。 ### 一、核心方法对比下表总结了三种主流方法的特点和适用场景： | 方法 | 核心函数/模块 | 是否自动递归 | 输出形式 | 优点 | 缺点/注意事项 | | :--- | :--- | :--- | :--- | :--- | :--- | | **列表递归法** | `os.listdir()`, `os.path.join()` | 否，需手动实现递归 | 文件路径列表 | 逻辑清晰，可控性强，可自定义过滤逻辑 | 代码相对复杂，需处理递归深度和权限问题 [ref_1][ref_4] | | **生成器遍历法 (推荐)** | `os.walk()` | 是，自动递归所有子目录 | 生成器，每次返回`(root, dirs, files)`三元组 | 简洁高效，Python标准库原生支持，内存友好 | 对遍历过程的直接控制较弱 | | **函数式编程法** | `os.listdir()`, `filter()`, 列表推导式 | 否，通常用于单层或需结合递归 | 过滤后的文件路径列表 | 代码优雅，符合函数式风格 | 性能可能不如`os.walk()`，递归需额外处理 [ref_4] | ### 二、详细代码实现与示例 #### 1. 使用 `os.listdir()` 结合递归此方法通过`os.listdir()`获取目录项列表，然后利用`os.path.isdir()`和`os.path.isfile()`进行判断，递归进入子文件夹 [ref_1][ref_3][ref_6]。 ```python import os def traverse_folder_recursive(folder_path): """递归遍历文件夹，打印所有文件的完整路径""" for item in os.listdir(folder_path): item_path = os.path.join(folder_path, item) # 拼接完整路径 if os.path.isdir(item_path): # 如果是子文件夹，则递归调用自身 traverse_folder_recursive(item_path) elif os.path.isfile(item_path): # 如果是文件，则打印其路径 print(f"文件: {item_path}") # 注意：此处忽略了符号链接等其他类型 # 使用示例 if __name__ == "__main__": target_folder = "./my_project" # 替换为你的目标文件夹路径 traverse_folder_recursive(target_folder) ``` **应用场景与扩展**： * **筛选特定文件**：在打印文件路径前，可增加扩展名判断。例如，只处理`.txt`文件： ```python if item_path.endswith('.txt') and os.path.isfile(item_path): print(f"文本文件: {item_path}") ``` * **处理权限问题**：实际运行时可能因权限不足无法访问某些文件夹，需使用`try-except`处理 [ref_6]。 ```python try: for item in os.listdir(folder_path): # ... 原有逻辑 except PermissionError: print(f"权限不足，跳过文件夹: {folder_path}") ``` #### 2. 使用 `os.walk()` (推荐) `os.walk()`是最高效和简洁的方法。它返回一个生成器，每次迭代生成一个三元组`(root, dirs, files)`，分别代表当前目录路径、子目录名列表和文件名列表 [ref_2][ref_3][ref_4]。 ```python import os def traverse_with_oswalk(root_folder): """使用os.walk遍历文件夹""" for root, dirs, files in os.walk(root_folder): # root: 当前正在遍历的文件夹路径 # dirs: root文件夹下的子文件夹名称列表 # files: root文件夹下的文件名称列表 for file_name in files: file_path = os.path.join(root, file_name) # 拼接文件的完整路径 print(f"文件: {file_path}") # 如果需要，也可以处理子文件夹路径 # for dir_name in dirs: # dir_path = os.path.join(root, dir_name) # print(f"文件夹: {dir_path}") # 使用示例 if __name__ == "__main__": target_folder = "./my_project" traverse_with_oswalk(target_folder) ``` **应用场景与扩展**： * **忽略特定目录**：可以在遍历中修改`dirs`列表来实现。例如，忽略名为`__pycache__`或`.git`的文件夹，以提升遍历效率。 ```python for root, dirs, files in os.walk(root_folder): # 原地修改dirs列表，使walk后续不再进入这些文件夹 dirs[:] = [d for d in dirs if d not in ['__pycache__', '.git']] for file_name in files: file_path = os.path.join(root, file_name) print(file_path) ``` * **结合文件处理**：在获取文件路径后，可进行读取、移动、分析等操作。例如，读取每个文本文件的前五行 [ref_1]： ```python for root, dirs, files in os.walk(root_folder): for file_name in files: if file_name.endswith('.txt'): file_path = os.path.join(root, file_name) try: with open(file_path, 'r', encoding='utf-8') as f: head_lines = [f.readline().strip() for _ in range(5)] print(f"{file_path} 前五行: {head_lines}") except Exception as e: print(f"读取文件 {file_path} 时出错: {e}") ``` #### 3. 函数式编程风格（单层过滤）此方法适合对单层目录进行快速过滤和操作，代码紧凑 [ref_4]。 ```python import os def filter_files_in_folder(folder_path, extension=None): """过滤指定文件夹下的文件（非递归）""" all_items = os.listdir(folder_path) # 使用列表推导式过滤出文件 files = [item for item in all_items if os.path.isfile(os.path.join(folder_path, item))] if extension: # 进一步按扩展名过滤 files = [f for f in files if f.endswith(extension)] return files # 使用示例 if __name__ == "__main__": folder = "./documents" txt_files = filter_files_in_folder(folder, '.txt') print(f"文本文件列表: {txt_files}") all_files = filter_files_in_folder(folder) print(f"所有文件列表: {all_files}") ``` ### 三、综合应用案例：将文件名写入Excel 结合`os.walk()`遍历和`openpyxl`库操作Excel，实现一个实用脚本，遍历所有文件并将路径写入Excel表格 [ref_5]。 ```python import os from openpyxl import Workbook def export_filenames_to_excel(root_folder, output_excel="file_list.xlsx"): """ 遍历文件夹及所有子文件夹，将文件名和路径写入Excel """ wb = Workbook() ws = wb.active ws.title = "文件列表" # 写入表头 ws.append(["序号", "文件路径", "文件名称", "所在文件夹"]) row_index = 1 for root, dirs, files in os.walk(root_folder): for file_name in files: file_path = os.path.join(root, file_name) # 写入数据行：序号、完整路径、文件名、父目录 ws.append([row_index, file_path, file_name, root]) row_index += 1 # 保存Excel文件 wb.save(output_excel) print(f"文件列表已导出至: {output_excel}") # 使用示例 if __name__ == "__main__": export_filenames_to_excel("./target_directory") ``` **关键点总结**： 1. **方法选择**：对于简单的单层操作，`os.listdir()`配合过滤即可；对于需要遍历整个目录树的复杂任务，**`os.walk()`是首选**，因其代码简洁且性能良好 [ref_3][ref_4]。 2. **路径处理**：务必使用`os.path.join()`来拼接路径，以保证代码在不同操作系统（Windows/Linux/macOS）上的可移植性 [ref_1]。 3. **异常处理**：实际部署时，应使用`try-except`块捕获`PermissionError`、`FileNotFoundError`等可能异常，增强脚本健壮性 [ref_6]。 4. **性能考量**：`os.walk()`基于生成器，在遍历海量文件时内存占用更优。若需深度定制遍历逻辑（如按特定顺序、提前终止），则可基于递归方法自行实现。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇 Java里的Base64和AES加解密，怎么用Python实现？

目录

Python里怎么高效地遍历整个文件夹树，包括所有子目录和文件？

Python内容推荐

Python遍历文件名和文件夹

python os.walk 遍历所有文件 文件夹（csdn）————程序.pdf

arcpy （arcgis python） 遍历某文件下所有要素类矢量shp

python遍历文件夹下所有excel文件

Python实现遍历文件夹中所有Excel文件

Python 遍历子文件和所有子文件夹的代码实例

对python遍历文件夹中的所有jpg文件的实例详解

Python实现合并同一个文件夹下所有txt文件的方法示例

遍历指定文件夹中的所有子目录和文件

遍历文件夹自动生成目录树

线程遍历网站文件夹及子文件夹下所有图片并生成图片URL

网站文件夹目录遍历

遍历文件夹并建成目录树

多级文件夹遍历,准确遍历多级文件夹下的内容

自动遍历文件夹生成成目录树.rar

遍历指定文件夹下所有文件

遍历文件夹并生成树，很不错的例子

扫描硬盘.遍历文件夹并建成目录树

遍历文件文件夹并导出到XML

如何遍历文件夹查找文件

python遍历文件夹下所有excel文件

python使用openCV遍历文件夹里所有视频文件并保存成图片

python实现遍历文件夹图片并重命名

Python实现合并同一个文件夹下所有txt文件的方法示例

python批量修改文件夹及其子文件夹下的文件内容

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构

python os.walk 遍历所有文件文件夹（csdn）————程序.pdf

arcpy （arcgis python）遍历某文件下所有要素类矢量shp