怎么用Python自动从一堆Excel里抓取固定位置的数据，再合并到一个新表格里？

### 批量提取多个Excel文件指定单元格内容并汇总要完成从多个 Excel 文件中提取特定单元格的内容并将这些内容汇总到一个新的 Excel 文件的任务，可以采用 Python 的 `pandas` 库配合循环结构实现。以下是具体方法： #### 方法概述通过遍历目标目录及其子目录中的所有 `.xlsx` 文件，逐一加载每个文件的所有 sheet 并从中提取所需的单元格内容。最终将所有提取的结果存储在一个 DataFrame 中，并将其导出为新的 Excel 文件。 #### 实现代码以下是一个完整的解决方案示例代码[^2]： ```python import os import pandas as pd def extract_specific_cells(directory, cell_positions): """ 提取指定目录下所有Excel文件的指定单元格内容参数: directory (str): 存放Excel文件的目标目录路径 cell_positions (list of tuple): 要提取的单元格位置列表，例如 [(0, 1), (2, 3)] 返回: pd.DataFrame: 包含所有提取结果的DataFrame """ result = [] for root, dirs, files in os.walk(directory): for file in files: if file.endswith('.xlsx'): file_path = os.path.join(root, file) try: excel_file = pd.ExcelFile(file_path) # 加载整个Excel文件 sheets = excel_file.sheet_names # 获取所有sheet名称 for sheet in sheets: df_sheet = pd.read_excel(excel_file, sheet_name=sheet) # 逐个读取sheet row_data = {'file': file, 'sheet': sheet} # 记录当前文件名和sheet名 for i, j in cell_positions: value = None try: value = df_sheet.iloc[i, j] # 提取指定单元格内容 except IndexError: pass # 如果索引超出范围，则跳过该单元格 column_key = f'cell_{i}_{j}' row_data[column_key] = value result.append(row_data) # 将本条记录加入结果集 except Exception as e: print(f"无法处理文件 {file}: {e}") return pd.DataFrame(result) # 定义参数 directory = r'C:\path\to\your\files' # 替换为目标目录的实际路径 cell_positions = [(0, 0), (1, 2)] # 替换为你想要提取的具体单元格坐标 # 运行函数 extracted_df = extract_specific_cells(directory, cell_positions) # 导出结果到新Excel文件 output_file = 'summary_output.xlsx' extracted_df.to_excel(output_file, index=False) ``` 上述代码实现了如下功能： - 使用 `os.walk()` 遍历指定目录及其子目录中的所有 `.xlsx` 文件。 - 对于每一个找到的 Excel 文件，使用 `pd.ExcelFile()` 和 `read_excel()` 函数依次加载其所有的 sheet。 - 根据传入的单元格位置列表 `cell_positions` 提取对应单元格的内容。 - 将每一条提取的信息存入字典形式的对象中，并追加到结果列表里。 - 最终将结果列表转化为 Pandas 数据框并通过 `to_excel()` 输出到新的 Excel 文件中。 #### 注意事项 - **异常处理**：在实际应用过程中可能会遇到一些损坏或者格式不兼容的 Excel 文件，因此建议增加更多的错误捕获逻辑以增强程序健壮性。 - **性能优化**：如果涉及非常庞大的数据集，可能需要考虑分批处理或其他更高效的策略来减少内存占用。 --- ###

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇 Python里用group_A.items()配合format打印字典时，{:6s}和{:2d}这些格式码有什么讲究？

目录

怎么用Python自动从一堆Excel里抓取固定位置的数据，再合并到一个新表格里？

Python内容推荐

Python将多个excel表格合并为一个表格

Python合并多个Excel数据的方法

Python将多个excel文件合并为一个文件

用python合并多个excel的数据到一个表格里,Python源码.zip

利用python对Excel中的特定数据提取并写入新表的方法

python 自动化合并excel表格代码

使用 Python 合并多个格式一致的 Excel 文件(推荐)

使用python将多个excel文件合并到同一个文件的方法

Python网页数据抓取以及表格的制作

python处理excel表格数据

python合并多个excel表格

python 实现读取一个excel多个sheet表并合并的方法

Python pandas实现excel工作表合并功能详解

Python将多份excel表格整理成一份表格

Python实现合并excel表格的方法分析

Python自动化办公+实现合并多个excel中同名的sheet

python制作爬虫并将抓取结果保存到excel中

python实现数据写入excel表格

Python实现抓取网页生成Excel文件的方法示例

python excel表格合并源代码（有界面程序（pyqt5)

本数据集包含了9位患者的心血管健康相关数据，旨在支持心脏疾病的预测与分析 每条记录涵盖14个关键属性，从基本的人口统计学信息（如年龄、性别、身高、体重、BMI）到临床指标（如静息血压、胆固醇水平、空腹

chrome-headless-shell-mac-arm64-150.0.7858.0(Canary).zip

混凝土结构中的表面裂纹检测.zip

【Python编程】Python内存管理与垃圾回收机制

GSL雅思高频单词表，2284词

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构

本数据集包含了9位患者的心血管健康相关数据，旨在支持心脏疾病的预测与分析每条记录涵盖14个关键属性，从基本的人口统计学信息（如年龄、性别、身高、体重、BMI）到临床指标（如静息血压、胆固醇水平、空腹