Python读取xlsx文件的两列数据，怎么快速转成嵌套列表？

<think>我们有一个明确的需求：将Excel（xlsx格式）文件中的两列数据转换为一个列表（list）形式存储起来。根据引用中提供的方法，我们可以使用多种库来实现，比如`openpyxl`、`pandas`、`xlrd`等。下面我将分别介绍几种方法：方法一：使用openpyxl（适用于处理xlsx文件）步骤： 1. 导入openpyxl 2. 加载工作簿 3. 选择工作表 4. 遍历需要的两列，将每行的两列数据作为一个元组（或列表）存入一个大的列表中方法二：使用pandas（简单高效，适合数据量较大的情况） 1. 导入pandas 2. 使用read_excel读取文件 3. 选择需要的两列 4. 转换为列表（每行作为一个元组或列表）方法三：使用xlrd（注意：xlrd新版本不支持xlsx，所以可能需要安装旧版本或使用xlrd2）由于引用[5]中使用了xlrd2，我们可以参考。考虑到用户要求的是xlsx格式，我们优先推荐使用openpyxl和pandas。下面分别给出示例代码： ### 方法一：使用openpyxl 假设我们要读取Sheet1中的A列和B列，将它们组成一个列表，列表中每个元素是[A列的值, B列的值]（或者元组）。 ```python import openpyxl # 加载工作簿 wb = openpyxl.load_workbook('your_file.xlsx') # 选择工作表，假设名为'Sheet1' sheet = wb['Sheet1'] # 初始化一个空列表 data_list = [] # 假设我们要读取A列和B列，从第1行开始（注意：openpyxl的行列索引从1开始） # 我们可以遍历每一行，直到遇到空行 for row in range(1, sheet.max_row+1): # 获取A列和B列的值 col1_value = sheet.cell(row=row, column=1).value col2_value = sheet.cell(row=row, column=2).value # 如果两列都有值，或者根据需求调整 # 这里我们不管是否为空，都加入列表，用户可以根据需要过滤 data_list.append([col1_value, col2_value]) # 打印结果 print(data_list) ``` 注意：openpyxl不会自动关闭工作簿，因为我们在内存中操作，不需要显式关闭。但如果要写入文件，则需要保存和关闭。 ### 方法二：使用pandas ```python import pandas as pd # 读取Excel文件 df = pd.read_excel('your_file.xlsx', sheet_name='Sheet1') # 假设两列的列名分别为'Col1'和'Col2'，如果没有列名，可以使用列索引，如第0列和第1列 # 方法1：使用列名 # data_list = df[['Col1', 'Col2']].values.tolist() # 方法2：使用列索引（iloc按位置索引） # 这里我们选择前两列（0和1） data_list = df.iloc[:, [0,1]].values.tolist() # 打印结果 print(data_list) ``` 如果文件没有列名，可以在read_excel时设置header=None，然后通过列索引选取。 ### 方法三：使用xlrd（注意：xlrd新版本不支持xlsx，所以我们使用xlrd2或者旧版本xlrd==1.2.0）但为了兼容xlsx，我们可以使用`openpyxl`或`pandas`，所以这里不推荐xlrd。根据用户需求，我们推荐使用pandas，因为它简洁高效。但如果用户没有安装pandas，可以使用openpyxl。 ### 注意事项 1. 文件路径：请确保文件路径正确，可以使用绝对路径或相对路径。 2. 空值处理：在读取时，空单元格会被读取为None（在openpyxl中）或NaN（在pandas中），用户可以根据需要进行处理。 ### 相关问题根据用户的问题，生成以下相关问题： §§相关问题§§ 1. 如何将Excel中多列数据转换为嵌套列表？ 2. 使用pandas读取Excel文件时如何跳过前几行？ 3. 如何将Excel文件中的特定列数据存储为字典？ 4. 使用openpyxl如何写入数据到Excel文件？ </think> ### Python将Excel两列数据转换为列表的方法根据您的需求，我将介绍三种常用方法将Excel(xlsx)文件中的两列数据转换为列表存储，每种方法都基于不同的库实现。 --- ### 方法1：使用Pandas（推荐） ```python import pandas as pd # 读取Excel文件 df = pd.read_excel('your_file.xlsx', sheet_name='Sheet1') # 选择需要转换的两列（假设列名为'ColA'和'ColB'） selected_columns = df[['ColA', 'ColB']] # 转换为嵌套列表：[[colA_val1, colB_val1], [colA_val2, colB_val2], ...] result_list = selected_columns.values.tolist() print(result_list) # 输出结果列表 ``` **优点**： - 简洁高效（仅需3行代码） - 自动处理空值和数据类型 - 适合大型数据集处理[^3] --- ### 方法2：使用openpyxl ```python from openpyxl import load_workbook # 加载工作簿 wb = load_workbook('your_file.xlsx') ws = wb.active # 获取活动工作表 result_list = [] # 遍历行（从第2行开始，假设第1行是标题） for row in ws.iter_rows(min_row=2, values_only=True): # 提取前两列数据（索引0和1） if row[0] is not None and row[1] is not None: # 跳过空行 result_list.append([row[0], row[1]]) print(result_list) # 输出结果列表 ``` **适用场景**： - 需要精细控制读取过程 - 处理特殊格式的Excel文件 - 内存敏感环境（可逐行处理）[^1][^4] --- ### 方法3：使用xlrd（兼容旧版Excel） ```python import xlrd # 打开工作簿 workbook = xlrd.open_workbook('your_file.xlsx') sheet = workbook.sheet_by_index(0) # 第一个工作表 result_list = [] # 遍历行（从第1行开始，跳过标题） for row_idx in range(1, sheet.nrows): colA = sheet.cell_value(row_idx, 0) # 第一列 colB = sheet.cell_value(row_idx, 1) # 第二列 result_list.append([colA, colB]) print(result_list) # 输出结果列表 ``` **注意**： - 需要安装`xlrd`库（`pip install xlrd`） - 更适合`.xls`格式文件[^5] --- ### 三种方法对比表 | 特性 | Pandas | openpyxl | xlrd | |------|--------|----------|------| | 代码简洁度 | ★★★★★ | ★★★☆☆ | ★★★☆☆ | | 大文件处理 | 优 | 良 | 中 | | 数据类型支持 | 全面 | 全面 | 基本 | | 特殊格式处理 | 自动 | 手动控制 | 手动控制 | | 推荐指数 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ | > **最佳实践建议**： > 1. 优先使用Pandas方法，效率最高且代码简洁 > 2. 若需处理特殊格式（如合并单元格），使用openpyxl > 3. 对于旧版Excel(.xls)文件，使用xlrd[^2] --- ### 常见问题解决方案 1. **列名不确定时**：使用列索引代替列名 ```python # Pandas中使用列索引 result_list = df.iloc[:, [0, 1]].values.tolist() # 第0列和第1列 ``` 2. **跳过空行处理**： ```python # 在openpyxl中添加过滤 if row[0] or row[1]: # 任一列有值 result_list.append([row[0], row[1]]) ``` 3. **指定工作表**： ```python # Pandas中指定sheet df = pd.read_excel('file.xlsx', sheet_name='DataSheet') ``` --- ### 相关问题 1. 如何将转换后的列表数据保存为新的Excel文件？ 2. Pandas读取Excel时如何跳过前几行标题？ 3. 如何处理Excel中的日期格式转换问题？ 4. 当Excel文件非常大时，如何优化内存使用？ 5. 如何将多列数据组合成字典列表？

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇 Python中怎么设计一个虚函数，确保基类和子类的实现都只能在子线程里运行？

目录

Python读取xlsx文件的两列数据，怎么快速转成嵌套列表？

Python内容推荐

Python读取xlsx文件的实现方法

python 读取文件夹下的子文件 xlsx，csv

python3读取csv和xlsx文件的实例

python写入数据到csv或xlsx文件的3种方法

python使用xlrd模块读取xlsx文件中的ip方法

Python操作Excel之xlsx文件

python解密带密码的xlsx文件，重新写出

Python批量将文件夹中xls文件批量转换为xlsx

python脚本实现xls(xlsx)转成csv

python读取xlsx的方法

python3 读取Excel表格中的数据

python使用pandas读xlsx文件

Python使用pandas和xlsxwriter读写xlsx文件的方法示例

python3读取excel文件只提取某些行某些列的值方法

解决python xlrd无法读取excel文件的问题

用Python将结果保存为xlsx的方法

python读取excel指定列数据并写入到新的excel方法

使用python，将xlsx内容转成json

Python读取xlsx数据生成图标代码实例

python实现xlsx文件分析详解

显示和隐藏进程的主窗口

#资源达人分享计划# clsWindow2.2_20210331控制PC版QQ发送消息.zip

根据进程ID获取进程的用户名

查看窗口和控件句柄、类名、标题、风格

Python获取系统所有进程PID及进程名称的方法示例

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构