用 Python 读 Excel 表格并画柱状图，有哪些关键步骤和常见坑？

读取 Excel 文件（`.xlsx`）并绘制柱状图是数据分析中的高频任务。与 CSV 不同，Excel 可能包含**多工作表、合并单元格、公式结果、日期格式、空行/列**等复杂情况，因此需更谨慎处理。下面我将为你提供 **完整、健壮、可直接运行的解决方案**，涵盖： ✅ 安装依赖 ✅ 读取 Excel（含错误处理与编码兼容） ✅ 数据清洗（去空、类型转换、中文支持） ✅ 用 `pandas + matplotlib` / `seaborn` / `pandas内置plot` 三种方式绘图 ✅ 关键陷阱提醒（如：`openpyxl` vs `xlrd`、日期自动转序数、sheet_name选择） --- ### ✅ 第一步：安装必要库（仅需执行一次） ```bash pip install pandas openpyxl matplotlib seaborn ``` > ⚠️ 注意： > - `xlrd` **已停止支持 `.xlsx`（仅支持旧版 `.xls`）**，新版必须用 `openpyxl`（pandas 默认后端）； > - `openpyxl` 是读写 `.xlsx` 的标准引擎，`pandas.read_excel(..., engine='openpyxl')` 可显式指定（通常自动识别）。 --- ### 📁 示例 Excel 文件结构（假设 `sales_data.xlsx`） | 产品 | 销量 | 月份 | 区域 | |--------|------|--------|------| | 苹果 | 42 | 2024-01| 华东 | | 香蕉 | 35 | 2024-01| 华南 | | 橙子 | 56 | 2024-02| 华北 | | ... | ... | ... | ... | > ✅ 实际使用时，请将 `"sales_data.xlsx"` 替换为你的真实文件路径（如 `"./data/quarterly_report.xlsx"`） --- ### 🐍 方法一：pandas + matplotlib（推荐 —— 灵活可控） ```python import pandas as pd import matplotlib.pyplot as plt # === 1. 读取 Excel（带容错）=== try: # ✅ 默认 engine='openpyxl'（pandas ≥ 1.2 自动启用） # 若报错 "Missing optional dependency 'openpyxl'"，请先 pip install openpyxl df = pd.read_excel("sales_data.xlsx", sheet_name=0, # 读第1个sheet（或传字符串如 'Sales'） header=0, # 第0行作为列名 skiprows=0, # 跳过前N行（如标题行在第2行则设 skiprows=1） usecols="A:C") # 只读 A~C 列（避免空列干扰），可选 print("✅ Excel 加载成功，前5行：") print(df.head()) except FileNotFoundError: print("❌ 错误：找不到文件 'sales_data.xlsx'，请检查路径！") exit() except ValueError as e: if "sheet" in str(e).lower(): print(f"❌ 工作表名错误：{e}，可用 sheet_name 查看所有表：") print(pd.ExcelFile("sales_data.xlsx").sheet_names) else: print(f"❌ 其他读取错误：{e}") exit() except Exception as e: print(f"❌ 未知错误：{e}") exit() # === 2. 基础数据清洗 === df = df.dropna(subset=['产品', '销量']) # 删除关键列为空的行 df['销量'] = pd.to_numeric(df['销量'], errors='coerce') # 强制转数字，异常变 NaN df = df.dropna(subset=['销量']) # 可选：按销量降序排列柱子（视觉更清晰） df = df.sort_values('销量', ascending=False) # === 3. 绘制柱状图（中文友好）=== plt.rcParams['font.sans-serif'] = ['SimHei', 'Arial Unicode MS', 'DejaVu Sans'] plt.rcParams['axes.unicode_minus'] = False plt.figure(figsize=(10, 6)) bars = plt.bar(df['产品'], df['销量'], color=plt.cm.plasma(df['销量']/df['销量'].max()), # 渐变色 edgecolor='darkgray', linewidth=0.8) # 添加数值标签 for bar, qty in zip(bars, df['销量']): plt.text(bar.get_x() + bar.get_width()/2, bar.get_height() + df['销量'].max()*0.005, f'{int(qty)}', ha='center', va='bottom', fontsize=10, fontweight='bold') plt.title('Excel 数据：各产品销量柱状图', fontsize=16, pad=20) plt.xlabel('产品名称', fontsize=12) plt.ylabel('销量（件）', fontsize=12) plt.xticks(rotation=0) # 若产品名长，可改为 rotation=15 或 30 plt.ylim(0, df['销量'].max() * 1.12) plt.grid(axis='y', linestyle='--', alpha=0.6) plt.tight_layout() plt.show() # plt.savefig("excel_bar_chart.png", dpi=300, bbox_inches='tight') ``` --- ### 🌈 方法二：用 pandas 内置 `.plot()`（最简！适合快速探索） ```python import pandas as pd import matplotlib.pyplot as plt df = pd.read_excel("sales_data.xlsx") # 清洗（同上） df = df.dropna(subset=['产品', '销量']) df['销量'] = pd.to_numeric(df['销量'], errors='coerce') df = df.dropna(subset=['销量']).sort_values('销量', ascending=False) # ✅ 一行绘图！pandas 封装了 matplotlib ax = df.plot(x='产品', y='销量', kind='bar', figsize=(10, 6), color='steelblue', legend=False, xlabel='产品', ylabel='销量', title='Pandas 内置绘图：产品销量') # 添加数值标签（pandas plot 不自带，需手动） for i, v in enumerate(df['销量']): ax.text(i, v + df['销量'].max()*0.005, str(int(v)), ha='center', va='bottom', fontweight='bold') plt.xticks(rotation=0) plt.tight_layout() plt.show() ``` > ✅ 优势：代码极简，自动适配 DataFrame 结构； > ❗ 局限：定制化能力弱于原生 matplotlib（如渐变色、复杂网格需额外调 `ax`）。 --- ### 🎨 方法三：用 seaborn（统计级美观，适合报告） ```python import pandas as pd import seaborn as sns import matplotlib.pyplot as plt df = pd.read_excel("sales_data.xlsx") df = df.dropna(subset=['产品', '销量']) df['销量'] = pd.to_numeric(df['销量'], errors='coerce') df = df.dropna(subset=['销量']).sort_values('销量', ascending=False) # 设置中文字体 plt.rcParams['font.sans-serif'] = ['SimHei', 'Arial Unicode MS'] plt.rcParams['axes.unicode_minus'] = False plt.figure(figsize=(10, 6)) # seaborn barplot 默认对 y 做聚合（mean），此处每行是单条记录 → 用 estimator=None 表示不聚合 ax = sns.barplot(data=df, x='产品', y='销量', palette='crest', # 现代感配色 estimator=None, # 关键！禁用聚合，直接画原始值 errorbar=None) # 关闭误差线（因无重复测量） # 添加数值标签 for i, v in enumerate(df['销量']): ax.text(i, v + df['销量'].max()*0.005, str(int(v)), ha='center', va='bottom', fontweight='bold') plt.title('Seaborn 绘制：Excel 产品销量（无聚合）', fontsize=16) plt.xlabel('产品', fontsize=12) plt.ylabel('销量', fontsize=12) plt.xticks(rotation=0) plt.tight_layout() plt.show() ``` > 💡 提示：若你的 Excel 中同一产品有多行（如每日销量），想画「每个产品的总销量」，则应先聚合： > ```python > df_agg = df.groupby('产品')['销量'].sum().reset_index().sort_values('销量', ascending=False) > ``` --- ### ⚠️ 关键陷阱与解决方案（避坑指南） | 问题 | 原因 | 解决方案 | |--------|------|-----------| | `ModuleNotFoundError: No module named 'openpyxl'` | 缺少 Excel 引擎 | `pip install openpyxl` | | 读出的日期变成 `44205.0` 这样的数字 | Excel 序数日期未解析 | 加参数 `parse_dates=['月份']` 或 `date_parser=pd.to_datetime` | | 中文列名读成 `Unnamed: 0` | Excel 有空白行/合并单元格 | 用 `skiprows=1` 或 `header=1` 调整表头位置；用 `pd.read_excel(..., skip_blank_lines=True)` | | `ValueError: Invalid file path or buffer object type` | 路径含中文或特殊字符 | 用 `os.path.abspath("文件名.xlsx")` 获取绝对路径，或改用正斜杠 `/` | | 柱子宽度太窄/重叠 | 数据点过多 | 改用 `plt.figure(figsize=(12,6))` 加宽，或用 `plt.xticks(rotation=30)` 倾斜标签 | --- ### 📥 下一步行动建议： 1. 将你的 `.xlsx` 文件放在 Python 脚本同目录； 2. 把代码中 `"sales_data.xlsx"` 替换为你的文件名； 3. 运行 —— 如果遇到报错（如 `Sheet not found`、`Invalid column name`），把**完整错误信息**发给我，我帮你逐行调试！ ---

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇 Python里怎么先读一个数字m，再读一行含m个空格分隔数字的列表？

目录

用 Python 读 Excel 表格并画柱状图，有哪些关键步骤和常见坑？

Python内容推荐

Python读取Excel表格,并同时画折线图和柱状图的方法

python 读excel文件并提取相关信息

python 中Arduino串口传输数据到电脑并保存至excel表格

Python对Excel按列值筛选并拆分表格到多个文件的代码

用python语言把excel表格首行删去

使用python批量读取word文档并整理关键信息到excel表格的实例

python实现数据写入excel表格

python读取Excel表格文件的方法

Python实现Word表格转成Excel表格的示例代码

python 将excel表格转换为图表

Python绘制堆叠柱状图的实例

python3 读取Excel表格中的数据

python处理excel表格数据

基于python实现把json数据转换成Excel表格

Python将多个excel表格合并为一个表格

python操作excel表格 格式设置

Python3读取和写入excel表格数据的示例代码

Python读取Excel数据并生成图表过程解析

Python读取Json字典写入Excel表格的方法

python实现PDF中表格转化为Excel的方法

Python解惑之True和False详解

Python中的True,False条件判断实例分析

浅谈Python里面None True False之间的区别

Python返回真假值（True or False）小技巧

python 输入年份 如果是闰年输出True 否则输出False 示例

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构

python操作excel表格格式设置

python 输入年份如果是闰年输出True 否则输出False 示例