这段Python代码是怎么一步步从Excel数据中提炼出个性化干预规律并绘图的？

以下是对给定 Python 代码每行作用的详细解释： ```python import pandas as pd import matplotlib.pyplot as plt ``` - 导入 `pandas` 库并将其重命名为 `pd`，用于数据处理和分析，提供 `DataFrame` 等数据结构，便于操作表格数据。导入 `matplotlib.pyplot` 库并将其重命名为 `plt`，用于数据可视化，提供类似于 MATLAB 的绘图接口 [^1]。 ```python infile = '第三问_个体最优方案.xlsx' patient_file = '第三问_患者清单.xlsx' outfile = '第三问_匹配规律.xlsx' plot_file = '第三问_匹配规律图.png' ``` - 定义输入文件、患者文件、输出文件和绘图文件的文件名。 ```python plt.rcParams['font.sans-serif'] = ['SimHei', 'Microsoft YaHei', 'Arial Unicode MS', 'DejaVu Sans'] plt.rcParams['axes.unicode_minus'] = False plt.rcParams['figure.facecolor'] = 'white' plt.rcParams['axes.facecolor'] = 'white' ``` - 设置 `matplotlib` 的绘图参数，包括字体、负号显示、图形背景颜色和坐标轴背景颜色。 ```python GRID_COLOR = '#D9E2EC' TEXT_COLOR = '#2D3142' ``` - 定义网格颜色和文本颜色。 ```python summary = pd.read_excel(infile, sheet_name='患者最优方案汇总') pat = pd.read_excel(patient_file, sheet_name='痰湿体质患者清单') ``` - 使用 `pandas` 的 `read_excel` 函数读取输入文件和患者文件中指定工作表的数据 [^2]。 ```python df = pat.merge(summary, on='样本ID', how='inner') ``` - 使用 `merge` 方法将 `pat` 和 `summary` 两个 `DataFrame` 按照 `样本ID` 进行内连接，得到合并后的 `DataFrame`。 ```python group_cols = ['痰湿分层', '活动能力分层', '年龄层'] rows = [] ``` - 定义分组的列名，初始化一个空列表 `rows` 用于存储分组后的结果。 ```python for keys, grp in df.groupby(group_cols, dropna=False): if len(grp) < 3: continue ``` - 使用 `groupby` 方法对 `df` 按照 `group_cols` 进行分组，遍历每个分组。如果分组的样本数少于 3，则跳过该分组。 ```python intensity_mode = grp['推荐强度主模式'].mode().iloc[0] freq_med = int(grp['推荐频次中位数'].median()) cost_med = round(grp['总成本'].median(), 2) score_drop = round((grp['初始痰湿积分'] - grp['6个月后痰湿积分']).median(), 2) ``` - 计算分组内 `推荐强度主模式` 的众数、`推荐频次中位数` 的中位数、`总成本` 的中位数以及 `初始痰湿积分` 与 `6个月后痰湿积分` 差值的中位数。 ```python rows.append(list(keys) + [len(grp), intensity_mode, freq_med, cost_med, score_drop]) ``` - 将分组的键、样本数、推荐主强度、推荐频次中位数、总成本中位数和痰湿积分下降中位数添加到 `rows` 列表中。 ```python rule_df = pd.DataFrame(rows, columns=[ '痰湿分层','活动能力分层','年龄层','样本数', '推荐主强度','推荐频次中位数','总成本中位数','痰湿积分下降中位数' ]) ``` - 将 `rows` 列表转换为 `DataFrame` 对象，并指定列名。 ```python text_rows = [] ``` - 初始化一个空列表 `text_rows` 用于存储文字规律描述。 ```python for _, r in rule_df.iterrows(): text_rows.append({ '规律描述': f"{r['痰湿分层']} + {r['活动能力分层']} + {r['年龄层']} → 推荐以 {int(r['推荐主强度'])} 级强度、每周 {int(r['推荐频次中位数'])} 次为主，总成本约 {r['总成本中位数']} 元，痰湿积分中位下降 {r['痰湿积分下降中位数']} 分。" }) ``` - 遍历 `rule_df` 的每一行，生成文字规律描述并添加到 `text_rows` 列表中。 ```python text_df = pd.DataFrame(text_rows) ``` - 将 `text_rows` 列表转换为 `DataFrame` 对象。 ```python with pd.ExcelWriter(outfile) as w: rule_df.to_excel(w, sheet_name='匹配规律表', index=False) text_df.to_excel(w, sheet_name='文字规律', index=False) ``` - 使用 `pandas` 的 `ExcelWriter` 将 `rule_df` 和 `text_df` 分别写入输出文件的不同工作表中，不保存索引 [^2]。 ```python if not rule_df.empty: plot_df = rule_df.copy() plot_df['组合标签'] = plot_df['痰湿分层'].astype(str) + ' | ' + plot_df['活动能力分层'].astype(str) + ' | ' + plot_df['年龄层'].astype(str) plot_df = plot_df.sort_values(['痰湿积分下降中位数', '样本数'], ascending=[True, False]) ``` - 如果 `rule_df` 不为空，复制 `rule_df` 并创建一个新的列 `组合标签`，将 `痰湿分层`、`活动能力分层` 和 `年龄层` 组合成一个字符串。然后按照 `痰湿积分下降中位数` 和 `样本数` 进行排序。 ```python colors = plt.cm.GnBu([0.35 + 0.5 * i / max(1, len(plot_df)-1) for i in range(len(plot_df))]) ``` - 使用 `plt.cm.GnBu` 颜色映射生成一组颜色。 ```python fig, ax = plt.subplots(figsize=(12, max(5, 0.65 * len(plot_df) + 1.5))) ``` - 创建一个新的图形和坐标轴对象，设置图形的大小。 ```python bars = ax.barh(plot_df['组合标签'], plot_df['痰湿积分下降中位数'], color=colors, edgecolor='white', linewidth=1.0) ``` - 使用 `barh` 函数绘制水平条形图，以 `组合标签` 为 y 轴，`痰湿积分下降中位数` 为 x 轴。 ```python ax.set_xlabel('痰湿积分下降中位数') ax.set_ylabel('人群组合') ax.set_title('第三问：不同人群的最优方案匹配规律', fontsize=13, fontweight='bold') ``` - 设置坐标轴标签和图形标题。 ```python for rect, _, intensity, freq, cost in zip(bars, plot_df['样本数'], plot_df['推荐主强度'], plot_df['推荐频次中位数'], plot_df['总成本中位数']): ax.text(rect.get_width(), rect.get_y() + rect.get_height()/2, f' 强度{int(intensity)}级 / 每周{int(freq)}次 / 成本{cost}', va='center', fontsize=9, color=TEXT_COLOR) ``` - 在每个条形图上添加文本注释，显示推荐强度、推荐频次和成本。 ```python ax.grid(axis='x', linestyle='--', alpha=0.35, color=GRID_COLOR) ``` - 设置 x 轴的网格线。 ```python fig.tight_layout() fig.savefig(plot_file, dpi=300, bbox_inches='tight') plt.close(fig) ``` - 调整图形布局，保存图形为图片文件，关闭图形对象。 ```python print(f'完成：{outfile}，并生成 {plot_file}') ``` - 打印完成信息。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇这段Python代码是如何为痰湿体质患者设计个性化6个月干预方案的？

目录

这段Python代码是怎么一步步从Excel数据中提炼出个性化干预规律并绘图的？

Python内容推荐

Python读取Excel数据并生成图表过程解析

python读取excel指定列数据并写入到新的excel方法

利用python对Excel中的特定数据提取并写入新表的方法

python读取txt中有规律的数据，并插入excel表格中

Python疫情数据下载，并保存成Excel

python实时读取串口数据并自动保存至excel

Python对Excel按列值筛选并拆分表格到多个文件的代码

用Python将数据写入已存在Excel

Python实现读取txt文件并转换为excel的方法示例

python读取并定位excel数据坐标系详解

Python导入数值型Excel数据并生成矩阵操作

Python向excel中写入数据的方法

python 中Arduino串口传输数据到电脑并保存至excel表格

Python爬取数据并实现可视化代码解析

python list格式数据excel导出方法

python实现数据导出到excel的示例--普通格式

python实现excel读写数据

Python读取Excel表格,并同时画折线图和柱状图的方法

python技能之数据导出excel的实例代码

Python使用Excel将数据写入多个sheet

PyPI 官网下载 | mlpack3-3.4.2-cp36-cp36m-manylinux1_x86_64.whl

实现基于C++或者python基本库，初学学习之用.zip

机器学习的一些基础算法，主要使用Python、Cpp、Matlab编写。.zip

jenkins-conf:Jenkins的配置文件

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构

Java线程池运行时状态怎么实时掌握？有哪些靠谱的监控手段？