用Pandas处理D盘Excel文件时，怎么完成读取、分组统计、时间格式转换、薪资分段和行索引提取等10项操作？

以下是基于 Pandas 库操作 Excel 文件的具体实现方案。假设我们有一个存储在 D 盘的名为 `data.xlsx` 的 Excel 文件，里面有一张工作表包含了以下字段：`id`, `name`, `education`, `salary`, 和 `createTime`。 ### 步骤解析 #### (1) **读取本地Excel数据** 首先需要导入 pandas 库，并指定路径加载该 excel 表格的数据到 DataFrame 中。 ```python import pandas as pd df = pd.read_excel(r'D:\data.xlsx') ``` #### (2) **查看DataFrame前5行** 显示 dataframe 最前面的部分记录以便初步了解数据结构。 ```python print(df.head()) ``` #### (3) **将 salary 列数据转换为最大值与最小值的平均值** 找到工资的最大和最小值求得均数后再赋给整个列。 ```python avg_salary = df['salary'].max() + df['salary'].min() df['salary'] = avg_salary / 2 ``` #### (4) **根据学历分组并计算平均薪资** 利用 groupby 函数按 education 分层再算各层次下薪水期望值得多少。 ```python grouped_df = df.groupby('education')['salary'].mean() print(grouped_df) ``` #### (5) **将 createTime 列时间转换为月-日格式** 借助 datetime 模块重新设定日期格式展示形式。 ```python df['createTime'] = pd.to_datetime(df['createTime']).dt.strftime('%m-%d') ``` #### (6) **查看索引、数据类型和内存信息** 获取关于当前表格基本信息如使用的空间大小等细节。 ```python print(df.info(memory_usage='deep')) ``` #### (7) **查看数值型列的汇总统计** 得到对于数字类型的变量描述性的统计数据报告包括计数、极差等等指标。 ```python summary_stats = df.describe(include=[np.number]) print(summary_stats) ``` #### (8) **新增一列，根据 salary 将数据分为三组** 依据特定规则创建新分类标签附加至原始资料集中成为额外维度特征之一。 ```python def categorize_salary(salary): if salary < threshold_low: return 'Low' elif threshold_low <= salary < threshold_high: return 'Medium' else: return 'High' threshold_low = ... # 自定义阈值 threshold_high = ... df['category'] = df['salary'].apply(categorize_salary) ``` #### (9) **按照 salary 列对数据进行降序排列** 通过 sort_values 方法调整排序次序使得高薪者排于前列位置上。 ```python sorted_df = df.sort_values(by='salary', ascending=False) print(sorted_df[['id','salary']]) ``` #### (10) **取出第33行数据** 选取某一行的所有元素呈现出来供参考查阅之需。（注意这里是基于零开始编号） ```python row_33_data = df.iloc[32] print(row_33_data) ``` 以上就是在 Jupyter Notebook 内部运行过程中每个环节对应代码片段示意说明；为了更直观清楚地表达每步效果变化情况，在实际练习时还可以配合生成相关图表或者做适当注解辅助理解流程走向哦！ ---

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇怎么用Python自动把Excel名单、对应头像和奖励信息批量生成PPT证书？

目录

用Pandas处理D盘Excel文件时，怎么完成读取、分组统计、时间格式转换、薪资分段和行索引提取等10项操作？

Python内容推荐

python利用pandas将excel文件转换为txt文件的方法

python将excel文件转换为txt文件

python实现读取excel文件中所有sheet操作示例

Python使用Pandas对csv文件进行数据处理的方法

Python读取Excel一列并计算所有对象出现次数的方法

Python操作Excel插入删除行的方法

解决python xlrd无法读取excel文件的问题

利用python3筛选excel中特定的行（行值满足某个条件/行值属于某个集合）

Python实现读取txt文件并转换为excel的方法示例

python pandas实现excel转为html格式的方法

python日记Day17——Pandas之Excel处理

python合并多个excel文件的示例

Python一键提取PDF中的表格到Excel

Python Pandas 对列/行进行选择，增加，删除操作

非常好用的python自动转换excel中日期格式，统一excel里日期格式，方便财务统计

Python操作Excel之xlsx文件

使用python批量读取word文档并整理关键信息到excel表格的实例

Python3.5 Pandas模块之DataFrame用法实例分析

python将字符串list写入excel和txt的实例

使用pandas读取文件的实现

闲鱼自动发货系统[可运行源码]

智能闲鱼客服机器人系统：专为闲鱼平台打造的AI值守解决方案，实现闲鱼平台7×24小时自动化值守，支持多专家协同决策、智能议价和上.zip

校园二手平台开发与市场分析.zip

闲鱼自动回复系统：闲鱼智能客服与商品自动发货工具

闲鱼自动发货系统部署教程[项目源码]

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构