用Pandas做基础数据清洗，删重、补缺、替换值该怎么写？

以下是基于Pandas库的一个简单的数据清洗代码示例，展示了如何删除重复行、填充缺失值以及替换特定值： ```python import pandas as pd # 创建一个样例数据集 data = { '姓名': ['小明', '小红', '小刚', None, '小丽', '小明'], '数学': [95, 88, None, 70, 85, 95], '英语': [None, 82, 76, 90, 95, 82] } df = pd.DataFrame(data) # 打印原始数据框 print("原始数据:") print(df) # 删除重复行 df = df.drop_duplicates() # 填充缺失值为默认值（例如：数学成绩填0，英语成绩填平均分） df['数学'] = df['数学'].fillna(0) average_english_score = df['英语'].mean() df['英语'] = df['英语'].fillna(average_english_score) # 替换特定值（例如：将名字中的None替换成'未知'） df['姓名'] = df['姓名'].fillna('未知') # 打印清理后的数据框 print("\n清理后的数据:") print(df) ``` 此代码实现了以下几个常见的数据清洗操作[^1][^2]: - 使用 `drop_duplicates()` 方法去除重复记录。 - 利用 `fillna()` 函数填补缺失值，其中可以指定固定数值或者计算得出的统计量（如均值）。 - 对于某些字段中的特殊值（比如字符串类型的 `None`），可以通过再次调用 `fillna()` 或者其他替代方法将其标准化。 ### 注意事项以上展示的是基础版本的数据清洗流程，在实际应用过程中可能还需要考虑更多细节问题，例如异常值检测与修正、日期时间格式转换等复杂场景下的处理逻辑。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇 Python里用集合检查姓名是否已存在，代码哪里容易出错？

目录

用Pandas做基础数据清洗，删重、补缺、替换值该怎么写？

Python内容推荐

Python pandas 数据清洗 基础教程

Python_pandas_数据清洗和预处理.docx

python数据清洗Pandas指导手册

Python pandas数据清洗基础教程

Python数据分析：活用Pandas库-数据集 pandas-for-everyone-master

Python数据分析实践：pandas数据结构new.pdf

Python源码-Pandas数据处理-空值、0值等异常值检测.zip

基础Python教程之pandas使用总结.pdf

Python中Pandas库的数据分析实战：从基础到进阶

《Python数据分析与应用》实验二 pandas统计分析基础.docx

计算机语言学中n-gram算法的python实现

pandas-练习数据

数据清洗与验证系统 pandas

数据预处理-数据清洗-使用Pandas进行缺失值清洗

7.Pandas 数据清洗 _ 菜鸟.pdf

用实战玩转Pandas数据分析.pdf

pandas官方文档中文版_pandas_数据清洗_

数据预处理-数据清洗-使用Pandas进行异常值清洗

Pandas数据清洗实战 之清洗猫眼电影

用NumPy和Pandas做数据分析实战

Pandas 数据处理,数据清洗详解

使用Python Pandas处理亿级数据的方法

数据清洗之 csv文件读写

Python数据分析基础：异常值检测和处理

使用Python(pandas库)处理csv数据

学生成绩管理系统C++课程设计与实践

别再只盯着BERT了：用知识蒸馏把大模型塞进你的手机App（附实战代码）

为什么ECS的Burst编译器不能直接读取单例管理器里的数据？

RH公司应收账款管理优化策略研究

避坑指南：ArcGIS像元统计处理月度栅格时，90%的人会忽略的3个细节（以气温数据为例）

Python pandas 数据清洗基础教程

Pandas数据清洗实战之清洗猫眼电影