python 两个dataframe有相同的列，如何用merge函数将a表的数据填充到b表为空的列中

在使用 `pandas.merge()` 函数填充一个 DataFrame 中的缺失值时，可以结合 `how='outer'` 参数实现全连接（outer join），并利用两个 DataFrame 中相同的列进行合并，从而实现对缺失值的填充。具体操作如下：假设 DataFrame A 包含完整数据，而 DataFrame B 中某些字段存在缺失值。两者具有相同的列结构，可以通过某一关键列（如 `id`）进行连接。此时，可以使用 `merge()` 函数将两个 DataFrame 合并，并使用 `fillna()` 方法填充缺失值。 ### 示例代码如下： ```python import pandas as pd import numpy as np # 创建 DataFrame A（完整数据） df_a = pd.DataFrame({ 'id': [1, 2, 3], 'value': [10, np.nan, 30] }) # 创建 DataFrame B（部分数据缺失） df_b = pd.DataFrame({ 'id': [1, 2, 3], 'value': [np.nan, 20, np.nan] }) # 使用 merge 函数按 id 列进行外连接 merged_df = pd.merge(df_a, df_b, on='id', how='outer', suffixes=('_a', '_b')) # 填充缺失值：优先使用 df_a 的值，若也缺失则使用 df_b 的值 merged_df['value'] = merged_df['value_a'].fillna(merged_df['value_b']) # 删除临时列 merged_df.drop(columns=['value_a', 'value_b'], inplace=True) print(merged_df) ``` 输出结果为： ``` id value 0 1 10.0 1 2 20.0 2 3 30.0 ``` 上述代码中，首先通过 `merge()` 函数实现外连接，确保所有记录都被保留[^1]；接着使用 `fillna()` 方法将 DataFrame A 中缺失的值用 DataFrame B 中对应的值进行填充；最后删除了合并过程中生成的临时列。此外，若两个 DataFrame 的列名完全一致，也可以在合并时使用 `left_on` 和 `right_on` 指定不同的列名进行连接，例如： ```python merged_df = pd.merge(df_a, df_b, left_on='key_a', right_on='key_b', how='outer') ``` ###

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇如何使用Python将数据集划分为测试集和训练集

目录

python 两个dataframe有相同的列，如何用merge函数将a表的数据填充到b表为空的列中

Python内容推荐

python 创建一个空dataframe 然后添加行数据的实例

python dataframe向下向上填充,fillna和ffill的方法

python merge、concat合并数据集的实例讲解

Python通过两个dataframe用for循环求笛卡尔积

Python pandas中 如何声明(创建)一个空的DataFrame对象（变量），如何快速的创建一个DataFrame变量？

python pandas dataframe 按列或者按行合并的方法

Python创建一个空的dataframe,并循环赋值的方法

使用Python向DataFrame中指定位置添加一列或多列的方法

Python中pandas dataframe删除一行或一列:drop函数详解

python DataFrame 修改列的顺序实例

python pandas.DataFrame.loc函数使用详解

python中pandas.DataFrame对行与列求和及添加新行与列示例

Python Merge函数原理及用法解析

Python DataFrame.groupby()聚合函数,分组级运算

Python pandas.DataFrame调整列顺序及修改index名的方法

利用Pandas 创建空的DataFrame方法

DataFrame 数据合并实现(merge，join，concat)

pandas对dataFrame中某一个列的数据进行处理的方法

pandas dataframe的合并实现（append, merge, concat）

pandas.DataFrame删除/选取含有特定数值的行或列实例

基于打开pycharm有带图片md文件卡死问题的解决

PyCharm集成Jupyter启动卡死解决[代码]

解决终端运行Py闪退

解决PyCharm闪退问题[项目代码]

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构

Java线程池运行时状态怎么实时掌握？有哪些靠谱的监控手段？

Python pandas中如何声明(创建)一个空的DataFrame对象（变量），如何快速的创建一个DataFrame变量？