Python里None和np.nan都能表示缺失值，它们到底有啥不一样？用的时候怎么选？

### Python `None` 与 `np.nan` 的区别及使用场景 #### 定义上的差异 `None` 是 Python 原生的对象，表示缺失值或空值。它是一个单例对象，在类型上属于 `NoneType`[^2]。而 `np.nan` 则是 NumPy 库定义的一个特殊浮点数 (float)，用于表示 IEEE 浮点标准中的“Not a Number”(NaN)[^3]。 --- #### 数据类型的对比 - **`None`**: 属于通用型的 Python 对象 (`NoneType`)，可以作为任意数据结构中的占位符。 - **`np.nan`**: 只能存在于数值型的数据容器中（如 NumPy 数组），因为它是基于 C 实现的 float 类型的一部分[^1]。 --- #### 计算能力的不同 - **`None`**: 不具备参与任何数学运算的能力。尝试将其用于加减乘除会引发错误。 - **`np.nan`**: 能够参与某些数学操作，但结果通常仍为 NaN。例如： ```python import numpy as np print(np.nan + 10) # 输出 nan print(np.nan * 5) # 输出 nan ``` 然而需要注意的是，涉及逻辑判断时，`np.nan` 表现出特殊的性质：两个 NaN 并不相等。 ```python print(np.nan == np.nan) # 输出 False ``` 为了检测是否存在 NaN，应使用专用方法如 `np.isnan()` 或 Pandas 提供的工具函数 `pd.isnull()`, `pd.isna()`。 --- #### 场景适用性分析 | 特性/场景 | `None` | `np.nan` | |-------------------|-------------------------------------------------------------------------------------------|------------------------------------------------------------------------------------------| | 缺失值标记 | 更适合一般用途，尤其是非数值型数据结构 | 主要针对数值型数组 | | 性能 | 较低性能，因需存储完整的 Python 对象 | 高效内存占用，适用于大规模科学计算 | | 运算兼容性 | 禁止任何形式的数学运算 | 支持部分数学运算 | | 替换与转换 | 如果目标是将数据写入数据库，则推荐先将 NaN 替换为 None | 当处理数据分析任务时，建议统一转为 NaN | 当涉及到 pandas DataFrame 处理时，出于一致性考虑，往往倾向于把所有的 `None` 统一替换为 `np.nan`，从而更好地利用库内置的功能来管理缺失值[^4]。 --- #### 示例代码展示以下是关于如何区分以及相互转化的小例子： ```python import numpy as np import pandas as pd data = [1, None, np.nan] # 检测缺失值 missing_values_check = [pd.isnull(value) for value in data] print(missing_values_check) # 输出: [False, True, True] # 将列表转化为 Series，并自动识别 None -> np.nan series_data = pd.Series(data) print(series_data) # 输出: 0 1.0 1 NaN 2 NaN dtype: float64 # 替换 np.nan 为 None cleaned_series = series_data.where(pd.notnull(series_data), None) print(cleaned_series.tolist()) # 输出: [1.0, None, None] ``` --- #### 结论总结综上所述，虽然两者都可以用来标志缺失数据，但在实际应用过程中应当依据具体需求选择合适的选项。对于常规编程环境或者混合类型的数据集来说，优先采用 `None`;而对于密集型数值运算场合则更适合选用 `np.nan`.

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇 Sublime Text 不能直接运行代码，那它到底怎么执行 Python 或 JS 这类脚本？

目录

Python里None和np.nan都能表示缺失值，它们到底有啥不一样？用的时候怎么选？

Python内容推荐

Python 实现使用空值进行赋值 None

python pandas消除空值和空格以及 Nan数据替换方法

Python数据分析及可视化-91

python处理两种分隔符的数据集方法

Python过滤掉numpy.array中非nan数据实例

python中resample函数实现重采样和降采样代码

python 读取.csv文件数据到数组(矩阵)的实例讲解

python dropna()用法.md

python 使用pandas计算累积求和的方法

python pandas移动窗口函数rolling的用法

新人日记20200430 关于利用python读取SQLite3的心得感受

python如何删除列为空的行

Python pandas.DataFrame 找出有空值的行

Python drop方法删除列之inplace参数实例

Python数据科学速查表 - 导入数据.pdf

如何使用内置 Python 函数在 Python 中导入文件.docx

Data-Types-for-Data-Science-in-Python-Datacamp

pandas 缺失值与空值处理的实现方法

pandas如何处理缺失值

对pandas replace函数的使用方法小结

处理minio文件分析链接的python

minio 文件服务器

minio-py:用于 Python 的 MinIO 客户端 SDK

二、python+前端 实现MinIO分片上传

Python连接MinIO[项目代码]

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构

二、python+前端实现MinIO分片上传