Python处理大文本时，怎么安全又省内存地删掉含特定内容的行？

在Python中，删除txt文件中符合条件的行有多种方法，以下为你介绍两种常见的处理方式。 ### 方法一：逐行读取并写入新文件当文件较大时，为避免耗尽内存，可逐行读取文件，并将不符合删除条件的行写入新文件，从而消除不需要的行。这种方法在处理12 - 50 GB大小的文件时，RAM使用率几乎保持不变，仅CPU周期显示正在处理中[^2]。示例代码如下： ```python # 定义输入文件路径、输出文件路径和删除条件函数 input_file = 'input.txt' output_file = 'output.txt' # 定义删除条件函数，这里以行中包含数字1为例 def condition(line): return '1' in line # 打开输入文件和输出文件 with open(input_file, 'r', encoding='utf-8') as infile, open(output_file, 'w', encoding='utf-8') as outfile: # 逐行读取输入文件 for line in infile: # 检查该行是否符合删除条件 if not condition(line): # 如果不符合条件，则写入输出文件 outfile.write(line) ``` ### 方法二：使用`numpy`库处理对于特定格式的txt文件，可使用`numpy`库的`loadtxt`和`savetxt`函数进行处理。例如，从众多txt文件中删除标签为1的行，可按如下代码操作[^3]： ```python import os import numpy as np # 定义标签文件路径和新标签文件路径 label_path = 'F:\\Object_Detection\\Annotations\\txt\\' new_label = 'F:\\Object_Detection\\Annotations\\delete_person\\' # 获取标签文件列表 label_name = os.listdir(label_path) new_name = label_name # 遍历每个标签文件 for i in range(len(label_name)): new_name = label_name[i] label_name[i] = label_path + label_name[i] # 加载标签数据 label_data = np.loadtxt(label_name[i]) new_name = new_label + new_name if label_data.ndim == 1: # 单行值或空文件 if label_data.size > 0: # 单行值 if label_data[0] == 1: with open(new_name, "a+") as f: pass # 记录 else: d = [] for j in range(len(label_data)): if label_data[j][0] == 1: d.append(j) if len(d): # 非空 # 删除符合条件的行 label_data = np.delete(label_data, d, axis=0) # 保存处理后的数据到新文件 with open(new_name, "a+") as f: # fmt ：设置多列保存格式 np.savetxt(new_name, label_data, fmt=''.join(['%d'] + [' %0.6f'] * 4), delimiter=' ') ```

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇用Python画电路图时，怎么一边绘图一边自动生成网表和连接代码？

目录

Python处理大文本时，怎么安全又省内存地删掉含特定内容的行？

Python内容推荐

Python实现删除文件中含“指定内容”的行示例

Python文本处理之按行处理大文件的方法

python 实现在txt指定行追加文本的方法

使用python读取.text文件特定行的数据方法

python文件特定行插入和替换实例详解

python实现按行切分文本文件的方法

用Python读取几十万行文本数据

python 实现批量替换文本中的某部分内容

python 去除txt文本中的空格、数字、特定字母等方法

利用python3筛选excel中特定的行（行值满足某个条件/行值属于某个集合）

Python3.5 处理文本txt,删除不需要的行方法

Python修改文件往指定行插入内容的实例

python读取文件指定行内容实例讲解

Python如何获取文件指定行的内容

解决python读取几千万行的大表内存问题

python TKinter获取文本框内容的方法

python文本分析与处理

Python删除n行后的其他行方法

Python做文本按行去重的实现方法

python实现根据指定字符截取对应的行的内容方法

在cmd命令行里进入和退出Python程序的方法

Python命令行和IDLE的清屏方法汇总

找Python安装目录,设置环境路径以及在命令行运行python脚本实例

在PyCharm的 Terminal（终端）切换Python版本的方法

在CMD命令行中运行python脚本的方法

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构