如何用Python把txt文件中每两个'text item'行之间的内容（含起始行）分别提取成独立列表？

好的！以下是关于如何通过 Python 实现从 `txt` 文件中按行读取并截取特定条件的内容的操作说明。 --- ### 需求解析我们需要完成的任务是从一个文本文件 (`txt`) 中逐行读取数据，并将满足以下规则的部分提取出来： 1. **起始标志**：找到包含关键字 `"text item"` 的所有行； 2. **结束标志**：提取当前起始标记到下一个起始标记之前的所有行（包括起始标记所在的那一行），存入一个新的列表； 3. 如果到达文件的最后一行，则将其作为最后一个区间的终点。最终结果是一个嵌套列表，其中每个子列表代表了上述区间内的内容。 --- ### 解决方案下面是完整的 Python 代码实现： ```python def extract_content_from_txt(file_path): result = [] # 存储最终的结果 current_section = None # 当前正在处理的片段 with open(file_path, 'r', encoding='utf-8') as file: lines = [line.strip() for line in file] # 按行读取文件并去除多余空白字符 start_keyword = "text item" # 定义触发的关键字 i = 0 # 初始化索引计数器 total_lines = len(lines) # 总共多少行数据 while i < total_lines: if start_keyword in lines[i]: # 找到起始关键词所在行 section_start = i # 记录此段开始位置 j = i + 1 # 开始寻找下一段起点或者文件结尾 while j < total_lines and start_keyword not in lines[j]: j += 1 section_end = j - 1 if j != total_lines else j # 确定本段落的结束点 # 将该部分添加至结果集 result.append(lines[section_start : section_end+1]) i = j # 更新指针到下一循环检查处 (j 已经是新的可能的起始点了) else: i += 1 # 若未匹配上则继续往下找 return result # 测试函数是否正常工作 if __name__ == "__main__": path_to_file = "./example.txt" sections = extract_content_from_txt(path_to_file) print("分割后的每一部分内容如下:") for idx, part in enumerate(sections): print(f"\n第 {idx+1} 部分:\n", "\n".join(part)) ``` #### 重要提示： - 函数会根据指定路径打开 `.txt` 文件进行操作。 - 假设输入的数据格式合理；如果某些极端情况如完全无目标字符串等，请额外增加错误校验机制保证程序鲁棒性。 --- ### 示例解读假设您的示例文档内容如下所示： ``` 这是一些无关的信息... 这里是第一个 text item 起始项 a1 接着第一组其他信息 b1 然后还是更多细节 c1 接下来第二个 text item 起始项 a2 第二块附加描述 d2 最后一条记录 e2 和一些随机文字 f2 g2 h2 还有另一个 text item 最终项目 x3 y3 z3 w3 以及最后几句话 q4 p5 r6 s7 t8 u9 v10 ``` 运行上面脚本之后可以获得这样的输出结构: ``` 第 1 部分: 这里是第一个 text item 起始项 a1 接着第一组其他信息 b1 然后还是更多细节 c1 第 2 部分: 接下来第二个 text item 起始项 a2 第二块附加描述 d2 最后一条记录 e2 和一些随机文字 f2 g2 h2 第 3 部分: 还有另一个 text item 最终项目 x3 y3 z3 w3 以及最后几句话 q4 p5 r6 s7 t8 u9 v10 ``` --- ### 关键知识点回顾 - 使用 `with open(...)` 可安全地管理资源访问权限及关闭流； - 字符串查找可通过简单的成员运算符(`in`)快速判定是否存在某字段； - 循环结合切片能高效定位复杂范围区域。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇数字倒过来写，Python里有几种靠谱做法？

目录

如何用Python把txt文件中每两个'text item'行之间的内容（含起始行）分别提取成独立列表？

Python内容推荐

使用python的scrapy模块爬取文本保存到txt文件

python如何提取英语pdf内容并翻译

Python-将epub文件转换为文本

python3爬虫学习之数据存储txt的案例详解

Python 实现文件读写、坐标寻址、查找替换功能

python读写汉字转成中文

python2使用bs4爬取腾讯社招过程解析

利用python爬取京东数据

Python Scrapy多页数据爬取实现过程解析

Python3爬虫爬取百姓网列表并保存为json功能示例【基于request、lxml和json模块】

python简单爬虫抓取新闻板块网页内容实例

Python爬取豆瓣网热门电影代码

基于python的简单爬取百度百科内容demo

Python爬虫之Scrapy（爬取csdn博客）

Python爬虫实现模拟点击动态页面

Python selenium爬取微博数据代码实例

python爬虫详解，包括原理流程等

Python爬虫获取微博TOP50热搜+写入Excel

python语言bknr爬虫程序代码.txt

Python Requests库详解

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构

Java线程池运行时状态怎么实时掌握？有哪些靠谱的监控手段？

桌面工具软件项目效益评估及市场预测分析

告别遮挡！UniApp中WebView与原生导航栏的和谐共处方案（附完整可运行代码）

OSPF是怎么在企业网里自动找最优路径并分区域管理的？

UML建模课程设计：图书馆管理系统论文