用python分辨小说txt文档有多少章，并且改写文档名，标注章节数

### 实现思路统计小说 TXT 文档中的章节数量并根据章节信息重命名文件，可以通过读取文件内容并识别章节标题的格式来实现。常见的章节标题格式包括“第X章”、“Chapter X”、“卷X”等。通过正则表达式匹配这些模式，可以实现章节的识别和统计。重命名文件时，可以根据统计结果动态生成文件名，例如“第1章-第10章.txt”表示该文件包含的章节范围。 ### 代码实现以下是一个完整的 Python 脚本，用于统计 TXT 文档中的章节数量并根据章节范围重命名文件： ```python import os import re import shutil def count_chapters(file_path, chapter_pattern=r"第\d+章"): """ 统计TXT文档中的章节数量。参数: file_path (str): TXT文件路径 chapter_pattern (str): 章节标题的正则表达式模式返回: list: 包含所有章节起始位置的列表 """ chapter_positions = [] pattern = re.compile(chapter_pattern, re.IGNORECASE) with open(file_path, 'r', encoding='utf-8') as file: content = file.read() matches = pattern.finditer(content) for match in matches: chapter_positions.append(match.start()) return chapter_positions def split_and_rename(file_path, chapter_positions, output_dir): """ 根据章节信息分割TXT文档并重命名文件。参数: file_path (str): 原始TXT文件路径 chapter_positions (list): 包含章节起始位置的列表 output_dir (str): 输出目录 """ if not os.path.exists(output_dir): os.makedirs(output_dir) with open(file_path, 'r', encoding='utf-8') as file: content = file.read() num_chapters = len(chapter_positions) for i in range(num_chapters): start_pos = chapter_positions[i] end_pos = chapter_positions[i + 1] if i < num_chapters - 1 else len(content) chapter_content = content[start_pos:end_pos] # 根据章节标题生成文件名 chapter_title_match = re.search(r"第\d+章", chapter_content[:100]) chapter_title = chapter_title_match.group() if chapter_title_match else f"Chapter_{i + 1}" output_file_path = os.path.join(output_dir, f"{chapter_title}.txt") with open(output_file_path, 'w', encoding='utf-8') as output_file: output_file.write(chapter_content) def main(): input_file = "novel.txt" # 输入小说文件路径 output_directory = "chapters" # 输出目录 chapter_positions = count_chapters(input_file) split_and_rename(input_file, chapter_positions, output_directory) if __name__ == "__main__": main() ``` ### 代码说明 1. **`count_chapters` 函数**：使用正则表达式匹配章节标题（默认模式为“第X章”），并记录每个章节的起始位置[^1]。 2. **`split_and_rename` 函数**：根据章节起始位置将文件内容分割为多个部分，并为每个部分生成以章节标题命名的新文件[^2]。 3. **主函数 `main`**：定义输入文件路径、输出目录，并调用上述函数完成章节数量统计和文件重命名操作。 ### 扩展功能 - **支持多种章节格式**：可以修改正则表达式以支持“Chapter X”、“卷X”等格式。 - **自动编号**：如果无法识别章节标题，可以使用数字编号作为默认文件名。 - **合并多个文件**：可以扩展脚本以支持合并多个 TXT 文件并按章节分割。 ### 注意事项 - 确保文件编码为 UTF-8，避免读取时出现乱码。 - 章节标题匹配的正则表达式可以根据实际需求调整。 - 输出目录需确保有写入权限，避免因权限问题导致文件无法生成。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇二项分布计算样本量npython

目录

用python分辨小说txt文档有多少章，并且改写文档名，标注章节数

Python内容推荐

Python tkinter实现图片标注功能(完整代码)

KIE关键信息抽取与视频超分辨率重构，python数据处理

yolov5目标检测自定义数据集可视化标注框的python脚本

基于深度学习YOLOv5目标检测算法进行垃圾物体识别与分类训练自己标注的垃圾数据集建立实时垃圾分类系统_Python编程语言_YOLOv5深度学习目标检测算法_垃圾数据集训练与标注.zip

YOLO-seg标注可视化[代码]

JSON转YOLO TXT代码[项目代码]

基于Pyqt5的超大影像区块标注工具

ZSSR-master_超分辨工具箱_ZSSRpytorch_zssr超分辨_

精灵标注-人工智能数据标注

免费铁路轨道病害检测数据集(COCO数据集标注)

YOLOv5数据集标注统计[源码]

使用现在的YOLO模型给数据集进行标注，或者读取ffhq的json文件将人脸数据集中人脸框标注为VOC格式

LabelImg 图像标注工具 深度学习工具

sparse.zip_sparse_图像标注_稀疏图像

常规的数据处理demo，包含裁切，融合，xml2txt等。

目标检测数据集：大分辨率水下海鲜动植物目标检测数据集（VOC标注格式的xml文件，已经做了训练集和测试集划分

基于YOLOv8深度学习框架与玉米杂草检测多分辨率数据集_结合YOLOv8n模型训练与评估_实现农田玉米及杂草目标检测系统_利用3574张标注图像与4981张未标注图像_覆盖玉米三.zip

小说自动转60宫格分镜（本地版本）.json

基于YOLOv8深度学习模型训练无人机视角森林火灾烟雾检测数据集_包含2603张图片及TXT格式标注文件_从数据准备开始包括格式转换将非YOLO格式标注转换为YOLO格式所需类别I.zip

道路病害数据集包含3000多张jpg格式的图片和对应txt格式的标签

基于打开pycharm有带图片md文件卡死问题的解决

PyCharm集成Jupyter启动卡死解决[代码]

解决终端运行Py闪退

解决PyCharm闪退问题[项目代码]

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构

Java线程池运行时状态怎么实时掌握？有哪些靠谱的监控手段？

LabelImg 图像标注工具深度学习工具