python将一个文件下的大量TXT文件转换成pdf

实现将一个文件夹中的大量 `.txt` 文件批量转换为 `.pdf` 格式，可以通过 Python 结合第三方库来完成。以下是一个基于 `reportlab` 库的解决方案，它能够逐行读取 `.txt` 文件，并将其内容写入生成的 PDF 文档中。 ### 使用 reportlab 生成 PDF `reportlab` 是一个功能强大的 PDF 生成库，可以灵活控制文本、字体、颜色等输出格式。以下是完整的代码示例： ```python import os from reportlab.pdfgen import canvas # 设置输入和输出文件夹路径 input_folder = "G:/TXT文档" output_folder = "G:/PDF输出" # 如果输出目录不存在，则创建 os.makedirs(output_folder, exist_ok=True) # 遍历输入文件夹中的所有 .txt 文件 for file_name in os.listdir(input_folder): if file_name.endswith(".txt"): # 构建完整文件路径 file_path = os.path.join(input_folder, file_name) # 生成对应的PDF输出路径 pdf_name = os.path.splitext(file_name)[0] + ".pdf" pdf_path = os.path.join(output_folder, pdf_name) # 创建PDF文档 c = canvas.Canvas(pdf_path) # 打开并读取文本文件内容 with open(file_path, 'r', encoding='utf-8') as txt_file: lines = txt_file.readlines() # 设置起始坐标和行高 x, y = 50, 750 line_height = 15 for line in lines: # 去除行末空白字符 clean_line = line.strip() if clean_line: c.drawString(x, y, clean_line) y -= line_height # 判断是否需要换页 if y < 50: c.showPage() y = 750 # 保存PDF文档 c.save() print(f"已转换: {file_name} -> {pdf_name}") ``` ### 功能说明 - **读取 `.txt` 文件**：使用 `open()` 函数以 UTF-8 编码读取文本文件。 - **生成 PDF**：利用 `canvas.Canvas()` 创建一个新的 PDF 页面，并通过 `drawString()` 方法将文本逐行绘制到页面上。 - **自动换页**：当文本内容接近页面底部时，自动调用 `showPage()` 换页，确保内容不会溢出。 - **输出路径管理**：程序会自动创建输出目录（如果不存在），并保留原始文件名，仅将扩展名替换为 `.pdf`。 ### 性能与扩展性该脚本适用于中小型规模的文本文件处理。若需处理非常大的文件或提高性能，可考虑引入多线程或多进程技术，如 `concurrent.futures` 模块[^2]。此外，还可以结合样式处理库（如 `weasyprint`）将 HTML/CSS 转换为 PDF，从而支持更复杂的排版需求。 ---

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇 python 调用exe输入参数并运行

目录

python将一个文件下的大量TXT文件转换成pdf

Python内容推荐

Python自动化办公学习项目_基于Python编程语言实现自动化办公流程的脚本集合涵盖Excel表格数据处理Word文档自动生成与编辑PDF文件批量转换与合并电子邮件自动.zip

计算机视觉_OpenCV_Python_图像处理_机器学习_文档数字化_智能扫描_自动校正_透视变换_自适应阈值_图像增强_交互式界面_批量处理_文档识别_边缘检测_角点定位_图像锐化_色彩优.zip

python实现pdf转换成word/txt纯文本文件

Python将txt文件转成pdf文件

Python-将epub文件转换为文本

利用python将pdf输出为txt的实例讲解

基于Python实现TXT文件转换WORD、PDF、图片【400010002】

基于python的上市公司年报分析（pdf转txt，停用词过滤，关键词分析，文本分析）

Python实现pdf文档转txt的方法示例

Python批量提取PDF文件中文本的脚本

利用python下载scihub成文献为PDF操作

python实现从pdf文件中提取文本,并自动翻译的方法

Python如何把多个PDF文件合并代码实例

Python-自动翻译论文pdf生成带翻译段落的文本文档txt

Python解析并读取PDF文件内容的方法

文件同步备份项目 Python完整源码与测试部署文档

非线性薛定谔方程的物理信息神经网络PINN研究（Python代码实现）

将文件保存成图片的格式.rar

pdf 转 txt 文件

PDF转txt格式

pytorch 查看cuda 版本方式

安装GPU版本Pytorch安装GPU版本Pytorch

解决pytorch GPU 计算过程中出现内存耗尽的问题

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构

Java线程池运行时状态怎么实时掌握？有哪些靠谱的监控手段？

桌面工具软件项目效益评估及市场预测分析