简历里Computer后面跟着一堆带括号的技能项，怎么用Python自动拆解成‘工具名’和‘熟练度’两列并存为CSV？

由于我们无法直接操作实际的 PDF 文件（如 `JILi_Jenny_CV-V3.pdf`）进行读取，但你已经提供了完整的文本内容，我们可以先通过 **模拟文本提取** 的方式，使用 Python 正则表达式从中提取 `"Computer"` 对应的部分，然后将其写入一个两列的 CSV 文件。 --- ### ✅ 目标从简历中提取： ``` Computer: Microsoft Office(Proficient), Tableau(Proficient), SQL(Proficient), Python(Proficient). ``` 输出到一个名为 `computer_skills.csv` 的 CSV 文件，结构如下： | Computer | Skill_Level | |--------------------|------------------------------------------| | Microsoft Office | Proficient | | Tableau | Proficient | | SQL | Proficient | | Python | Proficient | --- ### ✅ 完整 Python 代码 ```python import re import csv # 模拟从PDF中提取的原始文本（你可以替换成实际通过 PyPDF2 提取的内容） raw_text = """ Certifications: ACCA(8/13), HKICPA(10/15) Computer: Microsoft Office(Proficient), Tableau(Proficient), SQL(Proficient), Python(Proficient). Language: English(IELTS 7.0), Mandarin(Native). Interests: Photography, Swimming. """ # Step 1: 提取 Computer 开头的那一行 computer_section_match = re.search(r'Computer:\s*(.*?)(?:\n|$)', raw_text, re.DOTALL) if not computer_section_match: raise ValueError("未找到 'Computer' 相关信息") computer_line = computer_section_match.group(1).strip() # 提取冒号后的部分 # Step 2: 使用正则匹配每一个 "Skill(Level)" 的模式 skill_pattern = r'([^(,]+?)$([^)]+)$' matches = re.findall(skill_pattern, computer_line) # Step 3: 准备数据并清理空格 data = [] for skill, level in matches: skill_clean = skill.strip() level_clean = level.strip() data.append([skill_clean, level_clean]) # Step 4: 写入 CSV 文件 output_file = 'computer_skills.csv' with open(output_file, 'w', encoding='utf-8', newline='') as f: writer = csv.writer(f) # 写入表头 writer.writerow(['Computer', 'Skill_Level']) # 写入每一项技能 writer.writerows(data) print(f"✅ 成功提取 Computer 技能并保存至 '{output_file}'") for row in data: print(f" - {row[0]}: {row[1]}") ``` --- ### ✅ 输出结果（生成的 `computer_skills.csv` 内容）： ```csv Computer,Skill_Level Microsoft Office,Proficient Tableau,Proficient SQL,Proficient Python,Proficient ``` --- ### 📦 所需依赖安装 ```bash pip install PyPDF2 # 如果你要从真实 PDF 中提取文本 # 或者如果是扫描件： # pip install pdf2image pytesseract ``` > 🔁 如果你想从真正的 PDF 文件中读取文本，可以用 `PyPDF2` 替代上面的 `raw_text` 输入： ```python import PyPDF2 def read_pdf_text(pdf_path): text = "" with open(pdf_path, 'rb') as file: reader = PyPDF2.PdfReader(file) for page in reader.pages: text += page.extract_text() return text # 使用真实的 PDF 文件替换 raw_text # raw_text = read_pdf_text("JILi_Jenny_CV-V3.pdf") ``` --- ### ✅ 总结这段脚本可以： - 自动识别简历中 `Computer:` 后面的技术栈； - 解析每个工具及其熟练程度； - 导出为标准 CSV 文件供后续分析使用。如果你把 PDF 发给我（支持文本提取），我可以帮你直接运行完整流程！否则，你可以复制以上代码本地运行即可。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇 C# 里怎么像 Python 的 pychrome 那样用 Chrome DevTools 协议控制浏览器？

目录

简历里Computer后面跟着一堆带括号的技能项，怎么用Python自动拆解成‘工具名’和‘熟练度’两列并存为CSV？

Python内容推荐

python 快速把超大txt文件转存为csv的实例

SplitVideo:Python生成并执行appleScript将长视频分割成csv文件控制下的命名片段

Python数据存储之CSV数据的写入

使用python在本地电脑上快速处理数据

Tektronix示波器控制Python

Python 自动化办公 将初中生电脑阅卷考试的成绩和试卷图像按照类别放入不同文件夹 学习参考程序 文件管理

基于iTunes备份的微信聊天记录导出工具_支持iOS设备包括iPhone和iPad的文本消息提取与转换_通过Python脚本解析微信本地数据库并生成CSV格式文件_适用于个人数据.zip

基于python的电脑爬虫软件

电脑软件高效可用的34个Python 自动化办公库.rar

Python爬虫模拟器，让网络爬虫工作变得如些简单，会电脑操作就会网络爬虫！

Python实现手机自动拨号[源码]

python使用sklearn实现决策树的方法示例

详解解决Python memory error的问题（四种解决方案）

Amazon_Crawler:此应用程序是使用Beautiful Soup库用Python编写的网络爬虫。 它将在亚马逊网站上检索“笔记本电脑中的计算机”的结果页面，然后为列出的每个项目抓取各种规格和价格，并将其存储到CSV文件中

python xlsx to csv

用来分析小学期中期末成绩的质量分析工具（含Python源码），成绩单（CSV格式）

How to Think Like a Computer Scientist - Learning with Python 3 documentation

基于python如何快速编写量化策略及开发量化交易系统 7课 适合零基础快速入门学习

机器学习基于Python的模型构建与部署全流程技术实践：交通领域费用预测系统设计与实现

csv导入sqlite工具

Python解惑之True和False详解

Python中的True,False条件判断实例分析

浅谈Python里面None True False之间的区别

Python返回真假值（True or False）小技巧

python 输入年份 如果是闰年输出True 否则输出False 示例

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构

Python 自动化办公将初中生电脑阅卷考试的成绩和试卷图像按照类别放入不同文件夹学习参考程序文件管理

Amazon_Crawler:此应用程序是使用Beautiful Soup库用Python编写的网络爬虫。它将在亚马逊网站上检索“笔记本电脑中的计算机”的结果页面，然后为列出的每个项目抓取各种规格和价格，并将其存储到CSV文件中

基于python如何快速编写量化策略及开发量化交易系统 7课适合零基础快速入门学习

python 输入年份如果是闰年输出True 否则输出False 示例