刚学Python两天，怎么把《唐诗三百首.txt》按诗人和诗题分开存起来，还能快速查作者或找某首诗？

要解决您提出的唐诗文本处理任务，我们将分步进行。核心思路是：先读取文件，根据文件格式特征（如空行、特定标识符）分割出独立的诗篇，然后解析每首诗以提取标题、作者和正文，最后构建数据结构并实现查询功能。以下是根据您当前基础设计的完整Python代码实现，包含详细的中文注释。 ### 1. 代码实现 ```python # -*- coding: utf-8 -*- """ 唐诗三百首.txt 文件处理程序功能： 1. 读取文件并分离每首诗。 2. 创建字典，键为诗人名字，值为该诗人的诗集列表。 3. 实现按作者搜索诗集。 4. 实现按标题搜索诗的内容及作者。 """ def read_and_parse_poems(file_path): """ 读取唐诗文件并解析出每首诗的标题、作者和正文。假设文件格式为：标题行，接着是作者行，然后是诗句行，诗之间用空行分隔。 """ poems_list = [] with open(file_path, 'r', encoding='utf-8') as file: lines = file.readlines() current_poem = {'title': '', 'author': '', 'content': []} for line in lines: line = line.strip() # 去除首尾空白字符 if not line: # 遇到空行，表示一首诗结束 if current_poem['title']: # 确保当前诗的信息不为空 # 将内容列表合并为字符串 current_poem['content'] = '\n'.join(current_poem['content']) poems_list.append(current_poem) current_poem = {'title': '', 'author': '', 'content': []} # 重置为下一首诗准备 continue # 如果当前诗的标题为空，则当前行是标题 if not current_poem['title']: current_poem['title'] = line # 如果标题已设置但作者为空，则当前行是作者 elif not current_poem['author']: current_poem['author'] = line # 否则，当前行是诗句内容 else: current_poem['content'].append(line) # 处理文件末尾可能没有空行的情况 if current_poem['title']: current_poem['content'] = '\n'.join(current_poem['content']) poems_list.append(current_poem) return poems_list def build_poet_dict(poems_list): """ 根据解析出的诗列表，构建诗人名字到诗集列表的字典。字典结构：{ '诗人A': [ 诗1_dict, 诗2_dict, ... ], ... } """ poet_dict = {} for poem in poems_list: poet = poem['author'] if poet not in poet_dict: poet_dict[poet] = [] poet_dict[poet].append(poem) return poet_dict def search_by_author(poet_dict, author_name): """ 按作者姓名搜索，返回该作者的所有诗。返回格式：包含诗字典的列表。 """ return poet_dict.get(author_name, []) def search_by_title(poems_list, title): """ 按诗标题搜索，返回匹配的诗内容及作者信息。返回格式：匹配到的诗字典，或None。 """ for poem in poems_list: if poem['title'] == title: return poem return None def main(): # 文件路径，请根据实际情况修改 file_path = '唐诗三百首.txt' # 1. 读取并解析文件 print("正在读取并解析文件...") poems_list = read_and_parse_poems(file_path) print(f"共解析出 {len(poems_list)} 首诗。") # 2. 构建诗人字典 print("\n正在构建诗人-诗集字典...") poet_dict = build_poet_dict(poems_list) print(f"共找到 {len(poet_dict)} 位不同的诗人。") # 3. 示例查询：按作者搜索 search_author = "李白" print(f"\n查询作者 '{search_author}' 的诗集：") author_poems = search_by_author(poet_dict, search_author) if author_poems: print(f"找到 {len(author_poems)} 首诗：") for idx, poem in enumerate(author_poems, 1): print(f" {idx}. 《{poem['title']}》") else: print("未找到该作者的诗。") # 4. 示例查询：按标题搜索 search_title = "静夜思" print(f"\n查询标题为 '{search_title}' 的诗：") target_poem = search_by_title(poems_list, search_title) if target_poem: print(f"标题：{target_poem['title']}") print(f"作者：{target_poem['author']}") print("内容：") print(target_poem['content']) else: print("未找到该标题的诗。") # 5. 可选：查看字典结构示例 print("\n--- 诗人字典结构示例（前两位诗人）---") for idx, (poet, poems) in enumerate(poet_dict.items()): if idx >= 2: break print(f"诗人：{poet}，诗作数量：{len(poems)}") if __name__ == "__main__": main() ``` ### 2. 代码功能与关键步骤详解 1. **文件读取与解析 (`read_and_parse_poems`)** * 使用 `with open(...) as file` 安全地打开文件，并指定 `encoding='utf-8'` 以正确读取中文。 * 逐行读取文件内容。假设文件格式为：**标题行 -> 作者行 -> 诗句行（若干行） -> 空行**，如此循环。 * 使用一个临时字典 `current_poem` 来存储正在解析的诗的信息。 * 通过判断 `line.strip()` 是否为空字符串来识别分隔诗的空行。 * 解析逻辑：遇到非空行时，依次填充 `title`、`author`，之后的行都作为 `content`（存储为列表）。遇到空行或文件结束时，将当前诗存入总列表。 2. **构建诗人字典 (`build_poet_dict`)** * 初始化一个空字典 `poet_dict`。 * 遍历解析得到的所有诗 (`poems_list`)。 * 以每首诗的 `author` 字段作为键。如果该诗人还未在字典中，则为其创建一个空列表作为值。 * 将当前诗的字典（包含 `title`, `author`, `content`）追加到对应诗人的列表中。 * 此操作利用了Python字典的高效查找特性，为后续按作者查询打下基础 [ref_1]。 3. **按作者查询 (`search_by_author`)** * 此函数直接接收构建好的 `poet_dict` 和作者姓名。 * 使用字典的 `get` 方法进行查找。`get(key, default)` 会在字典中查找键 `key`，如果找到则返回对应的值（即该诗人的诗集列表），如果未找到则返回指定的默认值（这里为空列表 `[]`）。 * 这种方法的时间复杂度接近O(1)，效率极高。 4. **按标题查询 (`search_by_title`)** * 此函数遍历整个 `poems_list`。 * 将每首诗的 `title` 字段与目标标题进行精确匹配。 * 找到第一个匹配项后立即返回该诗的完整字典。 * 如果遍历结束仍未找到，则返回 `None`。 ### 3. 针对您当前基础的特别说明与扩展 * **数据结构选择**：我们使用“字典的列表”作为诗人的诗集。例如，`poet_dict['李白']` 的值是一个列表，列表中的每个元素都是一个字典，代表李白的一首诗。这种结构清晰且易于后续处理（如获取某首诗的详细内容）。 * **文件格式适应性**：核心解析函数 `read_and_parse_poems` 的逻辑基于对您提供的 `唐诗三百首.txt` 文件格式的假设。**如果实际文件格式不同（例如，标题和作者在同一行，或用特殊符号分隔），您需要调整解析逻辑**。一个更健壮的方法是先打印出文件的前几行进行分析： ```python with open('唐诗三百首.txt', 'r', encoding='utf-8') as f: for i in range(10): # 查看前10行 print(repr(f.readline().strip())) # repr() 可以显示换行符等特殊字符 ``` * **运行与测试**：将上述代码保存为 `.py` 文件（如 `tang_poetry.py`），并确保 `唐诗三百首.txt` 在同一目录下，然后运行即可。`main()` 函数中包含了示例查询，您可以将 `search_author` 和 `search_title` 变量替换成您想查询的内容。 * **下一步学习建议**： * **异常处理**：可以学习使用 `try...except` 来优雅地处理文件不存在、编码错误等情况。 * **模糊查询**：当前的标题查询是精确匹配。您可以学习字符串方法（如 `in` 操作符或 `str.find()`）来实现包含关键字搜索。 * **数据持久化**：学习使用 `json` 模块将 `poet_dict` 或 `poems_list` 保存到文件，下次程序启动时直接加载，避免重复解析。 * **更复杂的查询**：例如，查询诗中包含某个字（如“月”）的所有诗句，这涉及到对 `poem['content']` 字符串进行搜索，类似于从数据库中获取含指定字词的诗句的思路 [ref_1]。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇 Linux里用sh脚本打包Python项目，具体怎么写和运行？

目录

刚学Python两天，怎么把《唐诗三百首.txt》按诗人和诗题分开存起来，还能快速查作者或找某首诗？

Python内容推荐

python写的唐诗三百首小工具

”本办法“学Python--习题23人类语言languages.txt文件

python练习题Question3.txt

python练习题Question5.txt

python练习题Question4.txt

python练习题Question9.txt

python练习题Question1.txt

python练习题Question2.txt

”本办法“学Python--习题26程序改错exercise.txt文件

Python-全唐诗分析程序

Python-最全中华古诗词数据库

基于循环神经网络来生成唐诗python源码（ 利用循环神经网络，实现唐诗生成任务）.zip

Windows版python-3.13.7-amd64.exe安装包附件

零基础学习python视频100集全百度云下载.txt

python入门教程.txt

python_docx-0.8.10-py2.py3-none-any.whl

python 3.13.9

PythonScript_full_0.9.0.1.zip

python练习题Question7.txt

python练习题Question44.txt

小甲鱼零基础学python全套课后题及答案.doc

Python Numpy:找到list中的np.nan值方法

用python生成1000个txt文件的方法

Python中pow()和math.pow()函数用法示例

Python实现读取TXT文件数据并存进内置数据库SQLite3的方法

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构

基于循环神经网络来生成唐诗python源码（利用循环神经网络，实现唐诗生成任务）.zip