怎么用Python爬取北京到上海高铁车次并导出为CSV文件？

好的，您希望从网页上获取北京到上海的高铁车次信息，并将其保存为CSV文件。下面我将为您补充完整的Python代码。 ### 补充后的完整代码： ```python import requests from lxml import etree import pandas as pd # 目标URL url = "https://www.chalieche.com/%e5%8c%97%e4%ba%ac-%e4%b8%8a%e6%b5%b7/" # 发送HTTP请求并检查响应状态码 response = requests.get(url) if response.status_code != 200: raise Exception(f"Failed to fetch data from {url}, status code: {response.status_code}") html = response.content.decode('utf-8') # 解决编码问题 tree = etree.HTML(html) # 抓取所有表格数据行 rows = tree.xpath('//table//tr') data = [] headers = None for row in rows: cells = row.xpath('./td') if not headers and len(cells) > 0: # 获取表头 (假设第一行是表头) headers = [cell.text.strip() for cell in cells] continue if len(cells) == len(headers): station_data = {} for idx, cell in enumerate(cells): key = headers[idx] value = ''.join(cell.itertext()).strip() station_data[key] = value data.append(station_data) df = pd.DataFrame(data) # 筛选出包含“G”字开头的车次 filtered_df = df[df.iloc[:, 0].str.startswith("G")] # 将结果导出成 CSV 文件 output_file = 'beijing_shanghai_trains.csv' filtered_df.to_csv(output_file, index=False, encoding='utf_8_sig') print(f"Data successfully saved to {output_file}") ``` 该段代码做了以下改进： 1. **添加了对 HTTP 请求返回值的状态检测**：保证只有当请求成功 (`status_code=200`) 的时候才会继续解析页面内容； 2. **修正了解析 HTML 编码的方式**, 使用 `response.content` 并指定正确的解码方式避免乱码情况发生; 3. **遍历整个表格结构**: 捕获所有的列标题以及每条记录的内容，并构造 DataFrame 对象； 4. **筛选符合条件的数据** : 根据您的需求选择以字母 G 开始的所有列车班次； 5. **生成 CSV 文件**: 最终的结果会存储在一个名为 `beijing_shanghai_trains.csv` 的文件里，采用 UTF-8 带 BOM 的编码格式确保 Excel 中可以正常显示中文字符；注意：此示例基于所提供的 URL 和目标网站的具体布局工作。如果网站结构发生变化，则需要相应调整 XPath 或其他抓取策略。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇用Python自动抓取携程酒店评论，具体怎么操作？

目录

怎么用Python爬取北京到上海高铁车次并导出为CSV文件？

Python内容推荐

python爬取招聘网信息并保存为csv文件

Python简单爬虫导出CSV文件的实例讲解

python如何爬取网站数据并进行数据可视化

Python爬取电影榜单Top100并保存csv文件（附源码下载）

python 使用xpath/lxml爬取网页表格并存CSV

python网络爬虫：实现百度热搜榜前50数据爬取，生成CSV文件

python食物数据爬取及分析（源码、爬取数据、数据可视化图表、报告）

python爬虫爬取网页表格数据

python3 爬取网页表格实例

Python爬取股票信息，并可视化数据的示例

python爬取并分析淘宝商品信息

python爬取上海停车场位置并进行可视化展示

python爬取携程网评论.zip

python爬取电影Top250数据并进行可视化分析.zip

利用python爬取豆瓣音乐TOP250的数据----最终结果生成一个music.csv文件

Python-简单的爬虫爬取上海地区链家挂牌二手房信息

爬取微博数据_爬取微博_python爬虫_爬取微博数据并可视化_数据开发_微博分析_

python 对多个csv文件分别进行处理的方法

Python：输入关键字进行百度搜索并爬取搜索结果存放在csv中

Python爬取天气分析可视化.zip

Python将一个CSV文件里的数据追加到另一个CSV文件的方法

Python爬取破解无线网络wifi密码过程解析

python爬取cnvd漏洞库信息的实例

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构

Java线程池运行时状态怎么实时掌握？有哪些靠谱的监控手段？

桌面工具软件项目效益评估及市场预测分析