python3.12版本，帮我生成一个代码，可以爬虫爬出一个网页里的视频

在 Python 3.12 中，可以使用 `requests` 和 `BeautifulSoup` 库结合 `re`（正则表达式）来提取网页中的视频文件。以下是一个完整的示例代码，展示如何从网页中提取所有 `.mp4` 视频链接并下载它们： ```python import os import re import requests from bs4 import BeautifulSoup # 创建文件夹用于存储下载的视频 def create_folder_if_not_exists(folder_name): if not os.path.exists(folder_name): os.makedirs(folder_name) # 提取网页中的视频链接 def extract_video_links(url, video_extension='.mp4'): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.3' } response = requests.get(url, headers=headers) response.raise_for_status() # 使用 BeautifulSoup 解析 HTML soup = BeautifulSoup(response.text, 'html.parser') # 使用正则表达式匹配视频链接 video_pattern = re.compile(rf'https?://[^"\']+\{video_extension}') video_links = video.findall(response.text) # 或者直接从 <video> 标签提取 src 属性 video_tags = soup.find_all('video') for tag in video_tags: src = tag.get('src') if src and src.endswith(video_extension): video_links.append(src) return video_links # 下载视频文件 def download_video(url, folder): response = requests.get(url, stream=True) file_name = os.path.join(folder, url.split('/')[-1]) with open(file_name, 'wb') as f: for chunk in response.iter_content(chunk_size=1024): if chunk: f.write(chunk) print(f"已下载: {file_name}") # 主函数 def main(): target_url = "https://example.com" # 替换为实际目标网页 video_folder = "downloaded_videos" create_folder_if_not_exists(video_folder) video_links = extract_video_links(target_url) print(f"找到 {len(video_links)} 个视频文件。") for i, link in enumerate(video_links, 1): print(f"{i}. {link}") download_video(link, video_folder) if __name__ == "__main__": main() ``` ### 代码说明： 1. **创建文件夹**：使用 `create_folder_if_not_exists` 函数确保视频文件有存储路径。 2. **提取视频链接**： - 使用 `BeautifulSoup` 解析 HTML 文档并提取 `<video>` 标签中的 `src` 属性。 - 使用正则表达式匹配所有 `.mp4` 文件的链接。 3. **下载视频**：通过 `requests` 库下载视频文件，并以二进制流模式写入本地。 ### 注意事项： - **目标网页**：替换 `target_url` 为实际需要爬取的网页链接。 - **视频格式**：示例中提取 `.mp4` 格式视频，可根据需要修改 `video_extension` 参数。 - **请求头**：添加 `User-Agent` 模拟浏览器行为，避免被服务器屏蔽。 ### 扩展功能： - 支持下载其他格式的视频文件（如 `.webm`, `.ogg`）。 - 添加异常处理以应对网络请求失败或无效链接。 - 使用多线程或异步请求加快下载速度。 ---

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇用Python实现：打开指定路径下.exe文件，并在打开界面指定窗口输入用户名、密码

目录

python3.12版本，帮我生成一个代码，可以爬虫爬出一个网页里的视频

Python内容推荐

解析Python网络爬虫_复习大纲.docx

Python3网络爬虫案例实战课程 视频+文档+源码

python爬虫项目——自动批量抓取m3u8网页视频

Python网络爬虫实习报告总结归纳.docx

Python网络爬虫实习报告.pdf

python爬虫，爬取CNNNews网页的带视频的新闻

基于python的网络爬虫简单实现

Python爬虫进阶之爬取某视频并下载的实现

韦玮老师-精通python网络爬虫源代码

Python网络爬虫实习报告.doc

基于Python的网络爬虫技术研究.pdf

基于python的网络爬虫爬取天气数据及可视化分析（Matplotlib、sk-learn等，包括ppt，视频）

python爬虫视频教程

Python爬虫教学视频-最全的Python爬虫视频教程全集

python爬虫之requests的使用

Python网络爬虫课程设计报告+视频录制脚本+源代码

Python网络爬虫视频教程.docx

python爬虫教程

Python网络爬虫实习报告计划.pdf

基于python的网络爬虫技术研究.pdf

python快速编写单行注释多行注释的方法

Python中注释（多行注释和单行注释）的用法实例

Pyhton中单行和多行注释的使用方法及规范

Python中的单行、多行、中文注释方法

Perl中的单行注释和多行注释语法

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构

Python3网络爬虫案例实战课程视频+文档+源码