想用Python自动抓取BBC等国外新闻网站的指定关键词新闻，该怎么做？

要在特定的外国新闻网站上搜索你需要的新闻，可以利用Python编写一个简单的网络爬虫程序，并结合目标网站的API或HTML结构提取所需信息。下面是一个基于`requests`和`BeautifulSoup`库的基本示例。假设我们选择的是BBC News作为目标站点： ### 完整代码 ```python import requests from bs4 import BeautifulSoup def search_news(keyword): # BBC新闻的URL模板（可以根据需求调整） base_url = "https://www.bbc.com/news" headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36' } response = requests.get(base_url, headers=headers) if response.status_code == 200: soup = BeautifulSoup(response.text, 'html.parser') articles = [] for article in soup.find_all('a', class_='gs-c-promo-heading'): # 根据页面结构调整标签和类名 title = article.get_text(strip=True) link = article['href'] # 检查关键词是否出现在标题中 if keyword.lower() in title.lower(): full_link = f"https://www.bbc.com{link}" if not link.startswith("http") else link articles.append({'title': title, 'url': full_link}) return articles else: print(f"请求失败，状态码：{response.status_code}") return [] # 示例调用 if __name__ == "__main__": keyword = input("请输入你想搜索的新闻关键词: ") results = search_news(keyword) if results: print("\n找到的相关新闻:") for idx, result in enumerate(results, start=1): print(f"{idx}. {result['title']}\n 链接: {result['url']}\n") else: print("未找到相关新闻。") ``` --- ### 说明 1. **依赖项** - `requests`: 用于发送HTTP请求获取网页内容。 - `BeautifulSoup` (`bs4`): 解析HTML文档，帮助定位需要的信息。如果尚未安装这两个库，请运行以下命令： ```bash pip install requests beautifulsoup4 ``` 2. **功能模块** - 程序会访问BBC新闻主页（或其他指定网址），解析其HTML源代码。 - 使用`BeautifulSoup`查找所有符合条件的文章链接及标题。 - 提供用户输入的功能，筛选包含关键字的新闻条目。 3. **注意事项** - 这段代码仅适用于像BBC这样的静态网站；如果目标网站的内容由JavaScript动态加载，则需改用Selenium等工具模拟浏览器操作。 - 替换适合的目标网站及其对应的CSS Selectors以适应其他新闻平台的需求。 ---

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇用Python读取Excel中C5单元格的值，不同库的操作方式有什么区别？

目录

想用Python自动抓取BBC等国外新闻网站的指定关键词新闻，该怎么做？

Python内容推荐

Python自动化实现微信自动回复（关键词自动回复）

Python数据抓取双色球开奖

Python-抓取知乎V2EX等网站热榜信息

【coze智能体开发】基于Python的网页内容抓取插件：实现新闻详情页数据提取与调试

基于 python获取教育领域新闻进行分词关键词词共现分析 Gephi 软件绘制主题知识图谱 （附代码+报告）.rar

基于Python编程语言实现的新浪新闻网站数据自动化采集与结构化存储系统_新浪新闻实时抓取新闻正文提取新闻标题解析新闻发布时间戳记录新闻分类标签识别新闻来源追踪新闻图片.zip

Python数据抓取技术与实战.pdf

python学习抓取头条首页新闻

python爬虫项目——自动批量抓取m3u8网页视频

python爬虫，从网上自动爬取指定关键词的图像数据

Python-Python爬虫小脚本爬搜狐新闻列表存入数据库爬新闻新闻采集

python+selenium实现自动化百度搜索关键词

Python微信关键词自动回复

python实现抓取整个网站

从DOM分析，使用python开始爬取央视新闻网站.pdf

基于python爬虫+Github Action实现每天早上自动发送科技新闻到邮箱（Using Python web s

Python网页抓取讲解.pptx

糗事百科网站文本数据自动化抓取与存储项目_极简说明为使用Python脚本自动抓取糗事百科网站文本页面所有35个页面的笑话和故事内容并存储到本地数据库_内容关键词包括糗事百科网站文本.zip

python批量读取txt文件（读取指定行内容/统计关键词数量/读取指定关键词之间的内容/创建空白txt/统计行数和字符串数量）

Python 自动办公- Python爬虫爬取会计师协会网站的指定文章 Python源码

python自动化办公手册.pdf

python抓取并保存html页面时乱码问题的解决方法

Python实现爬虫抓取与读写、追加到excel文件操作示例

python 微信自动打卡脚本微信自动打卡脚本

实用自动化运维Python脚本分享

构建智慧警务大数据平台：全面技术架构设计解析

保姆级教程：用Wireshark抓包分析DoIP协议（从车辆发现到诊断通信）

CAPWAP隧道是怎么在AP和AC之间建立并传输数据的？

2020年互联网大厂薪资职级深度解析

3分钟搞懂dB/dBm/dBV区别：从放大器增益到噪声测量的完整对照表

基于 python获取教育领域新闻进行分词关键词词共现分析 Gephi 软件绘制主题知识图谱（附代码+报告）.rar