news 2026/4/17 21:59:51

在Trae上使用Bright Data MCP采集数据

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
在Trae上使用Bright Data MCP采集数据

不知道你发现没,由于现在ChatGPT、DeepSeek、Gemini、豆包等AI大模型的兴起,大家的搜索习惯发生了很大变化,传统的谷歌、百度、必应搜索像是老古董,已经没法满足用户对信息准确性、及时性、高质量的要求了,甚至懒得点开一个个网页去找答案。

其实网页爬虫也一样,爬虫说到底就是收集数据,和你平时浏览网页没区别,只不过是用脚本批量化的去采集数据,AI大模型的出现让爬虫也开始进化,传统的Python爬虫、软件爬虫在慢慢被AI爬虫取代,比如说我常用的一个数据采集MCP-Bright Data MCP,能通过Trae这样的Agent调用,直接用自然语言就可以采集目标网站的数据,完全不用写代码,甚至你都不用打开目标网站。

最近刚好苹果发布新iPhone,我用Bright Data MCP获取最新的iPhone 17价格信息,能实时采集且不需要我处理任何网站限制的问题,我把采集来的信息写成了一个可视化看板,用来实时监测价格信息。

当然这只是自娱自乐的玩意,且是小批量采集公开数据,要遵守网站规定噢。

在这里插入图片描述

以上做的事情分为三个步骤,第一是在Trae上配置Bright Data MCP服务,第二是搭建智能体,给到数据采集需求,第三是将反馈的数据开发成可视化看板,咱们会详细讲解每个步骤实现过程。

一、在Trae上配置Bright Data MCP服务

首先要介绍下什么是MCP,它的学名是“模型上下文协议”,你可以理解成它是连接AI大模型和外部工具的一个媒介,类似于电脑和互联网的关系,大模型原先只是封闭的大脑,有了MCP后它就连接了无数的信息、工具、数据,可以做更多的事情,比如Bright Data MCP能实现复杂网站的数据采集。

讲到Bright Data MCP,它是亮数据开发的一款专门用于网络数据采集、搜索的MCP服务,可以最大的特点是可以自动处理各种网站的反爬机制,不需要你考虑什么IP识别、人机检测等技术细节,把爬虫所有能遇到的封禁问题都在后台解决了,你只需要专注于提问聊天就行。

亮数据会送新用户3个月免费额度,每个月5000次MCP请求,完全够用了。

https://get.brightdata.com/wmcp

Bright Data MCP能在Trae、Cluade Code、Cursor等Agent中部署,以Trae为例,主要分为3个步骤。

1、注册亮数据账号,获取MCP API key

你可以直接去亮数据网站注册,注册好后在账户设置-用户管理界面生成专用API key。

https://get.brightdata.com/wmcp

2、获取MCP服务信息

同样在亮数据后台,有个MCP功能区,里面提供了本地和远程两种MCP模式,建议用本地MCP,自己搭建也不复杂,而且相对灵活。

复制上面的MCP配置信息,以及之前申请的Key,留着备用。

这里讲下Bright Data MCP的4个核心组件,分别是search_engine用于搜索引擎抓取、web_scraper用于处理反爬机制、search_engine_batch用于批量搜索引擎抓取、scrape_batch用于批量网页抓取,它们相互配合能采集非常复杂的网页数据。

3、在Trae中配置MCP

Trae是近一年比较流行的AI编辑器,字节开发的产品,类似于VsCode,但Trae有更强的AI编程能力,比如搭建智能体、布置MCP等。

在Trae的AI功能管理中选择手工添加MCP,开始配置信息。

接下来,在配置框里粘贴刚刚在亮数据后台复制的MCP配置信息。

补充一点,配置MCP需要电脑安装Node.js,如果没安装Trae会提醒你安装,直接同意即可。

接下来你就会在MCP界面看到配置好的Bright Data MCP。

MCP服务需要在智能体中使用,接下来我在Trae中创建一个名为“EasySearch”的智能体,并勾选Bright Data MCP服务,还要注意设置初始提示词,告诉智能体它是干什么的,需要在提示语里告诉它用Bright Data MCP。

在这里插入图片描述

到这一步,你就可以用Bright Data MCP来采集数据了。

打开Trae AI对话框,选择刚创建的“EasySearch”智能体,直接问它:

请你梳理美国amazon、苹果官网上iphone17全系列最新价格、配置信息、链接、日期, 以列表形式输出,呈现各平台的对比

该智能体就会自动调用Bright Data MCP服务,去采集网站上iPhone17的价格信息。

最后你会得到结构化的Excel数据,清晰明了。

针对该数据,你还可以让Trae开发一个可视化看板,用于展示。

除了Trae,一些Vscode插件也支持部署Bright Data MCP服务,比如Cline,直接设置远程MCP服务,非常简单。

在亮数据后台复制远程MCP配置信息。

在Cline 远程MCP配置界面粘贴Bright Data MCP配置信息。

提问Cline,它会自动调用Bright Data MCP来采集数据。

总的来说,AI爬虫已经成为不可逆的趋势,完全不需要写代码处理网页,几乎零门槛,而且能很好的和一些智能体结合,做出不错的产品,比如手机的价格监测应用,运营的好也能带来不错的效果。

你可以拿Bright Data MCP练练手,刚好亮数据会送新用户3个月免费额度,每个月5000次MCP请求,足够开发一个小应用了。

https://get.brightdata.com/wmcp

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 3:53:20

用Glyph做论文摘要:超长学术文档处理实战分享

用Glyph做论文摘要:超长学术文档处理实战分享 1. 为什么传统方法在论文摘要上总卡壳? 你有没有试过把一篇30页的PDF论文丢给大模型,让它生成摘要?结果往往是:前两页还能跟上,到第十五页就开始胡说&#x…

作者头像 李华
网站建设 2026/4/18 3:53:23

FSMN-VAD按需计费方案:私有化部署成本优化实战

FSMN-VAD按需计费方案:私有化部署成本优化实战 1. 为什么语音端点检测需要“按需计费”思维? 你有没有遇到过这样的情况:公司采购了一套语音识别系统,结果发现真正卡脖子的不是ASR模型本身,而是前端预处理——大量音…

作者头像 李华
网站建设 2026/4/10 11:23:55

Qwen3-1.7B嵌入式设备适配:边缘计算部署可行性分析

Qwen3-1.7B嵌入式设备适配:边缘计算部署可行性分析 1. Qwen3-1.7B模型定位与轻量化特征 Qwen3-1.7B是通义千问系列中面向资源受限场景设计的紧凑型语言模型,参数量约17亿,在保持基础语义理解、指令遵循和多轮对话能力的同时,显著…

作者头像 李华
网站建设 2026/4/13 15:04:29

AI文字检测太难?试试这个一键启动的WebUI工具

AI文字检测太难?试试这个一键启动的WebUI工具 OCR文字检测常被低估——它不像大模型聊天那样引人注目,却在文档处理、票据识别、教育辅助、内容审核等真实场景中承担着“看不见的基建”角色。但现实是:部署一个可用的OCR检测服务&#xff0c…

作者头像 李华
网站建设 2026/4/16 15:05:16

数据稀缺场景离心泵轴承故障检测与诊断【附代码】

✅ 博主简介:擅长数据搜集与处理、建模仿真、程序设计、仿真代码、论文写作与指导,毕业论文、期刊论文经验交流。 ✅成品或者定制,扫描文章底部微信二维码。 (1) 托辊故障声学机理分析与信号采集优化 托辊故障声学诊断的基础在于深入理解故障…

作者头像 李华
网站建设 2026/4/10 19:57:26

双电机线控转向容错控制策略【附代码】

✅ 博主简介:擅长数据搜集与处理、建模仿真、程序设计、仿真代码、论文写作与指导,毕业论文、期刊论文经验交流。 ✅成品或者定制,扫描文章底部微信二维码。 (1) 双电机协同控制与同步性能优化 双电机线控转向系统采用并联驱动架构,两台电机…

作者头像 李华