news 2026/6/10 17:15:35

MiroThinker:开源搜索代理模型助力高效研究

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
MiroThinker:开源搜索代理模型助力高效研究

MiroThinker 是一个开源的搜索代理模型,旨在通过工具增强推理和现实世界信息搜索的能力,实现与 OpenAI Deep Research 和 Gemini Deep Research 之间的深度研究体验相匹配。

🚀 MiroThinker 概述

MiroThinker 是 MiroMind 的旗舰研究代理模型,旨在提升工具辅助推理和信息搜寻的能力,使复杂的现实研究工作流能够应对各种挑战。其核心功能包括:

  • MiroThinker:开放源代码的搜索模型,原生支持工具辅助推理,在多个基准测试中取得领先性能。
  • MiroFlow:开放源代码的研究代理框架,提供可复现的尖端性能。
  • MiroVerse:支持研究代理训练的优质开放源数据集,包含 147,000 个样本。
  • MiroTrain / MiroRL:支撑研究代理模型稳健高效训练的基础设施。

✨ 主要特点

1. MiroThinker v1.5

MiroThinker v1.5 是全球领先的开源搜索代理,支持 256K 上下文窗口、长期推理和深入的多步骤分析。它的特点包括:

  • 处理每个任务最多400 次工具调用,相较于之前的代理实现了显著提升。
  • 提供30B 和 235B参数规模的多种可扩展选项,适应不同的研究环境和计算预算。
模型名称基础模型最大上下文最大工具调用HuggingFace 链接
MiroThinker-v1.5-30BQwen3-30B-A3B-Thinking-2507256K400🤗 link
MiroThinker-v1.5-235BQwen3-235B-A22B-Thinking-2507256K400🤗 link

MiroThinker v1.5 在多个基准上实现了强劲的研究表现,如 HLE-Text 达到 39.2%,BrowseComp 达到 69.8%,并在 GAIA-Val-165 中达到了 80.8%。这些结果超越了之前的开放源代理,并设立了新的世界领先水平。

2. MiroThinker v1.0

与之前仅依赖模型规模或上下文长度进行扩展的模型不同,MiroThinker v1.0 引入了交互式扩展,系统性地训练模型处理更深和更频繁的代理-环境交互。

其特点包括:

  • 600 次工具调用,极大地拓展了可处理的信息量。
  • 8B、30B 和 72B参数规模发布,提供全面的工具和工作流套件,灵活支持多样的研究设置与计算预算。
模型名称基础模型最大上下文最大工具调用HuggingFace 链接
MiroThinker-v1.0-8BQwen3-8B256K600🤗 link
MiroThinker-v1.0-30BQwen3-30B-A3B-Thinking-2507256K600🤗 link
MiroThinker-v1.0-72BQwen2.5-72B-Instruct256K600🤗 link

MiroThinker v1.0 在 HLE-Text 和 BrowseComp 上的性能也显示出显著提高,分别达到 37.7% 和 55.6%。

3. 训练数据与基础设施

MiroVerse 提供丰富的训练数据集,支持高清晰度的研究代理训练。利用 MiroTrain 和 MiroRL,用户可以轻松构建稳定的训练环境,确保研究代理模型效率最大化。

📈 基准测试表现

MiroThinker 在各项基准测试中的表现令人瞩目,特别是在复杂任务中的准确性和深度推理能力上,展示了其在现实应用场景中的强大适应性。

🚀 快速开始

环境要求

  • Python 3.10+
  • uv 包管理器(安装指南)
  • 需要的 API 密钥(请参阅配置部分)

安装步骤

# 克隆仓库gitclone https://github.com/MiroMindAI/MiroThinkercdMiroThinker# 设置环境cdapps/miroflow-agent uvsync# 配置 API 密钥cp.env.example .env# 编辑 .env 文件以添加您的 API 密钥(如 SERPER_API_KEY, JINA_API_KEY 等)

工具配置

MiroThinker 的工具配置涉及多个 API 集成,以支持搜索、信息抽取和代码执行等功能。

示例配置
# 最小配置示例SERPER_API_KEY=your_serper_keySERPER_BASE_URL="https://google.serper.dev"JINA_API_KEY=your_jina_keyJINA_BASE_URL="https://r.jina.ai"E2B_API_KEY=your_e2b_key

运行第一个任务

设置完环境后,运行main.py来测试默认问题:“今天计算机科学领域的 arxiv 论文标题是什么?”

cdapps/miroflow-agent# 使用 MiroThinker 模型uv run python main.pyllm=qwen-3agent=mirothinker_v1.5_keep5_max200 llm.base_url=http://localhost:61002/v1

对比同类项目

MiroThinker 作为一个开源项目,其具有与其他研究代理模型的竞争优势。例如,WebThinkerWebAgents也专注于提供高效的信息检索和处理能力。MiroThinker 的优势在于对交互式扩展的支持,它能在模型规模和上下文长度外,通过实时反馈进一步提升性能,满足更为复杂的任务要求。

如需了解更多关于类似项目的信息,可以访问他们的 GitHub 页面。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/9 19:45:23

【AI大模型开发】-创建RAG问答实战(LangChain+DeepSeek+Faiss)

1. 项目简介 ChatPDF-Faiss 是一个基于 FAISS 向量数据库的 PDF 文档智能问答系统,能够从 PDF 文档中提取信息并回答用户的问题。该系统利用了阿里云 DashScope API 提供的文本嵌入和大语言模型能力,实现了对 PDF 文档的高效检索和智能问答。 1.1 核心功…

作者头像 李华
网站建设 2026/6/10 6:41:22

基于Java+SpringBoot+SSM思政考核管理系统(源码+LW+调试文档+讲解等)/思政管理系统/考核管理系统/思想政治教育系统/思政工作管理系统/思政评估管理系统

博主介绍 💗博主介绍:✌全栈领域优质创作者,专注于Java、小程序、Python技术领域和计算机毕业项目实战✌💗 👇🏻 精彩专栏 推荐订阅👇🏻 2025-2026年最新1000个热门Java毕业设计选题…

作者头像 李华
网站建设 2026/6/10 2:52:28

未来JS架构:Realm隔离——从全局共享到独立环境的必然

绝大多数开发者都清楚:执行不受信任的JavaScript代码存在显著风险。然而,直到深入理解某一特性后我才意识到——过去我们往往是在进行缺乏根本性解决的修补,借助各种临时方案勉强维持系统运行。 你可能遇到过这样的场景:为执行第…

作者头像 李华
网站建设 2026/6/10 6:42:47

科研级 YOLOv8 改进实战:ODConv 动态卷积助力特征提取突破瓶颈

文章目录 科研级YOLOv8改进:ODConv动态卷积助力,让特征提取突破瓶颈的实战指南 一、为何ODConv是特征提取的革新之选? 二、ODConv与传统卷积的原理博弈 2.1 ODConv的动态提取智慧 2.2 传统卷积的局限 三、核心代码实现:从ODConv到动态特征提取 四、分步集成:让YOLOv8换上O…

作者头像 李华
网站建设 2026/6/10 7:11:35

pcacli.dll文件丢失找不到 免费下载方法分享

在使用电脑系统时经常会出现丢失找不到某些文件的情况,由于很多常用软件都是采用 Microsoft Visual Studio 编写的,所以这类软件的运行需要依赖微软Visual C运行库,比如像 QQ、迅雷、Adobe 软件等等,如果没有安装VC运行库或者安装…

作者头像 李华
网站建设 2026/6/10 7:53:38

face_recognition`这个Python库,它是基于dlib实现的人脸检测/识别工具

你现在关注的是face_recognition这个Python库,它是基于dlib实现的人脸检测/识别工具,上手简单且功能实用。结合你之前安装dlib的背景,我会帮你把face_recognition的安装、核心用法和注意事项讲清楚,确保你能快速用起来。 一、先完…

作者头像 李华