news 2026/6/16 11:49:25

【iManus】通用 Agent 架构实现技术实现原理剖析:Plan-Act, sandbox, 操作浏览器,执行代码,shell,读写文件等

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【iManus】通用 Agent 架构实现技术实现原理剖析:Plan-Act, sandbox, 操作浏览器,执行代码,shell,读写文件等

【iManus】通用 Agent 架构实现技术实现原理剖析:Plan-Act, sandbox, 操作浏览器,执行代码,shell,读写文件等

AI Manus 是一个通用的 AI Agent 系统,可以完全私有部署,支持在沙盒环境中运行各种工具和操作。

AI Manus 项目目标是希望成为可完全私有部署的企业级 Manus 应用。垂类 Manus 的应用有多种重复性的工程化工作,这个项目希望把这部分统一,让大家可以像搭积木一下建立起一个垂类 Manus 应用。

AI Manus 中每个服务与工具都包含一个 Built-in 版本,可以做到完全私有部署。后续可以通过 A2A 与 MCP 协议,把 Built-in 的 Agent 与 Tools 都置换掉。底层基建也可以通过提供多样的提供商配置或者简单的开发适配置换掉。AI Manus 从架构设计上便支持分布式多实例部署,方便横向扩展,达到企业级的部署要求。

文章目录

  • 【iManus】通用 Agent 架构实现技术实现原理剖析:Plan-Act, sandbox, 操作浏览器,执行代码,shell,读写文件等
    • 核心功能
  • ⚙️ 系统架构
    • 整体设计
  • 🚀 快速上手
    • 环境准备
    • Docker 安装
      • Windows & Mac 系统
      • Linux 系统
    • 部署
  • MCP 配置
    • 简介
    • 演示
    • 配置说明
      • MCP 配置文件
        • 配置文件结构
        • 当前配置示例
      • Docker Compose 配置
    • 更多资源
  • 📋 配置说明
    • 配置项
      • 模型提供商配置
      • 模型配置
      • MongoDB 配置
      • Redis 配置
      • 沙箱配置
      • 搜索引擎配置
        • Google 搜索配置
      • 认证配置
        • 密码认证配置
        • 本地认证配置
      • JWT 配置
      • 邮箱配置
      • MCP 配置
      • 日志配置

核心功能

部署:最小只需要一个 LLM 服务即可完成部署,不需要依赖其它外部服务。
工具:支持 Terminal、Browser、File、Web Search、消息工具,并支持实查看和接管。
沙盒:每个 Task 会分配单独的一个沙盒,沙盒在本地 Dock 环境里面运行。
任务会话:通过 Mongo/Redis 对会话历史进行管理,支持后台任务。
对话:支持停止与打断,支持文件上传与下载。
多语言:支持中文与英文。
认证:用户登录与认证。

⚙️ 系统架构

整体设计

当用户发起对话时:

  1. Web 向 Server 发送创建 Agent 请求,Server 通过/var/run/docker.sock创建出 Sandbox,并返回会话 ID。
  2. Sandbox 是一个 Ubuntu Docker 环境,里面会启动 chrome 浏览器及 File/Shell 等工具的 API 服务。
  3. Web 往会话 ID 中发送用户消息,Server 收到用户消息后,将消息发送给 PlanAct Agent 处理。
  4. PlanAct Agent 处理过程中会调用相关工具完成任务。
  5. <
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 12:24:59

MediaGo:终极m3u8下载教程,快速掌握流媒体视频提取

MediaGo&#xff1a;终极m3u8下载教程&#xff0c;快速掌握流媒体视频提取 【免费下载链接】m3u8-downloader m3u8 视频在线提取工具 流媒体下载 m3u8下载 桌面客户端 windows mac 项目地址: https://gitcode.com/gh_mirrors/m3u8/m3u8-downloader 还在为无法下载在线视…

作者头像 李华
网站建设 2026/6/10 15:25:31

Qwen3-4B-Instruct代码生成实战:编程助手系统搭建教程

Qwen3-4B-Instruct代码生成实战&#xff1a;编程助手系统搭建教程 1. 引言 1.1 学习目标 本文旨在指导开发者从零开始&#xff0c;基于阿里开源的大语言模型 Qwen3-4B-Instruct-2507 搭建一个可实际运行的编程助手系统。通过本教程&#xff0c;读者将掌握&#xff1a; 如何…

作者头像 李华
网站建设 2026/6/15 22:33:50

电商客服实战:用Sambert快速搭建多情感语音应答系统

电商客服实战&#xff1a;用Sambert快速搭建多情感语音应答系统 1. 引言&#xff1a;智能客服的语音表达力升级需求 在当前电商服务场景中&#xff0c;自动化客服系统已广泛应用于售前咨询、订单查询、售后处理等环节。然而&#xff0c;传统的文本回复或机械式语音播报往往缺…

作者头像 李华
网站建设 2026/6/15 17:31:18

环世界模组管理终极指南:告别加载混乱,轻松打造完美殖民地

环世界模组管理终极指南&#xff1a;告别加载混乱&#xff0c;轻松打造完美殖民地 【免费下载链接】RimSort 项目地址: https://gitcode.com/gh_mirrors/ri/RimSort 还在为环世界模组管理头疼吗&#xff1f;当你精心收集了几百个模组&#xff0c;准备大展身手时&#x…

作者头像 李华
网站建设 2026/6/10 12:27:25

从零部署DeepSeek-OCR:CUDA升级、vLLM集成与Docker发布

从零部署DeepSeek-OCR&#xff1a;CUDA升级、vLLM集成与Docker发布 1. 引言&#xff1a;为何需要构建高性能OCR推理服务&#xff1f; 在企业级文档自动化处理场景中&#xff0c;传统OCR工具已难以满足日益复杂的业务需求。DeepSeek-OCR作为一款基于深度学习的先进光学字符识别…

作者头像 李华