DeerFlow一文详解：基于LangStack的AI系统搭建步骤-程序员充电站

DeerFlow一文详解：基于LangStack的AI系统搭建步骤

1. 引言：你的深度研究助理来了

想象一下，你需要快速了解一个复杂的技术趋势，比如“大模型在医疗影像诊断中的应用”。传统的方式是什么？打开搜索引擎，输入关键词，在几十个网页里翻找、筛选、整理，最后再手动写成报告。这个过程耗时耗力，信息还可能不全面。

现在，有一个工具能帮你自动化完成这一切：DeerFlow。

DeerFlow是一个开源的深度研究助理。你只需要给它一个研究主题，它就能自动调用搜索引擎、网络爬虫、Python代码分析等多种工具，为你生成一份结构清晰、内容详实的报告，甚至还能把报告转换成一段生动的播客音频。

听起来很酷，对吧？这篇文章，我就带你从零开始，一步步搭建并运行这个强大的AI系统。无论你是想用它来辅助工作研究，还是想学习如何构建一个多智能体AI应用，这篇教程都能给你清晰的指引。

2. 认识DeerFlow：不只是个聊天机器人

在动手之前，我们先花几分钟了解一下DeerFlow到底是什么，以及它背后的技术栈。这能帮助你更好地理解后续的部署和操作。

2.1 核心能力：它能做什么？

DeerFlow不是一个简单的问答机器人。它是一个多智能体协作系统，可以理解为一个小型的研究团队：

深度研究：你提出一个开放性问题（如“分析2024年AI芯片市场格局”），它会自动规划研究步骤，搜索最新资料，并综合分析。
报告生成：研究完成后，它会自动整理成结构化的Markdown报告，包括摘要、核心观点、数据支持和引用来源。
播客创作：更厉害的是，它还能将生成的报告，通过文本转语音（TTS）服务，合成一段可以“听”的播客。
代码执行：在研究过程中，如果需要数据分析或图表绘制，它可以安全地运行Python代码来完成。

2.2 技术架构：LangStack与多智能体

DeerFlow是基于LangStack技术栈构建的。你可以把LangStack想象成一个乐高积木平台，而DeerFlow就是用这些积木搭建起来的一个复杂机器人。

它的核心是LangGraph，一个用于构建多智能体工作流的框架。在DeerFlow内部，有不同角色的“智能体”分工协作：

协调器：接收你的问题，并制定研究计划。
规划器：将大问题拆解成具体的搜索、分析等子任务。
研究员/编码员：负责执行搜索、阅读网页、运行代码等具体工作。
报告员：汇总所有发现，撰写最终报告。

这种架构让DeerFlow能处理非常复杂和开放的任务，而不仅仅是简单的一问一答。

2.3 核心组件与集成

为了让这个“研究团队”顺利工作，DeerFlow集成了许多强大的外部服务：

大模型引擎：项目内置了vLLM来高效部署和运行Qwen2.5-7B-Instruct模型，作为整个系统的“大脑”。
搜索引擎：支持集成Tavily、Brave Search等，用于获取实时、准确的网络信息。
文本转语音（TTS）：集成了火山引擎的TTS服务，这是生成播客的关键。
交互界面：提供了控制台（CLI）和网页（Web UI）两种方式与你互动，满足不同使用习惯。

了解了这些背景，我们就知道，部署DeerFlow不仅仅是启动一个服务，而是搭建一个包含模型服务、应用逻辑和前端界面的完整系统。接下来，我们进入实战环节。

3. 环境准备与一键部署

得益于项目良好的封装，部署DeerFlow的过程已经非常简化。我们假设你已经在CSDN星图镜像广场找到了DeerFlow的预置镜像并成功启动了一个云环境（如火山引擎FaaS）。下面的步骤主要在这个云环境内进行。

主要前提：你的环境应该已经预装了Python 3.12+ 和 Node.js 22+，这是DeerFlow运行的基础。

整个系统的启动分为两个核心服务：

大模型服务：由vLLM驱动，提供AI推理能力。
DeerFlow应用服务：包含所有业务逻辑和Web界面。

系统已经配置了启动脚本，我们首先需要确认这两个服务是否都正常运行。

4. 服务状态检查：两步确认

部署完成后，不要急着打开界面。我们先通过几条简单的命令，确保后台服务都已就绪。

4.1 检查大模型服务（vLLM）

大模型是DeerFlow的“发动机”。我们通过查看它的日志来确认是否启动成功。

打开终端，输入以下命令：

cat /root/workspace/llm.log

这条命令会显示vLLM服务的启动日志。你需要关注日志的末尾部分。

如何判断启动成功？如果看到类似下面的关键信息，就说明模型服务已经正常加载并开始监听请求了：

Uvicorn running on http://0.0.0.0:8000(服务地址)
Loaded the model in ... s(模型加载完成)
没有出现持续的ERROR报错信息。

服务启动成功的示意图如下：

（示意图：日志末尾显示模型加载完成和HTTP服务启动信息）

4.2 检查DeerFlow应用服务

模型服务OK之后，我们再来检查主应用服务。同样，通过查看它的启动日志：

cat /root/workspace/bootstrap.log

如何判断启动成功？查看日志末尾，寻找这些关键信号：

Application startup complete.或DeerFlow server is running on ...
Connected to LLM backend at ...(表示成功连接到了上一步的模型服务)
Web UI available at ...(提示Web界面的访问地址)

服务启动成功的示意图如下：

（示意图：日志显示应用启动完成，并连接了LLM后端）

如果检查失败怎么办？如果日志中显示启动失败或错误，最常见的原因是模型服务未启动或端口冲突。请确保先成功完成第4.1步。如果问题持续，可以尝试查阅/root/workspace/目录下更详细的错误日志文件。

两个服务的日志都显示成功之后，恭喜你，DeerFlow的后台系统已经准备就绪！现在，让我们去前端看看它的样子。

5. 快速上手：使用Web界面进行研究

DeerFlow提供了一个直观的Web界面，让所有复杂的研究任务都能通过简单的对话完成。

5.1 访问Web界面

在云服务环境中，通常可以通过点击提供的“WebUI”链接或访问指定的端口号来打开界面。操作示意图如下：

界面打开后，你会看到一个简洁的聊天窗口。

5.2 开始你的第一次研究

在输入框上方或侧边栏，找到一个类似“开始新研究”或“深度研究”的按钮（通常比较醒目）。点击它，告诉系统你要启动一个复杂的任务，而不是简单聊天。

5.3 输入研究主题并观察

点击按钮后，就可以在输入框中提出你的研究主题了。尽量描述得清晰、具体。

举个例子：

不好的提问：“AI”
好的提问：“请深入分析一下，对比GPT-4o和Claude 3.5 Sonnet，在代码生成能力上各自有什么优势和特点？最好能结合2024年的一些评测报告。”

输入问题后，点击发送。这时，神奇的事情就开始了。

你会看到：

规划阶段：DeerFlow会先“思考”，输出一个初步的研究计划，比如“1. 搜索最新的对比评测文章；2. 查找官方技术文档；3. 分析代码生成的具体案例...”。
执行阶段：系统会像一个真正的助手一样，一条条地汇报进度：“正在搜索...”、“找到了X篇文章，正在分析...”、“根据Y报告，发现...”。
生成阶段：最后，它会输出一份完整的Markdown格式报告。报告中通常会包含摘要、分点论述、数据引用来源，甚至可能还有它自动生成的简单分析图表。

在这个过程中，你可以泡杯咖啡，等待你的“个人研究助理”为你完成所有繁重的信息搜集和整理工作。

6. 进阶使用与技巧

掌握了基本操作后，这里有一些小技巧能让你用得更好：

主题具体化：问题越具体，DeerFlow的研究方向就越明确，生成报告的质量也越高。
利用播客功能：在报告生成后，看看界面是否有“生成播客”或“转换为音频”的选项。这个功能非常适合用来快速制作内容简报或在自己通勤时“听”报告。
理解其局限：DeerFlow依赖于网络搜索的结果，所以对于极其前沿（当天发生）或需要访问付费墙后内容的话题，它可能无法获取最佳信息。它的分析基于所搜到的资料，不能替代真正的领域专家判断。
查看执行详情：Web界面有时会提供“查看详细步骤”的选项，让你能了解它具体搜索了哪些关键词、参考了哪些网页，这对于追溯信息来源非常有帮助。

7. 总结

通过以上步骤，我们完成了从理解、部署到使用DeerFlow的全过程。我们来回顾一下关键点：

DeerFlow是什么：一个基于LangStack（LangGraph）构建的开源多智能体深度研究系统，能自动化完成信息搜索、分析、报告撰写乃至播客生成。
部署核心：部署关键是确保两大服务正常运行——vLLM模型服务和DeerFlow主应用服务。通过检查llm.log和bootstrap.log可以快速确认状态。
使用精髓：通过Web界面，使用“深度研究”模式，输入具体、明确的研究主题，然后观察多智能体协作完成任务的整个过程。
价值所在：它极大地提升了获取和整合公开领域信息的效率，是研究人员、内容创作者、市场分析师和广大求知者的强大效率工具。

DeerFlow展示了如何将大模型、多智能体工作流和各类工具链（搜索、代码、TTS）有机结合，构建出解决复杂实际问题的AI应用。希望这篇教程能帮助你顺利启动这个强大的工具，并启发你探索更多AI应用的可能性。