01 Agent 到底是什么?
普通大模型,只会回答。Agent 不一样,它可以先判断,再行动,再根据结果继续判断。
一句话:Agent = 会使用工具的大模型循环。
用户问“帮我分析这只股票今天为什么涨”,普通问答可能直接编。Agent 会先查行情,再查公告,再查新闻,再把结果合在一起回答。
这就是差别。不是模型更神,而是模型被接到了真实系统上。
02 为什么固定 Chain 不够?
Chain 适合固定流程。比如企业知识库问答:检索,拼上下文,调用模型,返回答案。流程清晰,稳定,可控。
但真实任务经常不固定。用户的问题可能需要查订单,也可能需要查数据库,也可能需要查网页,也可能先检索再计算。你提前写死所有分支,代码会越来越乱。
Agent 的价值,就是把“下一步做什么”交给模型判断。
但注意:不是把一切都交给模型。模型只负责决策。真正执行,还是工具和业务系统。
03 LangChain 里的 Agent,不是玄学
LangChain 官方现在把 Agent 讲得很清楚:Agent 是模型在循环中调用工具,直到任务完成。围绕这个循环,还有一层 harness,也就是模型、Prompt、工具、中间件、状态、检查点这些工程能力。
所以 LangChain Agent 不是一个“神秘智能体”。它更像一个可运行的图:模型节点负责判断,工具节点负责执行,状态负责保存消息,路由负责决定继续还是结束。
04 create_agent 做了什么?
从使用者看,create_agent 很简单:传模型,传工具,传系统提示词。
from langchain.agents import create_agent
from langchain.tools import tool
@tool
def query_order(order_id: str) -> str:
"""查询订单状态"""
return "订单已发货,预计明天到达"
agent = create_agent(
model="openai:gpt-5.5",
tools=[query_order],
system_prompt="你是一个客服助手,回答必须简洁准确。"
)
result = agent.invoke({
"messages": [{"role": "user", "content": "帮我查订单 123"}]
})
从源码视角看,create_agent 不是简单返回一个函数。它会创建一个 Agent Graph。这个 Graph 里至少有模型节点和工具节点。模型节点输出 tool_calls,工具节点执行工具,再把结果写回 messages。
如果模型还要继续调用工具,就继续循环。如果模型不再返回 tool_calls,就结束。
05 Agent 的状态核心:messages
Agent 不是靠一个字符串记上下文。它靠状态。状态里最重要的字段,就是 messages。
messages 里会依次保存用户消息、模型消息、工具调用、工具返回、最终回答。每一轮模型调用,都会读取这组消息。
这也是为什么前面我们专门讲过 Messages。Agent 是 Messages 的高级用法。
06 Agent Loop 怎么跑?
源码链路可以压缩成五句话。
第一步,agent.invoke() 把用户输入写入 State。
第二步,图运行时进入 model node。
第三步,model node 把 messages、system_prompt、tools 组装好,调用模型。
第四步,模型如果返回 tool_calls,图会路由到 tools node;tools node 执行工具,生成 ToolMessage。
第五步,ToolMessage 进入 messages,图再回到 model node。直到模型不再返回 tool_calls。
所以 Agent 的本质不是“模型会思考”。而是“模型输出动作,系统执行动作,结果再喂回模型”。
07 Tool Calling 和 Agent 的关系
上一章讲 Tool Calling,我们只讲到模型怎么选择工具。到了 Agent,这个动作被自动循环起来。
手动 Tool Calling 是你自己写 while 循环:发现 tool_calls,就执行工具,再把结果塞回模型。
Agent 是 LangChain 帮你把这个循环封装好。
但封装不等于不用理解。线上排查时,你一定要知道:模型有没有返回 tool_calls?工具有没有执行?ToolMessage 有没有回填?最后有没有再次调用模型?
08 什么场景适合 Agent?
不是所有任务都要 Agent。能固定流程,就别上 Agent。Agent 强在动态决策,也贵在动态决策。
一句话:固定流程用 Chain。动态工具调用用 Agent。复杂审批和状态机用 LangGraph。
09 Agent 的能力边界
Agent 很强,但也危险。它可能选错工具,可能传错参数,可能重复调用,可能把成本打爆。
所以生产环境不能让 Agent 裸奔。
工具必须白名单。参数必须校验。高风险动作必须人工确认。工具结果必须审计。模型失败必须降级。
10 企业项目里怎么落地?
推荐架构还是老规矩:Java 主服务做业务,Python AI 服务做 Agent。
Java 负责鉴权、用户、订单、权限、审计。Python 负责 LangChain、模型、工具、RAG、Agent 编排。
Agent 不直接碰生产数据库。它通过受控工具访问业务系统。每次调用都要有 requestId、userId、toolName、args、result、cost、latency。
11 智能客服里的 Agent 怎么跑?
用户问:我的订单怎么还没到?
Agent 第一轮调用模型。模型判断需要查订单,于是返回 query_order 工具调用。
工具节点查询订单系统,返回物流状态。
模型第二轮读取 ToolMessage,发现还需要查售后规则,于是调用 policy_search。
拿到规则后,模型生成最终答案:订单当前在哪,预计多久到,是否可以补偿,下一步怎么做。
这就是 Agent 比普通 RAG 更强的地方:它不是只查一次资料,而是会根据中间结果继续行动。
12 源码理解的关键点
理解 Agent,不要背概念。抓住四个点就够。
第一,Agent 的输入输出是 State,不只是字符串。
第二,State 里最关键的是 messages。
第三,模型是否返回 tool_calls,决定图往哪里走。
第四,工具执行结果必须变成 ToolMessage,再喂回模型。
这四点明白了,LangChain Agent 就不玄了。
14 总结
Chain 是固定流水线。Agent 是动态决策循环。
Tool Calling 是单次工具选择。Agent 是把工具选择、工具执行、结果回填、再次判断串成循环。
create_agent 的价值,不是少写几行代码,而是把模型、工具、Prompt、中间件、状态和运行时组织成一个可控的 Agent Graph。
真正落地时,Agent 不能裸奔。必须有权限、审计、限流、超时、人工确认和降级兜底。
下一章,我们继续讲新版 LangChain 的核心入口:create_agent。重点看它的参数、运行图、状态 schema、中间件和结构化输出。
内容来源:LangChain 系列之Agent:从固定流程到模型自主决策:功能变化与行业影响解析_热闻岛