news 2026/6/10 18:08:47

AgentCore新增四大功能,为Agent落地扫清困难

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AgentCore新增四大功能,为Agent落地扫清困难

re:Invent 2025,亚马逊云科技带来一系列重磅发布,掀起全球云计算创新浪潮。为帮助开发者们深入了解各项技术创新成果、上手使用最新功能,特推出本系列解读文章,助您探索云上未来的无限可能!

re:Invent 2025,亚马逊云科技宣布Amazon Bedrock AgentCore(仅海外业务使用)新增多项功能,旨在进一步扫清阻碍AI Agent投入生产部署的各种困难。

目前,各行各业均已利用AgentCore开展相关开发工作,这一业界卓越的Agent开发服务,能够帮助用户安全构建、部署和运行各种规模的高性能Agent。自2025年7月发布预览版以来,在短短5个月内,AgentCore SDK的下载量已突破200万次。以下为部分应用案例:

  • 作为体育领域的先驱与创新标杆,PGA TOUR构建了一套多Agents内容生成系统,专门为其数字平台创作文章。这套依托AgentCore构建的全新解决方案,帮助PGA TOUR将内容撰写效率提升10倍,同时成本降低95%,更好地为赛场选手提供全方位的赛事报道。

  • 独立软件供应商(ISVs)Workday,正基于AgentCore打造未来的软件产品。AgentCore Code Interpreter为Workday规划Agent提供了安全的数据保护功能,以及支撑金融数据探索分析的核心功能。用户可通过自然语言查询分析财务与业务运营数据,让财务规划工作变得清晰直观且易于自主操作。这项能力将常规规划分析工作耗时缩短30%,每月可节省约100小时

  • 巴西分销零售企业Grupo Elfa,借助AgentCore Observability,实现了对其Agent的全面审计追溯与实时指标监控,将企业原本被动响应的业务流程,转变为主动预判的运营模式。依托这一服务,该公司销售团队日均能够处理数千份报价请求,企业也能够全面掌握Agent的决策过程。这不仅助力企业达成了Agent决策与交互行为100%可追溯的目标,更将问题解决时间缩短50%

随着企业加速Agent规模化部署,他们在设定合理的运行边界与开展质量校验方面遭遇诸多挑战,难以放心部署Agent。Agent所具备的自主性是其强大功能的主要来源,但这一特性也让规模化部署变得困难重重,因为Agent可能会不当访问敏感数据、做出未经授权的决策,或是执行超出预期的操作。开发团队必须在赋予Agent充分自主性的同时,确保其在合规边界内运行,并保障Agent达到能向客户与员工交付的质量标准。

AgentCore新功能将消除这一过程中的不确定性,助力用户构建并部署值得信赖的AI Agent:

Policy in AgentCore(预览版)

该功能通过细粒度权限策略,在AgentCore Gateway工具调用执行前进行拦截校验,从而为Agent的行为划定明确边界。

AgentCore Evaluations(预览版)

利用对准确性、实用性等核心维度进行测评的内置评估器,以及针对特定业务需求的自定义评估器,来基于Agent的真实运行表现开展质量监控。

此外,AgentCore还推出多项新功能,进一步拓展Agent的能力边界:

AgentCore Memory情景记忆功能

这是一项全新的长期策略机制,可助力Agent从过往运行经验中学习,并在类似情境中灵活调整解决方案,提升未来执行同类任务时的一致性与性能表现。

AgentCore Runtime双向流式传输功能

支持部署语音交互Agent,让用户能够以自然流畅的交流节奏,与Agent进行实时双向对话。

Policy in AgentCore

精准管控Agent

Policy in AgentCore功能支持用户管控Agent的操作权限范围,其作用机制独立于Agent的推理流程之外。该功能将Agent视为具备自主决策能力的主体,要求Agent的决策必须经过验证之后,再触达工具、系统或数据。这一功能与AgentCore Gateway集成,可在工具调用发生时实时拦截,在保持操作速度的同时处理请求,确保工作流始终能够快速响应。

用户既可以使用自然语言创建策略,也可以直接使用Cedar(一种专为细粒度权限管控设计的开源策略语言),您无需编写自定义代码,即可简化规则的设定、理解与审计流程。这一功能让开发、安全与合规团队无需掌握专业编程知识,也能创建、解读与审查规则。

策略规则独立于Agent的构建方式或所采用的模型。您可以定义Agent可访问的工具与数据(包括API、Amazon Lambda函数、MCP服务器与第三方服务)、可执行的操作以及执行操作的具体条件。

团队只需一次配置清晰的策略规则,即可在整个企业范围内统一应用。策略部署到位后,开发者能够自由创新Agent交互体验,企业也可放心部署Agent自主运行,同时确保其始终在既定的权限边界与合规要求内行动。

Policy in AgentCore使用指南

您可以在AgentCore控制台新增的“Policy”板块中创建一个策略引擎,并关联一个或多个AgentCore Gateway。

策略引擎是一组在网关端点进行评估的策略集合。将网关与策略引擎关联时,您可以选择是否强制执行策略评估结果——即直接允许或拒绝对应的工具调用请求,也可以选择仅生成日志。使用日志有助于用户在生产环境中应用策略之前,测试与验证策略。

然后,您可以定义需要应用的策略,从而对关联的AgentCore Gateway所提供工具的访问权限进行精细管控。

创建策略时,您可以从自然语言描述入手(描述内容需包含要使用的身份验证声明信息),也可以直接编辑Cedar代码。

基于自然语言的策略编写功能,为您提供了一种更易上手的细粒度策略创建方式。您无需编写标准化的策略代码,而是只需用简洁的英文描述规则即可。系统会解读您的意图,生成候选策略,对照工具架构进行验证,并运用自动推理机制检查安全条件,识别出权限过于宽松、过于严格或包含无法满足条件的指令。

不同于通用大语言模型(LLM)的转译功能,该功能可以理解工具的结构逻辑,生成的策略不仅语法严谨规范,并且也与您的真实意图相匹配,同时还会标记出无法执行的规则。该功能也可作为MCP服务器使用,因此您可以直接在偏好的AI辅助编码环境中编写和验证策略,将其融入日常开发工作流程。这种方式能有效缩短上手时间,让您无需掌握Cedar专业知识,也能编写出高质量的权限管控规则。

以下是一则策略示例,其权限校验逻辑基于两部分信息:

  • 用于AgentCore Gateway身份验证的JWT token中包含的OAuth声明信息(用于判定role)。

  • 工具调用时传入的参数(context.input)。

根据该策略,仅拥有refund-agent角色且退款金额(context.input.amount)低于200美元的已认证用户,方可访问该退款处理工具。

permit( principal is AgentCore::OAuthUser, action == AgentCore::Action::"RefundTool__process_refund", resource == AgentCore::Gateway::"<GATEWAY_ARN>")when { principal.hasTag("role") && principal.getTag("role") == "refund-agent" && context.input.amount < 200};

左右滑动查看完整示意

AgentCore Evaluations

实现持续、实时的质量洞察

AgentCore Evaluations是一项全托管服务,帮助开发者持续监控和分析基于真实行为的Agent表现。开发者可以使用内置评估器来衡量常见的质量维度,如正确性、帮助性、工具选择准确性、安全性、目标成功率和上下文相关性。同时,您也能创建基于模型的定制评分系统,根据自身需求配置提示词与模型,实现契合业务需求的定制化评分。同时,服务会自动采集Agent的实时交互数据,并持续评分。

AgentCore Evaluations的所有结果,均与AgentCore Observability的洞察信息,一同以可视化形式呈现在Amazon CloudWatch中,帮助您实现统一监控。您还可以基于评估分数设置提醒和警报,主动监控Agent运行质量,一旦相关指标超出可接受范围,便会发出警报,提醒及时响应处理。

该功能可在测试阶段与生产阶段灵活应用:

  • 测试阶段:您可在部署前对照基准指标检测Agent性能,避免存在缺陷的版本触达终端用户。

  • 生产阶段:您可依托该功能持续优化Agent性能。当质量指标低于预设阈值时(例如,某客服Agent的满意度评分在8小时内下降幅度超过10%),系统会立即触发警报,助力团队更快发现与解决质量问题。

AgentCore Evaluations使用指南

您可在AgentCore控制台新增的“Evaluations”板块中创建在线评估任务。数据源可以选择AgentCore Agent端点,也可以选择外部Agent所使用的Amazon CloudWatch日志组。例如,本例使用的示例客服Agent,与此前介绍AgentCore预览版时所用的是同一个。

然后,您可以选择需要使用的评估器,包括自定义评估器——您既可以基于现有模板进行定义,也可以从零开始全新构建。

以客服Agent为例,您可选择以下评估指标:

  • 准确性:评估Agent回复中的信息是否符合事实、客观无误。

  • 忠实度:评估回复内容是否有对应的上下文或信息来源支持。

  • 实用性:从用户角度评估Agent回复的实用价值与帮助作用。

  • 危害性:评估回复是否包含有害内容。

  • 刻板印象:检测是否存在针对特定个人或群体的笼统性表述。

工具选择与工具参数准确性这两类评估器,可帮助您判断Agent是否为任务选择了恰当的工具,以及是否能从用户查询中提取正确的参数。

完成评估任务创建时,您可选择采样率与可选的过滤条件。权限配置方面,您既可以新建一个Amazon IAM服务角色,也可以直接使用现有服务角色。

评估结果会在生成的同时,会同步至Amazon CloudWatch的AgentCore Observability仪表盘。您可点击任意柱状图区域,查看对应的追踪信息,深入洞察该特定评估背后的请求与响应详情。

评估结果会同步至Amazon CloudWatch,因此您可以使用其全部功能开展各类操作,例如创建警报与实现自动化操作。

在AgentCore Evaluations中

创建自定义评估器

自定义评估器支持您根据Agent的独特需求,定义契合业务场景的质量指标。创建自定义评估器时,您需要指定用来评判的模型,并配置推理参数(如温度系数、最大输出token数),以及包含评判规则的定制化提示词。您既可以修改某款内置评估器的提示词,也可以直接输入全新的提示词。

然后,需要定义评估结果的评分量级,您既可以设置为数值形式,也可以采用自定义的文本标签。最后,您需配置评估的计算范围,即由模型针对单条追踪记录、完整会话或每次工具调用完成评估计算。

AgentCore Memory情景记忆功能

支持Agent基于经验进行自主学习

AgentCore Memory是一项全托管服务,可为AI Agent赋予记忆过往交互的能力。如今该功能新增了一种长期记忆策略,能让Agent从历史交互经验中学习,并将这些经验应用到后续的交互过程中,从而为用户提供更有用的帮助。

以Agent预订差旅行程为例:随着时间推移,Agent会逐渐学习并掌握您的预订偏好。例如,您可能会因为某次客户会议而需要将航班改签到更晚时段,当您下次预订行程涉及客户会议时,Agent会基于这些学习到的偏好,主动为您推荐灵活的返程方案。如同一位经验丰富的助理会了解领导独特的出行习惯一样,搭载情景记忆功能的Agent如今也能识别并适配用户个性化需求。

启用这项全新的情景记忆功能后,AgentCore Memory会捕捉结构化的情景片段,记录Agent交互过程中的上下文信息、推理逻辑、执行动作及最终结果。与此同时,一个反思Agent会分析这些情景片段,从中提炼出更具普适性的规律与洞察。之后面对相似任务时,Agent可调取这些学习成果,从而提升决策一致性与任务处理效率。

这一功能还有助于减少对定制化指令的依赖,用户只需在Agent上下文中纳入完成特定任务所需的具体学习成果,而无需加载一长串所有可能的建议。

AgentCore Runtime双向流式传输功能

实现更自然流畅的对话交互

借助AgentCore Runtime,您仅需几行代码即可部署Agent应用。为简化自然流畅且响应迅速的对话体验部署流程,AgentCore Runtime现已支持双向流式传输功能。该功能可让语音Agent在用户说话过程中同步倾听并动态调整,这意味着用户也可在Agent回复中途随时打断,Agent会即刻适配新的对话上下文。

不同于传统的轮次式交互(用户必须等待Agent完整应答后才能继续新的对话),双向流式传输功能可实现流畅自然的对话,让Agent能够根据用户实时表述,动态调整回复内容。

从零开始构建这类对话体验需要投入大量的工程开发工作,来处理复杂的实时并发通信流程。双向流式传输功能通过管理Agent同时生成输出与处理输入所需的基础设施,让Agent从容应对各类打断操作,并且在对话动态切换过程中始终保持上下文连贯性,从而简化了构建过程。

现在,您可以轻松部署能够自然适配人类交流习惯的Agent——支持用户中途插话、上下文切换与实时澄清需求,全程不会中断对话逻辑。

须知事项

Amazon Bedrock AgentCore(包括Policy功能预览版)已在以下亚马逊云科技区域可用:美国东部(俄亥俄州、北弗吉尼亚州)、美国西部(俄勒冈州)、亚太地区(孟买、新加坡、悉尼、东京)以及欧洲地区(法兰克福、爱尔兰)。

AgentCore Evaluations预览版的可用区域包括:美国东部(俄亥俄州、北弗吉尼亚州)、美国西部(俄勒冈州)、亚太地区(悉尼)和欧洲地区(法兰克福)。有关各区域的可用情况及未来规划,您可参阅亚马逊云科技区域功能页面。

使用AgentCore时,您只需按实际用量付费,无需提前承诺。如需了解详细定价信息,请参阅Amazon Bedrock定价页面。此外,AgentCore还纳入亚马逊云科技免费套餐,新用户可免费试用,快速上手探索这款核心服务。

上述全新功能可兼容各类开源框架,例如CrewAI、LangGraph、LlamaIndex及Strands Agents,且支持任意基础模型。AgentCore各项服务既可组合使用,也可单独运行。您还能借助AgentCore开源MCP服务器,在您偏好的AI辅助开发环境中快速上手。

如需进一步了解并快速开始使用AgentCore,敬请参阅AgentCore开发者指南。

亚马逊云科技区域功能页面:

https://builder.aws.com/capabilities/

Amazon Bedrock定价:

https://aws.amazon.com/bedrock/pricing/

AgentCore开发者指南:

https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/what-is-bedrock-agentcore.html

我们将持续推出更多关于re:Invent 2025重磅发布的解读文章,帮助您快速上手!

本篇作者

Danilo Poccia

作为亚马逊云科技的首席布道师(EMEA),他利用自己的经验帮助人们将想法变为现实,专注于Serverless架构、事件驱动编程以及机器学习和边缘计算的技术和商业影响。他是《Amazon Lambda in Action》一书的作者。

新用户注册海外区域账户,可获得最高200美元服务抵扣金,覆盖Amazon Bedrock生成式AI相关服务。“免费计划”账户类型,确保零花费,安心试用。

星标不迷路,开发更极速!

关注后记得星标「亚马逊云开发者」

听说,点完下面4个按钮

就不会碰到bug了!

点击阅读原文查看博客!获得更详细内容!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/9 18:37:53

Qwen2.5-7B故障排查:常见问题解决方案

Qwen2.5-7B故障排查&#xff1a;常见问题解决方案 1. 背景与应用场景 1.1 Qwen2.5-7B 模型简介 Qwen2.5 是阿里云推出的最新一代大语言模型系列&#xff0c;覆盖从 0.5B 到 720B 参数的多个版本。其中 Qwen2.5-7B 是一个中等规模、高性价比的开源模型&#xff0c;适用于本地…

作者头像 李华
网站建设 2026/6/10 10:54:00

基于工控机的USB转串口驱动安装操作指南

工控机上搞定USB转串口&#xff1a;从装驱动到稳定通信的全链路实战指南 你有没有遇到过这样的场景&#xff1f; 一台崭新的工控机&#xff0c;系统干净、性能强劲&#xff0c;结果一接到现场——PLC连不上&#xff0c;仪表读不出数据。排查半天才发现&#xff1a; 没有串口…

作者头像 李华
网站建设 2026/6/10 10:52:56

rs232串口调试工具在数据帧解析中的应用详解

串口调试实战&#xff1a;如何用RS232工具精准解析数据帧&#xff1f;你有没有遇到过这样的场景&#xff1f;设备上电后&#xff0c;串口调试工具里刷出一堆“烫烫烫”或乱码字符&#xff0c;而你完全摸不着头脑——到底是波特率错了&#xff1f;还是电平没转换&#xff1f;亦或…

作者头像 李华
网站建设 2026/5/31 10:30:46

SMD2835封装LED灯珠品牌光衰特性研究:完整指南

SMD2835封装LED灯珠光衰实测指南&#xff1a;从原理到品牌对比&#xff0c;选对灯珠少走弯路你有没有遇到过这样的情况&#xff1f;灯具刚装上去时亮堂堂的&#xff0c;用了一年半载却发现明显变暗&#xff0c;甚至出现色差、闪烁&#xff1f;问题很可能不在电源或电路设计&…

作者头像 李华
网站建设 2026/6/9 22:06:19

【系统】Linux内核和发行版的关系

理解内核和发行版的关系&#xff0c;能帮你更清晰地选择适合 YOLO 部署的系统。 核心结论&#xff1a;Linux 内核是所有 Linux 发行版的「底层核心引擎」&#xff0c;发行版是基于内核、搭配完整软件生态和配置工具的「开箱即用操作系统」。一个内核可以支撑多个发行版&#xf…

作者头像 李华
网站建设 2026/6/10 12:38:04

计算机毕业设计springboot“红色长征”宣传网站的设计与实现 基于SpringBoot的红色长征精神传播平台的设计与实现 SpringBoot+Vue红色长征记忆展馆网站建设

计算机毕业设计springboot“红色长征”宣传网站的设计与实现&#xff08;配套有源码 程序 mysql数据库 论文&#xff09; 本套源码可以在文本联xi,先看具体系统功能演示视频领取&#xff0c;可分享源码参考。1934-1936 年的万里长征&#xff0c;是中华民族精神的高光刻度。把这…

作者头像 李华