今天,PPIO 上线 GLM-5.1。
GLM-5.1 是智谱新一代的旗舰级智能体工程模型,其编码能力比上一代产品显著增强。GLM-5.1 在 SWE-Bench Pro 测试中取得了最先进的性能,并在 NL2Repo(代码库生成)和 Terminal-Bench 2.0(真实终端任务)测试中大幅领先于 GLM-5。
但最有意义的飞跃不仅仅体现在首次运行的表现上。之前的模型——包括 GLM-5——往往过早地耗尽了其性能储备:运用熟悉的技巧来快速取得初步进展,然后便停滞不前。给予模型更多的时间也无济于事。
相比之下,GLM-5.1 的设计目标是在更长的时间跨度内保持对智能体任务的有效性。该模型能够更准确地处理模糊问题,并在更长的运行时间内保持高效,能够分解复杂问题,运行实验,解读结果,并精准地识别障碍。通过反复迭代,GLM-5.1 不断回顾其推理过程并调整策略,从而在数百轮迭代和数千次工具调用中持续优化。运行时间越长,结果越好。
目前,该模型已上线 PPIO 模型广场,您可以在线试用该模型或通过 API 快速集成。 地址:https://ppio.com/model/zai-org/glm-5.1