news 2026/4/18 14:41:55

AI核心知识56——大语言模型之ToT(简洁且通俗易懂版)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI核心知识56——大语言模型之ToT(简洁且通俗易懂版)

Tree of Thoughts (ToT / 思维树)是提示工程(Prompt Engineering)中一种高级且强悍的推理框架

如果说Chain of Thought (CoT / 思维链)是让 AI“一条路走到黑”地线性思考,那么ToT就是让 AI 学会像人类大师一样“深思熟虑、多步推演、甚至回头重来”

它是目前解决高难度复杂推理问题(如数学证明、创意写作、复杂代码架构)的最强手段之一。


1. 🌳 核心理念:从“线”到“树”的进化

为了理解 ToT,我们先看 AI 思考模式的进化史:

  1. Input-Output (IO / 直接问答)

    • 模式:问题 → 答案。

    • 缺陷:靠直觉瞎蒙,容易出错。

  2. Chain of Thought (CoT / 思维链)

    • 模式:问题 → 步骤1 → 步骤2 → 步骤3 → 答案。

    • 缺陷线性思维。一旦中间某一步走错了(比如步骤2算错了),后面就全错了,且 AI不知悔改,只会硬着头皮继续错下去。

  3. Tree of Thoughts (ToT / 思维树)

    • 模式:问题 → 步骤1 → {分支A, 分支B, 分支C} ...

    • 优势

      • 探索 (Exploration):在每一个节点,AI 会构思出多种可能得下一步(分支)。

      • 评估 (Evaluation):AI 会自我评估:“分支 A 看起来不太对,分支 B 更有希望”。

      • 回溯 (Backtracking):如果发现分支 B 走不通了,AI 会掉头回来,去走分支 C。

一句话总结:ToT 允许 AI 在脑子里进行“预演”,如果不通就换条路,直到找到最优解。


2. ⚙️ ToT 是如何工作的?(四个步骤)

在 PE 工程中,实施 ToT 通常需要通过代码(如 Python 脚本)配合 Prompt 来实现一个循环:

  1. 思维分解 (Decomposition)

    • 把一个大问题拆解成若干个小的思维步骤(Thought Steps)。

  2. 思维生成 (Thought Generation)

    • 在当前步骤,让 AI 生成k个可能的下一步。

    • 例子:玩 24 点游戏,手牌是4, 9, 10, 13。AI 生成:“4+9=13”, “13-10=3”, “10/4=2.5” 等几种可能。

  3. 状态评估 (State Evaluation)

    • 让 AI(或者外部评分器)给这几个可能的下一步打分。

    • 评估:“10/4=2.5 产生了小数,对于算 24 点可能不利,低分”;“4+9=13 看起来不错,保留”。

  4. 搜索算法 (Search Algorithm)

    • 使用BFS (广度优先搜索)DFS (深度优先搜索)来遍历这棵树。如果评估分数太低,就剪枝(Prune),不再继续往下想。


3. 🧠 经典案例:24点游戏

24 点游戏(用 4 个数字通过加减乘除算出 24)是测试 ToT 的经典考题。

  • CoT (思维链) 的表现

    • 它通常会试着算一下,如果第一步算错了(比如先算了 4+9=13,然后发现后面没法凑出 24),它就卡住了,最后强行胡编一个答案。

    • 成功率:约 4%(在 GPT-4 早期测试中)。

  • ToT (思维树) 的表现

    • 它列出所有第一步的可能性。

    • 它发现“先算 4+9”这条路走不通,于是回溯,尝试“先算 13-9”。

    • 经过多轮推演,它找到了路径。

    • 成功率:飙升至74%


4. ⚖️ 代价是什么?

虽然 ToT 强无敌,但它有一个巨大的缺点:贵且慢

  • Token 消耗巨大:CoT 只需要生成 1 次回答。ToT 可能需要生成 10 次、100 次甚至更多次(因为要探索很多分支),Token 消耗量是指数级增长的。

  • 延迟高:用户可能要等很久才能拿到答案。

因此,ToT 通常只用于那些“必须要对”、“逻辑极其复杂”且“不在乎时间成本”的任务(如数学证明、复杂代码架构设计、长篇小说大纲规划)。


总结

Tree of Thoughts (ToT)是 Prompt Engineering 从“话术技巧”迈向“算法工程”的标志。

它不仅仅是在写 Prompt,而是在用 Prompt 实现搜索算法。它让 AI 拥有了人类最宝贵的思维品质:深思熟虑自我纠错

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 5:39:22

Agent权限失控危机四伏,政务数字化转型如何破局?

第一章:政务 Agent 的权限控制在政务系统中,Agent 通常指代自动化服务代理或智能执行单元,负责数据采集、流程触发与跨系统交互。由于政务数据敏感度高、业务逻辑复杂,必须对 Agent 实施严格的权限控制机制,确保其行为…

作者头像 李华
网站建设 2026/4/18 5:25:25

产业分化——通用入口、垂直深井与场景嵌入的三重奏

当技术范式发生转移,其引发的涟漪必然重塑产业格局。AI搜索领域并未走向单一垄断,反而因技术特性、用户需求和应用场景的差异,催生了三条清晰且可能长期并存的演进路径:打造通用智能入口、挖掘垂直专业深井、以及融入超级场景生态…

作者头像 李华
网站建设 2026/4/18 11:50:20

AI全景之第四章第三节:机器学习核心技术体系(强化学习)

在机器学习的三大核心范式中,强化学习(Reinforcement Learning, RL)以其独特的“试错学习”机制脱颖而出——它既不像监督学习那样依赖标注数据,也不同于无监督学习专注于数据分布挖掘,而是通过智能体(Agent)与环境(Environment)的持续交互,在“探索-利用”的平衡中寻…

作者头像 李华
网站建设 2026/4/18 5:38:12

从WRF到Transformer:6种Agent模型实战对比,结果令人震惊

第一章:从WRF到Transformer:气象Agent模型演进全景气象建模技术在过去几十年中经历了从物理驱动到数据驱动的深刻变革。早期以WRF(Weather Research and Forecasting)为代表的传统数值天气预报模型,依赖于大气动力学方…

作者头像 李华
网站建设 2026/4/18 2:04:03

基于百度指数构建购房需求分析系统答辩问题

1. 数据来源和数据量数据来源:开发一个能够稳定、高效地爬取百度指数中购房相关数据的爬虫程序,并对爬取到的原始数据进行有效的清洗和预处理,为后续的数据分析和预测提供可靠的数据基础。数据量:系统已获取并整合了约1万条购房相…

作者头像 李华