news 2026/6/10 12:43:46

[工业自动化-31]:AI模型训练是闭环控制,其中反向传播是反馈系统;AI预测是开环控制,没有反馈;AI智能体和具身智能从感知到决策到执行,到反馈,是闭环控制;

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
[工业自动化-31]:AI模型训练是闭环控制,其中反向传播是反馈系统;AI预测是开环控制,没有反馈;AI智能体和具身智能从感知到决策到执行,到反馈,是闭环控制;

一、AI模型训练:闭环控制系统(以反向传播为反馈机制)

✅ 控制结构

  • 目标最小化损失函数(即让预测尽可能接近真实标签);
  • 控制器:优化器(如SGD、Adam);
  • 被控对象:神经网络的参数(权重与偏置);
  • 反馈信号:损失函数的梯度(通过反向传播计算)。

🔁 反馈回路(闭环)

📌 关键点

  • 反向传播 = 误差反馈机制:将输出端的“偏差”(损失)逐层传递回输入端,指导参数调整;
  • 闭环性:每一次迭代都依赖上一次的输出结果来修正自身,形成自我优化回路
  • 稳态目标收敛到损失函数的局部极小值(理想情况下接近全局最优)。

💡类比:如同学生做题后对答案(反馈),错题订正(参数更新),下次做得更好。


二、AI预测(推理):开环控制系统

✅ 控制结构

  • 目标:对新输入快速生成输出;
  • 控制器:固定参数的神经网络;
  • 无反馈:输出不用于修改模型本身。

⛔ 无反馈回路(开环)

📌 关键点

  • 参数冻结:训练完成后,模型结构与权重固定;
  • 单向执行:输入 → 输出,无自我修正能力;
  • 脆弱性:若输入分布偏移(如训练用白天图像,测试用夜间图像),性能骤降,但系统无法感知或调整。

💡类比:背熟答案的学生参加考试——若题目稍变,无法现场调整策略。


三、AI智能体与具身智能:高级闭环控制系统

✅ 控制结构

  • 目标在环境中最大化长期奖励(或达成任务目标);
  • 感知器:传感器/观测接口(摄像头、麦克风、API等);
  • 控制器:策略网络(Policy Network)或规划模块;
  • 执行器:动作输出(电机、API调用、文本生成);
  • 反馈源:环境返回的新状态与奖励信号。

🔁 感知-决策-执行-反馈闭环

📌 关键点

  • 持续交互:智能体与环境形成永不停止的交互循环
  • 反馈驱动学习:通过强化学习(如PPO、DQN)或在线微调,不断优化策略;
  • 具身性(Embodiment):智能体拥有“身体”(物理或虚拟),其行为直接影响感知输入,形成行动-感知耦合

💡类比:人类学骑自行车——摔倒(负反馈)→ 调整平衡(策略更新)→ 再尝试,直至掌握。


四、三者对比总结

维度AI训练AI预测AI智能体/具身智能
控制类型闭环开环闭环
反馈存在?✅(损失梯度)✅(环境奖励/状态)
参数是否更新?是(在线/离线学习)
目标导向最小化损失执行映射最大化累积奖励
适应性离线适应在线自适应
典型应用模型开发阶段模型部署阶段机器人、游戏AI、自动驾驶

五、深层意义:AI从“工具”到“行为主体”的演进

  1. 训练闭环 → 让AI“学会”某种能力(学习阶段);
  2. 预测开环→ 让AI“应用”所学(执行阶段);
  3. 智能体闭环→ 让AI“活在世界中”,通过行动改变环境并从结果中学习(自主阶段)。

正如控制论之父维纳所言:
“有效的行为必须基于对结果的感知。”
真正的智能,不在于计算多快,而在于能否构建并利用反馈回路实现目标/意图


六、未来趋势:融合闭环

  • 训练-部署一体化:模型上线后持续收集用户反馈,自动触发再训练(如推荐系统);
  • 具身预训练在模拟环境中通过闭环交互预训练通用策略(如Google RT-2);
  • AI Agent操作系统具备记忆、规划、反思能力的闭环认知架构(如AutoGen、LangChain Agent)。

结语

AI的智能化程度,取决于其闭环的深度与广度。

  • 训练闭环赋予AI知识,
  • 预测开环赋予AI效率,
  • 智能体闭环赋予AI生命。

当AI不仅能“知道”,还能“行动”并“从行动中学习”——它便真正踏入了自主智能的殿堂。这正是控制论留给AI时代的终极启示。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 8:12:09

基于Springboot+Vue的乡镇卫生所医用物资进销存系统源码文档部署文档代码讲解等

课题介绍 本课题旨在设计并实现一套基于SpringBootVue的乡镇卫生所医用物资进销存系统,解决当前乡镇卫生所医用物资采购无序、库存管控混乱、出入库登记繁琐、物资过期预警不足等问题,适配乡镇卫生所医用物资精细化管理的核心需求。系统采用前后端分离架…

作者头像 李华
网站建设 2026/6/9 21:05:43

MAVLink 通信协议 C++ 开发实战:从环境搭建到飞控通信全解析

前言 MAVLink(Micro Air Vehicle Link)是一款轻量级、低带宽、高可靠性的微小型无人机通信协议,由 PX4 团队主导设计,广泛应用于无人机、无人车、机器人等嵌入式系统的跨设备通信场景。其核心优势在于专为资源受限的硬件&#xf…

作者头像 李华
网站建设 2026/6/10 1:21:12

告别传统RAG的痛点!Agent Skills让知识库检索更智能(本地知识库搭建新思路:用Agent Skills实现渐进式检索)

文章目录 📖 介绍 📖 🏡 演示环境 🏡 📒 Agent Skills在知识库检索中的实践探索 📒 📝 传统RAG的局限性 📝 Agent Skills的核心设计理念 🎯 分层索引导航 🎯 先学习,再处理 🎯 渐进式检索 📝 实际应用场景对比 场景一:查询AI行业趋势 场景二:分析电…

作者头像 李华
网站建设 2026/6/10 8:06:08

基于multisim的波形发生与变换电路设计

设计正弦波振荡电路,要求产生1KHz的正弦波,并将1KHz的正弦波转换成1kHz的方波和三角波。 仿真图: 仿真演示与文件下载:基于multisim的波形发生与变换电路设计演示视频_哔哩哔哩_bilibili

作者头像 李华
网站建设 2026/6/10 8:08:24

淘宝评论数据采集 API 全解析【淘宝评论API】

一、官方 API 方案 1.1 核心接口概览 淘宝开放平台 (TOP) 提供的官方评论数据接口主要有以下 3 个,权限申请门槛较高,仅对企业 / 店铺商家开放,个人开发者无法申请: 接口名称功能描述适用场景taobao.item.review.get获取淘宝商…

作者头像 李华
网站建设 2026/6/10 8:08:20

打卡信奥刷题(2789)用C++实现信奥题 P3939 数颜色

P3939 数颜色 题目背景 大样例可在页面底部「附件」中下载。 题目描述 小 C 的兔子不是雪白的,而是五彩缤纷的。每只兔子都有一种颜色,不同的兔子可能有相同的颜色。小 C 把她标号从 1 到 nnn 的 nnn 只兔子排成长长的一排,来给他们喂胡萝…

作者头像 李华