news 2026/6/10 12:43:46

[工业自动化-31]：AI模型训练是闭环控制，其中反向传播是反馈系统；AI预测是开环控制，没有反馈；AI智能体和具身智能从感知到决策到执行，到反馈，是闭环控制；

张小明

前端开发工程师

1.2k 24

文章封面图 — [工业自动化-31]：AI模型训练是闭环控制，其中反向传播是反馈系统；AI预测是开环控制，没有反馈；AI智能体和具身智能从感知到决策到执行，到反馈，是闭环控制；

一、AI模型训练：闭环控制系统（以反向传播为反馈机制）

✅ 控制结构

目标：最小化损失函数（即让预测尽可能接近真实标签）；
控制器：优化器（如SGD、Adam）；
被控对象：神经网络的参数（权重与偏置）；
反馈信号：损失函数的梯度（通过反向传播计算）。

🔁 反馈回路（闭环）

📌 关键点

反向传播 = 误差反馈机制：将输出端的“偏差”（损失）逐层传递回输入端，指导参数调整；
闭环性：每一次迭代都依赖上一次的输出结果来修正自身，形成自我优化回路；
稳态目标：收敛到损失函数的局部极小值（理想情况下接近全局最优）。

💡类比：如同学生做题后对答案（反馈），错题订正（参数更新），下次做得更好。

二、AI预测（推理）：开环控制系统

✅ 控制结构

目标：对新输入快速生成输出；
控制器：固定参数的神经网络；
无反馈：输出不用于修改模型本身。

⛔ 无反馈回路（开环）

📌 关键点

参数冻结：训练完成后，模型结构与权重固定；
单向执行：输入 → 输出，无自我修正能力；
脆弱性：若输入分布偏移（如训练用白天图像，测试用夜间图像），性能骤降，但系统无法感知或调整。

💡类比：背熟答案的学生参加考试——若题目稍变，无法现场调整策略。

三、AI智能体与具身智能：高级闭环控制系统

✅ 控制结构

目标：在环境中最大化长期奖励（或达成任务目标）；
感知器：传感器/观测接口（摄像头、麦克风、API等）；
控制器：策略网络（Policy Network）或规划模块；
执行器：动作输出（电机、API调用、文本生成）；
反馈源：环境返回的新状态与奖励信号。

🔁 感知-决策-执行-反馈闭环

📌 关键点

持续交互：智能体与环境形成永不停止的交互循环；
反馈驱动学习：通过强化学习（如PPO、DQN）或在线微调，不断优化策略；
具身性（Embodiment）：智能体拥有“身体”（物理或虚拟），其行为直接影响感知输入，形成行动-感知耦合。

💡类比：人类学骑自行车——摔倒（负反馈）→ 调整平衡（策略更新）→ 再尝试，直至掌握。

四、三者对比总结

维度	AI训练	AI预测	AI智能体/具身智能
控制类型	闭环	开环	闭环
反馈存在？	✅（损失梯度）	❌	✅（环境奖励/状态）
参数是否更新？	是	否	是（在线/离线学习）
目标导向	最小化损失	执行映射	最大化累积奖励
适应性	离线适应	无	在线自适应
典型应用	模型开发阶段	模型部署阶段	机器人、游戏AI、自动驾驶

五、深层意义：AI从“工具”到“行为主体”的演进

训练闭环 → 让AI“学会”某种能力（学习阶段）；
预测开环→ 让AI“应用”所学（执行阶段）；
智能体闭环→ 让AI“活在世界中”，通过行动改变环境并从结果中学习（自主阶段）。

正如控制论之父维纳所言：
“有效的行为必须基于对结果的感知。”
真正的智能，不在于计算多快，而在于能否构建并利用反馈回路实现目标/意图。

六、未来趋势：融合闭环

训练-部署一体化：模型上线后持续收集用户反馈，自动触发再训练（如推荐系统）；
具身预训练：在模拟环境中通过闭环交互预训练通用策略（如Google RT-2）；
AI Agent操作系统：具备记忆、规划、反思能力的闭环认知架构（如AutoGen、LangChain Agent）。

结语

AI的智能化程度，取决于其闭环的深度与广度。

训练闭环赋予AI知识，
预测开环赋予AI效率，
智能体闭环赋予AI生命。

当AI不仅能“知道”，还能“行动”并“从行动中学习”——它便真正踏入了自主智能的殿堂。这正是控制论留给AI时代的终极启示。

版权声明: 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系邮箱：809451989@qq.com进行投诉反馈，一经查实，立即删除！

网站建设 2026/6/10 8:12:09

基于Springboot+Vue的乡镇卫生所医用物资进销存系统源码文档部署文档代码讲解等

课题介绍本课题旨在设计并实现一套基于SpringBootVue的乡镇卫生所医用物资进销存系统，解决当前乡镇卫生所医用物资采购无序、库存管控混乱、出入库登记繁琐、物资过期预警不足等问题，适配乡镇卫生所医用物资精细化管理的核心需求。系统采用前后端分离架…

作者头像

李华

网站建设 2026/6/9 21:05:43

MAVLink 通信协议 C++ 开发实战：从环境搭建到飞控通信全解析

前言 MAVLink（Micro Air Vehicle Link）是一款轻量级、低带宽、高可靠性的微小型无人机通信协议，由 PX4 团队主导设计，广泛应用于无人机、无人车、机器人等嵌入式系统的跨设备通信场景。其核心优势在于专为资源受限的硬件&#xf…

作者头像

李华

网站建设 2026/6/10 1:21:12

告别传统RAG的痛点！Agent Skills让知识库检索更智能（本地知识库搭建新思路：用Agent Skills实现渐进式检索）

文章目录 📖 介绍 📖 🏡 演示环境 🏡 📒 Agent Skills在知识库检索中的实践探索 📒 📝 传统RAG的局限性 📝 Agent Skills的核心设计理念 🎯 分层索引导航 🎯 先学习，再处理 🎯 渐进式检索 📝 实际应用场景对比场景一：查询AI行业趋势场景二：分析电…

作者头像

李华

网站建设 2026/6/10 8:06:08

基于multisim的波形发生与变换电路设计

设计正弦波振荡电路，要求产生1KHz的正弦波，并将1KHz的正弦波转换成1kHz的方波和三角波。仿真图： 仿真演示与文件下载：基于multisim的波形发生与变换电路设计演示视频_哔哩哔哩_bilibili

作者头像

李华

网站建设 2026/6/10 8:08:24

淘宝评论数据采集 API 全解析【淘宝评论API】

一、官方 API 方案 1.1 核心接口概览淘宝开放平台 (TOP) 提供的官方评论数据接口主要有以下 3 个，权限申请门槛较高，仅对企业 / 店铺商家开放，个人开发者无法申请： 接口名称功能描述适用场景taobao.item.review.get获取淘宝商…

作者头像

李华

网站建设 2026/6/10 8:08:20

打卡信奥刷题（2789）用C++实现信奥题 P3939 数颜色

P3939 数颜色题目背景大样例可在页面底部「附件」中下载。题目描述小 C 的兔子不是雪白的，而是五彩缤纷的。每只兔子都有一种颜色，不同的兔子可能有相同的颜色。小 C 把她标号从 1 到 nnn 的 nnn 只兔子排成长长的一排，来给他们喂胡萝…

作者头像

李华