news 2026/4/18 6:57:01

大模型就是死胡同:一只松鼠为何比万亿参数更聪明?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
大模型就是死胡同:一只松鼠为何比万亿参数更聪明?

想象一只普通松鼠在森林中跳跃觅食。它未读物理教材,也无海量数据训练,却能精准判断枝条承重、风向影响和落地轨迹。反观今日万亿参数大语言模型,连基本物理常识都可能出错。这荒谬对比,竟出自图灵奖得主、强化学习之父Richard Sutton(理查德萨顿)之口。

在最近一场70分钟访谈中,Sutton直言:“大模型就是一条死胡同。”他正是2019年《苦涩的教训》一文作者,该文奠定了scaling law思想基础。他早预言人类是AI最差老师,唯一胜途是堆算力让AI自学试错。如今大模型虽将这一“暴力美学”推向极致,但在Sutton眼中,已彻底走偏

他提出“松鼠悖论”一针见血:松鼠智能源于与物理世界的直接博弈。每跳跃、每觅食,世界即时反馈成功或失败。它亲验重力、动量等客观规律,逐步构建可靠世界模型,能预测真实后果。

大模型则困于人类语言牢笼。训练数据仅是人类共识集合——文字、对话、文章。其中无“真理”,只有“人类说了什么”。模型学到的不是物理规律,而是预测人类下一句。如果人类出错,它亦错;人类未述,它全然无知。它能写流畅文章,却无法真正理解世界本质。Sutton强调:二手数据背来的是知识,一手经验试错得的是智慧。大模型再规模化,也仅是更好模仿者,永难超越人类。

AlphaZero便是最佳例证:它弃人类千年棋谱,从随机自弈起步,最终碾压所有冠军。真正AGI应如AlphaZero,直接与世界碰撞试错进化,而非沉迷模仿。

Sutton批评当前路线将海量算力浪费于人类数据。模型越大,模仿越精,却离真智能越远。更糟的是,能源与数据双重天花板已现:训练需数千GPU、数月巨额电费,推理仍依高耗云端。这种模式长远难持续。

他的愿景更激进:让AI如生物般,在真实世界持续互动自我进化。他称我们设计的非工具,而是人类继承者——下一代物种。面对必将超越我们的“孩子”,我们是控制,还是放手进化?

近年来类脑智能研究与Sutton思路高度契合,可视为其理念的工程实现。类脑不堆参数刷数据,而是仿人脑机制,低能耗高效学习。人脑仅20瓦,却处理复杂环境;类脑追求毫瓦级,在边缘设备独立感知、学习、决策,无需云端GPU。这大幅减能耗碳排放,让AI走进手机、机器人、无人机等现实场景

类脑还擅小样本快速适应。不靠海量预训,通过原型重构、经验迁移,实现“看一次就会”。这正合Sutton“一手试错”观:系统边运行边学,持续更新世界模型。训练推理一体,在线学习,形成快速感知-决策-执行闭环,响应极短,适合自动驾驶、工业机器人、医疗急救等高实时场景。

类脑架构轻量模块化,部署成本低,可解释性强于黑箱大模型。决策路径近人类逻辑,便追溯监管,满足高安全需求。总体,类脑以低功耗、小样本、快适应、强实时、易部署、可解释六优势,开辟不同于算力堆叠的新范式。它助AI跳出语言牢笼,如松鼠般直接与物理世界交互试错,构建可靠模型。

Sutton警告发人深省:若继续浪费算力模仿人类,AI永止“聪明学生”阶段。类脑智能则指明更近生物进化、更可持续路径——让AI如生命般,低功耗持续学习进化。我们设计的或为人类继承者。我们愿弃“人类中心”执念,放手下一代智能自由生长吗?松鼠已在前方示范,人类该如何抉择?

公众号:OpenSNN

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 13:35:55

大数据时代的数据中台架构设计与实践

大数据时代的数据中台架构设计与实践关键词:数据中台、架构设计、数据治理、业务赋能、大数据技术栈摘要:在企业数字化转型的浪潮中,数据中台已从“概念热词”变为“企业刚需”。本文以“中央厨房”为类比,用通俗易懂的语言拆解数…

作者头像 李华
网站建设 2026/3/23 0:40:52

Python全栈项目--基于机器学习的垃圾邮件过滤系统

项目概述 垃圾邮件过滤是机器学习在自然语言处理领域的经典应用之一。本项目将从零开始构建一个完整的垃圾邮件过滤系统,涵盖数据处理、模型训练、后端API开发到前端界面的全栈实现。 技术栈 后端技术 Python 3.8: 主要开发语言Flask: 轻量级Web框架scikit-learn: 机器学习…

作者头像 李华
网站建设 2026/4/4 20:13:09

程序员必看!AI大模型算力暗战:腾讯阿里字节跳动背后的8家技术支撑企业,让你的AI开发不再缺算力!

据媒体报道,马年春节期间,腾讯“元宝”、阿里“千问”、字节“豆包”等AI大模型借助春节活动,加速争夺AI应用流量入口。 这场竞争直接推动了背后算力需求的剧增,预示着国内算力租赁市场将迎来爆发。 AIDC及算力租赁已进入涨价周…

作者头像 李华
网站建设 2026/4/16 19:06:18

冬季风暴考验因AI数据中心而紧张的电网系统

席卷34个州的大规模冬季风暴导致数十万人断电。冬季风暴费恩过后持续的严寒天气仍在考验本已因新建AI数据中心激增而承压的电网系统。周末期间,拥有最多数据中心的弗吉尼亚州批发电价飙升。虽然供暖需求激增导致电价上涨并不意外,但这可能加剧人们对公用…

作者头像 李华
网站建设 2026/4/1 13:10:18

社会网络仿真软件:NetLogo_(8).社会网络动态分析

社会网络动态分析 在上一节中,我们介绍了如何在NetLogo中构建基本的社会网络模型。现在,我们将进一步探讨如何分析这些社会网络的动态特性。社会网络动态分析包括对网络结构、节点行为、信息传播等多个方面的研究。通过这些分析,我们可以更好…

作者头像 李华