news 2026/4/18 10:09:04

数学家陶哲轩直言:大语言模型和其他现代AI的数学门槛没那么高,却有个“致命短板”至今无解

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
数学家陶哲轩直言:大语言模型和其他现代AI的数学门槛没那么高,却有个“致命短板”至今无解

来源:跟着大咖学AI


著名数学家、菲尔兹获得者陶哲轩在最近的一次视频访谈中谈到AI并发表了自己的观点。他认为,训练和运行大语言模型和其他现代AI所需的数学知识并不高深,本科数学专业的基础就足够支撑,核心只需掌握矩阵乘法和基础微积分。

人类早已掌握大语言模型的搭建、训练和运行方法,真正的核心难题并非“如何让模型跑起来”,而是缺乏可靠的理论框架来提前预测其任务表现。

以下相关视频和文字内容:

『 训练和运行大语言模型(或其他现代 AI)所需的数学知识并没有那么复杂。本科数学专业的学生就已经具备了必要的相关知识 —— 本质上,你只需要掌握矩阵乘法和一点微积分就行。

The mathematics required to train and run a large language model (or any other modern AI) isn’t that complicated. An undergraduate math major already has all the necessary prerequisites—basically, you just need to understand matrix multiplication and a bit of calculus.

真正的难点不在于让这些模型 “如何运行”,我们已经知道怎么构建、训练和操作大语言模型了。难点在于理论层面我们缺少可靠的方法来评估或预测它们的性能。

The real challenge isn’thowthese models run (we know how to build, train, and operate large language models). Instead, the problem lies in theory: we lack a reliable way to evaluate or predict their performance.

让人意外的是,这些模型在某些任务上表现极佳,在另一些任务上却效果很差,但我们没法提前预判哪些任务会是哪种情况。我们甚至连基础的经验法则都没有,只能依赖实证实验。

What’s surprising is that these models work extremely well for some tasks but poorly for others—and we can’t predict which tasks will fall into which category in advance. We don’t even have basic heuristic rules of thumb for this; we can only rely on empirical experiments.』

视频来源:

https://www.youtube.com/watch?v=ukpCHo5v-Gc ,油管 ,@DrBrianKeating

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828

未来知识库是“欧米伽未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 18:13:08

新手必看:工业控制项目中正确使用STLink引脚图

工业控制调试不翻车:一张STLink引脚图背后的硬核细节你有没有过这样的经历?深夜赶工,终于写完一段关键的电机控制代码,兴冲冲插上STLink准备烧录——结果IDE弹出“No target connected”;再一摸STLink外壳,…

作者头像 李华
网站建设 2026/4/18 7:20:02

手把手教你用寄存器映射理解ISR入口地址设置

手把手教你从寄存器映射看透ISR入口地址的底层真相你有没有遇到过这样的情况:明明配置好了GPIO中断,NVIC也使能了,但就是进不了EXTI0_IRQHandler?或者OTA升级后系统一跳转就Hard Fault,调试器一看堆栈全乱了&#xff1…

作者头像 李华
网站建设 2026/4/18 8:31:25

全网最全8个AI论文工具,专科生搞定毕业论文!

全网最全8个AI论文工具,专科生搞定毕业论文! 专科生的论文救星:AI 工具如何改变你的写作方式 在当今快节奏的学习生活中,专科生面临着毕业论文的巨大压力。从选题到撰写,再到查重降重,每一个环节都可能让人…

作者头像 李华
网站建设 2026/4/18 4:05:00

数据服务熔断机制在大数据平台中的实现

数据服务熔断机制在大数据平台中的实现关键词:数据服务熔断、大数据平台、微服务架构、雪崩效应、服务治理、分布式系统、容错机制摘要:在分布式大数据平台中,服务间依赖关系复杂,网络波动、资源过载等问题易引发雪崩效应。本文系…

作者头像 李华
网站建设 2026/4/18 4:03:37

学霸同款2026 AI论文工具TOP9:本科生毕业论文写作全攻略

学霸同款2026 AI论文工具TOP9:本科生毕业论文写作全攻略 2026年学术写作工具测评:为何需要这份榜单? 随着人工智能技术的持续发展,AI论文工具已成为高校学生,尤其是本科生撰写毕业论文的重要辅助手段。然而&#xff0c…

作者头像 李华
网站建设 2026/4/18 4:04:25

智能写作新纪元:9款学术AI工具全流程应用评测

在学术论文撰写过程中,开题报告与正文的高效完成是研究者常见的难题。传统人工撰写模式虽然灵活性较高,但存在效率瓶颈,而现代人工智能技术能够实现内容的快速生成、重复率控制以及文本逻辑优化。实验数据显示,对9种主流智能写作平…

作者头像 李华