news 2026/4/18 9:15:04

AI 正在“吃光内存”,NVIDIA与SK海力士把目光投向了 NAND

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI 正在“吃光内存”,NVIDIA与SK海力士把目光投向了 NAND

继大规模蚕食DRAM市场后,英伟达与SK海力士计划推出性能提升近10倍的"AI SSD",引发NAND供应警报。随着AI产业重心从训练转向推理,技术栈需全面升级以构建低延迟、高吞吐环境,行业正聚焦通过NAND芯片打造推理优化的AI存储方案,SK海力士预计在2027年前推出相关解决方案。

AI SSD可以扩展到1亿IOPS,这比传统的企业SSD要大得多。当研究这种解决方案的需求时,很明显,当前的AI工作负载结构需要连续访问大量模型参数,这是HBM或通用DRAM产品无法满足的。AI SSD最终将允许伪内存层,针对AI工作负载进行优化,显著提升模型加载、参数访问以及数据调度效率,为大模型推理带来数量级上的性能改善。

随着传统AI工作负载向推理侧迁移,这一趋势的动因之一在于英伟达已决定在Rubin CPX GPU中集成通用GDDR7内存处理预填充阶段。据有关媒体报道,类似技术路径或将延伸至NAND领域,一系列举措可能彻底重塑NAND产业格局。

近年来,AI 训练和推理对 DRAM 尤其是 HBM 的需求急剧上升,头部厂商的大规模采购几乎锁定了未来一段时间的高端内存产能,供需紧张已经成为行业共识。在这样的背景下,仅依赖 DRAM/HBM 来承载越来越大的模型参数和中间数据,成本和可获得性都在变得越来越不友好。

AI SSD 的出现,本质上是一种向“内存层级外延”要空间的尝试。通过让高性能 NAND 承担部分原本由内存负责的数据访问工作,尤其是在推理场景中对容量和吞吐更敏感、对极致时延要求相对可控的环节,AI SSD 有机会在不显著推高成本的前提下,缓解内存压力,提升整体系统效率。这也意味着,NAND 在 AI 系统中的角色,正在从“冷数据存储”向“主动参与计算的数据层”演进。

从产业链角度看,这并非孤立动作。一方面,DRAM 与 HBM 供给趋紧、价格上行已是公开事实;另一方面,AI 服务器整体配置正在变得越来越“存储密集”,无论是本地推理、企业私有化部署,还是多模型并行运行,对高速、大容量存储的依赖都在明显提升。NVIDIA 与 SK hynix 在这一时间点推动 AI SSD,既是技术演进的结果,也是供应链现实倒逼下的一种必然选择。

对于 AI 服务器供应商和用户而言,这类变化意味着,未来的算力系统不再只是“GPU + 内存”的简单叠加,而是需要从更系统的角度重新审视 计算、内存与存储之间的分工与协同方式。谁能更早理解这种变化,并在架构设计和选型阶段提前做出调整,往往就能在成本、可扩展性和交付确定性上占据主动。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 7:37:36

3个关键步骤解决JimuReport报表组件依赖配置难题

3个关键步骤解决JimuReport报表组件依赖配置难题 【免费下载链接】jimureport 「数据可视化工具:报表、大屏、仪表盘」积木报表是一款类Excel操作风格,在线拖拽设计的报表工具和和数据可视化产品。功能涵盖: 报表设计、大屏设计、打印设计、图形报表、仪…

作者头像 李华
网站建设 2026/4/18 7:37:46

cursor: not-allowed 与 pointer-events: none 深度解析

引言 在前端开发中,我们经常需要处理元素的交互状态,特别是禁用状态。 cursor: not-allowed 和 pointer-events: none 是两个常用的 CSS 属性,但它们的作用机制和使用场景有很大不同。下面我们一起深入解析这两个属性的原理、区别以及最佳实…

作者头像 李华
网站建设 2026/4/18 8:41:24

当 Gemini 3 + Nano Banana Pro 掌握了“多巴胺”的像素级秘钥

在传统的创作逻辑中,美感是一种“共鸣”。但在 Gemini 3 与 Nano Banana Pro (NBP) 协同运作的今天,美感正在变成一种“诱导”。 这不再是关于“好不好看”的讨论。通过多模态大模型的实时演算,Gemini 3 已经能够精准识别出人类视网膜在处理…

作者头像 李华
网站建设 2026/4/13 21:16:51

FastDepth终极指南:嵌入式设备上的快速单目深度估计技术

FastDepth终极指南:嵌入式设备上的快速单目深度估计技术 【免费下载链接】fast-depth ICRA 2019 "FastDepth: Fast Monocular Depth Estimation on Embedded Systems" 项目地址: https://gitcode.com/gh_mirrors/fa/fast-depth 想要在资源受限的嵌…

作者头像 李华