news 2026/6/18 11:22:56

沐曦股份曦云C系列GPU Day 0 适配 MiniMax M3,国产算力支撑前沿Coding与Agentic能力

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
沐曦股份曦云C系列GPU Day 0 适配 MiniMax M3,国产算力支撑前沿Coding与Agentic能力

6月12日,MiniMax正式开源新一代原生多模态旗舰模型M3。沐曦股份曦云C系列GPU凭借全栈自研的软硬一体技术优势,完成对M3的Day 0深度适配,成为率先支持该模型的国产算力平台,持续领跑国产GPU极速适配赛道。

这是近期继M2.5、M2.7之后,曦云C系列又一次对MiniMax旗舰大模型实现极速适配。此次Day 0适配的快速实现,持续源于沐曦股份"自研GPU硬件+MXMACA全栈软件"的软硬一体核心优势。

曦云C系列GPU基于沐曦自主核心GPU IP打造,具备高能效比与高通用性,精准匹配大模型的超大规模参数处理及长上下文推理需求。MXMACA软件栈作为连接硬件算力与上层应用生态的核心枢纽,全链路覆盖底层驱动、用户态接口、MXCC编译器、算子深度适配及主流训练/推理框架对接,原生兼容 PyTorch、TensorFlow、vLLM与SGLang等 40 余种主流 AI 框架,支持 500+ AI 模型稳定运行,大幅缩短传统模型适配周期。曦云C系列GPU依托沐曦自研MXMACA软件栈的深度优化能力,成功实现M3的高效部署与稳定运行,为其前沿能力提供澎湃算力支撑。

在国产GPU Day 0适配赛道,沐曦股份持续保持行业领先地位。截至目前,沐曦已累计完成Day 0适配模型达26个,全面覆盖MiniMax、智谱、阿里千问、阶跃星辰、百度、DeepSeek等国内头部厂商的最新旗舰模型,品类涵盖语言、多模态、OCR、文生图、3D生成等全领域,构建起"模型发布—芯片适配—产业落地"的高效闭环。

关于MiniMax新一代原生多模态旗舰模型M3

MiniMax M3 在编程和智能体等专业任务上达到了前沿的能力。它使用了全新注意力架构 MSA (MiniMax Sparse Attention),最高支持 1M 超长上下文。它也是一个原生多模态模型,支持图片和视频的输入,并能操作电脑桌面。这三种能力是海外闭源前沿模型所必须拥有的。M3 是国内第一个齐备这些要素的模型,也是目前唯一的开源模型。

在 Artificial Analysis 综合智能指数排行榜上,M3 取得了全球开源模型的最高排名。

MSA:结构创新带来 Context Scaling

MSA 是一个简洁且易于扩展的全新稀疏注意力架构,让 context 真正成为又一个可被 scale 的维度。稀疏注意力机制普遍通过增加一个初筛阶段来避免复杂度爆炸问题。与 DSA 和 MoBA 等方案相比,MSA 可以更精确为 KV 分块,实现更高的有效上下文覆盖。

同时,MiniMax团队还在算子层直接优化,采用以 KV 块为外层来聚合命中 query 的 KV outer gather Q。每块只读一次、访存连续,在 M3 的 head 配比下计算访存比显著优于通行方法,比开源的 Flash-Sparse-Attention、FlashMoBA 快 4 倍以上。

简洁可扩展、易于实现且硬件友好的特点,使它的理论收益能真正落地:在 100 万上下文下,M3 每 token 计算量仅为上代模型的 1/20。在 prefilling 阶段,MiniMax团队实现了超过 9 倍的加速倍率,在 decoding 阶段有超过 15 倍的加速优势。而且在多个对照实验中,MSA 的绝大部分能力与全注意力打平。

前沿的Coding和Agentic能力

Coding 与 Agent 能力是 M3 重点提升之处,在涵盖软件工程、终端执行等多个维度的国际权威评测中,M3 均达到国际领先水平:

下一代 Agent Coding 比的不仅是代码生成,更要比拼长期协作能力、规划能力以及人与 Agent 的协同效率。M3 把真正对 Coding 和 Agent 至关重要的数据 Scale up,目标不仅是在 Benchmark 上取得领先,更是在真实研发流程中成为开发者可靠的协作伙伴。

多模态:原生训练,继续 Scale

M3 是一个从 Step 0 开始进行多模态混合训练的模型。这种原生多模态的路线能让不同模态数据的语义空间更天然、更高度的融合。

同时,在数据配比和构成上,MiniMax团队的大量实验显示,Interleaved data(交错数据)对模型性能带来的提升,比一般认为的更加关键。

这些文本和图像或其他模态在序列中交替自然排列的数据,对于整体训练数据的规模扩展也很重要。在MiniMax团队为这些数据重构整套数据管线后,已可以将训练数据 Token 规模提升至更大量级。

模型API 调用指南

http://platform.minimaxi.com/docs/api-reference/api-overview

模型体验链接及开源地址

https://huggingface.co/MiniMaxAI/MiniMax-M3

欢迎前往沐曦开发者社区Day 0版块获取推理镜像

https://developer.metax-tech.com

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/18 11:22:49

1.1.3 2026-04-30 Linux虚拟机XFS文件系统数据损坏异常恢复

一、业务背景 项目是边端的IOT物联网项目,由于历史原因,项目当时采用的是Vmware Workstation软件,在软件上部署一个Linux系统,即CentOs,宿主机是Window系统,项目正常运行了两年多,一天&#xff…

作者头像 李华
网站建设 2026/6/18 11:22:47

AI大模型企业迎重磅利好!证监会主席吴清:支持符合条件的港股

6月17日上午,2026陆家嘴论坛正式开幕,本届论坛主题为“全球治理倡议下的金融发展与合作:新愿景、新挑战和新机遇”。 会中,证监会主席吴清在陆家嘴论坛抛出了两件AI重磅利好: 第一件,扩大科创板第五套标准…

作者头像 李华
网站建设 2026/6/18 11:22:46

企业AI战略:从技术补丁到操作系统升级

1. 项目概述:为什么企业AI战略不是“技术选型清单”,而是生存操作系统升级 我带过17个跨行业AI落地项目,从制造业的预测性维护到保险业的智能核保,最常被问的问题不是“用不用大模型”,而是:“我们买了三套…

作者头像 李华
网站建设 2026/6/18 11:22:39

微信DAT图片恢复:异或加密原理与Python批量解密实战

1. 项目概述:微信DAT图片恢复的来龙去脉 如果你曾经尝试过从电脑版微信的缓存文件夹里找回那些误删或丢失的图片,大概率会碰到一堆以 .dat 为后缀的神秘文件。双击打不开,改后缀名也无效,它们就像被上了一把无形的锁&#xff0c…

作者头像 李华
网站建设 2026/6/18 11:22:36

宇视云APP下载录像操作指导

宇视云APP下载录像操作指导一、功能介绍宇视云APP接入带有存储功能的设备,支持下载录像二、配置步骤登录宇视云APP,进入设备实况点击【回放】按钮单击【下载】选取需要下载的录像时间段,点击开始下载三、配置关键点1、设备带有存储功能才可以…

作者头像 李华
网站建设 2026/6/18 11:22:32

AI数据收集与机器学习模型的双向耦合关系

1. 这不是“喂数据”那么简单:AI数据收集在机器学习 pipeline 中的真实位置与作用 你打开一篇讲大模型训练的文章,十有八九第一句就是“需要海量高质量数据”。但如果你真去干过一个端到端的工业级机器学习项目——比如给某家连锁药店建一个缺货预警模型…

作者头像 李华