news 2026/6/10 13:05:48

美团开源5600亿参数大模型LongCat-Flash-Chat:激活效率突破重构AI推理经济性

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
美团开源5600亿参数大模型LongCat-Flash-Chat:激活效率突破重构AI推理经济性

9月1日,中国互联网科技企业美团对外宣布,正式推出自主研发的超大规模语言模型LongCat-Flash-Chat,并同步开启开源进程。这款采用创新性混合专家(Mixture-of-Experts, MoE)架构的AI模型,以5600亿总参数规模为行业带来全新突破,其独特的动态激活机制使单次推理仅需调动186亿至313亿参数(平均270亿),在保持高性能的同时实现了推理速度超100tps的跨越式提升。

【免费下载链接】LongCat-Flash-Chat项目地址: https://ai.gitcode.com/hf_mirrors/meituan-longcat/LongCat-Flash-Chat

智能算力分配:"零计算专家"机制改写效率规则

LongCat-Flash-Chat最引人注目的技术创新在于其独创的"零计算专家"机制。该机制通过智能识别文本序列中的关键信息单元,实现算力资源的精准投放——对于非核心词汇自动降低计算权重,仅为承载关键语义的"重点词"分配高强度计算资源。这种差异化算力调度策略,使得5600亿参数的庞大规模模型在实际运行中仅需激活270亿级参数,在大幅降低计算开销的同时,显著提升了推理效率。

官方公布的经济性数据显示,该模型生成100万token的成本可控制在5元以内,较当前主流商业模型(包括Claude、Grok及OpenAI的中高端服务)展现出明显的价格优势。更为关键的是,美团技术团队通过创新的快捷连接MoE(ScMoE)架构设计与底层系统级优化,成功突破了传统MoE模型普遍存在的"通信瓶颈"难题,使模型能够稳定运行于数万块加速卡组成的分布式计算集群,同时实现高吞吐率与低延迟的双重技术指标。

场景化性能评测:智能体任务效率领跑行业

在公开评测体系中,LongCat-Flash-Chat展现出与"大而全"模型截然不同的性能特征。该模型采用"非思考型"设计理念,通过参数动态激活机制,在仅动用部分计算资源的情况下,依然取得接近主流大模型的综合表现。这种效率优先的架构设计,使其在运行时间长、操作步骤复杂的智能体类应用中具备独特优势。

在通用知识与语言理解领域,LongCat-Flash的测试成绩位居行业前列:ArenaHard-V2评测获得86.50分位列第二,MMLU综合得分89.71,中文权威评测CEval更是达到90.44分。这些成绩不仅接近国内领先模型水平,更值得注意的是,其参数激活规模显著小于DeepSeek-V3.1等同类产品。

智能体专项测试中,该模型的优势更为突出:τ2-Bench工具使用评测中性能超越部分更大规模模型,VitaBench复杂场景任务以24.30分的成绩高居榜首,充分验证了其在多工具协同调用与多步骤交互任务中的效率优势。编程能力方面,TerminalBench评测获得39.51分排名第二,SWE-Bench-Verified工程能力测试得60.4分,整体处于中上水准,可有效覆盖企业级常见编程需求。

指令执行能力测试中,LongCat-Flash-Chat表现尤为亮眼:IFEval英文指令理解以89.65分排名第一,中文评测体系中COLLIE指令集取得57.10分的最佳成绩,Meeseeks-zh中文多场景指令测试获得43.03分同样位列榜首,展现出对中英文双语指令集的高度适配能力。

技术演进路径:从内部效率工具到开源生态共建

回溯该模型的发展历程,今年3月美团创始人王兴已在财报电话会议中首次披露LongCat系列模型的研发进展。当时该模型主要服务于企业内部效率提升,已成功集成到AI编码辅助、智能会议纪要、文档智能处理及平面设计辅助等多个业务系统。随着技术成熟度提升,LongCat模型的应用边界不断拓展,6月10日美团基于该模型推出首款编程工具"NoCode",标志着技术成果开始向产品化阶段迈进。

此次LongCat-Flash-Chat的开源,不仅是美团在AI领域技术实力的集中展示,更体现了其通过开放协作推动行业进步的战略考量。该模型的核心技术价值在于,通过动态计算分配机制与通信-计算并行化架构创新,在模型性能与运行效率之间取得了突破性平衡。当然,作为新兴技术成果,模型在部分细分专业领域的表现仍需向专项优化模型看齐,同时大规模部署对硬件环境的要求以及开源生态的成熟度建设,都是需要持续完善的方向。

业界普遍认为,LongCat-Flash-Chat的开源将为AI技术的产业化应用提供新的可能性,特别是在智能客服、自动化办公、工业互联网等需要长时间持续运行的智能体场景中,其高效能特性有望带来显著的成本优化空间。随着开源社区的参与度提升,这一创新性模型的长期演进与实际应用价值值得期待。

【免费下载链接】LongCat-Flash-Chat项目地址: https://ai.gitcode.com/hf_mirrors/meituan-longcat/LongCat-Flash-Chat

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/9 19:56:12

力扣hot100:路径总和III

题目描述:思路:本题和“和为k的子数组 有异曲同工之妙”,思路也相似。可以用一个哈希表去存储每条路径的和,两条路径和只差即为中间路径的和。可以用递归的方式向下遍历这颗树,定义一个s,表示目前路径的和&…

作者头像 李华
网站建设 2026/6/9 7:09:08

Blender 3MF插件:5个高效解决3D打印工作流痛点的技术方案

Blender 3MF插件:5个高效解决3D打印工作流痛点的技术方案 【免费下载链接】Blender3mfFormat Blender add-on to import/export 3MF files 项目地址: https://gitcode.com/gh_mirrors/bl/Blender3mfFormat 作为连接创意设计与3D制造的关键桥梁,Bl…

作者头像 李华
网站建设 2026/6/10 6:08:56

48、Linux系统网络配置、故障排查与安全管理全解析

Linux系统网络配置、故障排查与安全管理全解析 1. 网络基础配置与操作 在Linux系统中,有多个工具和配置文件可用于网络配置和操作。 - IP地址获取与接口配置 : dhclient 程序可通过DHCP协议向本地网络查询IP地址信息,并使用这些信息配置接口。例如,当你需要自动获取…

作者头像 李华
网站建设 2026/6/10 5:19:22

Wan2.2-T2V-A14B能否生成适用于法庭质证的时空推演视频

Wan2.2-T2V-A14B能否生成适用于法庭质证的时空推演视频 在一场复杂的刑事案件庭审中,陪审团面对多份相互矛盾的证词、零散的时间线索和模糊的空间描述,往往难以构建出清晰的事件全貌。传统的案情还原依赖手绘示意图、3D建模动画或监控拼接视频&#xff0…

作者头像 李华
网站建设 2026/6/9 12:39:12

金融高频交易策略性能评估与优化框架

金融高频交易策略性能评估与优化框架关键词:金融高频交易、策略性能评估、优化框架、量化分析、交易策略摘要:本文围绕金融高频交易策略性能评估与优化框架展开深入探讨。首先介绍了该研究的背景、目的、预期读者以及文档结构等内容。接着阐述了核心概念…

作者头像 李华