美团开源5600亿参数大模型LongCat-Flash-Chat：激活效率突破重构AI推理经济性-程序员充电站

9月1日，中国互联网科技企业美团对外宣布，正式推出自主研发的超大规模语言模型LongCat-Flash-Chat，并同步开启开源进程。这款采用创新性混合专家（Mixture-of-Experts, MoE）架构的AI模型，以5600亿总参数规模为行业带来全新突破，其独特的动态激活机制使单次推理仅需调动186亿至313亿参数（平均270亿），在保持高性能的同时实现了推理速度超100tps的跨越式提升。

【免费下载链接】LongCat-Flash-Chat项目地址: https://ai.gitcode.com/hf_mirrors/meituan-longcat/LongCat-Flash-Chat

智能算力分配："零计算专家"机制改写效率规则

LongCat-Flash-Chat最引人注目的技术创新在于其独创的"零计算专家"机制。该机制通过智能识别文本序列中的关键信息单元，实现算力资源的精准投放——对于非核心词汇自动降低计算权重，仅为承载关键语义的"重点词"分配高强度计算资源。这种差异化算力调度策略，使得5600亿参数的庞大规模模型在实际运行中仅需激活270亿级参数，在大幅降低计算开销的同时，显著提升了推理效率。

官方公布的经济性数据显示，该模型生成100万token的成本可控制在5元以内，较当前主流商业模型（包括Claude、Grok及OpenAI的中高端服务）展现出明显的价格优势。更为关键的是，美团技术团队通过创新的快捷连接MoE（ScMoE）架构设计与底层系统级优化，成功突破了传统MoE模型普遍存在的"通信瓶颈"难题，使模型能够稳定运行于数万块加速卡组成的分布式计算集群，同时实现高吞吐率与低延迟的双重技术指标。

场景化性能评测：智能体任务效率领跑行业

在公开评测体系中，LongCat-Flash-Chat展现出与"大而全"模型截然不同的性能特征。该模型采用"非思考型"设计理念，通过参数动态激活机制，在仅动用部分计算资源的情况下，依然取得接近主流大模型的综合表现。这种效率优先的架构设计，使其在运行时间长、操作步骤复杂的智能体类应用中具备独特优势。

在通用知识与语言理解领域，LongCat-Flash的测试成绩位居行业前列：ArenaHard-V2评测获得86.50分位列第二，MMLU综合得分89.71，中文权威评测CEval更是达到90.44分。这些成绩不仅接近国内领先模型水平，更值得注意的是，其参数激活规模显著小于DeepSeek-V3.1等同类产品。

智能体专项测试中，该模型的优势更为突出：τ2-Bench工具使用评测中性能超越部分更大规模模型，VitaBench复杂场景任务以24.30分的成绩高居榜首，充分验证了其在多工具协同调用与多步骤交互任务中的效率优势。编程能力方面，TerminalBench评测获得39.51分排名第二，SWE-Bench-Verified工程能力测试得60.4分，整体处于中上水准，可有效覆盖企业级常见编程需求。

指令执行能力测试中，LongCat-Flash-Chat表现尤为亮眼：IFEval英文指令理解以89.65分排名第一，中文评测体系中COLLIE指令集取得57.10分的最佳成绩，Meeseeks-zh中文多场景指令测试获得43.03分同样位列榜首，展现出对中英文双语指令集的高度适配能力。

技术演进路径：从内部效率工具到开源生态共建

回溯该模型的发展历程，今年3月美团创始人王兴已在财报电话会议中首次披露LongCat系列模型的研发进展。当时该模型主要服务于企业内部效率提升，已成功集成到AI编码辅助、智能会议纪要、文档智能处理及平面设计辅助等多个业务系统。随着技术成熟度提升，LongCat模型的应用边界不断拓展，6月10日美团基于该模型推出首款编程工具"NoCode"，标志着技术成果开始向产品化阶段迈进。

此次LongCat-Flash-Chat的开源，不仅是美团在AI领域技术实力的集中展示，更体现了其通过开放协作推动行业进步的战略考量。该模型的核心技术价值在于，通过动态计算分配机制与通信-计算并行化架构创新，在模型性能与运行效率之间取得了突破性平衡。当然，作为新兴技术成果，模型在部分细分专业领域的表现仍需向专项优化模型看齐，同时大规模部署对硬件环境的要求以及开源生态的成熟度建设，都是需要持续完善的方向。

业界普遍认为，LongCat-Flash-Chat的开源将为AI技术的产业化应用提供新的可能性，特别是在智能客服、自动化办公、工业互联网等需要长时间持续运行的智能体场景中，其高效能特性有望带来显著的成本优化空间。随着开源社区的参与度提升，这一创新性模型的长期演进与实际应用价值值得期待。

【免费下载链接】LongCat-Flash-Chat项目地址: https://ai.gitcode.com/hf_mirrors/meituan-longcat/LongCat-Flash-Chat

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

美团开源5600亿参数大模型LongCat-Flash-Chat：激活效率突破重构AI推理经济性

智能算力分配："零计算专家"机制改写效率规则

场景化性能评测：智能体任务效率领跑行业

技术演进路径：从内部效率工具到开源生态共建

力扣hot100：路径总和III

Blender 3MF插件：5个高效解决3D打印工作流痛点的技术方案

48、Linux系统网络配置、故障排查与安全管理全解析

Wan2.2-T2V-A14B能否生成适用于法庭质证的时空推演视频

金融高频交易策略性能评估与优化框架

从原始信号到发表级图表，R语言甲基化分析全流程拆解，一步都不能少