美团开源LongCat-Flash-Chat：560B MoE架构的智能体革命_比特快讯

美团开源LongCat-Flash-Chat：560B MoE架构的智能体革命

创始人

2025-09-03 16:51:40

在人工智能迅猛发展的今天，美团正式宣布开源其全新大模型——LongCat-Flash-Chat。这款模型不仅具备560B的庞大参数量，还通过创新的混合专家（MoE）架构，展现出前所未有的推理效率和智能体应用能力。官方声称，LongCat-Flash-Chat的核心理念是“按需计算、极致速度、低成本”，其性能在众多主流模型中脱颖而出，尤其在复杂智能体任务中表现优异。

一、模型亮点：按需激活与并行加速的创新机制

LongCat-Flash-Chat的创新机制是其最引人注目的特点之一。通过引入“零计算专家（Zero-Computation Experts）”的概念，这一模型实现了在不降低表达能力的情况下，减少了不必要的计算开销。具体而言，模型在激活参数时，平均仅需调用约27B的参数，这在极大降低推理开销的同时，仍然能够与当前最先进的模型相媲美。

为了实现这一目标，LongCat-Flash-Chat采用了精细化的调度策略。训练过程中，模型通过PID控制器动态调整专家的偏置，使得单个token的平均激活参数稳定在约27B。这种算力的按需分配，保证了在复杂场景下的高效推理。

此外，模型在层间铺设跨层通道，使得MoE的计算和通信可以高度并行。底层的定制优化进一步提升了训练和推理的效率，使得LongCat-Flash-Chat在短短30天内完成了高效训练。在H800环境下，模型实现了单用户100+tokens/s的推理速度，极大地满足了高并发的需求。

二、性能成绩单：多维度指标全面强势

LongCat-Flash-Chat在多个权威基准上展现出色的性能，成为行业内的一匹黑马。在通用知识与理解方面，模型在ArenaHard-V2上取得了86.50的高分，位列第二；在MMLU基准上，得分89.71；而在CEval中更是达到了90.44。值得注意的是，这些成绩是在激活参数量显著减少的前提下取得的，整体效率与国内领先模型（如DeepSeek-V3.1、Kimi-K2等）相当。

在智能体与工具使用方面，LongCat-Flash-Chat在τ2-Bench测试中超越了多款参数规模更大的模型，展现出卓越的复杂场景处理能力。而在VitaBench中以24.30的成绩位列第一，显示出其在智能体任务中的绝对优势。

在编程与工程能力上，模型在TerminalBench中获得39.51的好成绩，排名第二；在SWE-Bench-Verified中则以60.4的分数展现出强大的竞争力。指令遵循方面，LongCat-Flash-Chat在IFEval中以89.65的成绩位列第一，中文的COLLIE与Meeseeks-zh也分别取得了57.10和43.03的优异成绩。

三、速度与成本：为长时智能体任务而生

LongCat-Flash-Chat的推理速度在H800上达到了约100tokens/s的生成速度，这使其特别适配长链路和长时交互的智能体任务。值得一提的是，经过系统优化后，其生成成本低至约5元/百万token，展现出显著的性价比，给企业级应用带来了更多的可能性。

四、部署方式：SGLang与vLLM双方案

为了满足不同用户的需求，美团为LongCat-Flash-Chat提供了两种高效的部署路径。以SGLang单机部署为例，用户可以通过简单的命令行操作快速启动模型。详细的部署说明与参数设置可在开源仓库中找到，确保用户能够顺利上手。

五、获取与体验：全平台开源，协议宽松

LongCat-Flash-Chat将全面开源，用户可以在官网上体验对话功能，同时也可以在Hugging Face和GitHub上找到相应的开源地址。为了促进二次开发与应用，官方采用了MIT License，允许基于模型输出进行训练与蒸馏，这为企业与开发者提供了极大的便利。

六、产业观察：高效MoE的“工程化拐点”

LongCat-Flash-Chat的发布标志着高效MoE模型在实际应用中的“工程化拐点”。通过将“零计算专家”、“PID控制”和“跨层并行”结合，形成了一种可落地的系统工程。这种新颖的架构为企业级智能体、复杂工具调用和多智能体编排等场景提供了全新的解决方案，推动了智能体应用的进一步发展。

七、谁值得关注

对于那些追求长链路、高并发和低成本的企业级智能体应用方，以及希望在工具调用、流程自动化和多智能体编排方面有所突破的开发者，LongCat-Flash-Chat无疑是一个值得关注的选择。此外，高校与实验室在研究MoE训练、弹性路由与推理优化等领域，也可以从中获得丰富的经验和启示。

总结

LongCat-Flash-Chat的开源不仅是一项技术创新，更是对智能体应用落地的有力推动。它通过激活更少参数的理念，成功实现了速度、成本与能力的完美平衡。对于正在探索智能体应用的团队来说，LongCat-Flash-Chat的开源无疑值得深度试用与对标，期待这一模型能够在未来的应用中展现出更大的潜力与价值。

上一篇：抗战胜利80周年阅兵和平鸽，是如何选拔出来的？

下一篇：曾凡博重返NBA之路：在凤凰城的特训与挑战

美团开源LongCat-Flash-Chat：560B MoE架构的智能体革命

相关内容

热门资讯