美团低调上新!实测首个开源「重思考」模型:8路并行,Agent硬刚Claude
PaperWeekly
2026-01-20 14:18
文章摘要
背景:美团LongCat团队开源了基于5600亿参数MoE架构的旗舰模型LongCat-Flash-Thinking-2601,聚焦于深度逻辑推理与智能体在陌生环境下的泛化能力。研究目的:通过引入重思考模式(并行8条推理路径)和自动化盲考机制,验证模型在复杂逻辑、脏数据处理、代码生成及随机任务中的真实性能,旨在提升大模型落地时的确定性与工程实用性。结论:模型在逻辑推理、抗噪声、代码生成及OOD任务中表现优异,超越了Claude等模型,其核心优势源于并行思考、环境规模扩展、抗噪课程学习等系统性训练范式重构,体现了美团在算法与工程结合上追求确定性的务实路径。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。