智谱宣布上线并开源GLM-5.2,该模型在Code Arena评估系统上获全球可用模型第一。它专为长程任务打造,有诸多新特色,未来还将瞄准智能体系统。
智谱此次上线并开源GLM-5.2,在Code Arena评估系统中,取得全球可用模型第一的成绩,这为其在开源模型领域赢得了极高的关注度。
GLM-5.2拥有Solid 1M上下文,稳定支撑长程任务。在多个长程任务基准中,表现介于Claude Opus 4.7与4.8之间,是排名最高的开源模型。不过在SWE - Marathon测试集上,低于Opus 4.8 13%,仍有提升空间。
GLM-5.2在前端、后端、长程任务上的成功率相比前一代GLM-5.1都有提升。在主流编程基准上,保持开源SOTA,与Claude Opus 4.8处于可比区间,还引入思考档位控制,平衡能力、速度和成本。
项目团队提出IndexShare,降低单位token的FLOPs;改进MTP层,提升接受长度。训练侧依赖自研Slime框架,实现Day 0运行在国产算力平台。
智谱表示接下来将瞄向完全自治的智能体系统,基于长程任务,让AI自主驱动、协同作业,有望形成新的生产力形态。
编辑观点:智谱GLM - 5.2的开源是开源模型领域的重要进展,虽有不足但优势明显。未来瞄准智能体系统,若能实现,将为行业带来新变革。