本报讯 (记者张文湘)3月18日,MiniMax(上海稀宇极智科技有限公司)发布新一代Agent旗舰大模型M2.7,首次展示“模型自我进化”路径。该模型通过构建Agent Harness体系,深度参与自身训练与优化流程,在部分研发场景中可承担30%—50%的工作量,并在内部评测集上实现约30%的效果提升。
据介绍,在核心能力上,M2.7在SWE-bench Pro中取得56.22%的成绩,接近国际一线水平;同时在VIBE-Pro、Terminal Bench2等真实工程测试中表现突出,支持端到端项目交付与复杂系统理解。办公场景方面,其在GDPval-AA的ELO得分是1495,为开源模型中最高,并显著提升Office文档处理与多轮编辑能力。
分析人士认为,如果自我“进化”能力进一步成熟,未来AI系统有望实现从数据构建、模型训练到评测优化的全流程自动化,这将显著压缩研发周期,并重塑AI产业的成本结构与竞争格局。M2.7的发布,意味着国内厂商正在尝试定义下一阶段的技术路线,即以Agent为核心、以自我“进化”为驱动的AI系统。
(编辑 黄力)