小米 MiMo-V2-Flash 开源:推理效率刷新开源榜,Agent测评全球第二
近日,小米发布开源 MoE 模型 Xiaomi MiMo-V2-Flash,总参数量 309B、活跃参数量 15B,专为智能体 AI 设计,核心优势聚焦 “快” 与高性价比。
该模型靠 Hybrid 注意力架构和多层 MTP 推理加速,Agent 测评基准跻身全球开源 Top 2,代码能力超越所有开源模型,比肩闭源标杆 Claude 4.5 Sonnet,推理成本仅为其 2.5%,生成速度还提升 2 倍。架构上采用 1:5 Global Attention 与 SWA 混合结构,128 窗口大小,原生支持 32K 上下文、可外扩至 256K。
目前,小米同步推出在线 AI 聊天服务 Xiaomi MiMO Studio,支持深度与联网搜索,用户可直接体验。模型权重及推理代码均以 MIT 协议全面开源,API 定价为输入$0.1/百万tokens、输出$0.3 / 百万 tokens,且限时免费。