在人形机器人的实际应用方面,小米今天也展示了最新的成果。
今天,小米机器人团队公布了一项最新进展:其自主研发的人形机器人,在真实的汽车制造工厂里,完成了一次长达 3 小时的连续“实习”作业。
这个工站的任务是安装自攻螺母。在汽车一体化压铸的后地板零件上,机器人需要从自动送钉设备中精准抓取螺母,将其放置在定位工装上,并配合后续工位完成自攻拧紧。整个过程中,机器人双臂协同,在生产节拍要求的 76 秒内,完成了双侧螺母的同时安装,成功率达到 90.2%。
小米表示,小米机器人双侧同时安装成功率为 90.2%,同时满足了最快76 秒的产线生产节拍要求。用一句很形象的话来说,小米机器人完全可以成为工厂的“正式工”。
对于小米机器人来说,这次实验难度最高的环节集中在自攻螺母的安装过程,需要确保其与定位销轴的精确对准和可靠贴合。而自攻螺母内侧的花键结构,每次抓取不固定的手内姿态,以及定位销轴上磁吸力带来的拉扯影响,都大幅增加了装配难度。
面对真实作业中的复杂情况,传统的“规则编程”显得有些力不从心——你无法穷举所有可能发生的意外。小米机器人的解决思路,是让机器人学会“自主学习”。
其核心技术框架建立在 Xiaomi-Robotics-0 这一通用 VLA 基座模型之上。该模型通过统一的动作空间设计和跨本体数据预训练,让机器人具备了对操作任务的理解和空间感知能力。
仅靠预训练模型还不够。团队引入了一个“VLA + RL(强化学习)”的联合训练框架。简单来说,VLA 模型为机器人提供了“常识”,而强化学习则让机器人在真实物理环境的交互中不断试错和学习,从每一次成功或失败的抓取中迭代自己的行为策略。这种方式有效降低了对昂贵且低效的真实遥操作数据的依赖,让机器人能更快地适配下游的多样化工况。
全身运动控制同样采用了类似的混合架构。一个基于二次规划的优化控制器,以亚毫秒级的速度处理平衡、安全、任务等多级优先级控制。而一个在仿真平台中历经数亿次“摸爬滚打”的强化学习控制器,则负责应对极端干扰,学会如何在失稳时保持平衡,并能零样本迁移到真实机器人身上。
根据官方透露的信息,包括料箱搬运、前徽标安装等其他典型工站的部署验证工作也正在推进中。这些工站将对机器人的移动操作全身协同、以及借助灵巧手提升作业效率等方面提出新的挑战。
从此次披露的诸多细节来看,小米机器人选择了一条相对务实的路径:不急于展示酷炫的“秀肌肉”,而是将机器人置于真实、严苛的工业环境中“磨炼”,并开放了技术方案细节、实验视频,甚至相关代码(Xiaomi-Robotics-0 已开源)。
这次“进厂实习”的机器人,并非凭空出现。它的背后,是小米在机器人领域多年布局的一次集中技术投射。
回顾小米的机器人之路,有两个关键的起点:2021年发布的四足机器人 CyberDog“铁蛋”,以及2022年亮相的全尺寸人形机器人 CyberOne“铁大”。其中,身高177cm、体重52kg的“铁大”,搭载了小米自研的仿生感知认知技术与 Mi-Sense 视觉空间系统,能感知人类情绪,实现双足平衡,最大模组峰值扭矩达300N·m。它最初定位面向家庭护理与陪伴,但其关节控制、动力输出等底层技术,成为了今天工业场景应用的基石。
真正让机器人具备“思考”能力的,是2026年2月开源的 VLA 大模型 Xiaomi-Robotics-0。这个拥有47亿参数的模型,采用了独特的“大脑+小脑”MoT 混合架构:大脑(VLM)负责理解指令与环境,小脑(DiT)负责生成平滑连贯的连续动作。它在 LIBERO、CALVIN 等主流仿真测试中刷新了 SOTA(当前最优)纪录,并且能在消费级显卡上实现 80ms 低延迟推理,解决了机器人“反应迟钝、动作断层”的行业痛点。
为了解决精细操作问题,团队还开发了纯触觉驱动的抓取微调模型 TacRefineNet。它无需视觉,仅凭指尖的高精度触觉阵列就能实现毫米级位姿调整,Zero-shot 部署于产线。
正是这套“Xiaomi-Robotics-0(大脑)+ TacRefineNet(小脑)+ CyberOne(身体)”的组合拳,构成了机器人进厂的技术底气。在组织层面,小米也已将机器人业务整合至北京小米机器人技术有限公司,总部迁入亦庄小米汽车工厂,实现研发制造一体化,并计划五年内投资20亿元,加速技术落地。
雷军表示:“未来5年,会有大批量人形机器人进入小米工厂干活。”对于整个行业而言,这类来自真实场景的实测数据,往往比精心策划的演示更具参考价值。它清晰地划出了一条从实验室理论到车间生产力的演进轨迹,也让人看到了人形机器人在智能制造领域,从“可用”走向“好用”的某种可能。