全球首个具身原生大模型，由两江新区企业发布！_科技资讯

创始人

2026-02-15 21:20:22

0次

近日，两江新区企业

原力灵机（重庆）智能科技有限公司

（简称“原力灵机”）

举行首届

“具身原生——原力灵机技术开放日”，

发布了全球首个

具身原生大模型DM0。

何为具身原生？

一起来看看

↓↓↓

“我们从第一行代码就为机器人而写。”原力灵机联合创始人＆CEO唐文斌表示，具身原生指具身智能从诞生之初就需立足真实世界，聚焦复杂环境中精准完成人类任务。

通俗来讲，就像婴儿一样，从出生就通过和物理世界打交道积累能力，也让机器人的“智能”从诞生之初就扎根真实世界。

▲活动现场。（企业供图）

虽然参数数量是衡量模型性能的重要指标，但模型的真正实力还取决于其架构、训练数据和优化方法。此次DM0最显著的突破是用小参数实现了大能力。

据介绍，此次发布的2.4B（24亿个可调参数）参数版本，在人工智能领域算是“轻量级”选手，但却在权威真机评测基准RoboChallenge上的30多个桌面级任务中取得了最高综合得分，成为首个同时拿下“单任务”和“多任务”双榜第一的具身大模型。

▲权威真机评测榜单。（企业供图）

“2.4B参数拿到双料第一，这说明什么？说明参数量不是壁垒，原生设计才是。”原力灵机合伙人周而进解释道。

机器人行业有一个大难题：

通常一个模型只能控制

一种类型的机器人，

换个机型就得重新训练。

DM0在预训练阶段即系统混合了操作、导航、全身控制三类核心任务，并覆盖了UR、Franka等8种构型迥异的机器人硬件。

就像老司机换了一辆车依然会开，DM0掌握的是通用的操作逻辑，而不是死记硬背某台机器人的参数，所以能跨机型干活，推进具身模型从“一机一模型”走向“通用策略”。

▲模型能力介绍。（企业供图）

除此之外，

DM0还是个

“眼神好、反应快、会思考”

的全能“大脑”。

机器人干活精细不精细，很大程度上取决于它“眼神”好不好。

周而进解释，目前不少VLA模型仍采用224至384的输入分辨率，这在执行精细动作时容易因像素误差放大而影响表现。因此，原力灵机团队针对精细操作场景设计了728×728高输入分辨率，并希望模型能直接处理720P级别的视频画面，同时尽可能控制精度损失。

同时，DM0反应极快，从“看到”到“行动”只需60毫秒，比人眨一次眼还快，在工业级精细作业中表现优异。而且它开发门槛低，可在4090、5090等在消费级显卡上实现二次开发与微调。

DM0构建的“空间推理思维链”，使机器人能拿到如“拍照后发送指令”这类任务时，会像人一样拆解步骤：先找到目标、规划行动路线，再一步步精准执行，形成“看、懂、想、做”闭环，完成需要多步骤思考的复杂任务。

目前，DM0的2.4B版本全面开源，代码、模型及RoboChallenge全部30个任务的参数与推理代码均已开放。