近日,两江新区企业
原力灵机(重庆)智能科技有限公司
(简称“原力灵机”)
举行首届
“具身原生——原力灵机技术开放日”,
发布了全球首个
具身原生大模型DM0。
何为具身原生?
一起来看看
↓↓↓
“我们从第一行代码就为机器人而写。”原力灵机联合创始人&CEO唐文斌表示,具身原生指具身智能从诞生之初就需立足真实世界,聚焦复杂环境中精准完成人类任务。
通俗来讲,就像婴儿一样,从出生就通过和物理世界打交道积累能力,也让机器人的“智能”从诞生之初就扎根真实世界。
▲活动现场。(企业供图)
虽然参数数量是衡量模型性能的重要指标,但模型的真正实力还取决于其架构、训练数据和优化方法。此次DM0最显著的突破是用小参数实现了大能力。
据介绍,此次发布的2.4B(24亿个可调参数)参数版本,在人工智能领域算是“轻量级”选手,但却在权威真机评测基准RoboChallenge上的30多个桌面级任务中取得了最高综合得分,成为首个同时拿下“单任务”和“多任务”双榜第一的具身大模型。
▲权威真机评测榜单。(企业供图)
“2.4B参数拿到双料第一,这说明什么?说明参数量不是壁垒,原生设计才是。”原力灵机合伙人周而进解释道。
机器人行业有一个大难题:
通常一个模型只能控制
一种类型的机器人,
换个机型就得重新训练。
DM0在预训练阶段即系统混合了操作、导航、全身控制三类核心任务,并覆盖了UR、Franka等8种构型迥异的机器人硬件。
就像老司机换了一辆车依然会开,DM0掌握的是通用的操作逻辑,而不是死记硬背某台机器人的参数,所以能跨机型干活,推进具身模型从“一机一模型”走向“通用策略”。
▲模型能力介绍。(企业供图)
除此之外,
DM0还是个
“眼神好、反应快、会思考”
的全能“大脑”。
机器人干活精细不精细,很大程度上取决于它“眼神”好不好。
周而进解释,目前不少VLA模型仍采用224至384的输入分辨率,这在执行精细动作时容易因像素误差放大而影响表现。因此,原力灵机团队针对精细操作场景设计了728×728高输入分辨率,并希望模型能直接处理720P级别的视频画面,同时尽可能控制精度损失。
同时,DM0反应极快,从“看到”到“行动”只需60毫秒,比人眨一次眼还快,在工业级精细作业中表现优异。而且它开发门槛低,可在4090、5090等在消费级显卡上实现二次开发与微调。
DM0构建的“空间推理思维链”,使机器人能拿到如“拍照后发送指令”这类任务时,会像人一样拆解步骤:先找到目标、规划行动路线,再一步步精准执行,形成“看、懂、想、做”闭环,完成需要多步骤思考的复杂任务。
目前,DM0的2.4B版本全面开源,代码、模型及RoboChallenge全部30个任务的参数与推理代码均已开放。
上一篇:伊朗高官:球在美国一边
下一篇:欧洲能成为一个地缘政治力量吗?